Index File Contents for Search

dennisjbr · 21.Апрель.2026 07:34:57

Итак, я изучаю этот вопрос и с помощью ИИ составляю макет, как лучше всего этого достичь. На ум приходит несколько идей. Использование Apache TIKA позволило бы нам выполнить OCR практически для любого текстового формата файла, включая изображения. Это был бы вариант с самостоятельным размещением. Или же: использовать Gemini Flash 1.5 (например), чтобы не только выполнять OCR, но и описывать просматриваемые и анализируемые изображения, а затем сохранять эти данные в таблице/столбце PostgreSQL для поиска. Конечно, это потребует значительных затрат токенов на начальном этапе для повторной обработки всех постов с вложениями/загрузками, но это было бы наиболее полезно. Похоже, получаешь то, за что платишь?

Тема		Ответов	Просм.
Index PDFs for search Support	1	390	07.10.2023
Searchable File Attachments Feature	12	2885	03.05.2022
Add support for searching pdf files in forum topics from AI personas Feature	3	143	12.12.2025
Browser-based PDF Viewer with search and highlighting capabilities Feature	9	2625	15.12.2020
Upload and discuss pdfs in composer Feature ai	5	314	24.02.2025

Index File Contents for Search

Связанные темы