Итак, я изучаю этот вопрос и с помощью ИИ составляю макет, как лучше всего этого достичь. На ум приходит несколько идей. Использование Apache TIKA позволило бы нам выполнить OCR практически для любого текстового формата файла, включая изображения. Это был бы вариант с самостоятельным размещением. Или же: использовать Gemini Flash 1.5 (например), чтобы не только выполнять OCR, но и описывать просматриваемые и анализируемые изображения, а затем сохранять эти данные в таблице/столбце PostgreSQL для поиска. Конечно, это потребует значительных затрат токенов на начальном этапе для повторной обработки всех постов с вложениями/загрузками, но это было бы наиболее полезно. Похоже, получаешь то, за что платишь?
1 лайк