@sam, я размещаю это на собственном сервере и сейчас сталкиваюсь с проблемами в Tesseract. Установил без проблем, но он выдаёт ошибки, которые, кажется, недостаточно серьёзны, чтобы сорвать выполнение задачи:
Ошибка при обработке OCR: /var/www/discourse/lib/discourse.rb:139:in `exec’: Не удалось выполнить OCR изображения с помощью Tesseract
Оценка разрешения как 337
Даже при этой ошибке PDF отображается в Persona как проиндексированный.
Не уверен, что это означает для влияния на RAG. Разберусь глубже в выходные.
Спасибо за столь быстрый ответ.