@sam、自己ホストしており、現在Tesseractと格闘しています。問題なくインストールできましたが、ジョブを失敗させるほど深刻ではないと思われるエラーが発生しています。
OCR処理中にエラーが発生しました: /var/www/discourse/lib/discourse.rb:139:in `exec’: Tesseract を使用した画像の OCR に失敗しました
解像度を 337 と推定しています
そのエラーが発生しても、PDF は Persona でインデックス化されているように表示されます。
これが RAG にどのような影響を与えるのか分かりません。週末にもっと深く掘り下げてみます。
迅速なご対応ありがとうございます。