@sam,我自行托管,现在正在与 tesseract 搏斗。安装没问题,但它抛出的错误似乎不足以导致作业失败:
OCR 处理期间出错:/var/www/discourse/lib/discourse.rb:139:in `exec’: 使用 Tesseract OCR 图像失败
估计分辨率为 337
即使出现此错误,PDF 在 Persona 中仍显示已索引。
我不确定这对 RAG 有何影响。我将在周末深入研究。
感谢您如此迅速地回复。
@sam,我自行托管,现在正在与 tesseract 搏斗。安装没问题,但它抛出的错误似乎不足以导致作业失败:
OCR 处理期间出错:/var/www/discourse/lib/discourse.rb:139:in `exec’: 使用 Tesseract OCR 图像失败
估计分辨率为 337
即使出现此错误,PDF 在 Persona 中仍显示已索引。
我不确定这对 RAG 有何影响。我将在周末深入研究。
感谢您如此迅速地回复。