RAG 未来会支持 PDF 文件吗?

@sam,我自行托管,现在正在与 tesseract 搏斗。安装没问题,但它抛出的错误似乎不足以导致作业失败:

OCR 处理期间出错:/var/www/discourse/lib/discourse.rb:139:in `exec’: 使用 Tesseract OCR 图像失败
估计分辨率为 337

即使出现此错误,PDF 在 Persona 中仍显示已索引。

我不确定这对 RAG 有何影响。我将在周末深入研究。

感谢您如此迅速地回复。

2 个赞