هل سيدعم RAG ملفات PDF في المستقبل؟

@sam، أنا أستضيف ذاتيًا وأصارع مع tesseract الآن. تم التثبيت بدون مشكلة ولكنه يرمي أخطاء لا تبدو خطيرة بما يكفي لفشل المهمة:

خطأ أثناء معالجة التعرف الضوئي على الحروف: /var/www/discourse/lib/discourse.rb:139:in `exec’: فشل في التعرف الضوئي على الحروف للصورة باستخدام Tesseract
تقدير الدقة على أنها 337

حتى مع هذا الخطأ، يظهر ملف PDF في Persona على أنه مفهرس.

أنا لست متأكدًا مما يعنيه هذا فيما يتعلق بتأثيره على RAG. سأتعمق أكثر خلال عطلة نهاية الأسبوع.

شكراً لردك السريع.

إعجابَين (2)