¿RAG soportará archivos PDF en el futuro?

@sam, me autoalojo y ahora estoy lidiando con tesseract. Se instaló sin problemas, pero está arrojando errores que no parecen ser lo suficientemente graves como para fallar el trabajo:

Error durante el procesamiento de OCR: /var/www/discourse/lib/discourse.rb:139:in `exec’: Falló el OCR de la imagen con Tesseract
Estimando la resolución en 337

Incluso con ese error, el PDF se muestra en Persona como indexado.

No estoy seguro de lo que esto significa en términos de impacto en RAG. Profundizaré durante el fin de semana.

Gracias por responder tan rápidamente.

2 Me gusta