Il RAG supporterà i file PDF in futuro?

@sam, mi auto-ospito e sto lottando con tesseract ora. Installato senza problemi ma sta generando errori che non sembrano abbastanza seri da far fallire il lavoro:

Errore durante l’elaborazione OCR: /var/www/discourse/lib/discourse.rb:139:in `exec’: Impossibile eseguire l’OCR dell’immagine con Tesseract
Stima della risoluzione come 337

Anche con quell’errore, il PDF viene mostrato in Persona come indicizzato.

Non sono sicuro di cosa significhi questo in termini di impatto su RAG. Approfondirò durante il fine settimana.

Grazie per aver risposto così rapidamente.

2 Mi Piace