RAG suportará arquivos PDF no futuro?

@sam, eu hospedo em casa e estou lutando com o tesseract agora. Instalou sem problemas, mas está gerando erros que não parecem ser sérios o suficiente para falhar o trabalho:

Erro durante o processamento de OCR: /var/www/discourse/lib/discourse.rb:139:in `exec’: Falha ao fazer OCR da imagem com Tesseract
Estimando a resolução como 337

Mesmo com esse erro, o PDF mostra na Persona como sendo indexado.

Não tenho certeza do que isso significa em termos de impacto no RAG. Vou investigar mais a fundo durante o fim de semana.

Obrigado por responder tão rapidamente.

2 curtidas