RAG suportará arquivos PDF no futuro?

Confirmado, me dê alguns dias aqui, quero também tentar a extração de texto direta, que é algo que podemos habilitar por padrão.

Então a extração “rica” baseada em LLM pode ficar atrás de flags.

O problema com muitos PDFs é que eles são enormes e podem consumir muitos recursos do servidor. Além disso, coisas como o Tesseract podem ser um pouco complicadas de instalar - isso pode melhorar a qualidade.

5 curtidas