¿RAG soportará archivos PDF en el futuro?

JSON es solo texto, así que ya lo soportamos.

Es una representación ineficiente para los LLM dado el gran volumen de duplicación dentro del formato, por lo que desperdiciaría algunos tokens, pero en general funcionará. Recomendaría ejecutar un script sobre él y reformatearlo para mejorar el rendimiento de RAG.

Es muy difícil hacer esto automáticamente porque JSON puede estar muy anidado y elegir una representación de texto específica del dominio perfecta depende en gran medida del dominio.

3 Me gusta