JSON n’est que du texte, nous le prenons donc déjà en charge.
C’est une représentation inefficace pour les LLM étant donné la grande quantité de duplication dans le format, donc cela gaspillerait quelques tokens, mais dans l’ensemble, cela fonctionnera. Je recommanderais d’exécuter un script dessus et de reformater pour améliorer les performances du RAG.
Il est très difficile de le faire automatiquement car le JSON peut être très imbriqué et choisir une représentation textuelle spécifique au domaine parfaite dépend fortement du domaine.