JSON — это просто текст, поэтому мы уже поддерживаем его.
Для больших языковых моделей это неэффективный формат из-за значительного дублирования внутри структуры, что приведёт к неоправданному расходу токенов, но в целом он будет работать. Я рекомендую запустить скрипт для преобразования и переформатирования данных, чтобы улучшить производительность RAG.
Автоматизировать это очень сложно, так как JSON может быть сильно вложенным, а выбор идеального текстового представления, специфичного для предметной области, сильно зависит от самой области.