JSON é apenas texto, então já o suportamos.
É uma representação ineficiente para LLMs, dada a grande quantidade de duplicação dentro do formato, o que desperdiçaria alguns tokens, mas, no geral, funcionará. Eu recomendaria executar um script sobre ele e reformatá-lo para melhorar o desempenho do RAG.
É muito difícil fazer isso automaticamente porque o JSON pode ser muito aninhado e escolher uma representação de texto específica do domínio perfeita depende muito do domínio.