Suspeito que isso seja limitação de taxa (rate limiting) ou algum erro com o preenchimento de embeddings, pois quando tento analisar os resultados da pesquisa, recebo JSON inválido de uma API JSON.
Coloquei uma salvaguarda.
Podemos procurar mais tarde em nossos logs de IA por “Falha ao pesquisar” para ver se ainda está acontecendo @Falco e, acho que, enviar o result.body para algum lugar.
Então os erros devem ter sumido agora, mas se a pesquisa falhar, as alucinações aumentarão.
Tive problemas para reproduzir isso, então suspeito que haja um caso de borda com nossos novos embeddings.