Estou usando o Gemini para o LLM, estou notando muitos erros nos logs e parece que eles vêm de uma tarefa de preenchimento de embeddings.
Exceção do trabalho: Net::HTTPBadResponse
/var/www/discourse/plugins/discourse-ai/app/jobs/scheduled/embeddings_backfill.rb:122:in `populate_topic_embeddings’
Com base no diagrama de arquitetura acima, ele só deve ser executado em um novo tópico, mas parece que há uma tarefa de preenchimento que também é executada em tópicos existentes. Isso em si é uma coisa boa, pois ajuda os tópicos existentes também.
Minha dúvida está relacionada aos limites. Se o Gemini for limitado a 60 consultas por minuto, suspeito que o limite possa estar causando os erros (há alguma maneira de confirmar?).
Quando um limite é atingido, o Discourse tenta novamente os embeddings para o tópico com falha depois de um tempo? Se sim, com que frequência e por quanto tempo? Se não, existe uma maneira de acionar manualmente a tarefa de preenchimento para tópicos relacionados para voltar e lidar com os tópicos não processados?


