Sto usando Gemini per l’LLM, sto notando molti errori nei log e sembra che provengano da un’attività di riempimento dei dati per gli embeddings.
Eccezione del job: Net::HTTPBadResponse
/var/www/discourse/plugins/discourse-ai/app/jobs/scheduled/embeddings_backfill.rb:122:in `populate_topic_embeddings’
In base al diagramma dell’architettura sopra, dovrebbe essere eseguito solo su un nuovo argomento, ma sembra che ci sia un’attività di riempimento che viene eseguita anche su argomenti esistenti. Questo di per sé è una buona cosa poiché aiuta anche gli argomenti esistenti.
La mia chiarificazione è relativa ai limiti. Se Gemini è limitato a 60 query al minuto, sospetto che la soglia possa causare gli errori (c’è un modo per confermarlo?).
Quando viene raggiunta una soglia, discourse ritenta gli embeddings per l’argomento fallito dopo un po’? Se sì, ogni quanto e per quanto tempo? In caso contrario, esiste un modo per attivare manualmente l’attività di riempimento per gli argomenti correlati per tornare indietro e gestire gli argomenti non elaborati?


