J’utilise Gemini pour le LLM, je remarque beaucoup d’erreurs dans les journaux et cela semble provenir d’une tâche de remplissage des embeddings.
Exception de tâche : Net::HTTPBadResponse
/var/www/discourse/plugins/discourse-ai/app/jobs/scheduled/embeddings_backfill.rb:122:in `populate_topic_embeddings’
D’après le schéma d’architecture ci-dessus, cela ne devrait s’exécuter que sur un nouveau sujet, mais il semble qu’il y ait une tâche de remplissage qui s’exécute également sur les sujets existants. C’est une bonne chose en soi, car cela aide également les sujets existants.
Ma clarification concerne les limites. Si Gemini est limité à 60 requêtes par minute, je soupçonne que le seuil pourrait causer les erreurs (y a-t-il un moyen de le confirmer ?).
Lorsqu’un seuil est atteint, Discourse réessaie-t-il de générer les embeddings pour le sujet échoué après un certain temps ? Si oui, à quelle fréquence et pendant combien de temps ? Sinon, y a-t-il un moyen de déclencher manuellement la tâche de remplissage pour que les sujets associés soient traités ultérieurement ?


