Ich verwende Gemini für das LLM und stelle viele Fehler in den Protokollen fest, die von einer Embeddings-Backfill-Aufgabe zu stammen scheinen.
Job-Ausnahme: Net::HTTPBadResponse
/var/www/discourse/plugins/discourse-ai/app/jobs/scheduled/embeddings_backfill.rb:122:in `populate_topic_embeddings’
Basierend auf dem obigen Architekturdiagramm sollte es nur bei einem neuen Thema ausgeführt werden, aber es scheint, dass es eine Backfill-Aufgabe gibt, die auch bei vorhandenen Themen ausgeführt wird. Das ist an sich eine gute Sache, da es auch bestehenden Themen hilft.
Meine Klärung bezieht sich auf Limits. Wenn Gemini auf 60 Abfragen pro Minute beschränkt ist, vermute ich, dass die Schwelle die Fehler verursacht (gibt es eine Möglichkeit, dies zu bestätigen?).
Wenn eine Schwelle erreicht wird, versucht Discourse nach einer Weile erneut, die Embeddings für das fehlgeschlagene Thema zu erstellen? Wenn ja, wie oft und wie lange? Wenn nicht, gibt es eine Möglichkeit, die Backfill-Aufgabe manuell für die zugehörigen Themen auszulösen, um die nicht verarbeiteten Themen zu bearbeiten?


