Nachdem ich Discourse auf 2.6.0 Beta 2 aktualisiert habe, sind die Embeddings ausgefallen und ich kann nicht herausfinden, warum.
Ich verwende Gemini Flash und Flash Lite LLMs, und sie funktionieren einwandfrei, der KI-Bot funktioniert usw.
Wenn ich jedoch zum Embedding-Modell gehe und auf dem Gemini-Embedding auf test klicke, erhalte ich diesen Fehler (und die Logs sind auch voll davon).
Trying to contact the model returned this error: { "error": { "code": 429, "message": "Sie haben Ihr aktuelles Kontingent überschritten. Überprüfen Sie Ihre Plan- und Abrechnungsdetails. Weitere Informationen zu diesem Fehler finden Sie unter: https://ai.google.dev/gemini-api/docs/rate-limits.\n* Kontingent überschritten für Metrik: generativelanguage.googleapis.com/embed_content_free_tier_requests, Limit: 0\n* Kontingent überschritten für Metrik: generativelanguage.googleapis.com/embed_content_free_tier_requests, Limit: 0\n* Kontingent überschritten für Metrik: generativelanguage.googleapis.com/embed_content_free_tier_requests, Limit: 0\n* Kontingent überschritten für Metrik: generativelanguage.googleapis.com/embed_content_free_tier_requests, Limit: 0", "status": "RESOURCE_EXHAUSTED", "details": [ { "@type": "type.googleapis.com/google.rpc.QuotaFailure", "violations": [ { "quotaMetric": "generativelanguage.googleapis.com/embed_content_free_tier_requests", "quotaId": "EmbedContentRequestsPerMinutePerProjectPerModel-FreeTier" }, { "quotaMetric": "generativelanguage.googleapis.com/embed_content_free_tier_requests", "quotaId": "EmbedContentRequestsPerMinutePerUserPerProjectPerModel-FreeTier" }, { "quotaMetric": "generativelanguage.googleapis.com/embed_content_free_tier_requests", "quotaId": "EmbedContentRequestsPerDayPerUserPerProjectPerModel-FreeTier" }, { "quotaMetric": "generativelanguage.googleapis.com/embed_content_free_tier_requests", "quotaId": "EmbedContentRequestsPerDayPerProjectPerModel-FreeTier" } ] }, { "@type": "type.googleapis.com/google.rpc.Help", "links": [ { "description": "Mehr über Gemini API-Kontingente erfahren", "url": "https://ai.google.dev/gemini-api/docs/rate-limits" } ] } ] } }
Das funktionierte bis 3.6.0 Beta 1 perfekt, nach dem Update auf Beta 2 trat dieser Fehler auf. Ich verwende denselben Schlüssel für dieses Embedding wie für die LLM. Ich habe sogar versucht, einen neuen Schlüssel zu generieren, 48 Stunden gewartet usw., aber nichts scheint das Problem zu beheben.
Kann mir jemand sagen, warum es plötzlich aufgehört hat zu funktionieren, warum der LLM-KI-Bot funktioniert, aber dieses nicht, und wie ich es beheben kann?