Estoy usando Gemini para el LLM, estoy notando muchos errores en los registros y parece que provienen de una tarea de relleno de embeddings.
Excepción del trabajo: Net::HTTPBadResponse
/var/www/discourse/plugins/discourse-ai/app/jobs/scheduled/embeddings_backfill.rb:122:in `populate_topic_embeddings’
Según el diagrama de arquitectura anterior, solo debería ejecutarse en un tema nuevo, pero parece que hay una tarea de relleno que también se ejecuta en temas existentes. Eso en sí mismo es algo bueno, ya que también ayuda a los temas existentes.
Mi aclaración está relacionada con los límites. Si Gemini está limitado a 60 consultas por minuto, sospecho que el umbral puede estar causando los errores (¿hay alguna forma de confirmarlo?).
Cuando se alcanza un umbral, ¿discourse reintenta los embeddings para el tema fallido después de un tiempo? Si es así, ¿con qué frecuencia y durante cuánto tiempo? Si no, ¿hay alguna forma de activar manualmente la tarea de relleno para que los temas relacionados vuelvan y manejen los temas no procesados?


