La resumen de IA no funciona después de actualizar a 3.3.0 beta1

@falco, continuando esto del último tema ya que se cerró automáticamente. Desafortunadamente, después de actualizar a la versión beta 1 de 3.3.0, la Resumen de IA ha dejado de funcionar por completo, es decir, el botón para resumir ha desaparecido por completo. Solo veo los botones en temas que previamente fueron resumidos por IA, pero ya no en temas nuevos (he verificado el umbral de resumen de temas).

Cuando miro los registros, veo este error, es nuevo y no estaba antes:

Mensaje

DiscourseAi::Completions::Endpoints::Gemini: estado: 429 - cuerpo: {
  "error": {
    "code": 429,
    "message": "Cuota excedida para la métrica de cuota 'Solicitudes de API de generación de contenido por minuto' y el límite 'Límite de solicitud de generación de contenido por minuto para una región' del servicio 'generativelanguage.googleapis.com' para el consumidor 'project_number:184805424415'.",
    "status": "RESOURCE_EXHAUSTED",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.ErrorInfo",
        "reason": "RATE_LIMIT_EXCEEDED",
        "domain": "googleapis.com",
        "metadata": {
          "quota_limit_value": "0",
          "quota_location": "us-east2",
          "quota_metric": "generativelanguage.googleapis.com/generate_content_requests",
          "service": "generativelanguage.googleapis.com",
          "quota_limit": "GenerateContentRequestsPerMinutePerProjectPerRegion",
          "consumer": "projects/184805424415"
        }
      },
      {
        "@type": "type.googleapis.com/google.rpc.Help",
        "links": [
          {
            "description": "Solicitar un límite de cuota más alto.",
            "url": "https://cloud.google.com/docs/quota#requesting_higher_quota"
          }
        ]
      }
    ]
  }
}


Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:93:in `block (2 levels) in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2353:in `block in transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http/response.rb:320:in `reading_body'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2352:in `transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2306:in `request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:19:in `block in request_with_mini_profiler'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/mini_profiler/profiling_methods.rb:50:in `step'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:18:in `request_with_mini_profiler'
/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:91:in `block in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:1570:in `start'

Env

HTTP HOSTS: xxx.com

Esto también está configurado en 50: "Net::HTTPBadResponse" errors on Gemini Embeddings - #2 by Falco

¿Hay algo que pueda proporcionar para ver qué está pasando?

Parece que es un error muy bien descrito, incluso te dieron un lugar para solicitar un aumento de cuota.

1 me gusta

Mi pregunta es por qué estoy recibiendo un error de límite de tasa cuando he establecido el límite en 50 solicitudes por minuto (Gemini tiene un límite de 60 por minuto) utilizando las instrucciones que proporcionaste anteriormente.

Eso limitará las llamadas automáticas en segundo plano, pero debe sumar las llamadas iniciadas por el usuario además de eso. Para obtener más información, consulte los registros en GCP.

1 me gusta

Gracias. Ahora mismo estoy intentando limitar el acceso a la IA solo al personal. He revisado todas las configuraciones de IA y he limitado los niveles de confianza al personal cuando están disponibles.

Supongo que hay algunos módulos que no tienen límites de confianza (¿Búsqueda? ¿Resumen?). ¿Pueden los rastreadores o los usuarios que no han iniciado sesión invocar estas funciones de IA? Es un sitio pequeño, así que sé que no son los usuarios que han iniciado sesión quienes usan las API.

Además, no entiendo por qué ha desaparecido el botón “Resumir con IA” y cómo recuperarlo. Cualquier información al respecto sería apreciada.

Para que lo sepas, los grupos que pueden usar la IA para resumir temas se controlan mediante custom summarization allowed groups. ¿Podrías comprobar esa configuración y ver si tienes los grupos que esperas ahí?

Creo que para la Búsqueda Semántica, la potencia de la IA está en la creación de las incrustaciones, por lo que una vez que eso se hace, la gente puede usar la Búsqueda de IA sin más llamadas al proveedor de IA en sí mismo. Ahora no estoy seguro de que eso sea exacto.

1 me gusta

Para completar, había algo mal con Gemini. La página de cuotas está en blanco y no muestra ninguna métrica contra la clave de API.

La solución corta fue eliminar la clave de API y regenerar una nueva. Ahora puedo ver el uso de métricas para la nueva clave de API/proyecto y está funcionando bien. Gracias Falco.

2 Me gusta

Aquí hay algunos comentarios adicionales. Una vez que la clave dejó de funcionar, la reemplacé con una nueva clave, pero las funciones de IA no funcionaron, el asistente del BOT (Explorador de foros y configuración, sin respuesta de ninguno y errores en los registros) no funcionó, el botón de resumen de IA desapareció, etc.

Intenté habilitar/deshabilitar el módulo de IA desde la configuración de administración, detener e iniciar el contenedor usando ./launcher stop app, pero eso tampoco ayudó. Necesité reiniciar toda la máquina para que las funciones de IA volvieran a funcionar.

EDITAR: Parece que establecer custom summarization allowed groups en Everyone deshabilita el botón de resumen de IA para todos (incluido el personal) @JammyDodger

Sí, ese pseudo-grupo everyone es complicado. Creo que hay planes para eliminarlo de ese tipo de configuraciones pronto para evitar que confunda a más personas. TL0 es el grupo que funcionaría para esto.

TL0 no funciona para usuarios que no han iniciado sesión. Por lo tanto, si queremos permitir que los usuarios anónimos utilicen la opción Resumir IA, no funcionará con TL0.

Creo que estas funciones son actualmente solo para miembros que han iniciado sesión.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.