Resumo de IA não funcionando após atualização para 3.3.0 beta1

@falco, continuando isto do último tópico, pois ele foi fechado automaticamente. Infelizmente, após a atualização para a versão beta 1 do 3.3.0, a Sumarização de IA parou de funcionar completamente, ou seja, o botão para resumir desapareceu completamente. Só consigo ver os botões em tópicos que foram previamente resumidos por IA, mas não em nenhum tópico novo (verifiquei o limite de sumarização de tópicos).

Quando olho para os logs, vejo este erro, que é novo e não estava lá antes:

Mensagem

DiscourseAi::Completions::Endpoints::Gemini: status: 429 - body: {
  "error": {
    "code": 429,
    "message": "Quota exceeded for quota metric 'Generate Content API requests per minute' and limit 'GenerateContent request limit per minute for a region' of service 'generativelanguage.googleapis.com' for consumer 'project_number:184805424415'.",
    "status": "RESOURCE_EXHAUSTED",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.ErrorInfo",
        "reason": "RATE_LIMIT_EXCEEDED",
        "domain": "googleapis.com",
        "metadata": {
          "quota_limit_value": "0",
          "quota_location": "us-east2",
          "quota_metric": "generativelanguage.googleapis.com/generate_content_requests",
          "service": "generativelanguage.googleapis.com",
          "quota_limit": "GenerateContentRequestsPerMinutePerProjectPerRegion",
          "consumer": "projects/184805424415"
        }
      },
      {
        "@type": "type.googleapis.com/google.rpc.Help",
        "links": [
          {
            "description": "Request a higher quota limit.",
            "url": "https://cloud.google.com/docs/quota#requesting_higher_quota"
          }
        ]
      }
    ]
  }
}


Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:93:in `block (2 levels) in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2353:in `block in transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http/response.rb:320:in `reading_body'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2352:in `transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2306:in `request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:19:in `block in request_with_mini_profiler'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/mini_profiler/profiling_methods.rb:50:in `step'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:18:in `request_with_mini_profiler'
/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:91:in `block in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:1570:in `start'

Env

HTTP HOSTS: xxx.com

Isto também está definido como 50: "Net::HTTPBadResponse" errors on Gemini Embeddings - #2 by Falco

Há algo que eu possa fornecer para ver o que está acontecendo?

Parece que é um erro muito bem descrito, eles até deram um lugar para solicitar um aumento de cota.

1 curtida

Minha pergunta é por que estou recebendo um erro de limite de taxa quando defini o limite para 50 solicitações por minuto (o Gemini tem um limite de 60 por minuto) usando as instruções que você forneceu anteriormente?

Isso limitará as chamadas automatizadas em segundo plano, mas você precisa somar as chamadas iniciadas pelo usuário além disso. Para mais informações, verifique os logs no GCP.

1 curtida

Obrigado. No momento, estou tentando limitar o acesso à IA apenas à equipe. Verifiquei todas as configurações de IA e limitei os níveis de confiança à equipe onde disponível.

Imagino que existam alguns módulos que não possuem limites de confiança (Pesquisa? Resumo?). Rastreadores ou usuários que não estão logados podem invocar esses recursos de IA? É um site pequeno, então sei que não são usuários logados que estão usando as APIs.

Além disso, não consigo entender por que o botão resumir com IA desapareceu e como recuperá-lo. Qualquer informação aqui seria apreciada.

Para sua informação, quais grupos podem usar a IA para resumir tópicos é controlado por custom summarization allowed groups (grupos personalizados que permitem sumarização). Você poderia verificar essa configuração e ver se os grupos que você espera estão lá?

Acho que para a Pesquisa Semântica, o poder da IA está na criação dos embeddings, então, uma vez que isso é feito, as pessoas podem usar a Pesquisa de IA sem mais chamadas ao provedor de IA em si. Agora não tenho certeza se isso é preciso.

1 curtida

Para concluir, havia algo errado com o Gemini. A página de cotas está em branco e não mostra nenhuma métrica para a chave de API.

A solução, em resumo, foi excluir a chave de API e gerar uma nova. Agora posso ver o uso de métricas para a nova chave de API/projeto e está funcionando bem. Obrigado, Falco.

2 curtidas

Alguns comentários adicionais aqui. Assim que a chave parou de funcionar, substituí-a por uma nova, mas os recursos de IA não funcionaram, o helper do BOT (Explorador de Fórum e Configurações - nenhuma resposta de nenhum deles e erros nos logs) não funcionou, o botão de sumarização de IA desapareceu, etc.

Tentei desativar/ativar o módulo de IA nas configurações de administrador, parar e iniciar o contêiner usando ./launcher stop app, mas isso também não ajudou. Precisei reiniciar a máquina inteira para que as funções de IA voltassem a funcionar.

EDIT: Parece que definir custom summarization allowed groups para Everyone desabilita o botão de sumarização de IA para todos (incluindo a equipe) @JammyDodger

Sim, esse pseudo-grupo everyone é complicado. Acho que há planos para removê-lo desses tipos de configurações em breve para evitar que engane mais pessoas. O TL0 é o grupo que funcionaria para isso.

TL0 não funciona para usuários que não estão logados. Portanto, se quisermos permitir que usuários anônimos usem a opção Resumir IA, não funcionará com TL0.

Eu acho que esses recursos são atualmente apenas para membros logados.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.