La riassuntivazione AI non funziona dopo l'aggiornamento a 3.3.0 beta1

@falco, continuando da ultimo argomento dato che si è chiuso automaticamente. Sfortunatamente, dopo l’aggiornamento a 3.3.0 beta1, la Riassunzione AI ha smesso di funzionare completamente, nel senso che il pulsante per riassumere è completamente scomparso. Vedo solo i pulsanti sugli argomenti che sono stati precedentemente riassunti con AI, ma non più su argomenti nuovi (ho controllato la soglia di riassunzione degli argomenti).

Quando guardo i log, vedo questo errore, è nuovo e non c’era prima:

Messaggio

DiscourseAi::Completions::Endpoints::Gemini: stato: 429 - corpo: {
  "error": {
    "code": 429,
    "message": "Quota superata per la metrica di quota 'Richieste API Genera Contenuto al minuto' e il limite 'Limite di richieste Genera Contenuto al minuto per regione' del servizio 'generativelanguage.googleapis.com' per il consumer 'project_number:184805424415'.",
    "status": "RESOURCE_EXHAUSTED",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.ErrorInfo",
        "reason": "RATE_LIMIT_EXCEEDED",
        "domain": "googleapis.com",
        "metadata": {
          "quota_limit_value": "0",
          "quota_location": "us-east2",
          "quota_metric": "generativelanguage.googleapis.com/generate_content_requests",
          "service": "generativelanguage.googleapis.com",
          "quota_limit": "GenerateContentRequestsPerMinutePerProjectPerRegion",
          "consumer": "projects/184805424415"
        }
      },
      {
        "@type": "type.googleapis.com/google.rpc.Help",
        "links": [
          {
            "description": "Richiedi un limite di quota più alto.",
            "url": "https://cloud.google.com/docs/quota#requesting_higher_quota"
          }
        ]
      }
    ]
  }
}


Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:93:in `block (2 levels) in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2353:in `block in transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http/response.rb:320:in `reading_body'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2352:in `transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2306:in `request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:19:in `block in request_with_mini_profiler'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/mini_profiler/profiling_methods.rb:50:in `step'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:18:in `request_with_mini_profiler'
/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:91:in `block in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:1570:in `start'

Env

HTTP HOSTS: xxx.com

Anche questo è impostato a 50: "Net::HTTPBadResponse" errors on Gemini Embeddings - #2 by Falco

C’è qualcosa che posso fornire per capire cosa sta succedendo?

Sembra un errore molto ben descritto, ti hanno persino indicato un posto dove richiedere un aumento della quota.

1 Mi Piace

La mia domanda è perché sto riscontrando un errore di limite di frequenza quando ho impostato il limite a 50 richieste al minuto (Gemini ha un limite di 60 al minuto) utilizzando le istruzioni che avevi fornito in precedenza?

Quelli limiteranno le chiamate automatiche in background, ma devi sommare le chiamate avviate dall’utente. Per maggiori informazioni controlla i log su GCP.

1 Mi Piace

Grazie. Al momento sto cercando di limitare l’accesso all’IA solo al personale. Ho ricontrollato tutte le impostazioni dell’IA e limitato i livelli di fiducia al personale dove disponibili.

Suppongo che ci siano alcuni moduli che non hanno limiti di fiducia (Ricerca? Riassunto?). I crawler o gli utenti non registrati possono invocare queste funzionalità AI? È un piccolo sito, quindi so che non sono gli utenti registrati a utilizzare le API.

Inoltre, non riesco a capire perché il pulsante “Riassumi con IA” sia scomparso e come ripristinarlo. Qualsiasi informazione qui sarebbe apprezzata.

Per tua informazione, i gruppi che possono utilizzare l’IA per riassumere argomenti sono controllati da custom summarization allowed groups. Potresti controllare quella impostazione e vedere se ci sono i gruppi che ti aspetti al suo interno?

Penso che per la Ricerca Semantica la potenza dell’IA sia nella creazione degli embedding, quindi una volta fatto questo le persone possono usare la Ricerca IA senza ulteriori chiamate al provider IA stesso. Ora non sono sicuro che sia accurato.

1 Mi Piace

Per concludere, c’era qualcosa che non andava in Gemini. La pagina delle quote è vuota e non mostra alcuna metrica rispetto alla chiave API.

La soluzione in breve è stata quella di eliminare la chiave API e rigenerarne una nuova. Ora posso vedere l’utilizzo delle metriche per la nuova chiave API/progetto e funziona correttamente. Grazie Falco.

2 Mi Piace

Ecco un feedback aggiuntivo. Una volta che la chiave ha smesso di funzionare, l’ho sostituita con una nuova chiave, ma le funzionalità AI non hanno funzionato, il BOT helper (Forum and Settings Explorer - nessuna risposta da entrambi ed errori nei log) non ha funzionato, il pulsante AI summarization è scomparso, ecc.

Ho provato a disabilitare/abilitare il modulo AI dalle impostazioni di amministrazione, fermare e avviare il container usando ./launcher stop app ma neanche questo ha aiutato. Ho dovuto riavviare l’intera macchina affinché le funzioni AI ricominciassero a funzionare.

EDIT: Sembra che impostare custom summarization allowed groups su Everyone disabiliti il pulsante AI Summarization per tutti (incluso lo staff) @JammyDodger

Sì, quel pseudo-gruppo everyone è un po’ complicato. Penso che ci siano piani per rimuoverlo da quel tipo di impostazioni presto per evitare di ingannare più persone. TL0 è il gruppo che funzionerebbe per questo.

TL0 non funziona per gli utenti che non hanno effettuato l’accesso. Quindi, se vogliamo consentire agli utenti anonimi di utilizzare l’opzione Riassumi AI, non funzionerà con TL0.

Penso che queste funzionalità siano attualmente riservate ai membri con accesso effettuato.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.