La résumé IA ne fonctionne pas après la mise à niveau vers 3.3.0 beta1

@falco, je continue ceci depuis le dernier sujet car il s’est fermé automatiquement. Malheureusement, après la mise à niveau vers la version bêta 3.3.0, la résumé par IA a complètement cessé de fonctionner, c’est-à-dire que le bouton pour résumer a complètement disparu. Je ne vois que les boutons sur les sujets qui ont été précédemment résumés par IA, mais plus sur aucun nouveau sujet (j’ai vérifié le seuil de résumé de sujet).

Lorsque je regarde les journaux, je vois cette erreur, elle est nouvelle et n’était pas là auparavant :

Message

DiscourseAi::Completions::Endpoints::Gemini: status: 429 - body: {
  "error": {
    "code": 429,
    "message": "Quota exceeded for quota metric 'Generate Content API requests per minute' and limit 'GenerateContent request limit per minute for a region' of service 'generativelanguage.googleapis.com' for consumer 'project_number:184805424415'.",
    "status": "RESOURCE_EXHAUSTED",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.ErrorInfo",
        "reason": "RATE_LIMIT_EXCEEDED",
        "domain": "googleapis.com",
        "metadata": {
          "quota_limit_value": "0",
          "quota_location": "us-east2",
          "quota_metric": "generativelanguage.googleapis.com/generate_content_requests",
          "service": "generativelanguage.googleapis.com",
          "quota_limit": "GenerateContentRequestsPerMinutePerProjectPerRegion",
          "consumer": "projects/184805424415"
        }
      },
      {
        "@type": "type.googleapis.com/google.rpc.Help",
        "links": [
          {
            "description": "Request a higher quota limit.",
            "url": "https://cloud.google.com/docs/quota#requesting_higher_quota"
          }
        ]
      }
    ]
  }
}


Backtrace

/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:93:in `block (2 levels) in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2353:in `block in transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http/response.rb:320:in `reading_body'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2352:in `transport_request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:2306:in `request'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:19:in `block in request_with_mini_profiler'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/mini_profiler/profiling_methods.rb:50:in `step'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-mini-profiler-3.3.1/lib/patches/net_patches.rb:18:in `request_with_mini_profiler'
/var/www/discourse/plugins/discourse-ai/lib/completions/endpoints/base.rb:91:in `block in perform_completion!'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/net-http-0.4.1/lib/net/http.rb:1570:in `start'

Env

HTTP HOSTS: xxx.com

Ceci est également défini sur 50 : "Net::HTTPBadResponse" errors on Gemini Embeddings - #2 by Falco

Y a-t-il quelque chose que je puisse fournir pour comprendre ce qui se passe ?

On dirait une erreur très bien décrite, ils vous ont même donné un endroit pour demander une augmentation de quota.

1 « J'aime »

Ma question est donc pourquoi est-ce que je rencontre une erreur de limite de débit alors que j’ai défini la limite à 50 requêtes par minute (Gemini a une limite de 60 par minute) en utilisant les instructions que vous aviez fournies précédemment ?

Cela limitera les appels automatiques en arrière-plan, mais vous devez y ajouter les appels initiés par l’utilisateur. Pour plus d’informations, consultez les journaux sur GCP.

1 « J'aime »

Merci. Pour l’instant, j’essaie de limiter l’accès à l’IA au personnel uniquement. J’ai vérifié tous les paramètres de l’IA et limité les niveaux de confiance au personnel lorsque cela était possible.

Je suppose qu’il existe certains modules qui n’ont pas de limites de confiance (Recherche ? Synthèse ?). Les robots d’exploration ou les utilisateurs non connectés peuvent-ils invoquer ces fonctionnalités d’IA ? C’est un petit site, donc je sais que ce ne sont pas les utilisateurs connectés qui utilisent les API.

De plus, je ne comprends pas pourquoi le bouton “Synthétiser avec l’IA” a disparu et comment le faire réapparaître. Toute information à ce sujet serait appréciée.

Pour information, les groupes qui peuvent utiliser l’IA pour résumer des sujets sont contrôlés par custom summarization allowed groups (groupes autorisés pour la synthèse personnalisée). Vous pourriez vérifier ce paramètre et voir si vous y trouvez les groupes que vous attendez ?

Je pense que pour la recherche sémantique, la puissance de l’IA réside dans la création des embeddings, donc une fois que c’est fait, les gens peuvent utiliser la recherche IA sans appels supplémentaires au fournisseur d’IA lui-même. Maintenant, je ne suis pas sûr que ce soit exact.

1 « J'aime »

Pour conclure, il y avait un problème avec Gemini. La page des quotas est vide et n’affiche aucune métrique pour la clé API.

La solution en bref a été de supprimer la clé API et d’en régénérer une nouvelle. Maintenant, je peux voir l’utilisation des métriques pour la nouvelle clé API/projet et cela fonctionne bien. Merci Falco.

2 « J'aime »

Voici quelques commentaires supplémentaires. Une fois que la clé a cessé de fonctionner, je l’ai remplacée par une nouvelle clé, mais les fonctionnalités d’IA n’ont pas fonctionné, l’assistant BOT (Forum et Explorateur de paramètres - aucune réponse de l’un ou l’autre et erreurs dans les journaux) n’a pas fonctionné, le bouton de résumé d’IA a disparu, etc.

J’ai essayé de désactiver/activer le module d’IA dans les paramètres d’administration, d’arrêter et de démarrer le conteneur en utilisant ./launcher stop app, mais cela n’a pas non plus aidé. J’ai dû redémarrer toute la machine pour que les fonctions d’IA recommencent à fonctionner.

EDIT : Il semble que la définition de custom summarization allowed groups sur Everyone désactive le bouton de résumé d’IA pour tout le monde (y compris le personnel) @JammyDodger

Oui, ce pseudo-groupe everyone est délicat. Je pense qu’il est prévu de le supprimer bientôt de ce type de paramètres pour éviter de tromper davantage de personnes. TL0 est le groupe qui fonctionnerait pour cela.

TL0 ne fonctionne pas pour les utilisateurs qui ne sont pas connectés. Donc, si nous voulons permettre aux utilisateurs anonymes d’utiliser l’option Résumer avec IA, cela ne fonctionnera pas avec TL0.

Je pense que ces fonctionnalités sont actuellement réservées aux membres connectés.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.