Commentaires sur la synthèse par IA

Feedback sur le résumé. Cela semble très prometteur :pray:

:point_up: la fenêtre contextuelle n’est pas assez large

  • Ce serait bien d’offrir des options sur la longueur du résumé. Il semble que cela vise un nombre de mots de 150 à 200, ce qui n’est pas beaucoup pour certains sujets.
  • J’aimerais pouvoir personnaliser l’invite. Par exemple, je privilégierais les puces.
  • J’aimerais expérimenter avec une invite qui cite qui dit quoi et référence les publications.
  • Je découplerais le résumé avec le paramètre minimum de publication de l’IA de celui général. Le résumé avec l’IA est probablement utile avec moins de publications.

Notez que gpt-3.5 dispose désormais d’une version avec une limite de 16k tokens, ce qui pourrait être très pertinent ici.

Et maintenant, les 2 fonctionnalités clés que j’aimerais voir :

  • résumés quotidiens avec la fonction de résumé par IA
  • résumés lorsque je survole le sujet (par exemple, pré-calculés)
4 « J'aime »

Nous utilisons actuellement une invite simpliste (lorsque OpenAI ou Anthropic sont sélectionnés), mais nous la modifierons très bientôt car nous y travaillons.

La personnalisation est une fonctionnalité intéressante, nous pourrions l’ajouter à l’avenir.

Nous venons de faire en sorte qu’il s’affiche pour les publications ayant au moins une réponse cette semaine.

Nous avons ajouté les modèles à grand contexte d’OpenAI le jour de leur sortie. Actuellement, vous pouvez choisir :

  • GPT 3.5 Turbo avec 16k
  • GPT 4 avec 32k
  • Claude avec 100k

Des travaux sont en cours pour mettre en cache les résumés générés afin qu’ils puissent être utilisés ailleurs, ce qui débloque des fonctionnalités comme celles-ci.

7 « J'aime »

Je ne vois pas cela sur mon site, y a-t-il un paramètre qui le contrôle ?

Plus de suggestions :

  • afficher le bouton résumer avec l’IA dans le pipeline.
  • avoir un moyen de remplacer le résumé normal par le résumé avec l’IA
  • Permettre de pointer les modèles GPT vers Azure. Nous avons observé des latences considérablement améliorées dans mon entreprise.
2 « J'aime »

C’est un changement que nous venons de faire cette semaine, il sera donc déployé sur votre site dans les prochains jours.

Qu’est-ce que le « pipeline » signifie ici ?

Comme vous pouvez le voir ici sur Meta, nous l’avons déjà fait. L’ancien résumé s’appelle maintenant « Afficher les meilleures réponses ». Nous travaillons encore sur la conception et l’ordre des boutons.

C’est dans notre feuille de route !

6 « J'aime »

Désolé pour le manque de clarté, je n’ai aucune idée pourquoi j’ai choisi ce mot :facepalm:

Je voulais dire ici

1 « J'aime »

Ceci est fait par :

C’est assez pénible à configurer car il faut créer un tas de déploiements, mais cela fonctionne bien.

1 « J'aime »

MODIFIÉ

En utilisant Gemini 1.5 Flash, les résumés contiennent souvent des liens vers plusieurs publications, mais les liens multiples ne sont pas rendus comme des liens. Je ne me souviens pas avoir vu d’autres modèles essayer d’utiliser plusieurs liens.

Les liens vers des publications uniques sont correctement rendus.

La charge utile de réponse correspondante inclut ce texte :
[Username redacted](/t/-/56915/8, /t/-/56915/13, /t/-/56915/28, /t/-/56915/33, /t/-/56915/36)

J’aime beaucoup l’idée de citer plusieurs liens, s’ils pouvaient être correctement rendus.

Eh bien, c’est tout simplement du markdown invalide, c’est pourquoi ça ne fonctionne pas.

C’est dommage que Gemini Flash ne puisse pas produire de markdown valide, ici sur Meta, nous utilisons Llama 3.1 quantifié en FP8 pour les résumés, et il peut gérer la production de liens markdown corrects sans problème.

2 « J'aime »

Et que haiku ne puisse apparemment pas renvoyer de code d’état valide. Ce sont les deux que j’ai essayés pour la résumé jusqu’à présent. J’essaierai Llama 3.1 ensuite.

Je ne sais pas si vous envisageriez de corriger les problèmes connus, comme la vérification des lundis et de ce markdown particulier. Je réalise que ce n’est pas idéal, mais ce serait peut-être mieux que de perdre d’autres bonnes options d’IA génératives.

Pouvez-vous voir des résumés invalides sur https://discuss.ai.google.dev/ ?

Nous utilisons Flash là-bas, si vous pouvez m’en indiquer quelques-uns, je serais heureux de faire un peu d’ingénierie de prompt.

C’est le seul que je vois en tête, mais ces sujets sont courts, donc un seul utilisateur ne serait généralement pas cité plusieurs fois.

1 « J'aime »

Cela semble tout à fait réparable car nous pouvons améliorer notre exemple ici, pour le moment, l’invite est :

Vous êtes un bot de résumé avancé qui génère des résumés concis et cohérents du texte fourni.\n\n- N'incluez que le résumé, sans aucun commentaire supplémentaire.\n- Vous comprenez et générez le Markdown des forums Discourse ; y compris les liens, _les italiques_, **les gras**.\n- Maintenez la langue d'origine du texte résumé.\n- Visez des résumés de 400 mots ou moins.\n- Chaque publication est formatée comme « \u003cNUMÉRO_DE_PUBLICATION\u003e \u003cNOM_D_UTILISATEUR\u003e \u003cMESSAGE\u003e »\n- Citez les publications notables spécifiques en utilisant le format [NOM](/t/-/31793/NUMÉRO_DE_PUBLICATION)\n - Exemple : lien vers la 3ème publication de sam : [sam](/t/-/31793/3)\n - Exemple : lien vers la 6ème publication de jane : [d'accord avec](/t/-/31793/6)\n - Exemple : lien vers la 13ème publication de joe : [#13](/t/-/31793/13)\n- Lors du formatage des noms d'utilisateur, utilisez @NOM_D_UTILISATEUR OU [NOM_D_UTILISATEUR](/t/-/31793/NUMÉRO_DE_PUBLICATION)

Cela semble un peu ambigu. Nous pouvons le baser sur quelque chose comme ceci :

Fondamentalement, @Roman / @Falco, nous devrons expulser ces invites du code source et peut-être les mettre dans un persona afin que les communautés puissent les ajuster et partager ce qui fonctionne mieux.

Je ne serais pas surpris si, à long terme, nous avions besoin d’invites spécifiques pour les modèles les plus faibles.

Un persona fonctionnerait très bien ici si nous avions un support pour les « exemples », ce qui ne semble pas être une énorme contrainte. Soit cela, soit nous le déplaçons vers CompletionPrompt et lui donnons une interface utilisateur.

5 « J'aime »

J’aime l’idée de personnaliser l’invite pour répondre à vos besoins et tirer parti des capacités du modèle. Je pense également que transformer les personas en un concept plus indépendant des fonctionnalités est une bonne idée.

1 « J'aime »

C’est essentiellement l’idée des « fonctions de persona », des « instructions préparées » dont nous avons discuté cette année. Nous déplacerions tout, comme l’assistant IA, le résumé, la recherche, etc., pour les utiliser, permettre la création de personnalisés et avoir une interface utilisateur pour les associer aux fonctionnalités de l’interface utilisateur.

Cela devient délicat lorsque nous mettons à jour ceux qui sont pré-remplis pour expédier un format différent, par exemple XML vers JSON, donc j’espère que c’est quelque chose que nous pourrons envisager de construire l’année prochaine.

1 « J'aime »

Je ne suis pas tout à fait les derniers messages. J’obtiens toujours des résumés invalides. Y a-t-il quelque chose de spécifique que je puisse essayer avec les personas, ou dois-je attendre le refactoring dont vous discutez ?

4 messages ont été déplacées vers un nouveau sujet : Gestion des problèmes de format de réponse JSON de DeepSeek