Discourse Chatbot đŸ€–

Une PR est ouverte pour ajouter GPT-5, mais quelque chose ne fonctionne pas correctement pendant la CI.

J’ai ouvert un sujet Dev à ce sujet.

A été fusionné.

Si vous trouvez le raisonnement de GPT-5 trop lent, vous pouvez changer le niveau de raisonnement. Il y a maintenant un nouveau niveau minimal.

Merci Ă  @NateDhaliwal pour son aide sur ce point !

2 « J'aime »

Notre bot expirait jusqu’à ce que nous ayons dĂ©fini le raisonnement sur minimal. Merci !

1 « J'aime »

Pour ĂȘtre honnĂȘte, je trouve que GPT-5 est gĂ©nĂ©ralement trop lent et ne vaut manifestement pas le temps de rĂ©ponse supplĂ©mentaire.

Comment l’avez-vous trouvĂ© pour votre bot de support ?

J’ai essayĂ© gpt-5 via Chat GPT, ce qui est trĂšs diffĂ©rent de via l’API, et il lui faut ce long temps de raisonnement pour donner des rĂ©ponses lĂ©gĂšrement meilleures que ce que 4o ou o1 donneraient. Quand il doit rĂ©pondre rapidement, il n’est pas meilleur que 4.1.

Je suis tout Ă  fait sĂ»r que la situation est similaire, voire pire, en raison du manque d’outils et de requĂȘtes, lors de l’utilisation de l’API. Mais je ne sais pas avec certitude, car gpt-5 est douloureusement lent et dans un environnement de forum, il doit rĂ©pondre Ă  la vitesse de la lumiĂšre.

1 « J'aime »

En termes de performance du contenu, de maniĂšre anecdotique, il semble que gpt-5 donne des rĂ©ponses techniques sensiblement meilleures que gpt-4o. Je ne suis pas sĂ»r de la maniĂšre de quantifier cela, mais cela m’a vraiment impressionnĂ©.

J’obtiens des rĂ©sultats variables quant au temps de rĂ©ponse. Il semble, d’aprĂšs mes expĂ©riences de ce matin, que gpt-5 soit plus lent en moyenne, mais pas trop, et il y a eu des cas oĂč la rĂ©ponse est arrivĂ©e plus rapidement avec gpt-5. Je mesure entre 5 secondes et 35 secondes pour une rĂ©ponse.

Nous utilisons RAG et je ne peux pas dire quelle partie de la latence provient de la recherche RAG par rapport à l’achùvement du chat. Il se peut que parfois il choisisse de ne pas effectuer de recherche RAG, que la recherche soit plus rapide, ou que quelque chose soit mis en cache (dans la recherche ou l’achùvement).

Nous choisirions gĂ©nĂ©ralement de meilleures rĂ©ponses plutĂŽt qu’une rĂ©ponse plus rapide, car donner de mauvais conseils techniques aux clients coĂ»te cher. Jusqu’à un certain point cependant, si cela expire, c’est une trĂšs mauvaise expĂ©rience utilisateur.

GPT-5 recommande principalement gpt-5-mini pour notre cas d’utilisation, et d’escalader vers gpt-5 dans certaines circonstances. Cela semble intĂ©ressant mais compliquĂ©. Avez-vous envisagĂ© de passer dynamiquement d’un modĂšle Ă  l’autre ? Pourquoi OpenAI ne le fait-il pas automatiquement ? ChatGPT - Compare GPT models performance

1 « J'aime »

Nous avons dĂ» revenir Ă  gpt-4o car apparemment gpt-5-mini pense pouvoir faire des choses qu’il ne peut pas faire. Il a proposĂ© avec assurance de configurer un service de surveillance d’alarme pour un client et de le connecter Ă  son Ă©quipement d’alarme domestique. Il leur a demandĂ© des numĂ©ros d’identification d’équipement et a hallucinĂ© comme s’il s’agissait d’un concierge qui mettait tout en place pour eux. Notre site web peut le faire, mais le chatbot ne le peut pas. Il ne semble pas respecter les garde-fous du prompt systĂšme comme le faisait gpt-4o. Nous devrons le renforcer avant de pouvoir le laisser utiliser par les gens.

Mise Ă  jour : Il s’avĂšre que gpt-5 est bien meilleur pour suivre les instructions et respecter les rĂšgles du prompt que gpt-5-mini. Si vous allez laisser un bot reprĂ©senter votre marque, je recommande gpt-5 mĂȘme s’il est plus lent et 5 fois plus cher. Il y a trop de risques que gpt-5-mini dĂ©raille.

1 « J'aime »

J’ai eu beaucoup de chance avec GTP-5-mini dans les flux agentiques via l’appel d’outils, l’écriture de code et les donnĂ©es structurĂ©es. Je trouve gĂ©nĂ©ralement que les donnĂ©es structurĂ©es sont plus faciles pour les applications d’IA que les donnĂ©es non structurĂ©es !.. ce Ă  quoi je ne m’attendais pas ! mais les garde-fous sont plus faciles
 (code-en-boucle, humain-en-boucle, llm-comme-juge, etc.)

veuillez regarder ceci pour une analyse détaillée des performances élevées et à faible coût de gpt-5-mini et gpt-4o


Si quelqu’un est intĂ©ressĂ© Ă  intĂ©grer des capacitĂ©s de donnĂ©es structurĂ©es dans Discourse sous forme de plugin, etc., veuillez me contacter.

Une extension NLP pour sql/stats/datascience pour Data Explorer en est un exemple
 Mais il pourrait Ă©galement y avoir un outil/plugin/fonctionnalitĂ© qui permet des requĂȘtes en langage naturel sur des fichiers olap sqlLite ou duckdb en lecture seule chargĂ©s dans le conteneur ? juste une pensĂ©e.. :thinking:

Au fait, j’ai ajoutĂ© GPT 5.1 au plugin ainsi que quelques corrections :

1 « J'aime »

@tom_eric vous avez posĂ© des questions sur la possibilitĂ© de jouer Ă  des jeux avec d’autres membres du forum sur un autre sujet.

J’ai essayĂ© cette invite avec Chatbot et il semble que cela fonctionne avec GPT 5.1, essayez-le :

@Chatbot facilite une partie de Go 9x9 avec @Other_Player et moi en utilisant un tableau markdown pour afficher le plateau - laissez-moi commencer et n’acceptez les coups que de moi et de @Other_Player et seulement quand c’est notre tour - affichez le plateau et demandez-moi de commencer


1 « J'aime »

Oh, merci. C’est une idĂ©e vraiment crĂ©ative. Oh, merci. C’est une idĂ©e vraiment crĂ©ative.

1 « J'aime »

De rien, fais-moi savoir comment ça se passe :+1: