Discourse est prêt pour les agents : voici comment

Discourse · Mai 22, 2026, 3:12

L'audience des forums évolue. Certains de vos lecteurs ne sont plus réellement des lecteurs — du moins pas au sens traditionnel. Ce sont des agents qui lisent pour le compte de quelqu'un, résumant votre contenu en une réponse destinée à une personne qui ne cliquera peut-être jamais sur le lien ni ne deviendra un véritable membre. Que vous gériez une communauté de support pour développeurs, un forum client ou un club de fans, vos connaissances sont actuellement intégrées dans les réponses générées par l'IA.

Ceci est un sujet de discussion complémentaire à l'article original disponible sur https://blog.discourse.org/2026/05/discourse-is-agent-ready-heres-how/

eisammy · Mai 22, 2026, 1:20

Question sincère : pourquoi devrais-je laisser les robots d’exploration IA inonder mon serveur ? Bien sûr, l’article précise que le choix m’appartiendra toujours, mais, du point de vue commercial et en prenant Reddit comme exemple de la manière dont ils gèrent le scraping par IA, quels seraient les avantages ici ?

Récemment, j’ai vu que Google allait créer des pages personnalisées en fonction de l’historique de ses utilisateurs, c’est-à-dire moins de clics pour les webmasters et plus d’argent pour Alphabet. Alors, encore une fois, quel est l’intérêt ?

Actuellement, j’autorise les moteurs de recherche et les services de mise en cache comme Wayback Machine à lire et à mettre en cache mon contenu, bien que je ne puisse voir là-dedans que la fourniture du contenu de mes utilisateurs à des fins de monétisation par Alphabet et autres, sans que ma communauté n’en tire aucun bénéfice, sans compter les questions juridiques comme la LGPD dans mon pays ou le RGPD en Europe.

Lilly · Mai 22, 2026, 1:22

Cela ressemble à un texte rédigé par une IA pour des forums autres que Discourse :

C’est confus. Est-ce qu’un membre du personnel humain a relu ce texte ?

Canapin · Mai 22, 2026, 1:37

Merci pour cette lecture intéressante !

Sans doute l’une des meilleures fonctionnalités de Discourse.
Je frémis à chaque fois que je cherche une URL qui renvoie uniquement des données sur un autre site web, pour découvrir qu’il n’en existe aucune.

Ce serait formidable si vous pouviez toujours inclure des liens vers vos sources pour des affirmations de ce type. Cela aiderait les lecteurs à vérifier les données

awesomerobot · Mai 22, 2026, 1:52

Cela dépend de l’objectif de votre forum : s’il s’agit par exemple d’un forum de marque ou de support, votre but pourrait être de fournir une réponse aux utilisateurs aussi rapidement que possible. Si le contenu est intégré à l’entraînement de l’IA, cela pourrait s’avérer bénéfique. Espérons que, s’il s’agit vraiment d’un problème non résolu, les gens trouveront quand même votre site pour en parler, mais cela reste un défi s’ils se tournent d’abord vers l’IA.

Dans un contexte plus social, les scrapers d’IA sont presque totalement inutiles, car vous souhaitez que les membres de votre communauté interagissent entre eux. Ce pourrait être un bon cas de figure pour tenter de les bloquer complètement.

Orioni · Mai 22, 2026, 2:34

D’un point de vue professionnel, en travaillant avec l’IA et le référencement naturel (SEO), l’impact et l’importance de llms.txt n’ont pas encore été prouvés. Récemment, Google a déclaré ne pas l’utiliser ni le prendre en charge. Cela ne signifie pas que d’autres agents ne le feront pas. Mais c’est une nuance que je tenais à partager.

darkpixlz · Mai 22, 2026, 6:27

Honnêtement, je ne le fais pas. C’est mon opinion personnelle, mais les LLM ont toujours été interdits d’accès à mes sites web et le resteront. Je n’aime pas offrir gratuitement mon travail acharné, qu’il s’agisse de texte ou de code, aux scrapers, en particulier ceux d’OpenAI ou d’Anthropic.

La plupart de mes domaines contiennent des fichiers comme ceux-ci :
https://pyxfluff.dev/robots.txt
https://pyxfluff.dev/llms.txt

Bien sûr, tout cela relève simplement de préférences personnelles, mais cette folie actuelle autour de l’IA prendra fin dès que les gens cesseront de permettre à ces entreprises de voler le contenu de leurs sites web. Peut-être que la dernière mise à jour de Google, tant critiquée, remettra les propriétaires de sites web à l’ordre, car ils n’auront plus aucune visite sur leur site.

awesomerobot · Mai 22, 2026, 6:42

Malheureusement, il n’existe aucun moyen infaillible de bloquer les robots d’extraction des LLM si le contenu de votre site est accessible au public. Beaucoup d’entre eux ignorent le fichier robots.txt et tentent même de se faire passer pour des visiteurs humains (en utilisant différents agents utilisateur et adresses IP) pour contourner les blocages. Espérons qu’une réglementation juridique puisse établir des garde-fous dans cette situation, car il semble que beaucoup de gens souhaitent pouvoir choisir si leur contenu est utilisé de cette manière ou non !

ted · Mai 24, 2026, 12:21

Compte tenu du fait que les réglementations juridiques existantes, telles que les licences et le droit d’auteur, ont été totalement ignorées, je ne me fais pas trop d’illusions. Même si une entreprise comme Google se voit infliger une action de groupe et est condamnée à une amende de dizaines de milliards, cela reste une goutte d’eau par rapport aux centaines de milliards qu’elle a investis dans les LLM. La dynamique de la loi de puissance du « gagnant prend la majeure partie » rend le crime extrêmement rentable pour ces entreprises.

Eviepayne · Mai 24, 2026, 10:08

Je pense que l’ajout d’Anubis comme captcha pris en charge devrait accompagner cette mise à jour.

Sujet		Réponses	Vues
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	4840	Juillet 16, 2023
AI Citations - Does Discourse allow AI bot crawling? Support	10	253	Août 12, 2025
SEO for AI: How Community Content Wins in New Search Blog	6	632	Septembre 8, 2025
How do you use Discourse AI? Tell us and make it even better! Feature feedback , ai	20	2643	Mars 2, 2025
I populated my (mostly-dead) Discourse forum with bots! General show-and-tell	15	510	Mai 3, 2026

Discourse est prêt pour les agents : voici comment

Sujets connexes