Forums qui interdisent le contenu IA... Comment ça se passe ?

J’aimerais beaucoup connaître les retours d’expérience des équipes de forums qui interdisent le contenu généré par l’IA ou les LLM. Comment avez-vous réussi à faire comprendre cette règle aux utilisateurs ? Comment détectez-vous ces contenus ? Et comment abordez-vous les utilisateurs qui continuent à les poster malgré tout ?

Tous vos avis sont les bienvenus.

1 « J'aime »

La plupart, voire la totalité, des textes générés par l’IA se laissent facilement détecter à la simple lecture. La technologie SynthID de Google est intéressante pour détecter les images générées par l’IA et elle prétend pouvoir détecter le texte, probablement uniquement celui écrit par Gemini, mais OpenAI prend également en charge la norme. La capacité à détecter soi-même ce type de texte est probablement une compétence acquise, mais j’apprécie les travaux menés pour répondre à la crise actuelle que nous traversons, à savoir l’incapacité de détecter les images ou les textes générés par l’IA.

À mon avis, le silence (muting) et les suspensions restent la meilleure approche, surtout si le compte est récent. Si un nouveau compte arrive sur votre site et publie instantanément un sujet généré par l’IA, je ne vois aucune raison de ne pas simplement suspendre ce compte et de le bloquer.

En ce qui concerne le dilemme du scraping : mon site est actuellement destiné à la communication interne et à la documentation au sein d’une petite entreprise, et je prévois à terme de l’utiliser comme backend pour un blog. Il n’a pas été difficile de mettre en place un leurre (honeypot) pour dissuader les robots d’indexation qui choisissent d’ignorer les fichiers robots.txt de mes domaines.

Cette seule stratégie a entraîné quelque 6 MILLIONS de requêtes en l’espace de deux semaines (environ 6 requêtes/seconde vers le domaine) :

Chaque fois qu’un robot d’IA visite ce site, il est dirigé vers un labyrinthe infini de spam grâce au projet iocaine auto-hébergé, qui utilise un jeu de données d’environ 7 000 mots inventés, du HTML bidon, des mots aléatoires et des fausses nouvelles générées par un Llama 8B.

Évidemment, il s’agit d’une tactique nucléaire du type “dégagez”, qui ne convient pas à tout le monde, mais elle a été très efficace pour moi dans mon objectif d’empêcher les LLM de récupérer mon code ou mon contenu textuel. Je me souviens avoir lu une étude de cas réalisée par Anthropic sur l’empoisonnement des LLM, mais je ne retrouve plus l’article, donc je ne le joins pas ici. Cependant, il est certain qu’ils devront bientôt bloquer mon domaine lorsqu’ils réaliseront que leur bot a envoyé environ 5 millions de requêtes vers mon domaine récemment.

2 « J'aime »