Explorer les limites de l'IA dans la reconnaissance de contenu généré par l'IA

Vraiment ? Même pas OpenAI n’affirme que cela peut être fait.

3 « J'aime »

Bon appel, ce n’était qu’une option potentielle. Il y a eu de meilleurs modèles tels que GPT4-Turbo et Claude 3 depuis cet article de blog, qui pourraient théoriquement suggérer de meilleures performances.

1 « J'aime »

Ce n’était pas une critique de l’approche globale ici.

Utiliser un LLM pour rechercher des caractéristiques dans le texte qui pourraient suggérer qu’il s’agit de spam est un très bon objectif et j’accueille cette addition de tout cœur.

Mon seul problème concernait l’affirmation selon laquelle vous pouvez identifier automatiquement le texte généré par l’IA, ce qui est un problème très difficile.

Notez la distinction :

  1. Identifier le spam général avec un LLM = excellent et je vois comment cela pourrait être réalisable et très utile.
  2. Identifier que le spam a été généré par l’IA - avec ou sans l’utilisation d’un LLM, c’est difficile. Je ne pense pas que les modèles actuels soient capables de le faire spécifiquement bien et les positifs sont probablement juste des hallucinations.
3 « J'aime »

Je t’entends ! Oui, c’est un problème beaucoup plus nuancé. En fait, lors de mes tests initiaux, j’ai essayé de le configurer pour les deux, mais se concentrer uniquement sur le spam donne probablement de meilleurs résultats ici.

2 « J'aime »

Nous sommes donc d’accord.

Je pense cependant qu’il existe des signes révélateurs d’IA, comme la longueur des publications et l’utilisation excessive d’un langage exceptionnellement fleuri… donc peut-être que ces aspects peuvent être analysés… la longueur des publications est probablement difficile pour un LLM cependant, la « fleuri-té » pourrait être moins difficile. Vous pouvez utiliser des fonctions déterministes pour signaler la longueur des publications, bien sûr.

D’un autre côté, si quelqu’un a utilisé ChatGPT pour affiner par exemple son anglais (en tant que seconde langue), alors signaler sa publication n’est probablement pas utile à l’inclusion générale de la communauté.

En allant un peu plus loin, des techniques générales d’apprentissage automatique pourraient être utiles mais plus complexes à mettre en œuvre que de simplement envoyer du texte à un LLM et obtenir le résultat.

2 « J'aime »