Demande de fonctionnalité : filtre de "réponse insignifiante" par IA avec niveaux sélectionnables par l'utilisateur

Bonjour à tous,

J’aimerais proposer un filtre assisté par IA pour les réponses à faible signal / dénuées de sens (« réponses d’eau », commentaires génériques de spam) à l’intérieur des sujets.

Le problème

Dans de nombreuses communautés anglophones, les sujets sont souvent inondés de réponses courtes et peu élaborées comme :

  • « Merci / sympa / bon post »
  • « Je suis d’accord »
  • « Je suis » (pour suivre)
  • « Up » (pour remonter le sujet)
  • compliments génériques sans nouvelle information

Ces réponses ajoutent du bruit, augmentent le défilement et dégradent l’expérience de lecture pour tout le monde, surtout dans les longs fils de discussion.

Les modérateurs peuvent lutter contre cela avec des règles et des actions manuelles, mais cela ne s’adapte pas bien. Et le filtrage purement basé sur les expressions régulières (regex) a tendance à entraîner des taux de faux positifs élevés.

Ce que j’ai construit / prototype actuel

J’expérimente actuellement une approche de type plugin :

  1. Pré-filtre Regex pour intercepter les réponses courtes / évasives les plus évidentes
  2. Puis transmission des candidats restants à un LLM pour la classification
  3. L’interface utilisateur doit être transparente : afficher le nombre de réponses masquées
  4. Les réponses masquées doivent être consultables à la demande (« Afficher les réponses masquées »)
  5. (Optionnel) Pour le contenu masqué, exécuter une autre étape LLM pour extraire 2 à 3 phrases représentatives des réponses masquées, afin que les lecteurs puissent rapidement voir « ce qui a été masqué » sans tout développer.

Même avec uniquement les regex, l’expérience de lecture s’améliore considérablement (moins de défilement), mais le taux de faux positifs est trop élevé — je crois donc que le jugement basé sur un LLM est nécessaire.

Comportement produit proposé (côté utilisateur)

À l’intérieur de chaque sujet, les lecteurs verraient quelque chose comme :

  • « 12 réponses masquées (Filtre faible signal : Moyen) »
  • Boutons : Afficher les réponses masquées / Changer le niveau de filtre

Et proposer plusieurs niveaux, par exemple :

  • Désactivé : tout afficher
  • Faible : masquer les éléments évidents (précision très élevée)
  • Moyen : masquer les réponses courantes à faible signal
  • Élevé : filtrage agressif (l’utilisateur accepte)

Important :

  • Il doit s’agir d’une préférence par utilisateur (et peut-être aussi configurable par catégorie/par défaut du site).
  • Le système doit rester transparent et réversible : rien n’est « supprimé », seulement masqué par défaut.

Pourquoi cela convient à Discourse (surtout maintenant)

Discourse possède déjà plusieurs fonctionnalités liées à l’IA et l’écosystème Discourse AI est en croissance. Je pense qu’un « nettoyeur » de réponses dans le sujet est l’une des utilisations les plus pratiques et à fort impact des LLM pour l’expérience utilisateur de la communauté.

Ce n’est pas exactement de la « détection de spam » (qui est généralement au niveau du compte). Il s’agit davantage de la qualité de lecture au niveau du sujet.

Questions pour les mainteneurs / la communauté

  1. Discourse a-t-il déjà des plans pour un filtre de qualité des réponses / faible signal ?
  2. Serait-il logique de construire cela comme une extension de Discourse AI, ou comme un plugin séparé ?
  3. Quelle est la meilleure façon d’implémenter l’interface utilisateur/UX afin qu’elle soit transparente et ne confonde pas les utilisateurs ?
  4. Des préoccupations concernant la politique de modération, les niveaux de confiance ou les cas limites (par exemple, les réponses courtes mais utiles comme « Résolu », « +1 avec un lien », etc.) ?

Si cette direction semble pertinente, je suis heureux de partager plus de détails (règles regex, maquette UI, idées de prompts) et potentiellement de travailler sur une PR/un plugin.

Merci !


2 « J'aime »