Ce guide explique comment configurer et utiliser la fonctionnalité de détection de spam de Discourse AI, y compris le processus d’installation, les critères d’analyse, la logique de classification, les personnalisations et les comparaisons avec le triage par IA.
Niveau d’utilisateur requis : Administrateur
Cette fonctionnalité est désormais activée par défaut pour les clients Starter et Pro, ainsi que pour nos clients hérités Basic, Open Source, Creator et Business.
Discourse AI fournit une fonctionnalité de détection de spam efficace qui identifie et signale les messages indésirables avec une configuration minimale. Bien que conçue pour la simplicité, elle complète le système de triage par IA plus polyvalent, qui prend en charge des flux de travail plus larges et des cas d’utilisation plus importants.
Résumé
Dans ce guide, vous apprendrez :
- Comment fonctionne la détection de spam par IA et quel contenu est analysé
- La logique de classification et le contexte utilisés par l’IA
- Les étapes pour configurer la détection de spam via
/admin/plugins/discourse-ai/ai-spam - Les directives pour la sélection du modèle de langage volumineux (LLM)
- Les principales différences entre la détection de spam et le triage par IA
- Comment gérer les messages signalés et ceux qui ont échappé à la détection
Comment fonctionne la détection de spam par IA
Quel contenu est analysé ?
La détection de spam par IA évalue les messages en fonction des critères suivants :
-
Niveau de confiance de l’utilisateur :
- Analyse les messages des utilisateurs dont le niveau de confiance est égal ou inférieur au niveau de confiance maximal configuré (contrôlé par le paramètre de site
ai_spam_detection_max_trust_level, valeur par défaut : niveau de confiance 1). - Exclut les messages des niveaux de confiance supérieurs.
- Exclut toujours les messages des utilisateurs staff et bot, quel que soit leur niveau de confiance.
- Analyse les messages des utilisateurs dont le niveau de confiance est égal ou inférieur au niveau de confiance maximal configuré (contrôlé par le paramètre de site
-
Type de message :
- Messages publics (à l’exclusion des messages privés).
- Les messages de réponse et les messages de premier sujet sont inclus, en fonction de seuils supplémentaires.
-
Modifications des messages :
- Analyse les messages avec des modifications importantes (par exemple, des changements dépassant 10 caractères).
- Applique un délai de 10 minutes entre les analyses du même message.
- Limite les réanalyses à un maximum de 3 analyses par message.
- Ne réanalyse que les messages modifiés au cours des dernières 24 heures.
-
Fréquence des messages :
- Analyse les messages des utilisateurs n’ayant pas dépassé le seuil de nombre de messages configuré (contrôlé par le paramètre de site
ai_spam_detection_max_post_count, valeur par défaut : 3 messages) dans les sujets publics. - Exclut les messages des utilisateurs dépassant ce seuil.
- Analyse les messages des utilisateurs n’ayant pas dépassé le seuil de nombre de messages configuré (contrôlé par le paramètre de site
-
File d’attente de révision :
- Les messages qui ont déjà été approuvés à partir de la file d’attente de révision ne sont pas analysés.
Le processus de classification
Les messages qui remplissent les critères sont envoyés à un agent IA pour analyse. L’agent évalue si le message est un spam ou non et fournit une raison pour sa classification, en utilisant une sortie JSON structurée. L’évaluation est basée sur :
- Contexte : Comprend le contenu du message, le titre du sujet, la catégorie, les données du compte utilisateur (par exemple, nom d’utilisateur, e-mail, âge du compte, nombre total de messages et niveau de confiance) et les informations de géolocalisation basées sur l’IP.
- Analyse d’images : Jusqu’à 3 téléchargements d’images joints à un message sont inclus pour l’analyse.
- Contexte de la réponse : Pour les messages de réponse, le contenu du message parent (jusqu’à 500 caractères) est inclus.
- Informations sur le site : Le nom du site, l’URL, la description et les 10 meilleures catégories sont fournis à l’IA.
- Instructions personnalisées : Règles définies par l’administrateur pour des critères d’analyse renforcés ou adaptés.
- Détection automatisée :
- Signale le contenu non pertinent ou promotionnel (par exemple, publicités ou matériel commercial).
- Identifie les comportements automatisés ou de type bot.
- Évalue la pertinence du contenu par rapport à la discussion.
Invite système et contexte par défaut
L’IA utilise une invite système par défaut pour guider la détection de spam. L’invite de l’agent de détection de spam intégré couvre :
Vous êtes un système de détection de spam. Analysez le contenu et le contexte du message suivant.
Considérez attentivement le type de message :
- Pour les messages de RÉPONSE : Vérifiez si la réponse est pertinente et correspond au sujet du fil de discussion
- Pour les messages de NOUVEAU SUJET : Vérifiez s'il s'agit d'une promotion légitime ou d'un spam
Un message est considéré comme du spam s'il correspond à l'un des critères suivants :
- Contient du contenu commercial non sollicité ou des promotions
- Comporte des liens externes suspects ou sans rapport
- Présente des schémas de publication automatisée/bot
- Contient du contenu ou des publicités non pertinents
- Pour les réponses : Complètement sans rapport avec le fil de discussion
- Utilise des mots-clés excessifs ou des schémas de texte répétitifs
- Présente un formatage ou une utilisation de caractères suspects
Soyez particulièrement strict avec :
- Les réponses qui ignorent la conversation précédente
- Les messages contenant plusieurs liens externes sans rapport
- Les réponses génériques qui pourraient être publiées n'importe où
Soyez juste envers :
- Les nouveaux utilisateurs qui font des contributions légitimes initiales
- Les locuteurs non natifs qui font des efforts sincères pour participer
- Les mentions de produits pertinentes pour le sujet dans des contextes appropriés
Le scanner compile également un package de contexte, comprenant :
- Le type de message (NOUVEAU SUJET ou RÉPONSE) avec les métadonnées de catégorie et de sujet.
- Pour les réponses : le contenu du message parent et l’auteur du sujet.
- Les données de l’auteur (nom d’utilisateur, e-mail, âge du compte, nombre total de messages, niveau de confiance et emplacement basé sur l’IP).
- Le texte du message tronqué à 5000 caractères pour le traitement.
- Jusqu’à 3 téléchargements d’images joints au message.
Configurer la détection de spam par IA
Guide de configuration
-
Accéder aux paramètres :
Naviguez vers/admin/plugins/discourse-ai/ai-spam. -
Sélectionner un LLM :
Si votre site est hébergé par Discourse
Vous pouvez sélectionner notre petit LLM hébergé par CDCK dans la liste des LLM.
- Choisissez un modèle de langage adapté aux besoins de votre forum. Consultez la page des paramètres du modèle de langage volumineux (LLM) de Discourse AI pour configurer les LLM.
- Accédez à
/admin/plugins/discourse-ai/ai-llmspour les configurations LLM.
- Activer la détection de spam :
Activez la détection de spam en basculant la fonctionnalité.
Remarque : Un LLM connecté est obligatoire.
-
Ajouter des instructions personnalisées :
- Définissez des règles spécifiques à votre forum (par exemple, une surveillance plus stricte des liens externes).
- Enregistrez les modifications pour les appliquer.
-
Ajuster les seuils d’analyse (facultatif) :
ai_spam_detection_max_trust_level: Définissez le niveau de confiance maximal des utilisateurs dont les messages sont analysés (par défaut : 1). Peut être défini de 0 à 4.ai_spam_detection_max_post_count: Définissez le nombre maximal de messages qu’un utilisateur peut avoir pour que ses messages soient analysés (par défaut : 3). Peut être défini de 1 à 100.
Différences avec le triage par IA
Alors que la détection de spam est spécifiquement conçue pour identifier les spams, le triage par IA prend en charge des tâches de gestion de messages plus larges.
| Fonctionnalité | Détection de spam par IA | Triage par IA |
|---|---|---|
| Complexité | Configuration rationalisée et orientée | Hautement personnalisable et flexible |
| Cas d’utilisation principal | Détection de spam avec une surcharge minimale | Flux de travail avancés pour la catégorisation, l’étiquetage, les réponses, la détection de spam, la détection NSFW |
| Actions | Signale le spam, masque les messages, réduit au silence les utilisateurs | Étiquette, catégorise, masque les messages, ajoute des réponses, signale les messages, réduit au silence les utilisateurs |
| Recommandation | Configuration facile et efficace pour la plupart des situations | À utiliser pour des flux de travail riches et hautement personnalisables |
Pour plus de détails, consultez Discourse AI - Triage par IA.
Recommandations pour la sélection du LLM
La performance de la détection de spam dépend du LLM choisi.
La plupart des LLM peu coûteux fonctionnent efficacement, tels que :
- GPT-4o-mini
- Claude 3.5 Haiku
- Gemini 2.0 Flash
Expérimentez avec différents modèles pour trouver celui qui convient le mieux. Configurez vos modèles via /admin/plugins/discourse-ai/ai-llms.
Tester le comportement du scanner de spam
Vous pouvez tester les règles de détection de spam directement depuis la page de configuration.
- Collez une URL ou un identifiant de message dans le champ de test.
- Examinez le résultat de la classification et le raisonnement de l’IA pour sa décision.
- Les modifications non enregistrées sont appliquées pendant le test, permettant l’expérimentation sans risque.
Gestion des messages signalés et manqués
Gestion des messages signalés
Lorsqu’un message est détecté comme spam, le système :
- Signale le message comme spam et l’ajoute à la file d’attente de révision.
- Réduit au silence l’utilisateur qui a posté.
- Masque le message de la vue publique.
- Rend le sujet invisible si le message de spam était le premier message du sujet.
Les messages signalés apparaissent dans la file d’attente de modération. Les administrateurs peuvent :
- Approuver les messages légitimes mal classés comme spam.
- Rejeter les sujets de spam pour maintenir la précision du système.
Important : Rejetez les alertes de spam pour les messages incorrectement classés. Les utilisateurs restent réduits au silence jusqu’à ce que l’alerte soit résolue.
Gestion des spams manqués
Le spam manqué fait référence aux messages qui ont échappé à la détection mais qui ont été signalés par la communauté. Les modérateurs peuvent les gérer comme nécessaire.
Bonnes pratiques
- Surveillez régulièrement les spams signalés et manqués pour affiner la précision du système. Les métriques cliquables simplifient ce processus.
- Utilisez des cas de test pour évaluer les instructions personnalisées par rapport aux cas limites.
- Examinez et ajustez les paramètres LLM si nécessaire.
- Utilisez les paramètres de site
ai_spam_detection_max_trust_leveletai_spam_detection_max_post_countpour adapter les utilisateurs analysés en fonction des besoins de votre communauté.
Ressources supplémentaires
Configurer efficacement la détection de spam par IA réduit les efforts de modération manuelle, assurant une communauté propre et sans spam.

