Dieser Leitfaden erklärt, wie die Spam-Erkennungsfunktion von Discourse AI konfiguriert und verwendet wird, einschließlich des Einrichtungsprozesses, der Scan-Kriterien, der Klassifizierungslogik, der Anpassungen und des Vergleichs mit der KI-Triage.
Erforderliches Benutzerniveau: Administrator
Dies ist jetzt standardmäßig für Starter- und Pro-Kunden aktiviert, ebenso wie für unsere bestehenden Basic-, Open-Source-, Creator- und Business-Kunden.
Discourse AI bietet eine effiziente Spam-Erkennungsfunktion, die Spam-Beiträge mit minimaler Konfiguration identifiziert und kennzeichnet. Obwohl sie auf Einfachheit ausgelegt ist, ergänzt sie das vielseitigere KI-Triage-System, das breitere Workflows und größere Anwendungsfälle unterstützt.
Zusammenfassung
In diesem Leitfaden erfahren Sie:
- Wie die KI-Spam-Erkennung funktioniert und welche Inhalte gescannt werden
- Die Klassifizierungslogik und der Kontext, die von der KI verwendet werden
- Schritte zur Konfiguration der Spam-Erkennung über
/admin/plugins/discourse-ai/ai-spam - Richtlinien für die Auswahl von Large Language Models (LLMs)
- Hauptunterschiede zwischen Spam-Erkennung und KI-Triage
- Wie man gekennzeichnete und übersehene Beiträge verwaltet
Funktionsweise der KI-Spam-Erkennung
Welche Inhalte werden gescannt?
Die KI-Spam-Erkennung bewertet Beiträge anhand dieser Kriterien:
-
Benutzervertrauensstufe:
- Scannt Beiträge von Benutzern mit einer Vertrauensstufe, die der konfigurierten maximalen Vertrauensstufe entspricht oder darunter liegt (gesteuert durch die Site-Einstellung
ai_spam_detection_max_trust_level, Standard: Vertrauensstufe 1). - Schließt Beiträge von höheren Vertrauensstufen aus.
- Schließt Beiträge von Mitarbeiter- und Bot-Benutzern unabhängig von der Vertrauensstufe immer aus.
- Scannt Beiträge von Benutzern mit einer Vertrauensstufe, die der konfigurierten maximalen Vertrauensstufe entspricht oder darunter liegt (gesteuert durch die Site-Einstellung
-
Beitragsart:
- Öffentliche Beiträge (ausgenommen private Nachrichten).
- Sowohl Antwortbeiträge als auch erste Themeneröffnungen werden basierend auf zusätzlichen Schwellenwerten einbezogen.
-
Beitragsbearbeitungen:
- Scannt Beiträge mit signifikanten Bearbeitungen (z. B. Änderungen, die 10 Zeichen überschreiten).
- Erzwingt eine Verzögerung von 10 Minuten zwischen Scans desselben Beitrags.
- Beschränkt Nachscans auf maximal 3 Scans pro Beitrag.
- Scannt nur Beiträge erneut, die innerhalb der letzten 24 Stunden bearbeitet wurden.
-
Beitragsfrequenz:
- Scannt Beiträge von Benutzern, die in öffentlichen Themen nicht mehr als die konfigurierte Beitragsschwellenwertanzahl aufweisen (gesteuert durch die Site-Einstellung
ai_spam_detection_max_post_count, Standard: 3 Beiträge). - Schließt Beiträge von Benutzern aus, die diesen Schwellenwert überschreiten.
- Scannt Beiträge von Benutzern, die in öffentlichen Themen nicht mehr als die konfigurierte Beitragsschwellenwertanzahl aufweisen (gesteuert durch die Site-Einstellung
-
Überprüfungswarteschlange:
- Beiträge, die bereits aus der Überprüfungswarteschlange genehmigt wurden, werden nicht gescannt.
Der Klassifizierungsprozess
Kriterien erfüllende Beiträge werden zur Analyse an einen KI-Agenten gesendet. Der Agent bewertet, ob der Beitrag Spam ist oder nicht, und liefert einen Grund für seine Klassifizierung in Form einer strukturierten JSON-Ausgabe. Die Bewertung basiert auf:
- Kontext: Enthält den Beitragsinhalt, den Themeneintitel, die Kategorie, Benutzerkontodaten (z. B. Benutzername, E-Mail, Kontenalter, Gesamtbeiträge und Vertrauensstufe) sowie IP-basierte Geolokalisierungsinformationen.
- Bildanalyse: Bis zu 3 hochgeladene Bilder, die an einem Beitrag angehängt sind, werden zur Analyse einbezogen.
- Antwortkontext: Bei Antwortbeiträgen wird der Inhalt des übergeordneten Beitrags (bis zu 500 Zeichen) einbezogen.
- Seiteninformationen: Der Seitenname, die URL, die Beschreibung und die Top-10-Kategorien werden der KI zur Verfügung gestellt.
- Benutzerdefinierte Anweisungen: Vom Administrator definierte Regeln für verstärkte oder angepasste Scan-Kriterien.
- Automatisierte Erkennung:
- Kennzeichnet irrelevante oder werbliche Inhalte (z. B. Anzeigen oder kommerzielle Materialien).
- Identifiziert automatisierte oder botähnliche Verhaltensweisen.
- Bewertet die Relevanz des Inhalts für die Diskussion.
Standard-Prompt und Kontext
Die KI verwendet einen standardmäßigen System-Prompt, um die Spam-Erkennung zu steuern. Der integrierte Prompt des Spam-Erkennungsagenten umfasst:
Sie sind ein Spam-Erkennungssystem. Analysieren Sie den folgenden Beitragsinhalt und Kontext.
Beachten Sie die Beitragsart genau:
- Bei ANTWORT-Beiträgen: Prüfen Sie, ob die Antwort relevant und themenbezogen für den Thread ist
- Bei NEUES THEMA-Beiträgen: Prüfen Sie, ob es sich um eine legitime Themenanfrage oder um Spam-Werbung handelt
Ein Beitrag ist Spam, wenn er eines der folgenden Kriterien erfüllt:
- Enthält unerwünschte kommerzielle Inhalte oder Werbung
- Enthält verdächtige oder nicht verwandte externe Links
- Zeigt Muster von automatisiertem/Bot-Posten
- Enthält irrelevante Inhalte oder Werbung
- Bei Antworten: Völlig irrelevant für den Diskussionsverlauf
- Verwendet übermäßige Schlüsselwörter oder sich wiederholende Textmuster
- Zeigt verdächtige Formatierung oder Zeichenverwendung
Seien Sie besonders streng bei:
- Antworten, die die vorherige Konversation ignorieren
- Beiträge, die mehrere nicht zusammenhängende externe Links enthalten
- Allgemeine Antworten, die überall gepostet werden könnten
Seien Sie fair zu:
- Neuen Benutzern, die legitime erste Beiträge leisten
- Nicht-Muttersprachlern, die ernsthaft versuchen, teilzunehmen
- Themenspezifische Produktnennungen in angemessenen Kontexten
Der Scanner kompiliert außerdem ein Kontextpaket, das Folgendes enthält:
- Beitragsart (NEUES THEMA oder ANTWORT) mit Kategorie- und Themenmetadaten.
- Bei Antworten: der Inhalt des übergeordneten Beitrags und der Autor des Themas.
- Autoreninformationen (Benutzername, E-Mail, Kontenalter, Gesamtbeiträge, Vertrauensstufe und IP-basierter Standort).
- Beitragstext auf 5000 Zeichen zur Verarbeitung gekürzt.
- Bis zu 3 hochgeladene Bilder, die dem Beitrag beigefügt sind.
Konfiguration der KI-Spam-Erkennung
Konfigurationsanleitung
-
Einstellungen aufrufen:
Navigieren Sie zu/admin/plugins/discourse-ai/ai-spam. -
Ein LLM auswählen:
Wenn Ihre Seite von Discourse gehostet wird
Sie können unser CDCK Hosted Small LLM aus der LLM-Liste auswählen.
- Wählen Sie ein Sprachmodell, das für die Anforderungen Ihres Forums geeignet ist. Informationen zur Konfiguration von LLMs finden Sie auf der Seite Large Language Model (LLM) Settings.
- Greifen Sie auf
/admin/plugins/discourse-ai/ai-llmsfür LLM-Konfigurationen zu.
- Spam-Erkennung aktivieren:
Aktivieren Sie die Spam-Erkennung, indem Sie die Funktion einschalten.
Hinweis: Ein verbundenes LLM ist zwingend erforderlich.
-
Benutzerdefinierte Anweisungen hinzufügen:
- Definieren Sie Regeln, die für Ihr Forum spezifisch sind (z. B. strengere Überwachung externer Links).
- Speichern Sie alle Änderungen, um sie anzuwenden.
-
Scan-Schwellenwerte anpassen (optional):
ai_spam_detection_max_trust_level: Legt die maximale Vertrauensstufe von Benutzern fest, deren Beiträge gescannt werden (Standard: 1). Kann von 0 bis 4 eingestellt werden.ai_spam_detection_max_post_count: Legt die maximale Anzahl von Beiträgen fest, die ein Benutzer haben kann, damit sein Beitrag noch gescannt wird (Standard: 3). Kann von 1 bis 100 eingestellt werden.
Unterschiede zur KI-Triage
Während die Spam-Erkennung speziell für die Identifizierung von Spam entwickelt wurde, unterstützt die KI-Triage umfassendere Beitragsverwaltungsaufgaben.
| Funktion | KI-Spam-Erkennung | KI-Triage |
|---|---|---|
| Komplexität | Optimierte, meinungsbildende Einrichtung | Hochgradig anpassbare und flexible Einrichtung |
| Primärer Anwendungsfall | Spam-Erkennung mit minimalem Overhead | Erweiterte Workflows für Kategorisierung, Kennzeichnung, Antworten, Spam-Erkennung, NSFW-Erkennung |
| Aktionen | Kennzeichnet Spam, verbirgt Beiträge, stummschaltet Benutzer | Kennzeichnet, kategorisiert, verbirgt Beiträge, fügt Antworten hinzu, kennzeichnet Beiträge, stummschaltet Benutzer |
| Empfehlung | Einfache Einrichtung und effektiv für die meisten Situationen | Verwenden Sie für umfangreiche, hochgradig anpassbare Workflows |
Weitere Einzelheiten finden Sie unter Discourse AI - KI-Triage.
Empfehlungen zur LLM-Auswahl
Die Leistung der Spam-Erkennung hängt vom gewählten LLM ab.
Die meisten kostengünstigen LLMs funktionieren effektiv, wie zum Beispiel:
- GPT-4o-mini
- Claude 3.5 Haiku
- Gemini 2.0 Flash
Experimentieren Sie mit verschiedenen Modellen, um die beste Lösung zu finden. Konfigurieren Sie Ihre Modelle über /admin/plugins/discourse-ai/ai-llms.
Testen des Verhaltens des Spam-Scanners
Sie können Spam-Erkennungsregeln direkt auf der Konfigurationsseite testen.
- Fügen Sie eine Beitrags-URL oder -ID in das Testfeld ein.
- Überprüfen Sie das Klassifizierungsergebnis und die Begründung der KI für ihre Entscheidung.
- Nicht gespeicherte Änderungen werden beim Testen angewendet, was Experimente ohne Risiko ermöglicht.
Umgang mit gekennzeichneten und übersehenen Beiträgen
Umgang mit gekennzeichneten Beiträgen
Wenn ein Beitrag als Spam erkannt wird, führt das System folgende Aktionen aus:
- Kennzeichnet den Beitrag als Spam und fügt ihn der Überprüfungswarteschlange hinzu.
- Stummschaltet den beitragenden Benutzer.
- Verbirgt den Beitrag vor der öffentlichen Ansicht.
- Macht das Thema unsichtbar, wenn der Spam-Beitrag der erste Beitrag im Thema war.
Gekennzeichnete Beiträge erscheinen in der Moderationswarteschlange. Administratoren können:
- Legitime Beiträge genehmigen, die fälschlicherweise als Spam klassifiziert wurden.
- Spam-Themen ablehnen, um die Genauigkeit des Systems zu wahren.
Wichtig: Kennzeichnungen für falsch klassifizierte Beiträge als Spam ablehnen. Benutzer bleiben stummgeschaltet, bis die Kennzeichnung behoben ist.
Umgang mit übersehenem Spam
Übersehener Spam bezieht sich auf Beiträge, die der Erkennung entgangen sind, aber von der Community gekennzeichnet wurden. Moderatoren können diese nach Bedarf verwalten.
Best Practices
- Überwachen Sie regelmäßig gekennzeichneten und übersehenen Spam, um die Genauigkeit des Systems zu verfeinern. Klickbare Metriken vereinfachen diesen Prozess.
- Verwenden Sie Testfälle, um benutzerdefinierte Anweisungen anhand von Grenzfallproblemen zu bewerten.
- Überprüfen und passen Sie die LLM-Einstellungen bei Bedarf an.
- Verwenden Sie die Site-Einstellungen
ai_spam_detection_max_trust_levelundai_spam_detection_max_post_count, um abzustimmen, welche Benutzer basierend auf den Bedürfnissen Ihrer Community gescannt werden.
Zusätzliche Ressourcen
Die effektive Konfiguration der KI-Spam-Erkennung reduziert den manuellen Moderationsaufwand und sorgt für eine saubere, spamfreie Community.

