Dies ist eine #how-to-Anleitung zur Einrichtung der Spam-Erkennung in Ihrer Community mit Discourse AI - AI Triage.
Erforderliches Benutzerniveau: Administrator
Discourse AI liefert jetzt einen effizienten Spam-Scanner, der nur minimale Einrichtung erfordert. Für benutzerdefinierte oder komplexe Anwendungsfälle empfehlen wir, dieser Anleitung zu folgen.
Übersicht
Spam-Erkennung ist eine wesentliche Funktion zur Aufrechterhaltung der Qualität von Diskussionen in Ihrer Community. Diese Anleitung hilft Ihnen bei der Einrichtung der Spam-Erkennung mit Discourse AI - AI Triage.
Voraussetzungen
Um die Spam-Erkennung zu konfigurieren, benötigen Sie Folgendes:
- Discourse AI
- Discourse Automation
- Eine Persona mit einer Systemaufforderung, die definiert, was Spam-Inhalt ausmacht.
- LLM (Large Language Model)
- Von Discourse gehostete Kunden können unser CDCK Hosted Small LLM bei der Konfiguration von Personas auswählen.
- Selbst gehostete Discourse-Benutzer müssen ein Drittanbieter-LLM konfigurieren.
Achten Sie bei der Erstellung der Aufforderung bei der Auswahl zwischen Spam und Nicht-Spam darauf, ähnliche Formulierungen für das Endergebnis zu vermeiden. In diesem Beispiel verwenden wir
spamundham(für Nicht-Spam).Der Klassifikator wird nicht immer zu 100 % perfekt funktionieren, seien Sie sich also falscher Ergebnisse bewusst und passen Sie die Aufforderungen an die Bedürfnisse Ihrer Community an. Je enger der Fokus, desto besser.
Kopierbare LLM-Aufforderungen zur Erkennung von Spam-Inhalten AI
Sie sind ein KI-Modell zur Spam-Erkennung, das Moderatoren von Online-Communities unterstützt. Ihre Aufgabe ist es, Forenbeiträge zu analysieren und zu bestimmen, ob es sich um Spam handelt, der entfernt werden sollte, um eine qualitativ hochwertige, themenbezogene Community aufrechtzuerhalten.
Ein Beitrag sollte als Spam klassifiziert werden, wenn er eines der folgenden Kriterien erfüllt:
- Der Beitrag ist für das Hauptthema oder den Zweck des Forums nicht relevant. Er ist völlig themenfremd.
- Er enthält verdächtige, irrelevante externe Links, insbesondere wenn sie auf kommerzielle Websites verlinken.
- Der Beitrag bewirbt oder wirbt eindeutig für ein Produkt, eine Dienstleistung, eine Website oder ein Social-Media-Konto, das nicht mit der Community in Verbindung steht.
- Er enthält Affiliate-Links oder Empfehlungscodes, die versuchen, Klicks zu monetarisieren.
- Die Schreibqualität ist sehr gering – viele Rechtschreib-/Grammatikfehler, fehlende Satzzeichen oder scheinbar automatisch generierter Text.
- Identische oder nahezu identische Inhalte werden kurzfristig vom selben Autor oder über mehrere Konten hinweg wiederholt gepostet.
Ein Beitrag sollte als Ham (legitim) klassifiziert werden, wenn:
- Der Beitrag ist themenbezogen und relevant für den Zweck des Forums.
- Es handelt sich um eine echte Frage, eine persönliche Geschichte, eine substantielle Meinung oder einen anderweitig legitimen Beitrag zur Community-Diskussion.
- Alle externen Links sind relevant und verweisen auf seriöse, nicht-kommerzielle Websites.
- Die Schrift scheint von einem Menschen zu stammen und entspricht den Qualitätsstandards für Grammatik, Rechtschreibung usw.
Einige Grenzfälle, auf die Sie achten sollten:
- Ein Beitrag, der ein Produkt oder eine Dienstleistung erwähnt, aber dennoch eine relevante, themenbezogene Frage oder Diskussion ist, sollte als Ham und nicht als Spam betrachtet werden.
- Zitate, Codebeispiele oder formatierter Text, der ungewöhnlich aussieht, sind nicht unbedingt Spam.
Wenn Sie die Analyse des Beitrags abgeschlossen haben, dürfen Sie NUR eine Klassifizierung als “spam” oder “ham” angeben. Wenn Sie unsicher sind, wählen Sie standardmäßig “ham”, um Fehlalarme zu vermeiden.
Diese Anweisungen müssen unbedingt befolgt werden.
Konfiguration
Nicht jeder Schritt ist obligatorisch, da Automatisierungsregeln nach Bedarf angepasst werden können. Eine Übersicht über alle verfügbaren Einstellungen finden Sie unter Discourse AI - AI Triage.
Aktivieren Sie das Discourse AI- und Automation-Plugin:
- Navigieren Sie zum Admin-Panel Ihrer Website.
- Navigieren Sie zu Plugins und dann zu Installierte Plugins.
- Aktivieren Sie die Plugins Discourse AI und Automation.
Erstellen Sie eine neue Automatisierungsregel:
- Navigieren Sie zum Admin-Panel Ihrer Website.
- Navigieren Sie zu Plugins und klicken Sie auf Automation.
- Klicken Sie auf die Schaltfläche
+ Erstellen, um mit der Erstellung einer neuen Automatisierungsregel zu beginnen.- Klicken Sie auf
Posts mit KI bearbeiten.- Legen Sie den Namen fest (z. B. „Posts mit KI bearbeiten“).
- Lassen Sie
Posts mit KI bearbeitenals ausgewähltes Skript.Was/Wann
Legen Sie den Auslöser fest:
- Wählen Sie
Post erstellt/bearbeitetals Auslöser.- Optional können Sie den Aktionstyp, die Kategorie, Tags, Gruppen und/oder Vertrauensstufen angeben, wenn Sie diese Automatisierung auf bestimmte Szenarien beschränken möchten. Wenn Sie diese Felder leer lassen, kann die Automatisierung uneingeschränkt ausgeführt werden.
- Konfigurieren Sie die übrigen optionalen Einstellungen im Abschnitt
Was/Wann, um die Automatisierung weiter einzuschränken.Skriptoptionen
Das Feld für die Systemaufforderung wurde zugunsten von Personas als veraltet markiert. Wenn Sie vor dieser Änderung eine KI-Automatisierung hatten, wird automatisch eine neue Persona mit der zugehörigen Systemaufforderung erstellt.
Persona:
Wählen Sie die für die Spam-Erkennungsautomatisierung definierte Persona aus.
Nach Text suchen:
Geben Sie die Ausgabe Ihrer Aufforderung ein, die die Automatisierung auslöst, nur das „positive“ Ergebnis. Wenn Sie unser obiges Beispiel verwenden, würden wir
spameingeben.
Kategorie und Tags festlegen:
Definieren Sie die Kategorie, in die diese Beiträge verschoben werden sollen, und die Tags, die hinzugefügt werden sollen, wenn der Beitrag als Spam markiert wird.
Markierung:
- Markieren Sie den Beitrag entweder als Spam oder zur Überprüfung.
- Wählen Sie einen Markierungstyp, um zu bestimmen, welche Aktion Sie möglicherweise ergreifen möchten.
Zusätzliche Optionen:
- Aktivieren Sie die Option „Thema ausblenden“, wenn der Beitrag ausgeblendet werden soll.
- Legen Sie eine „Antwort“ fest, die im Thema gepostet wird, wenn der Beitrag als Spam eingestuft wird.
Zusätzliche Hinweise
- Wenn Sie Automation zur Bekämpfung von Spam einsetzen, empfehlen wir, das Akismet-Plugin zu deaktivieren, falls es bereits aktiviert ist. Dies soll sicherstellen, dass nur ein System gegen Spam kämpft, um die besten Ergebnisse zu erzielen.
- Denken Sie daran, dass LLM-Aufrufe teuer sein können. Wenn Sie einen Klassifikator anwenden, achten Sie sorgfältig auf die Kosten und erwägen Sie immer, dies nur auf kleine Teilmengen anzuwenden.
- Bessere Modelle wie Claude-3-Opus liefern zwar bessere Ergebnisse, können aber auch höhere Kosten verursachen.
- Die Aufforderung könnte angepasst werden, um alle möglichen Erkennungen durchzuführen, wie z. B. die Offenlegung von PII, Verstöße gegen den Verhaltenskodex usw.
5 Beiträge wurden in ein neues Thema aufgeteilt: Erforschung der Grenzen von KI bei der Erkennung von KI-generierten Inhalten
Wie sind die Erfahrungen der Benutzer mit dieser Methode?
Ich habe gerade mit dem Testen begonnen, und es hat bereits gute Arbeit geleistet (vorerst habe ich mich entschieden, nur einen versteckten Tag anzuwenden, um zu überprüfen, ob die Dinge korrekt laufen, anstatt sie sofort zur Überprüfung einzureichen).
Aber ich habe eine kleine Nachfrage/Klärung: Wäre es für die Integration möglich, auf benutzerdefinierte Abfragen mit Ausgaben zuzugreifen, wie z. B. eine Gruppe von Beispielbeiträgen, die als Kontextdaten verwendet werden können?
Konkreter möchte ich alle bisherigen Spam-Beiträge basierend auf den vereinbarten Flags, die zur Löschung von Beiträgen geführt haben, einspeisen.
Derzeit unterstützen wir nur eine einzige Systemnachricht.
Ich denke jedoch, dass wir eine Nachverfolgung durchführen könnten, bei der Sie N Beispiele für Dinge, die nicht markiert werden sollen, und N Beispiele für Dinge, die markiert werden sollen, eingeben können. Dies könnte potenziell die Genauigkeit erhöhen.
Vielleicht ein dediziertes Feature-Thema dazu?
Ich werde versuchen, zunächst einige weitere Gedanken dazu zu sammeln. Die Ausführung in der letzten Woche war ziemlich erfolgreich, aber ich stoße immer noch auf einige kleine Ärgernisse, wie zum Beispiel die Unfähigkeit, private Nachrichten schnell auszuschließen (zum Beispiel hält es oft Discobot-Tutorial-Interaktionen für verdächtig; ich habe die Eingabeaufforderung so bearbeitet, dass diese nicht berücksichtigt werden, aber die KI-Protokolle zeigen an, dass die Erkennung den Kontext nicht kennt und nur den Inhalt des Beitrags selbst berücksichtigt).
Das scheint nicht ganz richtig zu sein… Ich bin mir nicht sicher, was die beabsichtigte Anweisung hier war? Vielleicht „KI aktivieren und Automatisierung aktivieren“?
Habe die Bearbeitung hier vorgenommen
Mich würde interessieren, ob es eine Möglichkeit gibt, Antworten in ein neues Thema zu verschieben, anstatt das gesamte Thema. Es könnte ein legitimes Thema sein, aber ein Spammer kommt herein und postet eine Spam-Antwort. Soweit ich sehen kann, wird das gesamte Thema verschoben, nicht diese spezielle Antwort.
Wo ich gerade dabei bin, was ist der Unterschied zwischen diesem und dem Discourse AI Spam-Detektor?
Könnten Sie dies bitte mit einem Beispiel näher erläutern?
Zu Ihrer Information: Sie sollten die Option Beitrag melden aktivieren können, die nur den “Spam”-Beitrag meldet.
Sicher. Nehmen wir zum Beispiel an, in einem Supportforum postet ein Spammer eine Spam-Antwort in einem bestehenden Thema über Probleme, die er hat. Der OP und die Antwortenden sind nicht dieselben Benutzer wie der Spammer. Wenn ich das richtig verstehe, wird AI Triage das gesamte Thema ausblenden und den Beitrag markieren. Könnte stattdessen der Spam-Beitrag in ein bestimmtes Thema verschoben werden, in einer Kategorie, die für Administratoren verfügbar ist?
Ich habe mich das gefragt, als ich diesen Beitrag gelesen habe.
Ja, das mache ich derzeit für den Hassrede-Detektor mit AI Triage.
Lol, wie konnte ich das übersehen
…
AI Triage wird das gesamte Thema ausblenden und den Beitrag markieren. Könnte der Spam-Beitrag stattdessen in ein bestimmtes Thema verschoben werden, das für Administratoren verfügbar ist?
AI Spam wird den Beitrag einfach ausblenden, diese Option können wir wahrscheinlich auch für die Triage hinzufügen.

