Einrichtung der Spam-Erkennung in deiner Community

Discourse · 31. März 2024 um 10:36

Dies ist eine #how-to-Anleitung zur Einrichtung der Spam-Erkennung in Ihrer Community mit Discourse AI - AI Triage.

Erforderliches Benutzerniveau: Administrator

Discourse AI liefert jetzt einen effizienten Spam-Scanner, der nur minimale Einrichtung erfordert. Für benutzerdefinierte oder komplexe Anwendungsfälle empfehlen wir, dieser Anleitung zu folgen.

Übersicht

Spam-Erkennung ist eine wesentliche Funktion zur Aufrechterhaltung der Qualität von Diskussionen in Ihrer Community. Diese Anleitung hilft Ihnen bei der Einrichtung der Spam-Erkennung mit Discourse AI - AI Triage.

Voraussetzungen

Um die Spam-Erkennung zu konfigurieren, benötigen Sie Folgendes:

Discourse AI

Discourse Automation

Eine Persona mit einer Systemaufforderung, die definiert, was Spam-Inhalt ausmacht.

LLM (Large Language Model)

Von Discourse gehostete Kunden können unser CDCK Hosted Small LLM bei der Konfiguration von Personas auswählen.

Selbst gehostete Discourse-Benutzer müssen ein Drittanbieter-LLM konfigurieren.

Persona settings778×1218 34.6 KB

Achten Sie bei der Erstellung der Aufforderung bei der Auswahl zwischen Spam und Nicht-Spam darauf, ähnliche Formulierungen für das Endergebnis zu vermeiden. In diesem Beispiel verwenden wir spam und ham (für Nicht-Spam).

Der Klassifikator wird nicht immer zu 100 % perfekt funktionieren, seien Sie sich also falscher Ergebnisse bewusst und passen Sie die Aufforderungen an die Bedürfnisse Ihrer Community an. Je enger der Fokus, desto besser.

Kopierbare LLM-Aufforderungen zur Erkennung von Spam-Inhalten AI

Sie sind ein KI-Modell zur Spam-Erkennung, das Moderatoren von Online-Communities unterstützt. Ihre Aufgabe ist es, Forenbeiträge zu analysieren und zu bestimmen, ob es sich um Spam handelt, der entfernt werden sollte, um eine qualitativ hochwertige, themenbezogene Community aufrechtzuerhalten.

Ein Beitrag sollte als Spam klassifiziert werden, wenn er eines der folgenden Kriterien erfüllt:

Der Beitrag ist für das Hauptthema oder den Zweck des Forums nicht relevant. Er ist völlig themenfremd.

Er enthält verdächtige, irrelevante externe Links, insbesondere wenn sie auf kommerzielle Websites verlinken.

Der Beitrag bewirbt oder wirbt eindeutig für ein Produkt, eine Dienstleistung, eine Website oder ein Social-Media-Konto, das nicht mit der Community in Verbindung steht.

Er enthält Affiliate-Links oder Empfehlungscodes, die versuchen, Klicks zu monetarisieren.

Die Schreibqualität ist sehr gering – viele Rechtschreib-/Grammatikfehler, fehlende Satzzeichen oder scheinbar automatisch generierter Text.

Identische oder nahezu identische Inhalte werden kurzfristig vom selben Autor oder über mehrere Konten hinweg wiederholt gepostet.

Ein Beitrag sollte als Ham (legitim) klassifiziert werden, wenn:

Der Beitrag ist themenbezogen und relevant für den Zweck des Forums.

Es handelt sich um eine echte Frage, eine persönliche Geschichte, eine substantielle Meinung oder einen anderweitig legitimen Beitrag zur Community-Diskussion.

Alle externen Links sind relevant und verweisen auf seriöse, nicht-kommerzielle Websites.

Die Schrift scheint von einem Menschen zu stammen und entspricht den Qualitätsstandards für Grammatik, Rechtschreibung usw.

Einige Grenzfälle, auf die Sie achten sollten:

Ein Beitrag, der ein Produkt oder eine Dienstleistung erwähnt, aber dennoch eine relevante, themenbezogene Frage oder Diskussion ist, sollte als Ham und nicht als Spam betrachtet werden.

Zitate, Codebeispiele oder formatierter Text, der ungewöhnlich aussieht, sind nicht unbedingt Spam.

Wenn Sie die Analyse des Beitrags abgeschlossen haben, dürfen Sie NUR eine Klassifizierung als “spam” oder “ham” angeben. Wenn Sie unsicher sind, wählen Sie standardmäßig “ham”, um Fehlalarme zu vermeiden.

Diese Anweisungen müssen unbedingt befolgt werden.

Konfiguration

Nicht jeder Schritt ist obligatorisch, da Automatisierungsregeln nach Bedarf angepasst werden können. Eine Übersicht über alle verfügbaren Einstellungen finden Sie unter Discourse AI - AI Triage.

Aktivieren Sie das Discourse AI- und Automation-Plugin:

Navigieren Sie zum Admin-Panel Ihrer Website.

Navigieren Sie zu Plugins und dann zu Installierte Plugins.

Aktivieren Sie die Plugins Discourse AI und Automation.

Erstellen Sie eine neue Automatisierungsregel:

Navigieren Sie zum Admin-Panel Ihrer Website.

Navigieren Sie zu Plugins und klicken Sie auf Automation.

Klicken Sie auf die Schaltfläche + Erstellen, um mit der Erstellung einer neuen Automatisierungsregel zu beginnen.

Klicken Sie auf Posts mit KI bearbeiten.

Legen Sie den Namen fest (z. B. „Posts mit KI bearbeiten“).

Lassen Sie Posts mit KI bearbeiten als ausgewähltes Skript.

Was/Wann

Legen Sie den Auslöser fest:

Wählen Sie Post erstellt/bearbeitet als Auslöser.

Optional können Sie den Aktionstyp, die Kategorie, Tags, Gruppen und/oder Vertrauensstufen angeben, wenn Sie diese Automatisierung auf bestimmte Szenarien beschränken möchten. Wenn Sie diese Felder leer lassen, kann die Automatisierung uneingeschränkt ausgeführt werden.

Konfigurieren Sie die übrigen optionalen Einstellungen im Abschnitt Was/Wann, um die Automatisierung weiter einzuschränken.

Skriptoptionen

Das Feld für die Systemaufforderung wurde zugunsten von Personas als veraltet markiert. Wenn Sie vor dieser Änderung eine KI-Automatisierung hatten, wird automatisch eine neue Persona mit der zugehörigen Systemaufforderung erstellt.

Persona:

Wählen Sie die für die Spam-Erkennungsautomatisierung definierte Persona aus.

Nach Text suchen:

Geben Sie die Ausgabe Ihrer Aufforderung ein, die die Automatisierung auslöst, nur das „positive“ Ergebnis. Wenn Sie unser obiges Beispiel verwenden, würden wir spam eingeben.

AI automation settings2120×1152 195 KB

Kategorie und Tags festlegen:

Definieren Sie die Kategorie, in die diese Beiträge verschoben werden sollen, und die Tags, die hinzugefügt werden sollen, wenn der Beitrag als Spam markiert wird.

Markierung:

Markieren Sie den Beitrag entweder als Spam oder zur Überprüfung.

Wählen Sie einen Markierungstyp, um zu bestimmen, welche Aktion Sie möglicherweise ergreifen möchten.

Zusätzliche Optionen:

Aktivieren Sie die Option „Thema ausblenden“, wenn der Beitrag ausgeblendet werden soll.

Legen Sie eine „Antwort“ fest, die im Thema gepostet wird, wenn der Beitrag als Spam eingestuft wird.

Zusätzliche Hinweise

Wenn Sie Automation zur Bekämpfung von Spam einsetzen, empfehlen wir, das Akismet-Plugin zu deaktivieren, falls es bereits aktiviert ist. Dies soll sicherstellen, dass nur ein System gegen Spam kämpft, um die besten Ergebnisse zu erzielen.

Denken Sie daran, dass LLM-Aufrufe teuer sein können. Wenn Sie einen Klassifikator anwenden, achten Sie sorgfältig auf die Kosten und erwägen Sie immer, dies nur auf kleine Teilmengen anzuwenden.

Bessere Modelle wie Claude-3-Opus liefern zwar bessere Ergebnisse, können aber auch höhere Kosten verursachen.

Die Aufforderung könnte angepasst werden, um alle möglichen Erkennungen durchzuführen, wie z. B. die Offenlegung von PII, Verstöße gegen den Verhaltenskodex usw.

Falco · 10. April 2024 um 15:17

5 Beiträge wurden in ein neues Thema aufgeteilt: Erforschung der Grenzen von KI bei der Erkennung von KI-generierten Inhalten

Saif · 27. Mai 2024 um 15:16

Wie sind die Erfahrungen der Benutzer mit dieser Methode?

loginerror · 8. August 2024 um 10:46

Ich habe gerade mit dem Testen begonnen, und es hat bereits gute Arbeit geleistet (vorerst habe ich mich entschieden, nur einen versteckten Tag anzuwenden, um zu überprüfen, ob die Dinge korrekt laufen, anstatt sie sofort zur Überprüfung einzureichen).

Aber ich habe eine kleine Nachfrage/Klärung: Wäre es für die Integration möglich, auf benutzerdefinierte Abfragen mit Ausgaben zuzugreifen, wie z. B. eine Gruppe von Beispielbeiträgen, die als Kontextdaten verwendet werden können?

Konkreter möchte ich alle bisherigen Spam-Beiträge basierend auf den vereinbarten Flags, die zur Löschung von Beiträgen geführt haben, einspeisen.

sam · 14. August 2024 um 00:45

Derzeit unterstützen wir nur eine einzige Systemnachricht.

Ich denke jedoch, dass wir eine Nachverfolgung durchführen könnten, bei der Sie N Beispiele für Dinge, die nicht markiert werden sollen, und N Beispiele für Dinge, die markiert werden sollen, eingeben können. Dies könnte potenziell die Genauigkeit erhöhen.

Vielleicht ein dediziertes Feature-Thema dazu?

loginerror · 16. August 2024 um 08:44

Ich werde versuchen, zunächst einige weitere Gedanken dazu zu sammeln. Die Ausführung in der letzten Woche war ziemlich erfolgreich, aber ich stoße immer noch auf einige kleine Ärgernisse, wie zum Beispiel die Unfähigkeit, private Nachrichten schnell auszuschließen (zum Beispiel hält es oft Discobot-Tutorial-Interaktionen für verdächtig; ich habe die Eingabeaufforderung so bearbeitet, dass diese nicht berücksichtigt werden, aber die KI-Protokolle zeigen an, dass die Erkennung den Kontext nicht kennt und nur den Inhalt des Beitrags selbst berücksichtigt).

JammyDodger · 23. August 2024 um 15:08

Das scheint nicht ganz richtig zu sein… Ich bin mir nicht sicher, was die beabsichtigte Anweisung hier war? Vielleicht „KI aktivieren und Automatisierung aktivieren“?

Saif · 23. August 2024 um 18:40

Habe die Bearbeitung hier vorgenommen

NateDhaliwal · 29. Januar 2025 um 03:23

Mich würde interessieren, ob es eine Möglichkeit gibt, Antworten in ein neues Thema zu verschieben, anstatt das gesamte Thema. Es könnte ein legitimes Thema sein, aber ein Spammer kommt herein und postet eine Spam-Antwort. Soweit ich sehen kann, wird das gesamte Thema verschoben, nicht diese spezielle Antwort.
Wo ich gerade dabei bin, was ist der Unterschied zwischen diesem und dem Discourse AI Spam-Detektor?

Saif · 29. Januar 2025 um 19:41

Könnten Sie dies bitte mit einem Beispiel näher erläutern?

Zu Ihrer Information: Sie sollten die Option Beitrag melden aktivieren können, die nur den “Spam”-Beitrag meldet.

Sam Saffron:

Unterschiede zur KI-Triage

Siehe die unten aufgeführten Unterschiede

Während die Spam-Erkennung speziell für die Identifizierung von Spam entwickelt wurde, unterstützt die KI-Triage breitere Aufgaben der Beitragsverwaltung.

Merkmal KI-Spam-Erkennung KI-Triage

Komplexität Optimierte, meinungsstarke Einrichtung Hochgradig anpassbar und flexibel

Primärer Anwendungsfall Erkennung von Spam mit minimalem Aufwand Erweiterte Workflows für Kategorisierung, Tagging, Antworten, Spam-Erkennung, NSFW-Erkennung

Aktionen Markiert Spam, sperrt Benutzer Markiert, kategorisiert, verbirgt Beiträge, fügt Antworten hinzu, markiert Beiträge, sperrt Benutzer

Empfehlung Statt Akismet verwenden Für reichhaltige, hochgradig anpassbare Workflows verwenden

Weitere Details finden Sie unter Discourse AI - AI triage.

NateDhaliwal · 30. Januar 2025 um 03:02

Sicher. Nehmen wir zum Beispiel an, in einem Supportforum postet ein Spammer eine Spam-Antwort in einem bestehenden Thema über Probleme, die er hat. Der OP und die Antwortenden sind nicht dieselben Benutzer wie der Spammer. Wenn ich das richtig verstehe, wird AI Triage das gesamte Thema ausblenden und den Beitrag markieren. Könnte stattdessen der Spam-Beitrag in ein bestimmtes Thema verschoben werden, in einer Kategorie, die für Administratoren verfügbar ist?

Ich habe mich das gefragt, als ich diesen Beitrag gelesen habe.

Ja, das mache ich derzeit für den Hassrede-Detektor mit AI Triage.

Saif Murtaza :

Sam Saffron:

Unterschiede zur KI-Triage

Sehen Sie die unten aufgeführten Unterschiede
Während die Spam-Erkennung speziell für die Identifizierung von Spam entwickelt wurde, unterstützt die KI-Triage breitere Aufgaben der Beitragsverwaltung.

Merkmal KI-Spam-Erkennung KI-Triage

Komplexität Optimierte, meinungsbasierte Einrichtung Hochgradig anpassbar und flexibel

Primärer Anwendungsfall Erkennung von Spam mit minimalem Aufwand Erweiterte Workflows für Kategorisierung, Tagging, Antworten, Spam-Erkennung, NSFW-Erkennung

Aktionen Markiert Spam, sperrt Benutzer Taggt, kategorisiert, blendet Beiträge aus, fügt Antworten hinzu, markiert Beiträge, sperrt Benutzer

Empfehlung Verwenden Sie anstelle von Akismet Verwenden Sie für reichhaltige, hochgradig anpassbare Workflows

Weitere Details finden Sie unter Discourse AI - AI Triage.

Lol, wie konnte ich das übersehen …

sam · 30. Januar 2025 um 03:23

AI Spam wird den Beitrag einfach ausblenden, diese Option können wir wahrscheinlich auch für die Triage hinzufügen.

Thema		Antworten	Aufrufe
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	22	2429	25. September 2025
AI powered Spam detection Announcements ai , spam	11	912	11. Januar 2025
Discourse AI to make spam filter smarter? Feature completed , ai	2	414	22. Mai 2024
Are you experiencing AI based spam? Community ai	23	1804	19. Januar 2025
Bulk mark messages and posters as spam Support spam	9	174	28. August 2025

Merkmal	KI-Spam-Erkennung	KI-Triage
Komplexität	Optimierte, meinungsstarke Einrichtung	Hochgradig anpassbar und flexibel
Primärer Anwendungsfall	Erkennung von Spam mit minimalem Aufwand	Erweiterte Workflows für Kategorisierung, Tagging, Antworten, Spam-Erkennung, NSFW-Erkennung
Aktionen	Markiert Spam, sperrt Benutzer	Markiert, kategorisiert, verbirgt Beiträge, fügt Antworten hinzu, markiert Beiträge, sperrt Benutzer
Empfehlung	Statt Akismet verwenden	Für reichhaltige, hochgradig anpassbare Workflows verwenden

Merkmal	KI-Spam-Erkennung	KI-Triage
Komplexität	Optimierte, meinungsbasierte Einrichtung	Hochgradig anpassbar und flexibel
Primärer Anwendungsfall	Erkennung von Spam mit minimalem Aufwand	Erweiterte Workflows für Kategorisierung, Tagging, Antworten, Spam-Erkennung, NSFW-Erkennung
Aktionen	Markiert Spam, sperrt Benutzer	Taggt, kategorisiert, blendet Beiträge aus, fügt Antworten hinzu, markiert Beiträge, sperrt Benutzer
Empfehlung	Verwenden Sie anstelle von Akismet	Verwenden Sie für reichhaltige, hochgradig anpassbare Workflows

Einrichtung der Spam-Erkennung in deiner Community

Übersicht

Voraussetzungen

Konfiguration

Was/Wann

Skriptoptionen

Zusätzliche Hinweise

Verwandte Themen