Discourse AI - Spam-Erkennung

pfaffman · 28. August 2025 um 15:35

Und hier ist ein Beispiel dafür, wie dieselben Spammer hier erwischt wurden: https://meta.discourse.org/t/full-list-of-quickbooks-desktop-support-contact-numbers-a-complete-call-center-in-the-usa/380776 (es ist bereits ausgeblendet).

Diese Jungs arbeiten definitiv hart.

haydenjames · 3. September 2025 um 13:12

Großartige Arbeit an diesem Feature. So sehe ich KI gerne eingesetzt.

Kurze Frage: Gibt es eine Zeitverzögerung, während der Inhalt gescannt wird, wenn ein neuer TL0-Benutzer eine Antwort oder ein Thema einreicht?

Ich sehe eine kurze Verzögerung im integrierten Tester (Screenshot unten), aber wenn ich von einem Testkonto aus poste, gibt es keine ähnliche Pause. Ist der Live-Scan asynchron nach der Veröffentlichung, wobei der Beitrag nur ausgeblendet wird, wenn er gegen eine Regel verstößt? (Kontext: Ich verwende die OpenAI ChatGPT 5 API.)

Was es wert ist, AI > Spam & Stats erhöht sich wie erwartet mit dem Testkonto, sodass der Beitrag gescannt WIRD; er führt nur nicht zur gleichen Verzögerung wie die Test-Schaltfläche.

Danke.

stance455 · 25. September 2025 um 10:52

Das funktioniert ziemlich gut, aber was passiert, wenn Dutzende von Themen/Benutzern markiert werden? Ich sehe keine Möglichkeit, diese Benutzer/Beiträge in großen Mengen zu sperren/löschen.

sps · 3. Februar 2026 um 19:49

Vielen Dank für den detaillierten Thread. Wir haben die Discourse AI Spam-Erkennung auf unserer Instanz aktiviert, und eines der Dinge, die wir sehen, ist die Standardeinstellung zum automatischen Stummschalten, wenn der erste Beitrag eines Kontos markiert wird.

Ich verstehe, dass dies dazu dient, Einmal-Spammer stummzuschalten. Dies führt jedoch zu Problemen, bei denen das Genehmigen/Akzeptieren einer Markierung dazu führt, dass der Benutzer stummgeschaltet bleibt, wenn wir die Markierung genehmigen, den Benutzer aber nicht stummschalten möchten. Es wäre gut, Folgendes zu haben:

eine Schaltfläche „Zustimmen und stummgeschaltet lassen“ und
eine separate Schaltfläche „Zustimmen und Stummschaltung aufheben“.

sam · 3. Februar 2026 um 23:57

Das ist eine knifflige Angelegenheit, wir wollen die Leute nicht mit zu vielen Optionen lähmen, aber ich verstehe vollkommen, dass dies bei einer größeren Anzahl ein Problem sein kann.

Ich werde mich mal beim Enterprise-XP-Team erkundigen, vielleicht gibt es eine kleine Anpassung, die wir für Ihr Forum vornehmen können.

singi2016cn · 28. Februar 2026 um 03:52

Ich habe in meiner lokalen Entwicklungsumgebung einen Test-Spam-Beitrag veröffentlicht, aber er ist nicht automatisch in die Warteschlange zur Überprüfung gelangt.

Das KI-Ergebnis stuft ihn tatsächlich als Spam-Beitrag ein.

Außerdem erfüllt er die anderen Kriterien für das Eintreten in die Warteschlange zur Überprüfung:

Benutzervertrauensstufe:
- Überprüft Beiträge von Benutzern mit einer Vertrauensstufe von 1 oder niedriger.
- Schließt Beiträge von Benutzern mit einer höheren Vertrauensstufe aus.
Beitragsart:
- Öffentliche Beiträge (ausgenommen private Nachrichten).
- Schließt Antwortbeiträge und den ersten Themadbeitrag gemäß anderen Schwellenwerten ein.
Beitrag bearbeiten:
- Überprüft Beiträge mit wesentlichen Bearbeitungen (z. B. Änderungen von mehr als 10 Zeichen).
- Erzwingt eine 10-minütige Verzögerung zwischen Überprüfungen desselben Beitrags.
Beitragsfrequenz:
- Priorisiert Fälle, in denen neue Benutzer insgesamt weniger als 4 Beiträge in öffentlichen Themen veröffentlicht haben.
- Schließt Beiträge von Benutzern aus, die diesen Schwellenwert überschreiten.

Dennoch ist das Endergebnis, dass er nicht in die Warteschlange zur Überprüfung aufgenommen wurde.

Wo sollte ich nachsehen, um das Problem zu finden?

per1234 · 28. Februar 2026 um 04:11

Hallo @singi2016cn.

Meinten Sie, dass Sie dies mit dem Testwerkzeug überprüft haben?

[quote=“sam, post:1, topic:343541”]## Testen des Spam-Scanner-Verhaltens
Sie können Spam-Erkennungsregeln direkt auf der Konfigurationsseite testen.

Fügen Sie eine Beitrags-URL oder -ID in das Testfeld ein.
Überprüfen Sie das Klassifizierungsergebnis (z. B. „SPAM“ oder „KEIN SPAM“) und analysieren Sie die Protokolle, um die Begründung zu verstehen.
Nicht gespeicherte Änderungen werden beim Testen angewendet, sodass Experimente ohne Risiko möglich sind.[/quote]

Sie können auf dieses Werkzeug zugreifen, indem Sie dieser Anleitung folgen:

Melden Sie sich mit einem Konto auf Ihrem Forum an, das Administratorrechte besitzt.
Navigieren Sie auf Ihrem Forum zu dieser Seite: /admin/plugins/discourse-ai/ai-spam
Klicken Sie auf der Seite auf die Schaltfläche „Testen…“.
Das Dialogfeld „Spamerkennung testen“ wird geöffnet.
Geben Sie die URL oder Beitrags-ID Ihres Test-Spam-Beitrags in das Feld „Beitrags-URL oder ID“ im Dialogfeld ein.
Klicken Sie auf die Schaltfläche „Test ausführen“.

singi2016cn · 28. Februar 2026 um 06:24

Ja, das Testtool gab eindeutig Spam zurück, aber als ich denselben Beitrag gepostet habe, gelangte er nicht in die Warteschlange zur Überprüfung.

Moin · 28. Februar 2026 um 10:59

Wer hat das gepostet? Haben Sie einen neuen Benutzer verwendet, den Sie zum Testen erstellt haben, oder haben Sie zum Beispiel ein Konto mit Moderatorberechtigungen verwendet?

singi2016cn · 2. März 2026 um 01:20

Normaler Benutzer, Vertrauensstufe 1, weder Administrator noch Moderator.

LotusJeff · 10. März 2026 um 02:34

Hier ist der benutzerdefinierte Anweisungssatz, den ich für die Spam-Erkennung verwende. Er ist detaillierter als die Standardversion, daher verbraucht er mehr Tokens. Was verwenden andere für benutzerdefinierte Anweisungssätze zur Spam-Erkennung?

Prägnanter Anweisungssatz zur Spam-Erkennung

Sie sind ein Spam-Erkennungssystem, das Forumbeiträge überprüft.

Ihre Aufgabe ist es festzustellen, ob ein Beitrag hauptsächlich dazu dient, Werbung zu machen, zu täuschen, Suchrankings zu manipulieren, bösartige Links zu verbreiten oder die Diskussion zu stören – anstatt sich aufrichtig an der Community zu beteiligen.

Bewerten Sie:

Beitragsinhalt
Beitragstyp (ANTWORT oder NEUES THEMA)
Thread-Kontext (bei Antworten)
Seiteninformationen

Als Spam einstufen, wenn der Beitrag:

Produkte, Dienstleistungen oder externe Websites ohne sinnvolle Beteiligung bewirbt
Verdächtige, irrelevante oder mehrere Werbelinks enthält
SEO-ähnliches Keyword-Stuffing oder repetitive Muster verwendet
Automatisiert, vorlagenbasiert oder bot-generiert erscheint
Für das Forumsthema irrelevant ist
Bei ANTWORT-Beiträgen: den Thread ignoriert und irrelevante Inhalte einfügt

Starke Spam-Indikatoren umfassen:

Affiliate-/Empfehlungslinks
Sprache wie „Jetzt kaufen“, Rabatte oder Verkaufsaktionen
Kontaktinformationen, die nicht mit der Diskussion zusammenhängen
Allgemeine Lobpreisung + Link
Copy-Paste-Struktur
Sinnloser oder KI-gesponnener Text

Nicht nur deshalb als Spam einstufen, weil:

Der Benutzer neu ist
Englisch fehlerhaft ist
Der Beitrag kurz ist
Der Ton enthusiastisch ist
Ein relevantes Produkt oder ein Lieferant im Kontext erwähnt wird

Legitime Signale umfassen:

Spezifische Verweise auf den Thread
Themenrelevante technische Diskussion
Echte Fragen
Persönliche Erfahrungen im Zusammenhang mit dem Forumsthema

Entscheidungsregel

Wenn die Hauptabsicht werblich, bösartig oder störend erscheint → spam = true.
Wenn der Beitrag sich sinnvoll an der Diskussion beteiligt → spam = false.

Bei Unsicherheit, aber wenn mehrere Warnsignale vorhanden sind, priorisieren Sie die Sicherheit der Community.

Ausgabeformat

Geben Sie nur gültiges JSON zurück:

{“spam”: true oder false, “reason”: “Kurze Erklärung (1–2 Sätze).”}

Fügen Sie keinen zusätzlichen Kommentar hinzu.

LotusJeff · 10. März 2026 um 16:04

Auf der Seite Admin->Plugin->AI->SPAM sollte ein Bericht angezeigt werden, der die Details der Zusammenfassungsbox zeigt. Die Zusammenfassungsbox zeigt die Anzahl der gescannten Beiträge, die erkannte Spam-Menge sowie Fehlalarme (False Positives) und Falsch-Negativ-Erkennungen (False Negatives).

Existiert der Detailbericht irgendwo, den ich nicht gefunden habe?
Gibt es eine Data Explorer-Abfrage, die die detaillierteren Informationen liefert?

Vielen Dank im Voraus.

Falco · 10. März 2026 um 16:52

Diese liefert Ihnen alle Details

SELECT * FROM ai_spam_logs ORDER BY 1 DESC LIMIT 50

Thema		Antworten	Aufrufe
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2088	30. Januar 2025
AI powered Spam detection Announcements ai , spam	11	1146	11. Januar 2025
AI spam bot says it is not spam but scan log says it is spam Bug ai	7	264	22. August 2025
Are you experiencing AI based spam? Community Building ai	22	2288	19. Januar 2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	496	18. Mai 2024