KI-Spam-Bot sagt, es sei kein Spam, aber das Scan-Protokoll sagt, es sei Spam

J-Ha_Hasegawa · 20. August 2025 um 00:20

Ich habe das Discourse AI Spam-Handling in unserem Forum aktiviert. Ich habe Claude Sonnet 4 mit einem API-Schlüssel eingerichtet und die Persona „Spam-Detektor“ ausgewählt.

Ich habe einen Testbeitrag erstellt, der eindeutig Spam ist. Nichts Subtiles daran.

Er wurde nicht blockiert und sofort veröffentlicht.

Als ich dem Spam-Bot die URL des Beitrags über die Testfunktion gab, sagt das Ergebnis „Kein Spam“, aber im Scan-Protokoll steht: „SPAM – Dies ist eine klare Werbeanzeige…“

Meine Erwartung wäre, dass das Ergebnis SPAM wäre, passend zur Deklaration SPAM im Scan-Protokoll. Und dass dies dann den Beitrag zur Überprüfung durch Administratoren und Moderatoren aufreihen würde, zum Beispiel.

Könnte mir jemand sagen, was ich übersehe? Ich bin kein Experte – daher bin ich offen für jeden Rat!

Vielen Dank!

Roman · 20. August 2025 um 00:34

Welchen Vertrauensgrad hat der Benutzer, der gepostet hat? Der KI-Spam wird Beiträge von TL2±Benutzern überspringen.

J-Ha_Hasegawa · 20. August 2025 um 00:48

Vielen Dank für Ihre Antwort!

Der Benutzer, den ich zum Posten verwendet habe, ist Neuer Benutzer mit Vertrauensstufe

Haben Sie eine Idee, warum der Beitrag durchgekommen ist?

Ich schätze Ihre Hilfe!

Roman · 20. August 2025 um 17:09

Dies behebt sowohl den Test als auch den Beitrag, der nicht markiert wird:

Die Eingabeaufforderung des Spam-Detektor-Persona-Systems verwirrte Claude-Modelle. Die Änderung macht die Anweisungen zum erwarteten Antwortformat expliziter.

J-Ha_Hasegawa · 22. August 2025 um 01:33

Ah, fantastisch! Die Testfunktion funktioniert wie erwartet.

Ich frage mich, ob Sie mir vielleicht helfen könnten, warum die KI-Spam-Funktion immer noch verhindert, dass ein Spam-Beitrag sofort gepostet wird? Ich habe den Beitrag an den KI-Spam-Test gesendet und er wird als Spam markiert – aber er wurde gepostet.

Fehlt mir vielleicht ein verbindendes Teil? Vielen Dank für Ihre Hilfe!

Jagster · 22. August 2025 um 05:05

Sind Sie ein Administrator oder ein höherer TL? Wenn ja, dann würden Sie vielleicht stattdessen einen Testbenutzer mit niedriger TL verwenden.

Roman · 22. August 2025 um 13:25

Wir überspringen einen Beitrag, wenn:

Das Vertrauensniveau des Autors größer als TL1 ist.
Der Beitrag zu einem privaten Nachrichtenthema gehört.
Der Autor ein Bot ist.
Der Autor zum Personal gehört (Moderator/Administrator).
Der Autor bereits mehr als 3 Beiträge in regulären (nicht-PM) Themen verfasst hat.
Der Beitrag bereits 3 oder mehr Mal gescannt wurde.

Wenn der Test funktioniert, bin ich zuversichtlich, dass es an einem der oben genannten Punkte liegt.

J-Ha_Hasegawa · 22. August 2025 um 15:29

Ahhh ja! Vielen Dank für Ihre geduldigen und hilfreichen Antworten!

Ich habe mit meinem Admin-Benutzer anstelle meines Benutzers mit Vertrauensstufe 0 gepostet.

Es funktioniert! Ich liebe es, wie der Benutzer discourse_ai_spam als der Benutzer angezeigt wird, der den Beitrag markiert und ausgeblendet hat.

Vielen Dank nochmals für Ihre schnelle und großzügige Hilfe dabei!

Thema		Antworten	Aufrufe
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4669	10. März 2026
AI powered Spam detection Announcements ai , spam	11	1146	11. Januar 2025
Are you experiencing AI based spam? Community Building ai	22	2286	19. Januar 2025
Discourse AI spam detection "Scan log" is frequently truncated Bug ai	1	156	18. Dezember 2025
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2087	30. Januar 2025

KI-Spam-Bot sagt, es sei kein Spam, aber das Scan-Protokoll sagt, es sei Spam

Verwandte Themen