Ich habe das Discourse AI Spam-Handling in unserem Forum aktiviert. Ich habe Claude Sonnet 4 mit einem API-Schlüssel eingerichtet und die Persona „Spam-Detektor“ ausgewählt.
Ich habe einen Testbeitrag erstellt, der eindeutig Spam ist. Nichts Subtiles daran.
Er wurde nicht blockiert und sofort veröffentlicht.
Als ich dem Spam-Bot die URL des Beitrags über die Testfunktion gab, sagt das Ergebnis „Kein Spam“, aber im Scan-Protokoll steht: „SPAM – Dies ist eine klare Werbeanzeige…“
Meine Erwartung wäre, dass das Ergebnis SPAM wäre, passend zur Deklaration SPAM im Scan-Protokoll. Und dass dies dann den Beitrag zur Überprüfung durch Administratoren und Moderatoren aufreihen würde, zum Beispiel.
Könnte mir jemand sagen, was ich übersehe? Ich bin kein Experte – daher bin ich offen für jeden Rat!
Dies behebt sowohl den Test als auch den Beitrag, der nicht markiert wird:
Die Eingabeaufforderung des Spam-Detektor-Persona-Systems verwirrte Claude-Modelle. Die Änderung macht die Anweisungen zum erwarteten Antwortformat expliziter.
Ah, fantastisch! Die Testfunktion funktioniert wie erwartet.
Ich frage mich, ob Sie mir vielleicht helfen könnten, warum die KI-Spam-Funktion immer noch verhindert, dass ein Spam-Beitrag sofort gepostet wird? Ich habe den Beitrag an den KI-Spam-Test gesendet und er wird als Spam markiert – aber er wurde gepostet.
Fehlt mir vielleicht ein verbindendes Teil? Vielen Dank für Ihre Hilfe!