Und hier ist ein Beispiel dafür, wie dieselben Spammer hier erwischt wurden: https://meta.discourse.org/t/full-list-of-quickbooks-desktop-support-contact-numbers-a-complete-call-center-in-the-usa/380776 (es ist bereits ausgeblendet).
Großartige Arbeit an diesem Feature. So sehe ich KI gerne eingesetzt.
Kurze Frage: Gibt es eine Zeitverzögerung, während der Inhalt gescannt wird, wenn ein neuer TL0-Benutzer eine Antwort oder ein Thema einreicht?
Ich sehe eine kurze Verzögerung im integrierten Tester (Screenshot unten), aber wenn ich von einem Testkonto aus poste, gibt es keine ähnliche Pause. Ist der Live-Scan asynchron nach der Veröffentlichung, wobei der Beitrag nur ausgeblendet wird, wenn er gegen eine Regel verstößt? (Kontext: Ich verwende die OpenAI ChatGPT 5 API.)
Was es wert ist, AI > Spam & Stats erhöht sich wie erwartet mit dem Testkonto, sodass der Beitrag gescannt WIRD; er führt nur nicht zur gleichen Verzögerung wie die Test-Schaltfläche.
Das funktioniert ziemlich gut, aber was passiert, wenn Dutzende von Themen/Benutzern markiert werden? Ich sehe keine Möglichkeit, diese Benutzer/Beiträge in großen Mengen zu sperren/löschen.
Vielen Dank für den detaillierten Thread. Wir haben die Discourse AI Spam-Erkennung auf unserer Instanz aktiviert, und eines der Dinge, die wir sehen, ist die Standardeinstellung zum automatischen Stummschalten, wenn der erste Beitrag eines Kontos markiert wird.
Ich verstehe, dass dies dazu dient, Einmal-Spammer stummzuschalten. Dies führt jedoch zu Problemen, bei denen das Genehmigen/Akzeptieren einer Markierung dazu führt, dass der Benutzer stummgeschaltet bleibt, wenn wir die Markierung genehmigen, den Benutzer aber nicht stummschalten möchten. Es wäre gut, Folgendes zu haben:
eine Schaltfläche „Zustimmen und stummgeschaltet lassen“ und
eine separate Schaltfläche „Zustimmen und Stummschaltung aufheben“.
Das ist eine knifflige Angelegenheit, wir wollen die Leute nicht mit zu vielen Optionen lähmen, aber ich verstehe vollkommen, dass dies bei einer größeren Anzahl ein Problem sein kann.
Ich werde mich mal beim Enterprise-XP-Team erkundigen, vielleicht gibt es eine kleine Anpassung, die wir für Ihr Forum vornehmen können.
Ich habe in meiner lokalen Entwicklungsumgebung einen Test-Spam-Beitrag veröffentlicht, aber er ist nicht automatisch in die Warteschlange zur Überprüfung gelangt.
Das KI-Ergebnis stuft ihn tatsächlich als Spam-Beitrag ein.
Außerdem erfüllt er die anderen Kriterien für das Eintreten in die Warteschlange zur Überprüfung:
Benutzervertrauensstufe:
Überprüft Beiträge von Benutzern mit einer Vertrauensstufe von 1 oder niedriger.
Schließt Beiträge von Benutzern mit einer höheren Vertrauensstufe aus.
Wer hat das gepostet? Haben Sie einen neuen Benutzer verwendet, den Sie zum Testen erstellt haben, oder haben Sie zum Beispiel ein Konto mit Moderatorberechtigungen verwendet?
Hier ist der benutzerdefinierte Anweisungssatz, den ich für die Spam-Erkennung verwende. Er ist detaillierter als die Standardversion, daher verbraucht er mehr Tokens. Was verwenden andere für benutzerdefinierte Anweisungssätze zur Spam-Erkennung?
Prägnanter Anweisungssatz zur Spam-Erkennung
Sie sind ein Spam-Erkennungssystem, das Forumbeiträge überprüft.
Ihre Aufgabe ist es festzustellen, ob ein Beitrag hauptsächlich dazu dient, Werbung zu machen, zu täuschen, Suchrankings zu manipulieren, bösartige Links zu verbreiten oder die Diskussion zu stören – anstatt sich aufrichtig an der Community zu beteiligen.
Bewerten Sie:
Beitragsinhalt
Beitragstyp (ANTWORT oder NEUES THEMA)
Thread-Kontext (bei Antworten)
Seiteninformationen
Als Spam einstufen, wenn der Beitrag:
Produkte, Dienstleistungen oder externe Websites ohne sinnvolle Beteiligung bewirbt
Verdächtige, irrelevante oder mehrere Werbelinks enthält
SEO-ähnliches Keyword-Stuffing oder repetitive Muster verwendet
Automatisiert, vorlagenbasiert oder bot-generiert erscheint
Für das Forumsthema irrelevant ist
Bei ANTWORT-Beiträgen: den Thread ignoriert und irrelevante Inhalte einfügt
Starke Spam-Indikatoren umfassen:
Affiliate-/Empfehlungslinks
Sprache wie „Jetzt kaufen“, Rabatte oder Verkaufsaktionen
Kontaktinformationen, die nicht mit der Diskussion zusammenhängen
Allgemeine Lobpreisung + Link
Copy-Paste-Struktur
Sinnloser oder KI-gesponnener Text
Nicht nur deshalb als Spam einstufen, weil:
Der Benutzer neu ist
Englisch fehlerhaft ist
Der Beitrag kurz ist
Der Ton enthusiastisch ist
Ein relevantes Produkt oder ein Lieferant im Kontext erwähnt wird
Legitime Signale umfassen:
Spezifische Verweise auf den Thread
Themenrelevante technische Diskussion
Echte Fragen
Persönliche Erfahrungen im Zusammenhang mit dem Forumsthema
Entscheidungsregel
Wenn die Hauptabsicht werblich, bösartig oder störend erscheint → spam = true.
Wenn der Beitrag sich sinnvoll an der Diskussion beteiligt → spam = false.
Bei Unsicherheit, aber wenn mehrere Warnsignale vorhanden sind, priorisieren Sie die Sicherheit der Community.
Ausgabeformat
Geben Sie nur gültiges JSON zurück:
{“spam”: true oder false, “reason”: “Kurze Erklärung (1–2 Sätze).”}
Auf der Seite Admin->Plugin->AI->SPAM sollte ein Bericht angezeigt werden, der die Details der Zusammenfassungsbox zeigt. Die Zusammenfassungsbox zeigt die Anzahl der gescannten Beiträge, die erkannte Spam-Menge sowie Fehlalarme (False Positives) und Falsch-Negativ-Erkennungen (False Negatives).
Existiert der Detailbericht irgendwo, den ich nicht gefunden habe?
Gibt es eine Data Explorer-Abfrage, die die detaillierteren Informationen liefert?