Frustrationen über KI-Spam-Detektor

,

Ich versuche, den KI-Spam-Detektor für meine eigene Discourse-Instanz einzurichten, habe aber mehrere Fragen:

Die Systemaufforderung für die Spam-Detektor-Persona kann nicht bearbeitet werden. Ich kann eine neue Persona erstellen, aber es gibt kein Feld, um Discourse mitzuteilen, dass sie als Spam-Detektor verwendet werden soll?

Ich möchte Qwen3 als LLM für die Aufgabe verwenden. Es gibt keine Voreinstellung für Qwen3, also werde ich eine benutzerdefinierte erstellen. Aber es gibt auch keinen Qwen3Tokenizer. Was macht der Tokenizer hier? Funktioniert QwenTokenizer für Qwen3?

Oder gibt es eine einfachere Option, bei der ich einen Webhook-ähnlichen Dienst einrichten kann und Discourse diesen bei neuen Themen/Beiträgen aufruft?

2 „Gefällt mir“

Hallo, um Ihre Frage zu beantworten:

Aus der Dokumentation:

Danke, aber ich weiß, was ein Tokenizer ist. Was ich nicht weiß, ist, wofür Discourse ihn verwendet und was passieren würde, wenn ich den falschen Tokenizer wähle? Ich brauche sowieso keinen Tokenizer, um einen LLM aufzurufen.

Können Sie versuchen, diese Seite zu besuchen: https://\u003cyour-site\u003e/admin/plugins/discourse-ai/ai-spam – dort sollten Sie benutzerdefinierte Anweisungen eingeben und gegen einen Beitrag testen können.

Soweit ich weiß, wird diese Anweisung an die Systemaufforderung angehängt, anstatt sie zu ersetzen, wodurch die Aufforderung noch länger wird und gemischte Sprachen enthält…

Aber das Bestehen des Tests bedeutet nicht, dass es kein Problem gibt. (FYI: Ich habe die LLM noch nicht vollständig eingerichtet; ich habe den kostenlosen Gemini-Dienst ausprobiert, aber eine 429-Fehlermeldung erhalten, daher versuche ich herauszufinden, wie ich llama.cpp in Discourse integrieren kann.)

Ich habe gerade eine schnelle Einrichtung vorgenommen und es funktioniert einwandfrei, wenn ich die benutzerdefinierte Persona für Spam auswähle.

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

Lassen Sie uns erneut wissen, wenn Sie dies über /discourse-ai/ai-spam nicht tun können.

4 „Gefällt mir“

Danke, also wirkt sich dieses „Spam-Erkennung“-Label nur auf die Listenfilterung von Personas aus?
Ich werde eine Testumgebung einrichten und es ausprobieren.

1 „Gefällt mir“

Es scheint zu funktionieren, danke!

2 „Gefällt mir“

Ich habe den Quellcode überprüft. Wenn ich mich nicht irre, wird der Tokenizer für zwei Dinge verwendet: Zählen von Tokens für Statistiken und Preisschätzung sowie Kürzen von Beiträgen auf das festgelegte Limit. Es sollte mich also nicht großartig beeinflussen, wenn ein falscher verwendet wird.

1 „Gefällt mir“