Discourse AI - Toxicity

Discourse · 24. April 2023 um 19:39

Dieses Thema behandelt die Konfiguration der Toxizitätsfunktion des Discourse AI Plugins.

Erforderliches Benutzerniveau: Administrator

Die Toxizitätsmodule können den Toxizitätswert jedes neuen Beitrags und jeder neuen Chat-Nachricht in Ihrer Discourse-Instanz automatisch klassifizieren. Sie können auch die automatische Kennzeichnung von Inhalten aktivieren, die einen Schwellenwert überschreiten.

Klassifizierungen werden in der Datenbank gespeichert, sodass Sie das Plugin aktivieren und Data Explorer für Berichte über die Klassifizierung neuer Inhalte in Discourse sofort verwenden können. Wir werden bald einige Standard-Data-Explorer-Abfragen mit dem Plugin ausliefern, um dies zu erleichtern.

Einstellungen

ai_toxicity_enabled: Aktiviert oder deaktiviert das Modul

ai_toxicity_inference_service_api_endpoint: URL, unter der die API für das Toxizitätsmodul läuft. Wenn Sie CDCK-Hosting verwenden, wird dies automatisch für Sie erledigt. Wenn Sie selbst hosten, lesen Sie die Anleitung für Self-Hosting.

ai_toxicity_inference_service_api_key: API-Schlüssel für die oben konfigurierte Toxizitäts-API. Wenn Sie CDCK-Hosting verwenden, wird dies automatisch für Sie erledigt. Wenn Sie selbst hosten, lesen Sie die Anleitung für Self-Hosting.

ai_toxicity_inference_service_api_model: ai_toxicity_inference_service_api_model: Wir bieten drei verschiedene Modelle an: original, unbiased und multilingual. unbiased wird gegenüber original empfohlen, da es versucht, Voreingenommenheiten, die durch das Trainingsmaterial in die Klassifizierung eingebracht werden, nicht zu übernehmen. Für mehrsprachige Communities unterstützt das letzte Modell Italienisch, Französisch, Russisch, Portugiesisch, Spanisch und Türkisch.

ai_toxicity_flag_automatically: Beiträge/Chat-Nachrichten automatisch kennzeichnen, wenn die Klassifizierung für eine bestimmte Kategorie den konfigurierten Schwellenwert überschreitet. Verfügbare Kategorien sind toxicity, severe_toxicity, obscene, identity_attack, insult, threat und sexual_explicit. Für jede Kategorie gibt es eine Einstellung ai_toxicity_flag_threshold_${category}.

ai_toxicity_groups_bypass: Benutzer in diesen Gruppen werden von ihren Beiträgen nicht vom Toxizitätsmodul klassifiziert. Standardmäßig sind dies Staff-Benutzer.

Zusätzliche Ressourcen

Discourse AI

Install plugins on a self-hosted site

Thema		Antworten	Aufrufe
Setting up toxicity detection in your community Site Management moderation , automation , how-to , ai	0	896	7. August 2024
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	3	419	7. Juli 2023
Discourse Google Perspective API Plugin official , perspective-api	6	21082	4. Januar 2026
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	2	821	1. Januar 2026
AI flagging too sensitive Support ai , ai-toxicity	2	584	31. März 2024

Discourse AI - Toxicity

Einstellungen

Zusätzliche Ressourcen

Verwandte Themen