Discourse Google Perspective API

:discourse2: Zusammenfassung Google Perspective API ist das offizielle Google Perspective API-Plugin für Discourse
:hammer_and_wrench: Repository-Link https://github.com/discourse/discourse-perspective-api
:open_book: Installationsanleitung So installiert man Plugins in Discourse

Funktionen

Was ist die Perspective API?

Laut der offiziellen Website ist „Perspective eine API, die es einfacher macht, bessere Gespräche zu führen. Die API verwendet maschinelle Lernmodelle, um die wahrgenommene Auswirkung eines Kommentars auf ein Gespräch zu bewerten. Dieses Modell wurde trainiert, indem Menschen gebeten wurden, Internetkommentare auf einer Skala von sehr toxisch bis sehr gesundem Beitrag zu bewerten. Toxisch wird definiert als… ein unhöflicher, respektloser oder unvernünftiger Kommentar, der Sie wahrscheinlich dazu bringt, eine Diskussion zu verlassen."

Was kann das discourse-perspective-api-Plugin?

  • Benutzer vor dem Absenden auffordern, ob sie sich eines potenziell toxischen Beitrags sicher sind.
  • Toxische Beiträge automatisch für Moderatoren und Administratoren zur Überprüfung markieren.
  • Optional private Kategorien und PMs auf toxische Inhalte scannen.

Konfiguration

Wo bekomme ich einen Perspective-API-Schlüssel?

Befolgen Sie diese Anweisungen, um ein Google Cloud-Konto zu erstellen und Zugriff auf einen API-Schlüssel zu erhalten.

Die API kann kostenlos genutzt werden. Hier sind die API-Referenzdokumente.

Schritt-für-Schritt-Anleitung für die Site-Einstellungen

(Admin → Geben Sie ‘perspective’ im Filter-Textfeld ein)

Die API ist derzeit nur für die englische Sprache verfügbar.
Die Standard-Schwellenwerte sind auf angemessen hoch eingestellt, aber diese Einstellungen bieten einige Anpassungsmöglichkeiten zur Feinabstimmung der Funktionsweise dieses Plugins. Probieren Sie die Live-Demo in den oben verlinkten offiziellen Dokumenten aus, um ein Gefühl dafür zu bekommen, wie sich die Schwellenwerte verhalten.

  • perspective_enabled:
    Aktiviert das Plugin zum Filtern potenziell toxischer Beiträge.

  • perspective_toxicity_model:
    Wählen Sie das Toxizitätsmodell für die Google Perspective API. Lesen Sie mehr darüber, wie diese Modelle entwickelt werden, in den API-Referenzdokumenten.

    • standard
      Klassifiziert unhöfliche, respektlose oder unvernünftige Kommentare, die wahrscheinlich dazu führen, dass Menschen eine Diskussion verlassen. Es ist einfacher, die Schwelle beim Standardmodell zu überschreiten, wenn Fluchwörter und Beleidigungen auf freundliche Weise verwendet werden, und Beiträge werden leicht markiert. Wenn Sie einen hohen Schwellenwert von 0,9 wählen, markiert das Standardmodell weniger Beiträge und führt weniger falsche Aktionen aus.

    • schwere Toxizität (experimentell)
      Dieses Modell verwendet denselben Algorithmus wie das Standardmodell, wurde jedoch darauf trainiert, Beispiele zu erkennen, die als „sehr toxisch" galten. Dies macht es viel weniger empfindlich gegenüber Kommentaren, die beispielsweise positive Verwendungen von Fluchwörtern enthalten. Beiträge werden nur markiert, wenn extreme Fälle von Toxizität erkannt werden, und der Schwellenwert für dieses Modell kann bis auf 0,7 als angemessener Wert gesenkt werden.

    Beispielsweise würde ein Beitrag mit „I f*****g love you man" unter dem Standard-Modell (unter Verwendung der Standardschwellenwerte) markiert, aber nicht mit dem schwere Toxizität-Modell.

  • perspective_notify_posting_min_toxicity_enable:
    Aktiviert die Prüfung auf potenziell toxische Inhalte, während ein Benutzer versucht, einen Beitrag zu senden, und sendet eine Benachrichtigung im Composer, wenn ein Benutzer etwas Toxisches schreibt.

    • perspective_notify_posting_min_toxicity:
      Wenn die API einen Score höher als diesen Schwellenwert zurückgibt, benachrichtigen wir den Benutzer und fragen, ob er sich sicher ist, potenziell toxische Inhalte zu veröffentlichen. Das Konfidenzniveau der Beitragstoxizität liegt zwischen 0 und 1, wobei 1 extrem toxisch bedeutet. Ein Wert über 0,9 sollte nur hochtoxische Beiträge markieren, abhängig vom verwendeten Modell. Da der Benutzer vor dem Veröffentlichen benachrichtigt wird, können wir hier einen etwas niedrigeren Schwellenwert wie 0,85 verwenden, um Benutzer im Voraus zu warnen.
  • perspective_flag_post_min_toxicity_enable:
    Markiert bereits gesendete potenziell toxische Beiträge und sendet Nachrichten, um Moderatoren über gesendete Beiträge zu benachrichtigen. Administratoren/Moderatoren werden über die markierten Beiträge informiert.

    • perspective_flag_post_min_toxicity:
      Wenn die API einen Score höher als diesen Schwellenwert zurückgibt, markieren wir den Beitrag für Administratoren/Moderatoren zur Überprüfung. Das Konfidenzniveau der Beitragstoxizität liegt zwischen 0 und 1, wobei 1 extrem toxisch bedeutet. Ein Wert über 0,9 sollte nur hochtoxische Beiträge markieren, abhängig vom verwendeten Modell.
  • perspective_google_api_key:
    API-Schlüssel für die Perspective API, den Sie nach Abschluss des oben genannten Registrierungsprozesses erhalten haben.

  • perspective_check_private_message:
    Prüft und markiert private Nachrichten, falls toxisch.
    Hinweis: Der Inhalt der PN wird an Moderatoren/Administratoren gesendet.
    Gilt auch für den Backfill-Modus.

  • perspective_check_secured_categories:
    Prüft zusätzlich private Kategorien auf toxische Inhalte, indem diese Einstellung aktiviert wird.

  • perspective_backfill_posts:
    Führt eine Toxizitätsabfrage für bestehende Beiträge durch und speichert die Ergebnisse in benutzerdefinierten Beitragsfeldern.
    Das Aktivieren dieses Modus deaktiviert die Online-Prüfung für Beiträge.

  • perspective_historical_inspection_period:
    Der Zeitraum in Tagen, nach dem eine neue Abfrageiteration nach Abschluss der letzten Iteration gestartet wird. Wird nur verwendet, wenn perspective_backfill_posts aktiviert ist.

Screenshots

Was ein Benutzer sieht, wenn er versucht, einen toxischen Beitrag zu senden:

Was Administratoren/Moderatoren sehen, wenn ein toxischer Beitrag gesendet wird:

ÄNDERUNGSVERZEICHNIS

TODO


Großer Dank an @fantasticfears für die Erstellung dieses Plugins!

49 „Gefällt mir“

Es sieht so aus, als ob die API aktualisiert wurde und nun mehr Sprachen wie Russisch unterstützt. Wann wird das Update zur Erweiterung der Unterstützung im Plugin erfolgen?

2 „Gefällt mir“

Gleiche Frage. Kann es für die portugiesische Sprache funktionieren, da diese derzeit von der API unterstützt wird?

EDIT: Ich habe es getestet und es funktioniert perfekt in portugiesischer Sprache.

Ich liebe es.

5 „Gefällt mir“

Gibt es etwas Neues zu dieser API? Ehrlich gesagt, ich möchte wissen, ob sie noch jemand benutzt und ob es etwas zu berichten gibt.

Unsere Kunden nutzen die Funktion „Triage nach Persona“ im Discourse AI-Plugin, die alles kann, was dies kann, aber Flexibilität für die Besonderheiten jeder Community bietet.

4 „Gefällt mir“

Gemini Flash 2.0 ist für meine Community nicht mehr ausreichend, ich habe im Grunde kein Toxizitätswerkzeug außer dieser API, aber das ist in Ordnung, ich werde später darüber nachdenken.

Gemini Flash 2.0 ist jetzt mehrere Versionen zurück, versuchen Sie, die aktuelle Version von Gemini Flash zu verwenden.

2 „Gefällt mir“

Wichtiger Hinweis: Die Perspective API wird eingestellt und der Dienst wird nach 2026 offiziell beendet.

Ich nehme an, wir können auf allgemeine LLM-Lösungen umsteigen? Genau wie bei der Spam-Filterung? Gibt es eine Roadmap, die ich abonnieren kann?

1 „Gefällt mir“

Ja, verwenden Sie KI + Automatisierung, wie oben erwähnt

4 „Gefällt mir“