Discourse AI Spam-Erkennung ersetzt Akismet-Plugin

Ab heute entfernen wir das Discourse Akismet-Plugin und aktivieren stattdessen standardmäßig Discourse AI - Spam detection für gehostete Kunden auf den Pro- und Standard-Tarifen.

Warum nehmen wir diese Änderung vor?

In den letzten Wochen haben wir festgestellt, dass unser KI-Spam-Detektor eine überlegene Leistung gegenüber Akismet liefert.

Wir hatten über 126 Websites, die ihn ausgiebig nutzten, und innerhalb von Meta haben wir persönlich eine Erfolgsquote von über 96 % bei der Erkennung von Spam gesehen.

Zusätzlich zur Leistung wäre die Einrichtung nun eine Standarderfahrung mit Anpassungs- und flexiblen Optionen, falls Sie diese benötigen.

Was muss ich tun?

Wenn Sie auf unserem Starter- oder Pro-Hosting sind, gar nichts!

Die Änderung erfolgt automatisch im Hintergrund. Sie werden Akismet nicht mehr in den Plugins sehen. Sie sehen nun den KI-Spam-Detektor in der Einstellung des KI-Plugins aktiviert, der ein von Discourse gehostetes Open-Weights-LLM verwendet.

Wenn Sie das KI-Plugin deaktiviert haben, müssen Sie den KI-Spam-Detektor manuell aktivieren und ein LLM auswählen.

Ich habe die KI-Spam-Erkennung bereits aktiviert!

Wenn Sie die KI-Spam-Erkennung bereits über What's New-Experimente aktiviert haben, können Sie diese Ankündigung getrost ignorieren, da Sie sie bereits haben!

Warum gilt diese Änderung nur für Starter und Pro?

Wie üblich beginnt die Einführung von Änderungen in unserem Hosting mit den Einstiegsstufen und wird schrittweise auf alle Stufen ausgeweitet.

19 „Gefällt mir“

2 Beiträge wurden in ein neues Thema verschoben: Rebranding des AI-Spam-Erkennungs-Accounts

Bedeutet das, dass Sie das Plugin insgesamt einstellen, oder nur, dass Sie es auf Ihrer gehosteten Plattform nicht mehr anbieten? Ich bin selbstgehostet und benutze kein ‘KI’. Werde ich gezwungen sein, die KI-Spam-Erkennung zu verwenden?

3 „Gefällt mir“

Diese Änderung betrifft nur gehostete Kunden der Starter- und Standard-Tarife. Das Akismet-Plugin wird entfernt und ist für diese Tarife nicht mehr verfügbar.

Selbst-Hoster können hier ihre eigenen Entscheidungen treffen.

3 „Gefällt mir“

Wird KI-Spam-Erkennung für Sprachen mit weniger Sprechern auf der Welt richtig funktionieren? Wie z. B. Ukrainisch.

Wird sie auch zweisprachige Beiträge verarbeiten, was in einigen Ländern natürlich ist, wie z. B. in der Ukraine, wo die Menschen sowohl Ukrainisch als auch Russisch austauschbar sprechen und manchmal beides in einem einzigen Beitrag verwenden können.

Ich schätze, ein weiteres Beispiel könnten Neapel/Italienisch sein? Oder Spanisch/Katalanisch? Aber bei diesen Paaren bin ich mir nicht sehr sicher – ich kenne nur Ukrainisch/Russisch.

3 „Gefällt mir“

Absolut, es hängt einfach vom LLM ab, das Sie zur Stromversorgung verwenden.

Google-Modelle sind tendenziell extrem mehrsprachig, Gemini Flash unterstützt 120 Sprachen und ist daher ein guter Kandidat.

Probieren Sie es mit der Testschaltfläche für einige echte Beiträge, einige Spam-Beiträge usw. aus. Sie können benutzerdefinierte Anweisungen geben wie:

Das Posten im Wechsel zwischen Russisch und Ukrainisch ist in Ordnung.

4 „Gefällt mir“

Über OpenAI funktioniert es für Finnisch. Nun, es gibt ab und zu Fehlalarme, wenn es sich um eine Einzeiler handelt, aber ich glaube nicht, dass das ein Sprachproblem ist, sondern schwache Eingabeaufforderungen.

5 „Gefällt mir“

Hallo, ich bin selbst gehostet. Ist die Askimet-Spam-Erkennung in den Kern einer Discourse-Installation integriert oder muss ich dieses Plugin separat installieren? Danke.

1 „Gefällt mir“

Es ist nicht im Kern enthalten. Sie finden das Thema hier: Discourse Akismet

Aber das Thema ist geschlossen und verborgen. Ich bin mir nicht sicher, was das bedeutet. Es wäre sinnvoll, wenn das Plugin nicht mehr gewartet würde, aber dieses Thema besagt, dass es nur aus zwei Hosting-Stufen entfernt wurde. Warum sollten Selbsthoster und gehostete Kunden in höheren Stufen die Informationen nicht durch Suchen in Meta finden können? Ich würde auf eine Antwort warten, bevor ich es installiere.


Und ich glaube, einmal im ersten Beitrag wurde versehentlich ‘Starter’ statt ‘Standard’ durch ‘Pro’ ersetzt.

Akismet hat uns zu oft im Stich gelassen. Wir haben beobachtet, dass viele Websites mit installierter Akismet-Software einfach mit Spam überflutet werden.

Selbsthoster sollten Discourse AI mit einem der vielen kostenlosen Modelle verwenden, wenn das Budget ein Problem darstellt. Gemini Flash 2.0 Free Tier tut es einigermaßen.

6 „Gefällt mir“

Vielen Dank für die Informationen, es war nicht offensichtlich, dass meine selbst gehostete Discourse-Site nicht vor Spam geschützt war. Ich ging fälschlicherweise davon aus, dass sie es war. Meiner Meinung nach sollten diese Informationen für angehende Discourse-Administratoren, die ihre Website selbst hosten möchten, prominenter dargestellt werden.

Ich werde nach dieser Discourse AI-Funktionalität suchen, die ich aufgrund von Budgetbeschränkungen noch nie in Betracht gezogen hatte.

Ich versuche hier, die Aktionen für einen Administrator einer selbst gehosteten Website wie meiner aufzulisten. Können Sie mir sagen, ob ich richtig liege?

  1. Zuerst sollte ich das Discourse AI-Plugin installieren? Discourse AI

  2. Zweitens sollte ich ein LLM einrichten, wie hier erklärt? Discourse AI - Large Language Model (LLM) settings page

  3. Dann sollte ich einen Spam-Erkennungsmechanismus einrichten, wie hier erklärt? Discourse AI - Spam detection

1 „Gefällt mir“

Eine Erinnerung/Notiz für Self-Hosters:

Das Hinzufügen von „zufälligen“ LLMs zur Bekämpfung des Spam-Problems kann ein Fass ohne Boden in Bezug auf Datenschutz und den Schutz personenbezogener Daten (PII) öffnen. Wenn Sie verpflichtet sind, die DSGVO, COPPA usw. einzuhalten, erfordert die Verwendung externer LLMs möglicherweise den Abschluss einer Datenschutzvereinbarung mit dem LLM-Anbieter, um sicherzustellen, dass Ihre Website keine PII an Dritte weitergibt. Und PII beginnen mit einfachen Dingen wie Namen und E-Mail-Adressen.

Dies ist nur etwas, das man im Hinterkopf behalten sollte.

2 „Gefällt mir“

Ich weiß nicht, wie es in den USA oder im Vereinigten Königreich aussieht [1], aber in der EU ist das eine relativ einfache Frage.

Notwendige Daten können an Dritte „geleakt“ oder übertragen werden, auch wenn sie als personenbezogene Daten gelten, wenn diese die DSGVO einhalten. Und das tun alle großen Anbieter. Oder zumindest sagen sie das. Es ist eine Frage des Vertrauens.

Ich muss es laut sagen, aber ich vertraue keinem Unternehmen aus China. Und das Gleiche gilt für US-Unternehmen. Beide Seiten haben massive Regierungsprobleme und müssen auf eine schwere Art und Weise im Ausland Geld verdienen. Microsoft hat Daten an die USA weitergegeben/gibt sie weiter, obwohl sie sie in der EU behalten sollten.

Nutze ich Amazon und OpenAI trotzdem? Ja, weil ich muss. Aber alle meine VPS und die meisten S3-Aktivitäten wurden von AWS wegverlagert. Aber meine persönlichen E-Mails und transaktionalen E-Mails von z. B. Foren werden immer noch von AWS bearbeitet.

Die gesamte Forum-basierte KI-Aktivität wird von OpenAI abgewickelt. Ich vertraue ihnen nicht – aber was sind meine Optionen? Ich mag die Verbindung zu Microsoft wirklich nicht, aber es könnte schlimmer sein…

Wir als EU-Administratoren sind also ziemlich sicher, wenn wir keine Ausweiskopien oder persönlichen Identifikationsdokumente anfordern, da Discourse als Plattform seinen Teil recht gut erledigt. Und solange der Drittanbieter erklärt, dass er die DSGVO und andere Vorschriften einhält (genau wie bei Google Ads usw.), ist das „Leaken“ kein rechtliches Problem.

Aber es ist definitiv ein moralisches Problem. Deshalb nutzen wir entweder KI und versuchen gleichzeitig, die Benutzer zu schulen, oder wir nutzen sie gar nicht. Das sind die Optionen.

Und im Großen und Ganzen… KI in Foren ist ein weitaus kleineres Problem, was personenbezogene Daten angeht, als die Nutzung von Meta, 8.8.8.8 als DNS oder kommerziellen VPN-Diensten (oder das Aufzeichnen von iPhone-Anrufen über chinesische Server… [2]).


  1. persönliche Meinung: beide Länder sind in dieser Angelegenheit ein Chaos ↩︎

  2. im Ernst… mein Saugroboter wollte alle Standortdaten und WLAN-Informationen nach China senden ↩︎

2 „Gefällt mir“

Benötigt das KI-Plugin mehr Rechenressourcen (sprich: Umwelressourcen) als Akismet?

1 „Gefällt mir“

100% unbekannt, Akismet ist eine API und Wordpress hat nie die genaue Menge an Berechnungen veröffentlicht, die sie verwenden.

Unsere GPU-Server bedienen unsere gesamte Kundenbasis, und LLMs sind in den letzten 3 Jahren deutlich effizienter geworden.

4 „Gefällt mir“