Blockierung der jüngsten Spamwelle

Wir werden seit Tagen von einer massiven Spam-Welle getroffen. Andere wie https://ask.learncbse.in/ haben es im Moment aufgegeben, wie es scheint :thinking:

Ich suche hier nur nach einer Variante:

Der Inhalt ändert sich oft, ebenso die E-Mail-Adressen und IPs, sodass das Blockieren die Menge reduziert, aber wir haben noch keine wirkliche Lösung gefunden. Aus Datenschutzgründen möchten wir nicht alles an Akisment senden.

Wenn wir blockieren würden

AS55836: Reliance Jio Infocomm Limited
AS9498: Bharti Airtel Ltd.
AS45609: Bharti Airtel Ltd.
AS24560: Bharti Airtel Ltd.

wären wir fein, aber das könnte ein guter (oder kleiner) Teil der indischen Bevölkerung sein.

4 „Gefällt mir“

Haben Sie versucht, bestimmte Wörter unter Admin → Anpassen → Beobachtete Wörter → Genehmigung erforderlich hinzuzufügen?

Aus Ihrem Screenshot würde ich versuchen, diese Wörter hinzuzufügen:

  • Bargeld
  • Kredit
  • Geld
  • Darlehen
  • gebührenfrei
  • Kundendienst
  • Service-Nummer
  • 0779*
  • Hotline
  • :point_left:

Es kann für Benutzer etwas unbequem sein, aber ich lasse Discourse einen Webhook an eine Firebase Cloud-Funktion (kostenlos) senden, die mein Telefon in einem Slack-Chatroom benachrichtigt, sodass ich Beiträge oft innerhalb von 60 Sekunden von meinem Telefon aus genehmigen kann, wenn ich wach bin.

3 „Gefällt mir“

Danke für den Hinweis, aber bitte schauen Sie sich https://ask.learncbse.in/ an (es ist nicht meine Instanz, aber die Beiträge sind mehr oder weniger die gleichen, gegen die ich kämpfe) und scrollen Sie durch die letzten Tage, sie verwenden eine Menge Kombinationen und Variationen jedes Schlüsselworts. Ich bin dabei, viele Regex für jedes Schlüsselwort zu erstellen, da sie überall einen Punkt, ein Komma, ein Pipe-Symbol hinzufügen, eine 0 durch ein O ersetzen, ein e durch eine 3, mitten im Wort ein (bisher) zufälliges Zeichen usw. usw. hinzufügen … es ist wirklich schwierig, gegen diese Art von Spam anzukämpfen.

Oder wenn Sie nicht auf einen zufälligen Link klicken möchten, hier ist ein Screenshot der letzten Stunden, aber das sind nur die letzten Stunden, sie variieren im Laufe der Zeit stark:

1 „Gefällt mir“

Nur zur Überprüfung, aber verwenden Sie die Admin-Einstellung min first post typing time? Ich finde das sehr nützlich, um viele unserer Probleme zu erkennen.

5 „Gefällt mir“

Ja, danke für den Hinweis, das ist eingestellt, aber ich meine, es ist nicht so schwer für den Bot, einfach ein paar Minuten zu warten :slight_smile:

1 „Gefällt mir“

Dieser Spam scheint eine andere Art zu sein als die KI-basierten Antworten/Inhalte, auf die sich das andere Thema konzentriert, daher habe ich es abgetrennt. :+1:

Wir haben ein neues KI-basiertes Tool zur Spam-Erkennung, das sich als recht effektiv erwiesen hat:

6 „Gefällt mir“

Danke für den Tipp, aber die Einrichtung eines LLM nur um ein anderes Spam-LLM für unseren Diskurs zu bekämpfen, ist für unseren Anwendungsfall viel zu teuer.

Als Spammer können Sie die Kosten für die Organisation leicht erhöhen, indem Sie einfach mehr Benutzer/Beiträge erstellen. Je nachdem, was Sie erreichen möchten, könnte dies auch eine Motivation sein, noch mehr Beiträge zu erstellen :slight_smile:

1 „Gefällt mir“

Hallo,

Haben Sie versucht, Akismet zu verwenden? Es scheint, dass deren Lösung für Sie funktionieren würde.

(kostenlos für den persönlichen Gebrauch, nicht für den kommerziellen Gebrauch – ich weiß nicht, wie Sie sich selbst einstufen würden)

2 „Gefällt mir“

Vielleicht würde es hier ein wenig helfen, wenn jeder erste Beitrag jedes Benutzers genehmigt werden müsste? Auf diese Weise würden sie es zumindest nie öffentlich ins Forum schaffen, und solange Sie nicht täglich viele echte Benutzer haben, die sich anmelden, denke ich, würde es zumindest etwas helfen.

5 „Gefällt mir“

Vielen Dank für all die Tipps.

Wir haben darüber nachgedacht, aber wir haben ein Datenschutz- und Sicherheitsprodukt, was bedeutet, dass wir unsere Benutzer so gut wie möglich schützen müssen. Der Inhalt ist sicher öffentlich, aber nicht die IP-Adresse/der Agent/der Referrer/die E-Mail, wenn ich Discourse Akismet richtig verstanden habe, wird dies an Akismet übertragen (sicher würde ich auch die Datenschutzerklärung lesen, aber die Übersicht reicht bereits aus, um die Entscheidung zu treffen).

Das wäre eine Idee. Bei ~2 Anmeldungen pro Tag sollte es keine allzu großen Probleme bereiten, aber es ist keine optimale Erfahrung, auf eine Genehmigung zu warten, aber wenn wir es richtig erklären, ist es vielleicht die beste Option, die wir im Moment haben.

1 „Gefällt mir“

Ja, Sie haben leider Recht – sie übertragen einige zusätzliche Daten an Akismet, die möglicherweise nicht mit Ihrer Datenschutzrichtlinie übereinstimmen. In diesem Fall ist der Vorschlag von @Firepup650 der beste.

1 „Gefällt mir“

Zu Ihrer Information, mein Geo Blocking plugin kann den Zugriff auf Discourse basierend auf dem Quell-AS-Netzwerk verweigern. Tatsächlich scheint viel von dieser Art von Spam aus diesen Netzwerken zu stammen, insbesondere aus AS45609.

Wenn Sie nicht die Hälfte Indiens blockieren möchten, könnte es sich lohnen zu untersuchen, wie schwierig es wäre, einige der Funktionalitäten dieses Plugins wiederzuverwenden, um Netzwerk- oder IP-basierte Regeln zur Genehmigungslogik hinzuzufügen („Genehmigung für neue Beiträge aus Netzwerken erforderlich“).

6 „Gefällt mir“

Ich habe viele Seiten auf dieser Beispiel-Website durchgesehen und denke, es wäre möglich, fast alle davon mit der Funktion “überwachte Wörter” zu blockieren, wenn Discourse-Regex auf Unicode-Bereiche angewendet werden kann.

Normale Benutzer verwenden wahrscheinlich keine Dinge wie diese:

  • 2+ Schrägstriche hintereinander
  • Ungewöhnliche Satzzeichen wie ^ (es sei denn, es ist eine Mathe-Seite)
  • Ungewöhnliche Unicode-Bereiche:
    • ✓ (Miscellaneous Symbols)
    • ∆ (Greek and Coptic)
    • ❽, ➁, ❸, 3, ❷ (Dingbats)
    • 𝘾, 𝙪, 𝙨, 𝙩 (Mathematical Alphanumeric Symbols)

ChatGPT könnte wahrscheinlich einen Regex dafür schreiben, wenn Discourse ihn unterstützt.

Eine weitere Idee ist, Cloudflare mit der Funktion Bot Fight Mode (kostenlos) auszuprobieren und alle Bots herauszufordern.

3 „Gefällt mir“

Ouh, das wäre die perfekte Lösung, ich werde mir den Code ansehen, danke!

Das Problem hier ist, dass dieser Bot irgendwie weiß, wie Discourse funktioniert: Im folgenden Szenario beobachte ich ❽ im Abschnitt “Require for Approval”. Das Problem ist nun, dass diese Bots oft zuerst einen zufälligen Text erstellen und ihn dann zum eigentlichen Inhalt bearbeiten. Das Bearbeiten eines Beitrags wird nicht gegen die Liste “Require for Approval” geprüft, siehe z. B.

VS

(hier habe ich die ❽ direkt während der Beitragserstellung hinzugefügt)

was bedeutet, dass unsere einzige Option darin besteht, es zum Blockierungsbereich hinzuzufügen, aber das Blockieren zu vieler Wörter und Zeichen kann leicht zu Problemen führen, bei denen normale Benutzer eine verwirrende Nachricht erhalten, wenn sie gültige Beiträge erstellen. Ich denke, hier liegen die meisten unserer Probleme. Meiner Meinung nach ist das ein Fehler, und auch beim Bearbeiten eines Beitrags sollte die Liste “Require Approval” gegen den bearbeiteten Inhalt geprüft werden, wenn die Änderung veröffentlicht wird.

2 „Gefällt mir“

Ich schätze, beobachtete Wörter werden dann nicht helfen. Ich hatte noch keinen Spam-Angriff von dort, aber ich mache mir Sorgen deswegen, weil die Benutzer angefangen haben, es herauszufinden.

3 „Gefällt mir“

Es sieht so aus, als ob eines meiner Foren gerade von derselben Art von Spam-Angriff getroffen wurde. Ich weiß nicht, ob sie den Bearbeitungstrick verwendet haben, da ich die Spam-Wörter noch nicht auf der Beobachtungsliste hatte.

2 „Gefällt mir“

Hallo zusammen :waving_hand:

Ich habe einen Proof of Concept dazu, wenn ihr ihn euch ansehen wollt

1 „Gefällt mir“

Gute Arbeit @juanjosegzl, ich würde das gerne als PR annehmen! :rocket:

Danke @RGJ Ich habe gerade ein PR eröffnet

1 „Gefällt mir“

Hallo @juanjosegzl ,

Ihr letzter PR hat das Plugin kaputt gemacht – es fordert jetzt jeden auf, seine Beiträge über die Moderation zu bestätigen (selbst die Moderation selbst), unabhängig von ihrem geografischen Standort. Gibt es Workarounds oder eine ETA für die Behebung?