Bloquer la récente vague de spam

Nous sommes frappés par une vague de spam massive depuis des jours. D’autres comme https://ask.learncbse.in/ ont abandonné pour le moment, semble-t-il :thinking:

Je cherche ici juste une variante :

Le contenu change souvent, les adresses e-mail et les adresses IP aussi, donc le blocage réduit la quantité, mais nous n’avons pas encore trouvé de solution réelle. Pour des raisons de confidentialité, nous ne voulons pas envoyer tout à Akisment.

Si nous bloquions

AS55836 : Reliance Jio Infocomm Limited
AS9498 : Bharti Airtel Ltd.
AS45609 : Bharti Airtel Ltd.
AS24560 : Bharti Airtel Ltd.

nous serions tranquilles, mais cela pourrait représenter une bonne (ou petite) partie de la population indienne.

4 « J'aime »

Avez-vous essayé d’ajouter certains mots à Admin → Personnaliser → Mots surveillés → Exiger l’approbation ?

D’après votre capture d’écran, j’essaierais d’ajouter ces mots :

  • cash
  • credit
  • money
  • loan
  • toll-free
  • customer care
  • care number
  • 0779*
  • helpline
  • :point_left:

Cela peut être légèrement gênant pour les utilisateurs, mais j’ai configuré Discourse pour qu’il envoie un webhook à une fonction cloud Firebase (gratuite) qui alerte mon téléphone dans une salle de discussion Slack, afin que je puisse souvent approuver les publications en modération en moins de 60 secondes depuis mon téléphone, si je suis réveillé.

3 « J'aime »

Merci pour l’indice, mais veuillez consulter https://ask.learncbse.in/ (ce n’est pas mon instance, mais les publications sont plus ou moins les mêmes contre lesquelles je me bats) et faites défiler les derniers jours, ils utilisent une tonne de combinaisons et de variations de chaque mot-clé. Je suis en train de créer beaucoup d’expressions régulières pour chaque mot-clé car ils ajoutent partout un “.”, une “,”, un “|”, remplacent un “0” par un “O”, un “e” par un “3”, ajoutent au milieu du mot un caractère (jusqu’à présent) aléatoire, etc. etc. … il est vraiment difficile de lutter contre ce type de spam.

Ou si vous ne voulez pas cliquer sur un lien aléatoire, voici une capture d’écran des dernières heures, mais ce ne sont que les dernières heures, elles varient beaucoup avec le temps :

1 « J'aime »

Juste pour vérifier, mais utilisez-vous le paramètre d’administration min first post typing time ? Je le trouve assez utile pour attraper beaucoup des nôtres.

5 « J'aime »

Oui, merci pour l’indice, c’est réglé mais je veux dire que ce n’est pas si difficile pour le bot d’attendre quelques minutes :slight_smile:

1 « J'aime »

Ce spam semble être d’un type différent des réponses/contenus basés sur l’IA sur lesquels l’autre sujet est axé, je l’ai donc séparé. :+1:

Nous avons un nouvel outil basé sur l’IA pour la détection de spam qui s’est avéré assez efficace :

6 « J'aime »

Merci pour le conseil, mais la mise en place d’un LLM juste pour combattre un autre LLM de spam dans notre discussion est beaucoup trop coûteuse pour notre cas d’utilisation.

En tant que spammeur, vous pouvez facilement augmenter les coûts pour l’organisation en créant simplement plus d’utilisateurs/de publications, donc selon ce que vous voulez réaliser, cela pourrait aussi être une motivation pour créer encore plus de publications :slight_smile:

1 « J'aime »

Salut,

Avez-vous essayé d’utiliser Akismet ? Il semble que leur solution pourrait vous convenir.

(gratuit pour un usage personnel, pas pour un usage commercial - je ne sais pas comment vous vous classeriez)

2 « J'aime »

Peut-être qu’exiger que le premier message de chaque utilisateur soit approuvé aiderait un peu ici ? De cette façon, au moins, ils n’arriveraient jamais publiquement sur le forum, et tant que vous n’avez pas beaucoup de vrais utilisateurs qui s’inscrivent quotidiennement, je pense que cela aiderait au moins un peu.

5 « J'aime »

Merci pour tous ces conseils.

Nous y avons pensé, mais nous avons un produit de confidentialité et de sécurité, ce qui signifie que nous devons protéger nos utilisateurs autant que possible. Le contenu est public, certes, mais pas l’adresse IP/l’agent/le référent/l’e-mail si j’ai bien compris Discourse Akismet, il est transmis à Akismet (je lirais bien sûr aussi la politique de confidentialité, mais l’aperçu suffit déjà pour prendre une décision).

Ce serait une idée. Avec environ 2 inscriptions par jour, cela ne devrait pas poser trop de problèmes, mais ce n’est pas la meilleure expérience d’attendre une approbation, mais si nous l’expliquons correctement, ce pourrait être la meilleure option que nous ayons pour l’instant.

1 « J'aime »

Oui, vous avez malheureusement raison - ils transmettent des données supplémentaires à Akismet, ce qui peut ne pas correspondre à votre politique de confidentialité. Dans ce cas, la suggestion de @Firepup650 est la meilleure qui soit.

1 « J'aime »

Pour information, mon plugin Geo Blocking plugin peut refuser l’accès à Discourse en fonction du réseau AS source. En effet, une grande partie de ce type de spam semble provenir de ces réseaux, en particulier de l’AS45609.

Si vous ne voulez pas bloquer la moitié de l’Inde, il pourrait être intéressant d’étudier la facilité avec laquelle on pourrait réutiliser une partie des fonctionnalités de ce plugin pour ajouter des règles basées sur le réseau ou l’IP à la logique d’approbation (« exiger l’approbation pour les nouveaux messages provenant de réseaux »).

6 « J'aime »

J’ai parcouru de nombreuses pages sur ce site exemple et je pense qu’il serait possible de bloquer presque tous ces éléments avec la fonctionnalité de mots surveillés, si les expressions régulières de Discourse peuvent fonctionner sur des plages Unicode.

Les utilisateurs réguliers n’utilisent probablement pas ce genre de choses :

  • 2 barres obliques ou plus d’affilée
  • Ponctuation inhabituelle comme ^ (sauf s’il s’agit d’un site de mathématiques)
  • Plages Unicode peu communes :
    • ✓ (Symboles divers)
    • ∆ (Grec et Copte)
    • ❽, ➁, ❸, 3, ❷ (Dingbats)
    • 𝘾, 𝙪, 𝙨, 𝙩 (Symboles alphanumériques mathématiques)

ChatGPT pourrait probablement écrire une expression régulière pour cela, si Discourse la prend en charge.

Une autre idée est d’essayer Cloudflare avec la fonctionnalité Bot Fight Mode (gratuite) et de défier tous les bots.

3 « J'aime »

Ouh, ce serait la solution parfaite, je vais jeter un œil au code, merci !

Le problème ici est que ce bot sait d’une manière ou d’une autre comment fonctionne Discourse : Dans le scénario suivant, je surveille ❽ dans la section « Exiger pour approbation ». Le problème est maintenant que ces bots créent souvent d’abord un texte aléatoire, puis le modifient pour y mettre le contenu réel. La modification d’un message n’est pas vérifiée par rapport à la liste « Exiger pour approbation », voir par exemple

VS

(ici j’ai ajouté le ❽ directement lors de la création du message)

ce qui signifie que notre seule option est de l’ajouter à la section de blocage, mais le blocage de trop de mots et de caractères peut facilement entraîner des problèmes où les utilisateurs normaux reçoivent un message déroutant lors de la création de messages valides. Je pense que c’est là que viennent la plupart de nos problèmes. À mon avis, c’est un bug, et aussi lors de la modification d’un message, la liste « Exiger l’approbation » devrait être vérifiée par rapport au contenu modifié lorsque le changement est publié.

2 « J'aime »

Je suppose que les mots surveillés n’aideront pas alors. Je n’ai pas encore eu d’attaque de spam de ce type, mais je m’en inquiète car les utilisateurs ont commencé à le comprendre.

3 « J'aime »

Il semble qu’un de mes forums ait été victime de ce même type d’attaque de spam. Je ne sais pas s’ils ont utilisé l’astuce de modification, car je n’avais pas encore les mots de spam sur la liste des mots surveillés.

2 « J'aime »

Bonjour à tous :waving_hand:

J’ai une preuve de concept de cela, si vous voulez y jeter un œil

1 « J'aime »

Excellent travail @juanjosegzl , je l’accepterais volontiers comme PR ! :rocket:

Merci @RGJ J’ai juste ouvert une PR

1 « J'aime »

Bonjour @juanjosegzl,

Votre dernier PR a cassé le plugin - il demande maintenant à tout le monde de confirmer leur publication via la modération (même les modérateurs eux-mêmes) quelle que soit leur localisation géographique. Y a-t-il des solutions de contournement ou une ETA pour la correction ?