La détection de spam avec Discourse AI remplace le plugin Akismet

À partir d’aujourd’hui, nous supprimerons le plugin Discourse Akismet et activerons à la place Discourse AI - Détection de spam par défaut pour les clients hébergés sur les plans Pro et Standard.

Pourquoi faisons-nous ce changement ?

Au cours des dernières semaines, nous avons constaté que notre détecteur de spam basé sur l’IA offrait des performances supérieures à celles d’Akismet.

Plus de 126 sites l’utilisent intensivement et, sur Meta, nous avons personnellement constaté un taux de réussite de plus de 96 % dans la détection de spam.

En plus des performances, la configuration serait désormais une expérience par défaut avec des options de personnalisation et de flexibilité, si vous en avez besoin.

Que dois-je faire ?

Si vous êtes sur notre hébergement Starter ou Pro, rien du tout !

Le changement se fera automatiquement en arrière-plan. Vous ne verrez plus Akismet dans les plugins. Vous verrez maintenant le détecteur de spam IA activé dans le paramètre du plugin IA en utilisant un LLM à poids ouverts hébergé par Discourse.

Si vous avez désactivé le plugin IA, vous devrez alors activer manuellement le détecteur de spam IA et sélectionner un LLM.

J’ai déjà activé la détection de spam IA !

Si vous avez déjà activé le détecteur de spam IA via les expériences Nouveautés, vous pouvez ignorer cette annonce en toute sécurité car vous l’avez déjà !

Pourquoi ce changement ne concerne-t-il que les plans Starter et Pro ?

Comme d’habitude, le déploiement des changements dans notre hébergement commence par les niveaux inférieurs et est progressivement étendu pour couvrir tous les niveaux.

19 « J'aime »

2 messages ont été divisés dans un nouveau sujet : Rebranding the ai spam detection account

Cela signifie-t-il que vous abandonnez complètement le plugin, ou que vous ne le proposez plus uniquement sur votre plateforme hébergée ? Je suis auto-hébergé et je n’utilise pas d’« IA ». Serai-je obligé de commencer à utiliser la détection de spam basée sur l’IA ?

3 « J'aime »

Ce changement affecte uniquement les clients hébergés des niveaux de plan Starter et Standard. Le plugin Akismet est supprimé et n’est plus disponible pour ces niveaux de plan.

Les auto-hébergeurs peuvent faire leurs propres choix ici.

3 « J'aime »

La détection de spam par IA fonctionnera-t-elle correctement pour les langues parlées par moins de personnes dans le monde ? Comme par exemple l’ukrainien.

De plus, gérera-t-elle les publications bilingues, ce qui est naturel dans certains pays, comme par exemple en Ukraine où les gens parlent à la fois l’ukrainien et le russe de manière interchangeable, et peuvent parfois utiliser les deux dans une seule publication.

Je suppose qu’un autre exemple pourrait être le napolitain/italien ? Ou l’espagnol/catalan ? Mais je ne suis pas très sûr de ces paires – je ne connais que l’ukrainien/russe.

3 « J'aime »

Absolument, cela dépend simplement du LLM que vous utilisez pour l’alimenter.

Les modèles Google ont tendance à être extrêmement multilingues, Gemini Flash prend en charge 120 langues, c’est donc un bon candidat.

Essayez-le avec le bouton de test sur de vrais messages, des messages de spam, etc. … vous pouvez fournir des instructions personnalisées comme :

Poster en russe / ukrainien de manière interchangeable est acceptable.

4 « J'aime »

Via OpenAI fonctionne pour le finnois. Eh bien, il donne de temps en temps des faux positifs s’il y a une seule ligne, mais je ne pense pas que ce soit un problème de langue, mais plutôt une mauvaise invite.

5 « J'aime »

[citation=“Saif, post:4, topic:354602”]
Les auto-hébergeurs peuvent faire leurs propres choix ici
[/citation]

Bonjour, je suis auto-hébergé. La détection de spam Askimet est-elle intégrée au cœur d’une installation Discourse ou dois-je installer ce plugin séparément ? Merci.

1 « J'aime »

Il n’est pas inclus dans le cœur. Vous pouvez trouver le sujet ici : Discourse Akismet

Mais le sujet est fermé et masqué. Je ne suis pas sûr de ce que cela signifie. Il serait logique que le plugin ne soit plus maintenu, mais ce sujet indique qu’il est seulement supprimé de deux niveaux d’hébergement. Alors pourquoi les auto-hébergeurs et les clients hébergés sur des niveaux supérieurs ne devraient-ils pas pouvoir trouver l’information en recherchant sur Meta ? J’attendrais une réponse à cela avant de l’installer.


Et je pense qu’une fois, dans le premier message, par accident, « Starter » au lieu de « Standard » a été remplacé par « Pro ».

Akismet nous a trop souvent déçus. Nous avons observé de nombreux sites sur lesquels il est installé qui sont tout simplement inondés de spam.

Les auto-hébergeurs devraient utiliser Discourse AI avec l’un des nombreux modèles gratuits si le budget est une préoccupation. Le niveau gratuit de Gemini Flash 2.0 fait raisonnablement l’affaire.

6 « J'aime »

Merci pour ces informations, il n’était pas évident que mon site Discourse auto-hébergé n’était pas protégé contre le spam. Je pensais à tort que c’était le cas. À mon avis, cette information devrait être mise en avant pour les futurs administrateurs de Discourse envisageant d’auto-héberger leur site.

Je vais chercher cette fonctionnalité Discourse AI, que je n’avais jamais envisagée auparavant en raison de restrictions budgétaires.

J’essaie ici de lister les actions pour un administrateur sur un site auto-hébergé comme le mien, pouvez-vous me dire si j’ai raison ?

  1. D’abord, je devrais installer le plugin Discourse AI ? Discourse AI

  2. Ensuite, je devrais configurer un LLM comme expliqué ici ? Discourse AI - Large Language Model (LLM) settings page

  3. Puis je devrais configurer un mécanisme de détection de spam comme expliqué ici ? Discourse AI - Spam detection

1 « J'aime »

Un rappel/une note pour les auto-hébergeurs :

L’ajout de LLM « aléatoires » pour traiter le problème du spam ouvre potentiellement une boîte de Pandore en termes de confidentialité et de protection des données personnelles identifiables (PII). Si vous êtes tenu de respecter le RGPD ou la COPPA, etc., l’utilisation de LLM externes pourrait vous obliger à conclure un accord de protection des données avec le fournisseur de LLM pour garantir que votre site ne divulgue pas de PII à un tiers. Et les PII commencent par des choses simples comme les noms et les adresses e-mail.

C’est juste quelque chose à garder à l’esprit.

2 « J'aime »

Je ne sais pas si c’est le cas aux États-Unis ou au Royaume-Uni [1], mais dans l’UE, c’est une question relativement simple.

Les données nécessaires peuvent être “fuites” aka. transférées à un tiers, même si elles sont considérées comme des données personnelles, s’ils respectent le RGPD. Et tous les acteurs majeurs le font. Ou du moins, c’est ce qu’ils disent. C’est une question de confiance.

Je déteste le dire à voix haute, mais je ne ferai confiance à aucune entreprise chinoise. Et il en va de même pour les entreprises américaines. Les deux parties ont d’énormes problèmes avec leur gouvernement, et le besoin de gagner de l’argent à l’étranger est considérable. Microsoft a divulgué/divulgue des données aux États-Unis, même s’ils devraient les conserver en UE.

Est-ce que j’utilise toujours Amazon et OpenAI ? Oui, parce que je dois le faire. Mais tous mes VPS et la plupart de mes activités S3 ont été déplacés d’AWS. Cependant, mes e-mails personnels, et ceux transactionnels de, par exemple, du forum, sont toujours gérés par AWS.

Toute l’activité d’IA basée sur le forum est gérée par OpenAI. Je ne leur fais pas confiance — mais quelles sont mes options ? Je déteste vraiment le lien avec Microsoft, mais les choses pourraient être pires…

Donc, nous, en tant qu’administrateurs de l’UE, sommes assez en sécurité lorsque nous ne demandons pas de copies de passeport ou de pièces d’identité, car Discourse en tant que plateforme gère sa part assez bien. Et tant que le tiers déclare qu’il respecte le RGPD et d’autres réglementations (la même chose qu’avec Google Ads, etc.), la “fuite” n’est pas un problème juridique.

Mais c’est une question morale, c’est sûr. C’est pourquoi nous utilisons l’IA tout en essayant d’éduquer les utilisateurs, ou nous n’en utilisons pas du tout. Ce sont des options.

Et dans l’ensemble… l’IA dans les forums est un problème bien moindre, en termes de données personnelles, que l’utilisation de Meta, 8.8.8.8 comme DNS ou des services VPN commerciaux (ou l’enregistrement d’appels iPhone utilisant des serveurs chinois… [2]).


  1. opinion personnelle : les deux pays sont un désastre à cet égard ↩︎

  2. sérieusement… mon aspirateur robot voulait envoyer toutes les données de localisation et les informations wifi en Chine ↩︎

2 « J'aime »

Le plugin IA consomme-t-il plus de ressources informatiques (c’est-à-dire environnementales) qu’Akismet ?

1 « J'aime »

100 % inconnu, Akismet est une API et Wordpress n’a jamais publié la quantité exacte de calcul qu’il utilise.

Nos serveurs GPU servent notre clientèle entière, et les LLM sont devenus significativement plus efficaces au cours des 3 dernières années.

4 « J'aime »