Discourse AI spamdetectie vervangt Akismet plugin

Starting today, we will be removing the Discourse Akismet plugin and will instead enable Discourse AI - Spam detection by default for hosted customers on Pro and Standard plans.

Why are we making this change?

Over the past few weeks, we’ve found our AI spam detector to deliver a superior performance over Akismet.

We’ve had over 126 sites extensively using it and within Meta, we’ve personally seen over 96% success rate in detecting spam.

On top of the performance, the setup would now be a default experience with customization and flexible options, should you need it.

What do I need to do?

If you are on our Starter or Pro hosting, nothing at all!

The change would happen automatically in the background. You will no longer see Akismet within the plugins. You will now see the AI spam detector turned on in the AI plugin setting using a Discourse-hosted open-weights LLM

If you have the AI plugin disabled, then you would manually need to turn on AI spam detector and select an LLM

I already have AI spam detection enabled!

If you already have AI spam detector enabled via What's New experiments, then you can safely ignore this announcement since you already have it!

Why is this change only for Starter and Pro?

As usual, the rollout of changes in our hosting begin with the starting tiers and are gradually expanded to cover all tiers.

19 likes

2 posts were split to a new topic: Rebranding the ai spam detection account

Does this mean you’re discontinuing the plugin at all, or just that you’re no longer offering it on your hosted platform? I’m self-hosted and I’m not using any ‘AI’. Will I be forced to start using the AI Spam detection?

3 likes

This change only affects hosted customers on Starter and Standard plan tiers. The Akismet plugin is removed and no longer available for those plan tiers

Self hosters can make their own choices here

3 likes

Will AI spam detection work properly for languages with lesser people who speak the language in the world base? Like e.g. Ukrainian.

Also, will it handle bilingual posts, which is natural for some countries, like e.g. in Ukraine people speak both Ukrainian and Russian interchangeably, and they can sometimes use both in a single post.

I guess another example could be Naple/Italian? Or Spanish/Catalan? But not very sure about these pairs – I only know about Ukrainian/Russian.

3 likes

Absolutely, it simply depends on the LLM you use to power it.

Google models tend to be extremely multilingual, Gemini Flash is 120 languages so it is a good candidate.

Try it out with the test button on some real posts, some spam posts etc… you can provide custom instructions like:

Posting in Russian / Ukrainian interchangeably is fine.

4 likes

Via OpenAI works for Finnish. Well, it gives every now and then false positives if there is one liner, but I don’t think that is language issue, but weak prompting.

5 likes

Hi, I am self hosted. Is the Askimet spam detection integrated into the core of a Discourse install or do I need to install this plugin separately? Thanks.

1 like

It’s not included in core. You can find the topic here: Discourse Akismet

But the topic is closed and hidden. I’m not sure what that means. It would make sense if the plugin were no longer maintained, but this topic says it’s only removed from two hosting tiers. So why shouldn’t self-hosters and hosted customers on higher tiers be able to find the information by searching Meta? I would wait for an answer to that before installing it.


And I think one time in the first post accidentially ‘Starter’ instead of ‘Standard’ was replaced with ‘Pro’.

Akismet has failed us, too many times. We have observed many sites with it installed which simply become flooded with spam.

Self hosters should use Discourse AI with one of the many free models if budget is a concern. Gemini Flash 2.0 free tier does the trick reasonably.

6 likes

Thanks for the information, it was not obvious my self hosted Discourse site was not protected against spam. I assumed wrongly it was. OMO this info should be more prominently put forward for would be Discourse admins envisaging self hosting heir site.

I will look for that Discourse AI functionality, which I never considered before due to budget restrictions.

I try here to list the actions for an admin on a self hosted site like me, can you tell me if I am right?

  1. First I should install the Discourse AI plugin? Discourse AI

  2. Second, I should setup a LLM like explained here? Discourse AI - Large Language Model (LLM) settings page

  3. Then I should setup a spam detection mechanism like explained here? Discourse AI - Spam detection

1 like

Een herinnering/opmerking voor self-hosters:

Het toevoegen van “willekeurige” LLM’s om het spamprobleem aan te pakken, opent mogelijk een doos van Pandora wat betreft privacy en bescherming van persoonlijk identificeerbare gegevens (PII). Als u verplicht bent de AVG of COPPA enz. te volgen, vereist het gebruik van externe LLM’s mogelijk dat u een gegevensbeschermingsovereenkomst aangaat met de LLM-provider om ervoor te zorgen dat uw site geen PII lekt naar een derde partij. En PII beginnen met eenvoudige dingen zoals namen en e-mailadressen.

Dit is slechts iets om in gedachten te houden.

2 likes

Ik weet niet hoe het zit in de VS of het VK [1], maar in de EU is dit een relatief eenvoudige vraag.

Noodzakelijke gegevens kunnen worden “gelekt” oftewel overgedragen aan derden, zelfs als het wordt beschouwd als PII, als zij voldoen aan de AVG. En alle grote spelers doen dat. Of dat zeggen ze. Het is een kwestie van vertrouwen.

Ik haat het om dit hardop te zeggen, maar ik vertrouw geen enkel bedrijf uit China. En hetzelfde geldt voor Amerikaanse bedrijven. Beide partijen hebben grote overheidsproblemen en de noodzaak om geld te verdienen op een buitenlandse manier is zwaar. Microsoft lekte/lekt gegevens naar de VS, ook al zouden ze die in de EU moeten houden.

Gebruik ik nog steeds Amazon en OpenAI? Ja, omdat ik dat moet. Maar al mijn VPS’en en het meeste S3-verkeer zijn verplaatst van AWS. Maar mijn persoonlijke e-mails, en transactionele e-mails van bijvoorbeeld het forum, worden nog steeds afgehandeld door AWS.

Alle forum-gebaseerde AI-activiteit wordt afgehandeld door OpenAI. Ik vertrouw ze niet - maar wat zijn mijn opties? Ik heb echt een hekel aan de Microsoft-verbinding, maar dingen zouden erger kunnen zijn…

Dus, wij als EU-beheerders zijn redelijk veilig als we geen paspoortkopieën of persoonlijke identiteitsbewijzen vragen, omdat Discourse als platform zijn deel redelijk goed afhandelt. En zolang een derde partij verklaart dat ze voldoen aan de AVG en andere regelgeving (hetzelfde als met Google Ads enz.) is “lekken” geen juridisch probleem.

Maar het is zeker een moreel probleem. Daarom gebruiken we ofwel AI en proberen we tegelijkertijd gebruikers te onderwijzen, of we gebruiken het helemaal niet. Dat zijn de opties.

En in het grote geheel… AI op het forum is een veel kleiner probleem, qua PII, dan het gebruik van Meta, 8.8.8.8 als DNS of commerciële VPN-diensten (of het opnemen van iPhone-gesprekken via Chinese servers… [2]).


  1. persoonlijke mening: beide landen zijn een puinhoop op dit gebied ↩︎

  2. echt waar… mijn robotstofzuiger wilde alle locatiegegevens en wifi-informatie naar China sturen ↩︎

2 likes

Does the AI plugin take more computational (read as: environmental) resources than Akismet?

1 like

100% unknown, Akismet is an API and Wordpress never published exact amount of computation they use.

Our GPU servers are serving our entire customer base, and LLMs have become significantly more efficient over the past 3 years.

4 likes