זיהוי דואר זבל באמצעות AI של Discourse מחליף את תוסף Akismet

Starting today, we will be removing the Discourse Akismet plugin and will instead enable Discourse AI - Spam detection by default for hosted customers on Pro and Standard plans.

Why are we making this change?

Over the past few weeks, we’ve found our AI spam detector to deliver a superior performance over Akismet.

We’ve had over 126 sites extensively using it and within Meta, we’ve personally seen over 96% success rate in detecting spam.

On top of the performance, the setup would now be a default experience with customization and flexible options, should you need it.

What do I need to do?

If you are on our Starter or Pro hosting, nothing at all!

The change would happen automatically in the background. You will no longer see Akismet within the plugins. You will now see the AI spam detector turned on in the AI plugin setting using a Discourse-hosted open-weights LLM

If you have the AI plugin disabled, then you would manually need to turn on AI spam detector and select an LLM

I already have AI spam detection enabled!

If you already have AI spam detector enabled via What's New experiments, then you can safely ignore this announcement since you already have it!

Why is this change only for Starter and Pro?

As usual, the rollout of changes in our hosting begin with the starting tiers and are gradually expanded to cover all tiers.

19 לייקים

2 posts were split to a new topic: Rebranding the ai spam detection account

האם זה אומר שאתה מפסיק את התוסף בכלל, או רק שאתה כבר לא מציע אותו בפלטפורמה המאוחסנת שלך? אני מארח בעצמי ולא משתמש ב’בינה מלאכותית’. האם א aanschול לאלץ אותי להתחיל להשתמש בזיהוי ספאם מבוסס בינה מלאכותית?

3 לייקים

This change only affects hosted customers on Starter and Standard plan tiers. The Akismet plugin is removed and no longer available for those plan tiers

Self hosters can make their own choices here

3 לייקים

Will AI spam detection work properly for languages with lesser people who speak the language in the world base? Like e.g. Ukrainian.

Also, will it handle bilingual posts, which is natural for some countries, like e.g. in Ukraine people speak both Ukrainian and Russian interchangeably, and they can sometimes use both in a single post.

I guess another example could be Naple/Italian? Or Spanish/Catalan? But not very sure about these pairs – I only know about Ukrainian/Russian.

3 לייקים

Absolutely, it simply depends on the LLM you use to power it.

Google models tend to be extremely multilingual, Gemini Flash is 120 languages so it is a good candidate.

Try it out with the test button on some real posts, some spam posts etc… you can provide custom instructions like:

Posting in Russian / Ukrainian interchangeably is fine.

4 לייקים

Via OpenAI works for Finnish. Well, it gives every now and then false positives if there is one liner, but I don’t think that is language issue, but weak prompting.

5 לייקים

Hi, I am self hosted. Is the Askimet spam detection integrated into the core of a Discourse install or do I need to install this plugin separately? Thanks.

לייק 1

It’s not included in core. You can find the topic here: Discourse Akismet

But the topic is closed and hidden. I’m not sure what that means. It would make sense if the plugin were no longer maintained, but this topic says it’s only removed from two hosting tiers. So why shouldn’t self-hosters and hosted customers on higher tiers be able to find the information by searching Meta? I would wait for an answer to that before installing it.


And I think one time in the first post accidentially ‘Starter’ instead of ‘Standard’ was replaced with ‘Pro’.

אקיזמט הכזיבה אותנו, יותר מדי פעמים. ראינו אתרים רבים עם ההתקנה שלה פשוט מוצפים בספאם.

מאחסנים עצמיים צריכים להשתמש ב-Discourse AI עם אחד מהמודלים החינמיים הרבים אם התקציב הוא שיקול. Gemini Flash 2.0 בדרגת חינם עושה את העבודה בצורה סבירה.

6 לייקים

Thanks for the information, it was not obvious my self hosted Discourse site was not protected against spam. I assumed wrongly it was. OMO this info should be more prominently put forward for would be Discourse admins envisaging self hosting heir site.

I will look for that Discourse AI functionality, which I never considered before due to budget restrictions.

I try here to list the actions for an admin on a self hosted site like me, can you tell me if I am right?

  1. First I should install the Discourse AI plugin? Discourse AI

  2. Second, I should setup a LLM like explained here? Discourse AI - Large Language Model (LLM) settings page

  3. Then I should setup a spam detection mechanism like explained here? Discourse AI - Spam detection

לייק 1

תזכורת למארחים עצמיים:

הוספת מודלי שפה גדולים (LLMs) “אקראיים” כדי להתמודד עם בעיית הספאם עלולה לפתוח קופסת פנדורה מבחינת פרטיות והגנה על נתונים אישיים מזהים (PII). אם אתה נדרש לעמוד בתקנות כמו GDPR או COPPA וכו’, השימוש במודלי שפה גדולים חיצוניים עשוי לדרוש ממך לחתום על הסכם הגנת נתונים עם ספק מודלי השפה הגדולים כדי להבטיח שהאתר שלך לא ידליף PII לצד שלישי. ו-PII מתחילים בדברים פשוטים כמו שמות וכתובות דוא"ל.

זה רק משהו שכדאי לזכור.

2 לייקים

אני לא יודע מה המצב בארה"ב או בבריטניה [1], אבל באיחוד האירופי זו שאלה פשוטה יחסית.

נתונים נחוצים יכולים להיות “מדממים” כלומר מועברים לצד שלישי, גם אם הם נחשבים למידע אישי מזהה (PII), אם הם עומדים בדרישות ה-GDPR. וכל השחקנים הגדולים עושים זאת. לפחות כך הם אומרים. זה עניין של אמון.

שונא להגיד את זה בקול רם, אבל אני לא סומך על אף חברה מסין. אותו דבר לגבי חברות אמריקאיות. לשתי הצדדים יש בעיות ממשלתיות גדולות, והצורך להרוויח כסף בסגנון זר הוא כבד. מיקרוסופט הדליפה/מדליפה נתונים לארה"ב, גם אם היא אמורה לשמור אותם באיחוד האירופי.

האם אני עדיין משתמש באמזון וב-OpenAI? כן, כי אני חייב. אבל כל שרתי ה-VPS שלי ורוב הפעילות ב-S3 הועברו מ-AWS. אבל המיילים האישיים שלי, ואלה העסקיים מפורומים למשל, עדיין מטופלים על ידי AWS.

כל הפעילות מבוססת פורום של AI מטופלת על ידי OpenAI. אני לא סומך עליהם - אבל מהן האפשרויות שלי? אני באמת לא אוהב את הקשר למיקרוסופט, אבל דברים יכולים להיות גרועים יותר…

אז, אנחנו כמנהלי מערכות באיחוד האירופי די בטוחים כאשר אנחנו לא מבקשים צילומי דרכון או תעודות זהות, כי Discourse כפלטפורמה מטפלת בחלק שלה די טוב. וכל עוד צד שלישי מצהיר שהוא עומד בדרישות ה-GDPR ורגולציות אחרות (אותו דבר כמו עם גוגל אדס וכו’), “דימום” אינו בעיה חוקית.

אבל זו בהחלט בעיה מוסרית. לכן אנחנו או משתמשים ב-AI ומנסים ללמד משתמשים במקביל, או לא משתמשים בכלל. אלו האפשרויות.

ובמבט רחב יותר… AI בפורום הוא בעיה הרבה יותר קטנה, מבחינת PII, מאשר שימוש במטא, 8.8.8.8 כ-DNS או שירותי VPN מסחריים (או הקלטת שיחות אייפון באמצעות שרתים סיניים… [2]).


  1. דעה אישית: שתי המדינות מבולגנות בעניין הזה ↩︎

  2. באמת… שואב האבק הרובוטי שלי רצה לשלוח את כל נתוני המיקום ומידע ה-WiFi לסין ↩︎

2 לייקים

Does the AI plugin take more computational (read as: environmental) resources than Akismet?

לייק 1

100% unknown, Akismet is an API and Wordpress never published exact amount of computation they use.

Our GPU servers are serving our entire customer base, and LLMs have become significantly more efficient over the past 3 years.

4 לייקים