Discourse AI per il rilevamento spam sostituisce il plugin Akismet

A partire da oggi, rimuoveremo il plugin Discourse Akismet e abilitare invece Discourse AI - Spam detection per impostazione predefinita per i clienti ospitati sui piani Pro e Standard.

Perché stiamo apportando questa modifica?

Nelle ultime settimane, abbiamo riscontrato che il nostro rilevatore di spam AI offre prestazioni superiori rispetto ad Akismet.

Abbiamo avuto oltre 126 siti che lo utilizzano ampiamente e, all’interno di Meta, abbiamo personalmente visto un tasso di successo superiore al 96% nel rilevare lo spam.

Oltre alle prestazioni, la configurazione sarebbe ora un’esperienza predefinita con opzioni di personalizzazione e flessibili, qualora ne avessi bisogno.

Cosa devo fare?

Se sei sul nostro hosting Starter o Pro, non devi fare assolutamente nulla!

La modifica avverrà automaticamente in background. Non vedrai più Akismet nei plugin. Ora vedrai il rilevatore di spam AI attivato nell’impostazione del plugin AI utilizzando un LLM open-weights ospitato da Discourse.

Se hai disabilitato il plugin AI, dovrai attivare manualmente il rilevatore di spam AI e selezionare un LLM.

Ho già abilitato il rilevamento dello spam AI!

Se hai già abilitato il rilevatore di spam AI tramite gli esperimenti di Novità, puoi tranquillamente ignorare questo annuncio poiché lo hai già!

Perché questa modifica è solo per Starter e Pro?

Come al solito, il rilascio delle modifiche nel nostro hosting inizia con i livelli iniziali e viene gradualmente esteso per coprire tutti i livelli.

19 Mi Piace

2 post sono stati divisi in un nuovo argomento: Rebranding dell’account di rilevamento spam AI

Significa che stai interrompendo completamente il plugin, o solo che non lo offri più sulla tua piattaforma ospitata? Io sono autosufficiente e non sto usando nessuna ‘AI’. Sarò costretto a iniziare a usare il rilevamento spam con l’AI?

3 Mi Piace

Questa modifica influisce solo sui clienti ospitati nei piani Starter e Standard. Il plugin Akismet viene rimosso e non è più disponibile per tali piani.

Gli self-hoster possono fare le proprie scelte qui.

3 Mi Piace

Il rilevamento dello spam AI funzionerà correttamente per le lingue con meno parlanti nel mondo? Come ad esempio l’ucraino.

Inoltre, gestirà post bilingui, il che è naturale per alcuni paesi, come ad esempio in Ucraina le persone parlano sia ucraino che russo in modo intercambiabile, e a volte possono usarli entrambi in un unico post.

Suppongo che un altro esempio potrebbe essere napoletano/italiano? O spagnolo/catalano? Ma non sono molto sicuro di queste coppie – conosco solo ucraino/russo.

3 Mi Piace

Assolutamente, dipende semplicemente dall’LLM che si utilizza per alimentarlo.

I modelli di Google tendono ad essere estremamente multilingue, Gemini Flash supporta 120 lingue, quindi è un buon candidato.

Provalo con il pulsante di test su alcuni post reali, alcuni post di spam, ecc… puoi fornire istruzioni personalizzate come:

Postare in russo / ucraino in modo intercambiabile va bene.

4 Mi Piace

Tramite OpenAI funziona per il finlandese. Beh, ogni tanto dà falsi positivi se c’è una sola riga, ma non credo sia un problema di lingua, bensì di prompt debole.

5 Mi Piace

Ciao, sono un hoster autonomo. Il rilevamento dello spam di Askimet è integrato nel core di un’installazione di Discourse o devo installare questo plugin separatamente? Grazie.

1 Mi Piace

Non è incluso nel core. Puoi trovare l’argomento qui: Discourse Akismet

Ma l’argomento è chiuso e nascosto. Non sono sicuro di cosa significhi. Avrebbe senso se il plugin non fosse più mantenuto, ma questo argomento dice che è stato rimosso solo da due livelli di hosting. Quindi perché gli auto-ospitanti e i clienti ospitati su livelli superiori non dovrebbero essere in grado di trovare le informazioni cercando su Meta? Aspetterei una risposta a questo prima di installarlo.


E penso che una volta nel primo post accidentalmente ‘Starter’ invece di ‘Standard’ sia stato sostituito con ‘Pro’.

Akismet ci ha deluso, troppe volte. Abbiamo osservato molti siti con esso installato che vengono semplicemente inondati di spam.

Chi si auto-ospita dovrebbe usare Discourse AI con uno dei tanti modelli gratuiti se il budget è una preoccupazione. Gemini Flash 2.0 livello gratuito fa il trucco ragionevolmente.

6 Mi Piace

Grazie per le informazioni, non era ovvio che il mio sito Discourse self-hosted non fosse protetto dallo spam. Ho erroneamente presunto che lo fosse. OMO queste informazioni dovrebbero essere presentate in modo più evidente per i futuri amministratori di Discourse che prevedono di ospitare il proprio sito.

Cercherò quella funzionalità di Discourse AI, che non avevo mai considerato prima a causa di restrizioni di budget.

Provo qui a elencare le azioni per un amministratore su un sito self-hosted come me, puoi dirmi se ho ragione?

  1. Per prima cosa dovrei installare il plugin Discourse AI? Discourse AI

  2. Secondo, dovrei configurare un LLM come spiegato qui? Discourse AI - Large Language Model (LLM) settings page

  3. Quindi dovrei configurare un meccanismo di rilevamento dello spam come spiegato qui? Discourse AI - Spam detection

1 Mi Piace

Un promemoria/nota per gli auto-hoster:

Aggiungere LLM “casuali” per affrontare il problema dello spam potenzialmente apre un vaso di Pandora in termini di privacy e protezione dei dati personali identificabili (PII). Se sei tenuto a seguire il GDPR o il COPPA ecc., l’uso di LLM esterni potrebbe richiedere la stipula di un accordo di protezione dei dati con il fornitore dell’LLM per garantire che il tuo sito non esponga PII a terzi. E le PII iniziano con cose semplici come nomi e indirizzi email.

Questo è solo qualcosa da tenere a mente.

2 Mi Piace

Non so se le cose siano negli USA o nel Regno Unito [1], ma nell’UE questa è una domanda relativamente semplice.

I dati necessari possono essere “sanguinati” alias trasferiti a terzi, anche se contati come PII, se seguono il GDPR. E tutti i principali attori lo fanno. O almeno così dicono. È una questione di fiducia.

Odio dirlo ad alta voce, ma non mi fiderò di nessuna azienda cinese. E lo stesso vale per le aziende statunitensi. Entrambe le parti hanno grossi problemi con il governo e la necessità di fare soldi all’estero è pesante. Microsoft ha perso/sta perdendo dati verso gli Stati Uniti, anche se dovrebbe mantenerli nell’UE.

Uso ancora Amazon e OpenAI? Sì, perché devo. Ma tutti i miei VPS e la maggior parte delle attività S3 sono stati spostati da AWS. Ma le mie email personali e quelle transazionali, ad esempio dal forum, sono ancora gestite da AWS.

Tutte le attività di intelligenza artificiale basate sul forum sono gestite da OpenAI. Non mi fido di loro, ma quali sono le mie opzioni? Mi dispiace davvero molto la connessione con Microsoft, ma le cose potrebbero andare peggio…

Quindi, noi amministratori UE siamo abbastanza al sicuro quando non chiediamo copie di passaporto o documenti d’identità, perché Discourse come piattaforma gestisce la sua parte abbastanza bene. E finché una terza parte dichiara di seguire il GDPR e altre normative (la stessa cosa che accade con Google Ads, ecc.), il “sanguinamento” non è un problema legale.

Ma è sicuramente un problema morale. Ecco perché usiamo l’IA e allo stesso tempo cerchiamo di educare gli utenti, oppure non la usiamo affatto. Queste sono le opzioni.

E nel quadro generale… l’IA nei forum è un problema molto più piccolo, in termini di PII, rispetto all’uso di Meta, 8.8.8.8 come DNS o dei servizi VPN commerciali (o alla registrazione di chiamate iPhone utilizzando server cinesi… [2]).


  1. opinione personale: entrambi i paesi sono un disastro in questa materia ↩︎

  2. sul serio… il mio aspirapolvere robot voleva inviare tutti i dati di localizzazione e le informazioni Wi-Fi in Cina ↩︎

2 Mi Piace

Il plugin AI richiede più risorse computazionali (leggasi: ambientali) di Akismet?

1 Mi Piace

100% sconosciuto, Akismet è un’API e Wordpress non ha mai pubblicato l’esatta quantità di calcolo che utilizza.

I nostri server GPU servono la nostra intera base di clienti e gli LLM sono diventati significativamente più efficienti negli ultimi 3 anni.

4 Mi Piace