Frustrazioni con il rilevatore di spam AI

,

Sto cercando di configurare il rilevatore di spam AI per la mia istanza Discourse, ma ho diverse domande:

Il prompt di sistema per la persona del rilevatore di spam non può essere modificato. Posso creare una nuova persona, ma non c’è un campo per far sapere a Discourse che verrà utilizzata come rilevatore di spam?

Voglio usare Qwen3 come LLM per l’attività. Non c’è una preimpostazione per Qwen3, quindi ne creerò una personalizzata. Ma non c’è nemmeno un Qwen3Tokenizer. Cosa fa il tokenizer qui? Il QwenTokenizer funziona per Qwen3?

Oppure, c’è un’opzione più semplice per configurare un servizio simile a un webhook che Discourse possa chiamare per nuovi argomenti/post?

2 Mi Piace

Ciao, per rispondere alla tua domanda:

Dalla documentazione:

Grazie, ma so cos’è un tokenizzatore. Quello che non so è per cosa lo usa Discourse e cosa succederebbe se scegliessi il tokenizzatore sbagliato? Non ho bisogno di un tokenizzatore per chiamare un LLM comunque.

Puoi provare a visitare questo https://\u003cyour-site\u003e/admin/plugins/discourse-ai/ai-spam - dovrebbe consentirti di inserire istruzioni personalizzate e testare rispetto a un post.

Se ho capito bene, questa istruzione viene concatenata al prompt di sistema invece di sostituirlo, rendendo il prompt ancora più lungo e con lingue miste…

Ma superare il test non significa che non ci sia alcun problema. (Per tua informazione, non ho ancora configurato completamente l’LLM; ho provato il servizio Gemini gratuito ma ho ricevuto un 429, quindi sto cercando di capire come integrare llama.cpp in Discourse ora.)

Ho appena fatto una configurazione rapida e funziona bene selezionando la persona personalizzata per lo spam.

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

Fateci sapere di nuovo se non riuscite a farlo tramite /discourse-ai/ai-spam

4 Mi Piace

Grazie, quindi quell’etichetta “rilevatore di spam” influisce solo sul filtraggio dell’elenco delle persone?
Configurerò un ambiente di test e ci proverò.

1 Mi Piace

Sembra funzionare, grazie!

2 Mi Piace

Ho controllato il codice sorgente. Se non ho commesso errori, il tokenizer viene utilizzato per due cose: contare i token per le statistiche e la stima dei prezzi, e troncare i post al limite impostato. Quindi non dovrebbe influenzarmi molto se ne viene usato uno sbagliato.

1 Mi Piace