Ho abilitato la gestione dello spam di Discourse AI sul nostro forum. Ho configurato Claude Sonnet 4 con una chiave API e selezionato la persona Spam detector.
Ho effettuato un post di prova che è chiaramente spam. Niente di sottile.
Non è stato bloccato ed è stato pubblicato immediatamente.
Quando ho fornito l’URL del post al bot anti-spam utilizzando la funzione di test, il risultato dice Non spam, ma nel registro di scansione dice: SPAM - Questa è una chiara pubblicità promozionale…
Mi aspetterei che il risultato fosse SPAM, corrispondente alla dichiarazione SPAM nel registro di scansione. E che questo mettesse in coda il post per la revisione da parte di amministratori e moderatori, ad esempio.
Qualcuno potrebbe condividere cosa mi sfugge? Non sono un esperto, quindi sono aperto a qualsiasi consiglio!
Questo risolverà sia il test che il post non vengono segnalati:
Il prompt di sistema del sistema Persona del rilevatore di spam confondeva i modelli Claude. La modifica rende più esplicite le istruzioni sul formato di risposta previsto.
Fantastico! La funzionalità di test funziona come previsto.
Mi stavo chiedendo se potessi aiutarmi a capire perché la funzionalità AI Spam non blocca ancora la pubblicazione immediata di un post spam? Ho inviato il post al test AI Spam e lo sta segnalando come spam, ma è stato pubblicato.
Mi manca forse un pezzo di collegamento? Grazie mille per il tuo aiuto!