Bot spam AI dice non essere spam ma log di scansione dice che è spam

Ho abilitato la gestione dello spam di Discourse AI sul nostro forum. Ho configurato Claude Sonnet 4 con una chiave API e selezionato la persona Spam detector.

Ho effettuato un post di prova che è chiaramente spam. Niente di sottile.

Non è stato bloccato ed è stato pubblicato immediatamente.

Quando ho fornito l’URL del post al bot anti-spam utilizzando la funzione di test, il risultato dice Non spam, ma nel registro di scansione dice: SPAM - Questa è una chiara pubblicità promozionale…

Mi aspetterei che il risultato fosse SPAM, corrispondente alla dichiarazione SPAM nel registro di scansione. E che questo mettesse in coda il post per la revisione da parte di amministratori e moderatori, ad esempio.

Qualcuno potrebbe condividere cosa mi sfugge? Non sono un esperto, quindi sono aperto a qualsiasi consiglio!

Grazie!

Qual è il livello di fiducia dell’utente che ha pubblicato? L’AI Spam salterà i post degli utenti TL2+.

4 Mi Piace

Grazie per la tua risposta!

L’utente che ho utilizzato per pubblicare è Nuovo utente di livello di fiducia

Qualche idea sul perché il post sia passato?

Apprezzo il tuo aiuto!

Questo risolverà sia il test che il post non vengono segnalati:

Il prompt di sistema del sistema Persona del rilevatore di spam confondeva i modelli Claude. La modifica rende più esplicite le istruzioni sul formato di risposta previsto.

4 Mi Piace

Fantastico! La funzionalità di test funziona come previsto.

Mi stavo chiedendo se potessi aiutarmi a capire perché la funzionalità AI Spam non blocca ancora la pubblicazione immediata di un post spam? Ho inviato il post al test AI Spam e lo sta segnalando come spam, ma è stato pubblicato.

Mi manca forse un pezzo di collegamento? Grazie mille per il tuo aiuto!

1 Mi Piace

Sei un amministratore o un TL di livello superiore? In caso affermativo, forse proveresti a usare un utente di test TL inferiore.

1 Mi Piace

Saltiamo un post quando:

  • Il livello di fiducia dell’autore è maggiore di TL1.
  • Il post appartiene a un argomento di messaggistica privata.
  • L’autore è un bot.
  • L’autore fa parte dello staff (moderatore/amministratore).
  • L’autore ha già pubblicato più di 3 post in argomenti normali (non PM).
  • Il post è già stato scansionato 3 o più volte.

Se il test funziona, sono sicuro che debba essere per uno dei motivi sopra indicati.

1 Mi Piace

Ahhh sì! Grazie per le tue risposte pazienti e utili!

Ho pubblicato con il mio utente amministratore invece che con il mio utente di livello di fiducia 0. :woman_facepalming:

Funziona! Adoro il modo in cui l’utente discourse_ai_spam appare come l’utente che ha segnalato e rimosso il post.

Grazie ancora per il tuo aiuto rapido e generoso!

3 Mi Piace