Le bot de spam IA dit qu'il ne fait pas de spam, mais le journal d'analyse dit que c'est du spam

J’ai activé la gestion du spam par Discourse AI sur notre forum. J’ai configuré Claude Sonnet 4 avec une clé API et sélectionné le persona de détecteur de spam.

J’ai effectué un message de test qui est clairement du spam. Rien de subtil à ce sujet.

Il n’a pas été bloqué et a été publié immédiatement.

Lorsque j’ai donné l’URL du message au bot de spam en utilisant la fonction de test, le résultat indique “Pas de spam”, mais dans le journal d’analyse, il est indiqué : “SPAM - Ceci est une publicité promotionnelle évidente…”

Je m’attendais à ce que le résultat soit SPAM, correspondant à la déclaration SPAM du journal d’analyse. Et que cela mette le message en file d’attente pour examen par les administrateurs et modérateurs, par exemple.

Quelqu’un pourrait-il m’expliquer ce que je rate ? Je ne suis pas un expert – je suis donc ouvert à toute suggestion !

Merci !

Quel est le niveau de confiance de l’utilisateur qui a posté ? Le spam IA ignorera les publications des utilisateurs TL2+.

4 « J'aime »

Merci pour votre réponse !

L’utilisateur que j’ai utilisé pour publier est un nouvel utilisateur de niveau de confiance

Avez-vous des idées sur la raison pour laquelle la publication a été acceptée ?

J’apprécie votre aide !

Cela corrigera le fait que le test et la publication ne soient pas signalés :

Le prompt système du système de personas du détecteur de spam confondait les modèles Claude. Le changement rend les instructions du format de réponse attendu plus explicites.

4 « J'aime »

Ah, fantastique ! La fonctionnalité de test fonctionne comme prévu.

Je me demandais si vous pourriez m’aider à comprendre pourquoi la fonctionnalité de spam IA ne bloque toujours pas la publication d’un message spammé ? J’ai envoyé le message au test de spam IA et il le signale comme spam - mais il a été publié.

Il me manque peut-être une pièce de connexion ? Merci beaucoup pour votre aide !

1 « J'aime »

Êtes-vous un administrateur ou un TL supérieur ? Si oui, vous pourriez peut-être utiliser un utilisateur de test TL inférieur à la place.

1 « J'aime »

Nous ignorons un message lorsque :

  • Le niveau de confiance de l’auteur est supérieur à TL1.
  • Le message appartient à un sujet de message privé.
  • L’auteur est un bot.
  • L’auteur fait partie du personnel (modérateur/administrateur).
  • L’auteur a déjà posté plus de 3 fois dans des sujets réguliers (non-PM).
  • Le message a déjà été analysé 3 fois ou plus.

Si le test fonctionne, je suis convaincu que c’est à cause de l’un des points ci-dessus.

1 « J'aime »

Ahhh oui ! Merci pour vos réponses patientes et utiles !

J’ai posté avec mon utilisateur administrateur au lieu de mon utilisateur de niveau de confiance 0. :woman_facepalming:

Ça marche ! J’adore la façon dont l’utilisateur discourse_ai_spam apparaît comme l’utilisateur qui a signalé et retiré la publication.

Merci encore pour votre aide rapide et généreuse !

3 « J'aime »