Discourse AI - Détection de spam

Nous avons effectué de nombreux tests à ce sujet, et nous n’obtenons pas du tout de résultats fiables. Pour information, nous utilisons le modèle gpt-4o.

Pour tester sa précision, j’ai donné les instructions simples suivantes :

Vous êtes un système de détection de spam. Analysez le contenu et le contexte suivants.
Notes ci-dessous. Si *UN* des éléments ci-dessous est vrai, alors marquez-le comme spam :
- Le nom d'utilisateur est très spécifiquement « testjon », alors c'est *TOUJOURS* du spam.
- Répondez uniquement avec « SPAM - C'est Jon ! » ou « PAS DE SPAM ».

Tester sur un message, par le nom d’utilisateur testjon, donne PAS DE SPAM. Il semble qu’il ne suive pas du tout bien les instructions. Des suggestions ?

D’autres ont-ils eu de bonnes ou de mauvaises expériences avec la détection de spam par IA ?