Frustrations concernant le détecteur de spam IA

,

J’essaie de configurer le détecteur de spam IA pour ma propre instance Discourse, mais j’ai plusieurs questions :

L’invite système du persona du détecteur de spam ne peut pas être modifiée. Je peux créer un nouveau persona, mais il n’y a aucun champ pour indiquer à Discourse qu’il va être utilisé comme détecteur de spam ?

Je souhaite utiliser Qwen3 comme LLM pour la tâche. Il n’y a pas de préréglage pour Qwen3, donc je vais en créer un personnalisé. Mais il n’y a pas non plus de Qwen3Tokenizer. Que fait le tokenizer ici ? Est-ce que QwenTokenizer fonctionne pour Qwen3 ?

Ou, existe-t-il une option plus simple qui me permettrait de configurer un service de type webhook et que Discourse l’appelle lors de nouveaux sujets/messages ?

2 « J'aime »

Bonjour, pour répondre à votre question :

D’après la documentation :

Merci, mais je sais ce qu’est un jetoniseur (tokenizer). Ce que je ne sais pas, c’est ce que Discourse en fait, et ce qui se passerait si je choisissais le mauvais jetoniseur ? Je n’ai pas besoin de jetoniseur pour appeler un LLM de toute façon.

Pouvez-vous essayer de visiter cette adresse https://\u003cvotre-site\u003e/admin/plugins/discourse-ai/ai-spam - cela devrait vous permettre d’insérer des instructions personnalisées et de tester contre une publication.

Si je comprends bien, cette instruction est concaténée à l’invite système au lieu de la remplacer, ce qui rend l’invite encore plus longue et avec des langues mélangées…

Mais réussir le test ne signifie pas qu’il n’y a pas de problème. (Pour information, je n’ai pas encore entièrement configuré le LLM ; j’ai essayé le service Gemini gratuit mais j’ai obtenu un 429, donc j’essaie de comprendre comment intégrer llama.cpp dans Discourse maintenant.)

Je viens de faire une configuration rapide et cela fonctionne bien en sélectionnant le persona personnalisé pour le spam.

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

Faites-nous savoir à nouveau si vous n’êtes pas en mesure de le faire via /discourse-ai/ai-spam

4 « J'aime »

Merci, donc cette étiquette « détecteur de spam » n’affecte que le filtrage de liste des personas ?
Je vais configurer un environnement de test et essayer.

1 « J'aime »

Cela semble fonctionner, merci !

2 « J'aime »

J’ai vérifié le code source. Si je ne me suis pas trompé, le tokenizer est utilisé pour deux choses : compter les tokens pour les statistiques et l’estimation des prix, et tronquer les publications à la limite définie. Donc, cela ne devrait pas beaucoup m’affecter si un mauvais est utilisé.

1 « J'aime »