关于AI垃圾邮件检测器的挫败感

,

I’m trying to setup the AI spam detector for my own Discourse instance, but have several questions:

The system prompt of spam detector persona can’t be edited. I can create a new persona but there is no field to make Discourse know that it is going to be used as a spam detector?

I want to use Qwen3 as the LLM for the task. There is no preset for Qwen3 so I’m going to create a custom one. But there isn’t a Qwen3Tokenizer either. What does the tokenizer do here? Does QwenTokenizer work for Qwen3?

Or, is there an easier option that I can setup a webhook-like service and Discourse calls it on new topics / posts?

1 个赞

您好,为了回答您的问题:

根据文档:

谢谢,但我知道什么是分词器(tokenizer)。我不知道的是 Discourse 用它来做什么,以及如果我选错了分词器会发生什么?无论如何,我调用大型语言模型(LLM)都不需要分词器。

您可以尝试访问此 https://<your-site>/admin/plugins/discourse-ai/ai-spam - 它应该允许您插入自定义指令并针对帖子进行测试。

我理解(IIUC)这个指令是附加到系统提示(system prompt)而不是替换它,这使得提示更长并且包含混合语言……

但是通过测试并不意味着没有问题。(仅供参考,我还没有完全设置好 LLM;我尝试了免费的 Gemini 服务但收到了 429 错误,所以我现在正在研究如何将 llama.cpp 集成到 Discourse 中。)

我刚刚做了一个快速设置,选择用于垃圾邮件的自定义角色后运行正常。

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

如果您仍然无法通过 /discourse-ai/ai-spam 进行操作,请再次告知我们。

1 个赞

谢谢,所以那个“垃圾邮件检测器”标签只影响人设的列表筛选吗?
我将设置一个测试环境并尝试一下。