关于AI垃圾邮件检测器的挫败感

,

我正在尝试为我自己的 Discourse 实例设置 AI 垃圾邮件检测器,但有几个问题:

垃圾邮件检测器角色的系统提示无法编辑。我可以创建一个新角色,但没有字段可以告诉 Discourse 将其用作垃圾邮件检测器?

我想将 Qwen3 用作 LLM 来完成此任务。没有 Qwen3 的预设,所以我将创建一个自定义预设。但是也没有 Qwen3Tokenizer。分词器(Tokenizer)在这里是做什么的?QwenTokenizer 适用于 Qwen3 吗?

或者,是否有更简单的选项,我可以设置一个类似 webhook 的服务,并在新主题/帖子时让 Discourse 调用它?

2 个赞

您好,为了回答您的问题:

根据文档:

谢谢,但我知道什么是分词器(tokenizer)。我不知道的是 Discourse 用它来做什么,以及如果我选错了分词器会发生什么?无论如何,我调用大型语言模型(LLM)都不需要分词器。

您可以尝试访问此 https://<your-site>/admin/plugins/discourse-ai/ai-spam - 它应该允许您插入自定义指令并针对帖子进行测试。

我理解(IIUC)这个指令是附加到系统提示(system prompt)而不是替换它,这使得提示更长并且包含混合语言……

但是通过测试并不意味着没有问题。(仅供参考,我还没有完全设置好 LLM;我尝试了免费的 Gemini 服务但收到了 429 错误,所以我现在正在研究如何将 llama.cpp 集成到 Discourse 中。)

我刚刚做了一个快速设置,选择用于垃圾邮件的自定义角色后运行正常。

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

如果您仍然无法通过 /discourse-ai/ai-spam 进行操作,请再次告知我们。

4 个赞

谢谢,所以那个“垃圾邮件检测器”标签只影响人设的列表筛选吗?
我将设置一个测试环境并尝试一下。

1 个赞

它似乎奏效了,谢谢!

2 个赞

我检查了源代码。如果我没有犯错的话,分词器用于两件事:统计计数和价格估算,以及将帖子截断到设定的限制。所以,如果使用了错误的分词器,对我影响不会太大。

1 个赞