我正在尝试为我自己的 Discourse 实例设置 AI 垃圾邮件检测器,但有几个问题:
垃圾邮件检测器角色的系统提示无法编辑。我可以创建一个新角色,但没有字段可以告诉 Discourse 将其用作垃圾邮件检测器?
我想将 Qwen3 用作 LLM 来完成此任务。没有 Qwen3 的预设,所以我将创建一个自定义预设。但是也没有 Qwen3Tokenizer。分词器(Tokenizer)在这里是做什么的?QwenTokenizer 适用于 Qwen3 吗?
或者,是否有更简单的选项,我可以设置一个类似 webhook 的服务,并在新主题/帖子时让 Discourse 调用它?
2 个赞
谢谢,但我知道什么是分词器(tokenizer)。我不知道的是 Discourse 用它来做什么,以及如果我选错了分词器会发生什么?无论如何,我调用大型语言模型(LLM)都不需要分词器。
nat
(Natalie T)
4
您可以尝试访问此 https://<your-site>/admin/plugins/discourse-ai/ai-spam - 它应该允许您插入自定义指令并针对帖子进行测试。
我理解(IIUC)这个指令是附加到系统提示(system prompt)而不是替换它,这使得提示更长并且包含混合语言……
但是通过测试并不意味着没有问题。(仅供参考,我还没有完全设置好 LLM;我尝试了免费的 Gemini 服务但收到了 429 错误,所以我现在正在研究如何将 llama.cpp 集成到 Discourse 中。)
nat
(Natalie T)
6
我刚刚做了一个快速设置,选择用于垃圾邮件的自定义角色后运行正常。


如果您仍然无法通过 /discourse-ai/ai-spam 进行操作,请再次告知我们。
4 个赞
谢谢,所以那个“垃圾邮件检测器”标签只影响人设的列表筛选吗?
我将设置一个测试环境并尝试一下。
1 个赞
我检查了源代码。如果我没有犯错的话,分词器用于两件事:统计计数和价格估算,以及将帖子截断到设定的限制。所以,如果使用了错误的分词器,对我影响不会太大。
1 个赞