关于AI垃圾邮件检测器的挫败感

lilydjwg · 2025 年11 月 19 日 03:20

我正在尝试为我自己的 Discourse 实例设置 AI 垃圾邮件检测器，但有几个问题：

垃圾邮件检测器角色的系统提示无法编辑。我可以创建一个新角色，但没有字段可以告诉 Discourse 将其用作垃圾邮件检测器？

我想将 Qwen3 用作 LLM 来完成此任务。没有 Qwen3 的预设，所以我将创建一个自定义预设。但是也没有 Qwen3Tokenizer。分词器（Tokenizer）在这里是做什么的？QwenTokenizer 适用于 Qwen3 吗？

或者，是否有更简单的选项，我可以设置一个类似 webhook 的服务，并在新主题/帖子时让 Discourse 调用它？

NateDhaliwal · 2025 年11 月 19 日 03:59

您好，为了回答您的问题：

根据文档：

lilydjwg · 2025 年11 月 19 日 04:02

谢谢，但我知道什么是分词器（tokenizer）。我不知道的是 Discourse 用它来做什么，以及如果我选错了分词器会发生什么？无论如何，我调用大型语言模型（LLM）都不需要分词器。

nat · 2025 年11 月 19 日 04:10

您可以尝试访问此 https://<your-site>/admin/plugins/discourse-ai/ai-spam - 它应该允许您插入自定义指令并针对帖子进行测试。

lilydjwg · 2025 年11 月 19 日 04:22

我理解（IIUC）这个指令是附加到系统提示（system prompt）而不是替换它，这使得提示更长并且包含混合语言……

但是通过测试并不意味着没有问题。（仅供参考，我还没有完全设置好 LLM；我尝试了免费的 Gemini 服务但收到了 429 错误，所以我现在正在研究如何将 llama.cpp 集成到 Discourse 中。）

nat · 2025 年11 月 19 日 06:03

我刚刚做了一个快速设置，选择用于垃圾邮件的自定义角色后运行正常。

Screenshot 2025-11-19 at 1.54.11 PM

Screenshot 2025-11-19 at 1.51.51 PM

如果您仍然无法通过 /discourse-ai/ai-spam 进行操作，请再次告知我们。

lilydjwg · 2025 年11 月 19 日 06:13

谢谢，所以那个“垃圾邮件检测器”标签只影响人设的列表筛选吗？
我将设置一个测试环境并尝试一下。

lilydjwg · 2025 年11 月 19 日 11:14

它似乎奏效了，谢谢！

lilydjwg · 2025 年11 月 21 日 04:21

我检查了源代码。如果我没有犯错的话，分词器用于两件事：统计计数和价格估算，以及将帖子截断到设定的限制。所以，如果使用了错误的分词器，对我影响不会太大。

话题		回复	浏览量
Discourse AI - Large Language Model (LLM) settings page Site Management how-to , ai	20	3933	2026 年5 月 9 日
AI powered Spam detection Announcements ai , spam	11	1146	2025 年1 月 11 日
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4686	2026 年3 月 10 日
Introducing Discourse AI Blog	26	4142	2023 年5 月 4 日
What's the cheapest/best AI to use for AI Spam? Support ai , spam	6	383	2025 年3 月 18 日