AI垃圾邮件机器人声称不是垃圾邮件,但扫描日志显示它是垃圾邮件

我在我们的论坛上启用了 Discourse AI 垃圾邮件处理功能。我已设置好 Claude Sonnet 4 和 API 密钥,并选择了“垃圾邮件检测器”角色。

我进行了一个测试帖子,内容明显是垃圾邮件,毫不含糊。

该帖子没有被阻止,并立即发布了。

当我使用测试功能将帖子 URL 提供给垃圾邮件机器人时,结果显示“不是垃圾邮件”,但在扫描日志中却显示:“垃圾邮件 - 这是一个明显的促销广告……”

我的期望是结果应该显示为“垃圾邮件”,与扫描日志中的声明一致。并且,这应该会将帖子排队等待管理员和版主审核等。

有人能分享一下我可能忽略了什么吗?我不是专家——所以乐于接受任何指导!

谢谢!

发帖人的信任级别是多少?AI垃圾邮件将跳过TL2+用户的帖子。

4 个赞

感谢您的回复!

我用来发帖的用户是新手用户信任级别

您对帖子为何能通过有什么看法?

感谢您的帮助!

这将修复测试和帖子未被标记的问题:

垃圾邮件检测器 Persona 系统提示让 Claude 模型感到困惑。此更改使预期的响应格式说明更加明确。

4 个赞

太棒了!测试功能运行正常。

我想知道您是否能帮助我解释一下为什么 AI Spam 功能仍然无法阻止垃圾帖子被立即发布?我已将该帖子发送到 AI Spam 测试,它确实将其标记为垃圾内容——但它还是被发布了。

是不是我遗漏了什么连接环节?非常感谢您的帮助!

1 个赞

您是管理员还是更高级别的TL?如果是,那么您也许可以尝试使用一些低级别的测试用户。

1 个赞

我们跳过帖子时:

  • 作者的信任级别大于 TL1。
  • 该帖子属于私信主题。
  • 作者是机器人。
  • 作者是工作人员(版主/管理员)。
  • 作者在常规(非私信)主题中已发布超过 3 篇帖子。
  • 该帖子已被扫描 3 次或更多次。

如果测试有效,我相信这一定是由于上述原因之一。

1 个赞

啊呀是的!感谢您耐心且有益的回复!

我用我的管理员用户而不是我的信任等级为 0 的用户发帖了。:woman_facepalming:

它奏效了!我喜欢 discourse_ai_spam 用户显示为标记和取消列表帖子的用户的方式。

再次感谢您快速而慷慨的帮助!

3 个赞