Discourse AI - 垃圾邮件检测

我们对此进行了大量测试,但结果一直不可靠。作为背景,我们使用的是 gpt-4o 模型。

为了测试其准确性,我给出了以下简单说明:

你是一个垃圾邮件检测系统。分析以下内容和上下文。
请注意以下几点。如果以下任何一项为真,则将其标记为垃圾邮件:
- 用户名是“testjon”,则*始终*是垃圾邮件。
- 只回复“SPAM - It's Jon!”或“NOT SPAM”。

在用户名为 testjon 的帖子上的测试结果是 NOT SPAM。似乎它根本不听从指示。有什么建议吗?

其他人是否在 AI 垃圾邮件检测方面有过好或坏的经历?