探索AI识别AI生成内容的极限

真的吗?甚至OpenAI也不声称可以做到这一点

3 个赞

明智的决定,那只是作为一种可能的选项提出的。自那篇博文以来,已经出现了像GPT4-Turbo和Claude 3这样更好的模型,这些模型理论上可能预示着更好的性能。

1 个赞

这并不是对这里整体方法的否定。

使用 LLM 来查找文本中可能表明其为垃圾邮件的特征是一个非常棒的目标,我 wholeheartedly 欢迎这项补充。

我唯一的问题是关于声称可以自动识别 AI 生成文本,这是一个非常困难的问题。

请注意区别:

  1. 使用 LLM 识别一般垃圾邮件 = 很棒,而且我可以看到这可能是可行的且非常有价值的
  2. 识别垃圾邮件是否由 AI 生成 - 无论是否使用 LLM,这都很困难。我认为目前的模型无法很好地做到这一点,而且阳性结果可能只是幻觉。
3 个赞

我明白你的意思!是的,这是一个更细致的问题。事实上,在我最初的测试中,我试图同时设置这两者,但只关注垃圾邮件可能在这里会产生更好的结果。

2 个赞

我们达成一致了。

我确实认为有一些人工智能的明显迹象——比如帖子的长度和过度使用异常华丽的语言……所以也许可以分析这些方面……帖子的长度对大型语言模型来说可能很难,“华丽”可能不那么难。当然,您可以使用确定性函数来标记帖子长度。

话又说回来,如果有人使用 ChatGPT 来改进他们的英语(作为第二语言),那么标记他们的帖子可能对社区的整体包容性没有帮助。

更进一步说,一般的机器学习技术可能很有用,但比将文本发送到大型语言模型并获取结果更复杂。

2 个赞