scztt
(Scztt)
1
我协助的一个论坛在近几个月来经历了海量垃圾邮件注册账户的涌入。这些几乎肯定是人工智能机器人,因为它们似乎能够填写一些注册表单(基本上是勾选框)、解决 hCaptcha,并处理验证电子邮件,甚至用户个人资料信息。我们通常可以根据几个因素(例如,阅读文章时间为零、姓名/电子邮件地址的一些细微差别、明显虚假的用户信息)来猜测哪些注册是假的,但这并不容易(例如,它们通常是合法的 Gmail 地址)。然而,这个过程是不可持续的——我们有时每天有 10 个虚假注册,而且考虑到我们筛选这些注册的能力有限,很容易出错。
添加验证码减少了虚假注册的数量,但我们仍然积压了大量需要批准的用户,这意味着新用户通常需要一到两周才能加入。我们考虑过对新用户进行基于文本的问卷调查,但现实是我们没有能力阅读一堆问题并猜测它们是否是人工智能生成的(而且:这个问题只会越来越难)。
一个选择是简单地允许这些用户加入,然后在他们发布明显垃圾信息时将他们标记出来?我认为我们犹豫是否要这样做,因为它只是将过程从一个地方(注册)转移到另一个地方(标记的帖子),而且事情一旦发生就无法挽回:一百个潜在的人工智能用户在几个月内慢慢开始发帖,很容易彻底毁掉论坛。
有人有什么策略来帮助处理这个问题吗?我们相对较小,所以我想我们不是唯一遇到这个问题的人……
4 个赞
Canapin
(Coin-coin le Canapin)
2
我的最大论坛每天有 5 到 10 个垃圾邮件账户。
我使用以下方法来帮助:
我最近几天安装了这个,效果非常好:
它会自动静默,并且不会创建可审核的项目。
调整您的垃圾邮件设置可能也有帮助:/admin/site_settings/category/spam
7 个赞
sam
(Sam Saffron)
4
关于 AI 用户账户,您能否详细说明一下如果用户从不发帖,它会造成什么“损害”?
一个月前,我们进行了一项更改,会隐藏低信任度和匿名用户的个人资料,直到用户实际发帖,这样垃圾信息就会被隐藏起来。
我认为,如果垃圾信息的数量真的很高,一个有趣的解决方法是,如果账户在 30 天内不发帖就将其删除,它们需要暴露自己,否则就会被删除。
AI 垃圾信息检测在我们启用的所有论坛上都取得了惊人的成功,您可以在您的论坛上使用它,一些免费模型如 Gemini 免费套餐。我们为客户提供对我们模型的访问权限,但这并不广泛提供给自托管者。
4 个赞
我发现 Discourse 有一个问题……它忽略了原生支持 CloudFlare Turnstile 的能力。老实说,这是我发现的最好的验证码解决方案之一,我运行了一个付费论坛脚本,它使用了 Turnstile,收到的垃圾邮件非常少,尽管我有很多新用户注册。大多数垃圾注册都被 Turnstile 阻止了。
我真的不明白为什么 Discourse 这么久了还没有将现有的解决方案集成到核心功能中。
scztt
(Scztt)
6
当我们被(垃圾邮件)淹没时,AI账户的数量是真实新用户账户的10倍,这使得一些版块管理工作变得非常不切实际。版主们有一种元层面的担忧,即拥有一个论坛,其中很大一部分或绝大多数用户是AI/垃圾邮件机器人,即使他们只是潜伏着,也可能对未来造成真正的损害。例如,如果一年后数百个虚假用户都开始发表看似合理但无用的帖子,我们想象这很容易就会压垮我们跟进的能力,并使整个版块变得毫无用处 
现在新加入者的情况有所好转,但我认为如果我们能避免这个问题,每个人都希望不要有这种潜伏者的问题。我们的版块已经被积极地抓取用于AI训练(这是一个小众领域,所以至少在旧版本的GPT中,如果你问对了问题,GPT可以重复论坛帖子的近乎直接的引用),所以每个人对此都有点不满。