阻止近期的垃圾邮件潮

SailReal · 2024 年7 月 3 日 10:43

我们已经遭受了数天的海量垃圾邮件攻击。其他网站，如 https://ask.learncbse.in/，目前似乎已经放弃了

我在这里只寻找一个变体：

内容经常变化，电子邮件地址和 IP 地址也一样，所以阻止可以减少数量，但我们还没有找到真正的解决方法。出于隐私原因，我们不想将所有内容发送给 Akisment。

如果我们阻止

AS55836：Reliance Jio Infocomm Limited
AS9498：Bharti Airtel Ltd.
AS45609：Bharti Airtel Ltd.
AS24560：Bharti Airtel Ltd.

我们就能解决问题，但这可能会影响一部分（或大部分）印度人口。

j127 · 2024 年7 月 3 日 20:10

您是否尝试过将某些词语添加到 Admin -\u003e Customize -\u003e Watched Words -\u003e Require Approval？

从您的截图中，我建议添加以下词语：

cash
credit
money
loan
toll-free
customer care
care number
0779*
helpline
:point_left:

这可能会给用户带来一些不便，但我设置了 Discourse 将一个 webhook 发送到 Firebase 云函数（免费），该函数会将通知发送到我的手机上的 Slack 聊天室，因此如果我醒着，我通常可以在 60 秒内从手机上批准审核帖子。

SailReal · 2024 年7 月 3 日 20:41

感谢您的提示，但请查看 https://ask.learncbse.in/ （这不是我的实例，但帖子大同小异，我正在与之斗争）并滚动浏览过去几天，他们正在使用大量关键字的组合和变体。我正在为每个关键字创建大量正则表达式，因为他们在每个地方都添加了“.”、“,”、“|”，用“O”替换“0”，用“3”替换“e”，在单词中间添加一个（到目前为止）随机字符等等……对抗这种垃圾邮件真的很难。

或者，如果您不想点击随机链接，这里是过去几个小时的屏幕截图，但这只是过去几个小时，它们会随时间变化很大：

JammyDodger · 2024 年7 月 3 日 20:49

只是为了确认一下，您是否使用了 min first post typing time 管理员设置？我觉得这个设置对于捕捉我们很多（帖子）很有用。

SailReal · 2024 年7 月 3 日 20:51

是的，感谢您的提示，这个已经设置好了，但我的意思是，让机器人再等几分钟并不是什么难事

JammyDodger · 2024 年7 月 3 日 20:59

此垃圾邮件似乎与另一个主题所关注的基于 AI 的答案/内容类型不同，因此我已将其分开。

我们确实有一个新的基于 AI 的垃圾邮件检测工具，该工具已被证明非常有效：

SailReal · 2024 年7 月 3 日 21:10

感谢您的建议，但仅仅为了对抗另一个垃圾信息 LLM 而设置一个 LLM，对于我们的用例来说成本太高了。

作为垃圾信息发送者，您可以通过创建更多用户/帖子轻松增加组织的成本，因此根据您想要实现的目标，这也可能是创建更多帖子的动机

anon82911141 · 2024 年7 月 3 日 21:24

您好，

您尝试过使用 Akismet 吗？看起来他们的解决方案可能适合您。

（个人使用免费，商业使用收费 - 不知道您如何归类自己）

Firepup650 · 2024 年7 月 3 日 21:25

也许要求每个用户的第一个帖子都经过审核会有所帮助？这样至少他们永远不会公开出现在论坛上，而且只要每天注册的真实用户不是很多，我认为这至少会有所帮助。

SailReal · 2024 年7 月 3 日 21:43

感谢所有提示。

我们确实考虑过，但我们有一个隐私和安全产品，这意味着我们需要尽可能地保护我们的用户。内容肯定是公开的，但如果我正确理解了 https://meta.discourse.org/t/discourse-akismet/109337，IP 地址/用户代理/推荐人/电子邮件会传输给 Akismet（当然也会阅读隐私政策，但概述已足够做出决定）。

这会是一个想法。每天大约有 2 个注册用户，应该不会太麻烦，但等待批准并不是最佳体验，但如果我们解释得当，这可能是我们目前拥有的最佳选择。

anon82911141 · 2024 年7 月 3 日 21:46

是的，不幸的是你说得对——它们确实会将一些额外数据传输给 Akismet，这可能与您的隐私政策不符。在这种情况下，@Firepup650 的建议是最好的。

RGJ · 2024 年7 月 3 日 22:33

供您参考，我的 Geo Blocking plugin 可以根据源 AS 网络拒绝访问 Discourse。确实，很多这类垃圾邮件似乎都源自这些网络，尤其是 AS45609。

如果您不想阻止印度一半的用户，那么可能值得研究一下该插件中的某些功能是否可以重用于将网络或 IP 规则添加到审批逻辑中（“要求来自网络的帖子的审批”）。

j127 · 2024 年7 月 3 日 23:36

我浏览了该示例网站的许多页面，认为如果 Discourse 的正则表达式可以处理 Unicode 范围，那么使用“监视的单词”功能几乎可以阻止所有这些。

普通用户可能不会使用类似以下的内容：

连续出现 2 个或更多斜杠
不寻常的标点符号，如 ^（除非是数学网站）
不常见的 Unicode 范围：
- ✓（杂项符号）
- ∆（希腊语和科普特语）
- ❽, ➁, ❸, 3, ❷（花边装饰）
- 𝘾, 𝙪, 𝙨, 𝙩（数学字母数字符号）

如果 Discourse 支持，ChatGPT 也许能为这些编写正则表达式。

还有一个想法是尝试 Cloudflare 的 Bot Fight Mode 功能（免费），并挑战所有机器人。

SailReal · 2024 年7 月 4 日 08:18

哦，这将是完美的解决方案，我会看看代码，谢谢！

这里的问题是这个机器人不知何故知道 Discourse 的工作原理：在以下场景中，我在“需要审批”部分监视 ❽。现在的问题是，这些机器人经常先创建随机文本，然后将其编辑为实际内容。编辑帖子不会根据“需要审批”列表进行检查，请参阅例如

对比

（这里我在创建帖子时直接添加了 ❽）

这意味着我们唯一的选择是将其添加到阻止部分，但阻止过多的单词和字符很容易导致问题，即普通用户在创建有效帖子时会收到令人困惑的消息。我认为这就是我们大多数问题的根源。在我看来，这是一个错误，而且在编辑帖子时，“需要审批”列表在更改发布时应该根据编辑后的内容进行检查。

j127 · 2024 年7 月 4 日 08:54

看来“监视词”也无济于事了。我还没有遇到过垃圾邮件攻击，但我担心这个问题，因为用户开始弄清楚这一点了。

j127 · 2024 年7 月 13 日 17:11

看起来我的一个论坛也遭到了同样的垃圾邮件攻击。我不知道他们是否使用了编辑技巧，因为我还没有将垃圾邮件词语添加到监视词语列表中。

juanjosegzl · 2025 年7 月 13 日 18:09

大家好

我已经为此准备了一个概念验证，如果您想看看的话：

RGJ · 2025 年7 月 13 日 21:29

干得漂亮 @juanjosegzl ，我很乐意接受这个 PR！

juanjosegzl · 2025 年7 月 19 日 14:33

谢谢 @RGJ 我刚刚打开了一个 PR

Shelim · 2025 年7 月 29 日 17:24

您好 @juanjosegzl，

您上次的 PR 破坏了插件——它现在要求每个人通过审核来确认他们的帖子（即使是审核人员自己），而与他们的地理位置无关。有什么临时解决方案或修复的预计时间吗？

话题		回复	浏览量
Our forum is getting "bamwar" spam Support	34	11650	2016 年4 月 1 日
Diagnosing spam attack of 100 topics Feature	34	3097	2017 年5 月 29 日
Tips for Preventing Spam Site Management moderation , explanation , spam	14	5409	2025 年12 月 1 日
Spam Posts Support	2	548	2024 年4 月 10 日
Watched words to block recent spam attack Sysadmins watched-words , spam	12	408	2025 年9 月 10 日

阻止近期的垃圾邮件潮

相关话题