自动添加关于互联网重复内容的员工通知?

Akismet 垃圾邮件过滤器在查找 Docker 论坛与 Stack Exchange 网站(主要是 Stack Overflow)、GitHub 和 Reddit 之间的重复帖子方面做得相当好。这些帖子会进入审核,但随后不会显示 Akismet 可能找到匹配帖子的位置:


Akismet 将此帖子标记为潜在垃圾邮件。

我想问一下是否可以配置 Akismet 插件以显示其他出现位置的 URL。但实际上,我想要更多……

通常,只需将部分文本复制粘贴到 Google 即可找到来源。在 Docker 论坛上,我倾向于拒绝标记(批准重复帖子),同时为回答问题的志愿者添加一个工作人员通知。如下所示


:warning: 此帖子也发布在 Stack Overflow 上。如果您想花时间回答,您可能想检查是否添加了新详细信息或是否有人已在那里回答

所以,我想知道:是否有人尝试过自动化类似的操作?

附注:

  • 我也倾向于在 Stack Overflow 上发布指向论坛的链接;这无论如何都是手动操作。因此,如果自动化,那么人们可能无论如何都想收到通知。

  • 我很经常对_“新用户以可疑的速度输入了他们的第一篇帖子,怀疑是机器人或垃圾邮件发送者行为”_使用相同的方法,而 Akismet(尚未)检测到(或标记)为重复项。

4 个赞

你好 @Arjan:wave:

我不知道 Akismet 会过滤在线重复副本;我猜是那些示例中使用的某些标记触发了 Akismet。

我找不到 Akismet 提供该服务的相关信息,你能提供指导吗?如果该信息可以通过他们的服务获取,也许我们可以利用它。:slight_smile:

2 个赞

嗯,你可能是对的。我大胆地假设 Stack Exchange 也在使用 Akismet(实际上我并不知道)。我认为,虽然我需要找到一些例子,但我还看到过在现有帖子被复制到 Stack Exchange 后,审核才被触发。大多数时候,Stack Exchange 的帖子似乎更旧,这也解释了复制粘贴触发了“在可疑地快速输入了他们的第一篇帖子”的审核。

此外,在一段时间内,我们肯定看到过许多帖子被编辑后出现误报。这让我认为过滤器被其自身的算法弄糊涂了,无法找到重复项,不理解来自某个在线数据库的重复项就是同一个论坛上的同一个帖子。在寻找原因时,我没有在 Akismet 的服务中找到任何参考。

所以,很多都是猜测。我会尝试找一些例子,但也许还有更多的帖子在论坛和其他地方之间被复制,也许我只找到了其中的一些。:thinking:

看起来 Stack Exchange 有自己的解决方案,至少在两年前是这样:How does spam protection work on Stack Exchange? - Stack Overflow

当然,Akismet 仍然可以订阅 Stack Exchange帖子的公开feed,但他们的目标不是查找重复项。(或者也许 Akismet 标记的 Stack Exchange 重复项也在其他地方重复了。算了。)

1 个赞

@maiki 我没有遇到过可以证实这种情况的例子。当然,Akismet 在一段时间后会将被标记为垃圾邮件的现有帖子,但我对其内部运作机制一无所知,无法确定。

1 个赞