屏蔽Google的“帮我写”

j127 · 2024 年3 月 28 日 06:34

我刚看到谷歌发布了一项功能，鼓励 Chrome 用户使用 AI 在网上撰写内容。

我认为这有可能破坏在线社区的实用性。用户将无法确定他们是否在与一个由在浏览器中按按钮但实际上没什么可说的人控制的机器人进行交流。

也许可以通过跟踪文本是由浏览器插入还是由用户键入来检测？如果没有检测到粘贴，但编辑器突然填满了文本，那很可能是 AI 生成的。

如果帖子是 AI 生成的，也许可以给它一个特殊的标记，并可以选择性地进行审核？管理员可以看到用户发布了多少看起来像 AI 生成的帖子。只是在头脑风暴。

merefield · 2024 年3 月 28 日 09:15

已经有一个“输入过快”检测器可以捕获复制粘贴了？

至于分析实际内容，我就留在这里了：

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text

“截至 2023 年 7 月 20 日，由于准确率低，AI 分类器已不再可用。我们正在努力整合反馈，并正在研究更有效的文本来源追踪技术，并承诺开发和部署能够让用户了解音频或视觉内容是否由 AI 生成的机制。”

我不知道有什么替代品。

这是一个棘手的问题。

j127 · 2024 年3 月 28 日 18:50

现有的工具可能会在审核中捕捉到，但管理员无法区分复制粘贴（通常是垃圾信息发送者）和浏览器插入的 AI（一种动机不同的新型问题）。将无法看到用户从 Chrome 或浏览器扩展中注入内容的频率历史记录，这将使得检测那些不自己撰写内容的用户的难度增加。

我设想的用户贡献动机是为了获得在线知名度或某种“积分”。他们沉迷于阅读，但多年来一直潜水。这个 AI 工具鼓励他们写一些东西，而否则他们会满足于默默阅读。

我认为，如果这项功能被广泛使用，论坛内容的质量将逐渐下降。至少，人们会普遍认为“论坛的质量不如以前了”。

这种下降已经发生在整个网络上，许多人现在会在搜索查询中附加“reddit”，因为他们试图避免 SEO 垃圾信息和 AI 文章。

如果这项功能变得流行，审核也将变得更加困难，因为“输入过快”过滤器捕获的每个帖子都必须仔细检查是否为 AI。版主将无法快速确定“这是粘贴的”（可能是在文本编辑器中编写然后复制粘贴的）还是“这是从 Chrome 或扩展程序注入的”（可能是 AI）。如果管理员还能看到每个用户注入帖子的数量历史记录，我们就能更轻松地做出这些审核决定。

Ed_S · 2024 年3 月 28 日 21:05

如果这里有人能访问该功能，也许他们可以解释或演示它会产生什么样的输出。

j127 · 2024 年3 月 28 日 22:40

这是一个截图。它会打开一个框。你告诉它写什么，如果你点击“插入”，它就会被发送到编辑器。我让它写一篇长文，但它只写了一个段落。

我通常不使用Google Chrome，但当我启动它来检查一个网站时，一个标签会自动打开，宣传这项新功能。

merefield · 2024 年3 月 28 日 22:50

如果它瞬间被发送到编辑器，它应该像从另一个来源复制粘贴一样触发审核队列的标志。

j127 · 2024 年3 月 28 日 23:02

它可能会进入审核流程，但仍然无法区分用户的不同动机。

我只是建议，如果人们开始使用此功能并使用 AI 进行发帖，一些额外的工具将有助于保护论坛免受其影响：

即使是受信任的用户，也要将帖子发送到审核流程（或者至少在帖子发布后标记为需要人工审核）。
将来自 AI 工具的文本插入标记为与复制/粘贴不同。
为每个用户保留一个计数器，记录他们将文本插入编辑器的次数。一个长期用户只使用一次该功能不应该是一个大问题，但能够检测到文本插入的模式会很有用。

merefield · 2024 年3 月 28 日 23:24

我找不到相关文档，但我强烈怀疑“AI 工具”使用的是浏览器的 Clipboard API，因此网站将无法区分文本的来源。

simon · 2024 年3 月 28 日 23:53

这有点好笑。谷歌应该提供一种方法来阻止它在一个网站或域名上——类似于智能撰写在谷歌文档中可以关闭的方式。

我完全支持使用人工智能作为写作助手，但不以这种方式。

j127 · 2024 年3 月 29 日 00:13

可能仍然存在可检测的差异——粘贴时，光标必须进入文本区域并按键或右键单击，但注入内容时则不需要执行这些操作。（编辑：要使用该功能，您需要单击一次右键。然后会有一个停顿，而您使用该工具。之后内容就会被注入。）

即使无法检测到，也应该跟踪哪些用户在复制/粘贴以及频率。否则，版主将花费大量时间试图分析帖子，并与用户就他们除了直觉之外没有证据的事情争论。版务管理本身就是一项极其艰巨的任务。

Ed_S · 2024 年3 月 29 日 07:44

感谢 @j127 的插画。

对于我自己的社区，我希望继续允许任何人使用翻译工具，以防他们对英语没有信心，但我不想看到平淡无奇、没有实质内容的 AI 帖子。介于两者之间，可能有一些帖子是人们希望使用 AI 工具进行润色的——如今，人们常用这些工具来改进求职信、文档或演示文稿。我认为我可能对此持开放态度。

对我来说重要的是帖子的质量——它是否为讨论增添了价值，是否表达了发帖人的观点、经验或知识。

我认为我今天的辩护有两点：

警惕这种情况可能发生
也许发布一些指导（或规则），说明立场是什么，以便在不至于太令人意外的情况下审核违规内容。

我认为自动防御不太可能有效，尤其是随着 AI 工具的不断改进。

awesomerobot · 2024 年3 月 29 日 14:26

完全同意。现在已经有各种各样的 AI 模型，模型训练方式的各种变体，以及用户在生成输出时可以提供的无限变化的提示。任何检测 AI 生成内容的策略都会很快失败。

j127 · 2024 年3 月 29 日 19:25

我提出的方法并不依赖于人工智能内容是如何生成的。它衡量内容被注入页面的方式以及用户交互的时机。它将最终的决定权留给版主，版主将拥有更多信息来做出决定。它不能抓到所有东西，但可以抓到很多东西。

在我的主论坛中，垃圾信息发送者通常会创建账户并发布内容很长时间，假装是普通用户。有时账户会有一两年历史才开始注入垃圾链接。他们不发布任何有趣的内容，但也不违反任何规则，所以不能马上禁止他们。没有足够的时间与他们单独交谈以确定他们是否是合法用户。这是我担心的一类人。

这个 Google Chrome 功能可能不会成功，但它有可能对论坛产生巨大的负面影响，增加版主负担，并因充斥着刚好能通过的空洞人工智能内容而降低公众对其价值的看法。

如果它成功了，将无法区分人工智能帖子和那些写得不太好但仍属于可接受内容范围内的用户，而试图在没有数据的情况下做出这些版主决定可能会给管理员带来压倒性的负担。如果版主做出错误决定，或者被指控的人谎称使用了人工智能，可能会导致与用户之间耗时费力的来回争论。

现在添加一项功能来防御这个问题可能还为时过早，但我希望 Discourse 会关注它。

sam · 2024 年4 月 2 日 03:37

我们确实在密切关注这一领域。

我们需要听取来自社区的成功和失败的案例，以帮助决定策略。

这里有各种各样的情况：

拼写/措辞检查器+++……它应该被禁止吗？如果人工智能让我的写作更清晰了一点，那么它去除了一点点，这真的是犯罪吗？
多语言故事……如果能出现真正的多语言论坛，那不是很棒吗？不是每个人都说一口流利的英语。
在发帖前，有一个集思广益的伙伴来交流想法，这算犯罪吗？

我确实认为改进审核是有价值的……当然。黄色/橙色/红色标记系统可能很有趣……当然。

simon · 2024 年4 月 2 日 04:40

我对 Google 的 AI 写作助手持有的异议在于其用户界面。它会生成回复并显示一个大的“插入”按钮。将 AI 用作写作工具的非懒惰方式是与它就你正在写的内容进行对话。

justanotherperson · 2024 年4 月 6 日 20:22

是的，我非常同意。我们可能有 AI 探测器，但为什么花了 15 分钟才有人指出一个 AI 生成的指南*（在我常去的论坛上）？它可能被禁用了，但这会让人们辛勤工作的成果对 AI 来说毫无意义。事实上，我们已经遇到了两次 AI 生成的指南和一位人类-AI 用户。

*

在那个论坛上，我们在六月份与 AI 有过糟糕的经历，我们大多数人都相信亲力亲为（更具体地说，是自己写指南）。

j127 · 2024 年4 月 6 日 20:42

感谢您对此事的关注。

我并非反对人工智能（AI）——我只是反对那些被冒充为人类撰写的内容的AI生成内容。

在我主要的论坛中，关于AI内容的规则是，只要明确标明是来自ChatGPT的，就可以发布来自ChatGPT等工具的想法。人们可以发布一些ChatGPT的输出内容，作为人与人之间对话的基础。但是，不允许出现冒充人类的机器人评论。

我认为像Grammarly这样的扩展程序是针对特定网站激活的，然后它们会处理已经直接输入到文本区域的文本，所以它们不会被检测为AI插入。

如果有人使用独立的语法检查应用程序而不是浏览器扩展程序，那么就会检测到像Ctrl+V（或Command+V，或右键单击并粘贴）这样的交互，这与直接AI插入有所区别。

我认为，如果人们用自己的语言撰写内容，然后在论坛中运行的AI进行翻译，那将是理想的。翻译技术将继续进步，因此从长远来看，让用户用母语发帖可能会带来更好的翻译内容。

我认为，用户在外国语言中注入AI内容，可能还会让知道内容是否由AI工具注入变得更加有用。目前，通过阅读通常不难检测到英文中的ChatGPT内容，但其他语言的AI生成内容可能无法检测到，除非通过监控用户与页面的交互。

我想知道这样做的人是否占AI用户的很小一部分。如果有人在另一个窗口中与AI进行头脑风暴，然后粘贴文本，那么按键/点击是可以检测到的。谷歌的工具不进行头脑风暴，只是自动生成内容。

Jagster · 2024 年4 月 6 日 21:52

人工智能文本的检测，即区分机器生成文本和人类生成文本的能力，取决于多种因素，语言是其中之一。英语长期以来一直是人工智能研究和开发的核心，这意味着英语语言模型经过了更多的训练，并且通常更成熟。这可能导致英语人工智能文本比其他语言更流畅，更难识别。

另一方面，随着人工智能模型的发展并在多语言数据上进行训练，它们在其他语言中生成可信文本的能力也在提高。像 GPT-3 及其后续版本这样的多语言模型已经展示了它们在多种语言中生成流畅文本的能力。这意味着在不同语言中检测人工智能生成文本的难易程度差距可能会随着时间的推移而缩小。

人工智能文本检测还取决于其他因素，例如文本的上下文、主题的复杂性以及读者识别文本中不自然表达或重复模式的能力。此外，语法和词汇等特定语言的特征会影响识别人工智能生成文本的难易程度。

—

是的，开头是人工智能生成的，而且是芬兰语。芬兰语版本很容易手动检测，因为没有人那样说话。除此之外，它很准确，但语气很奇怪。

然后我通过 deepl 将其翻译成英文版本。即使是我，也能立刻看出它很可能是人工智能写的。

我的弱点是，当所有人工智能解决方案在创建能欺骗母语读者文本方面同样糟糕时，人工智能就完全没有能力区分了。

（而且我有点困惑，为什么它即使是英语也如此糟糕）

那么还剩下什么？例如，检测前面提到的粘贴移动。

我不在乎我犯了多少语法错误，或者我乱用介词，你通常都能很好地理解我，但有时可能会出现我想或需要写出尽可能清晰的英语的情况。然后我可以让人工智能修改我的文本，或者使用 deepl 将其翻译成英语。

你认为我如何在这里获得文本确切地说。而且，如果在那时，其他一些自动工具告诉我我的文本被标记为 ctrl-v，因为

我在别处翻译了它
我按照建议在这里使用 PM 创建了该文本

我会非常生气。

再说一遍，我只是另一个最终用户，但我看不到我们如何能赢得这场比赛。与人工智能图像相同的问题。

Ed_S · 2024 年4 月 7 日 07:08

有时我们会发现自己试图用技术手段解决社会问题。这里存在的社会问题是低质量的贡献：一项有版主行动支持的政策应该能奏效……除了规模问题。

我运行的是小型论坛，所以这不是我的问题。一个小论坛可以变成一个大论坛，可以在不扩大版主管理规模的情况下实现这一点——以及用户标记。你的用户需要警惕低质量的内容，你的版主需要对标记做出反应。

我认为——希望——我们可以避免被人工智能帖子淹没，同时又不至于失去人们使用自动翻译的能力。我们不需要 100% 的成功率——我们需要将论坛内容保持在对用户有效的质量水平，这样人们就会继续回来，继续贡献，并帮助进行标记。

j127 · 2024 年4 月 8 日 19:31

仅凭单个帖子很难检测到，这就是为什么我建议跟踪用户执行此操作的频率——可能通过ctrl-v、右键单击、标签焦点和文本插入（单独评分）等方式。目标是了解用户的模式，这样在需要处理他们时，就有证据而不是仅仅猜测。

最终的审核决定仍将由人工做出，但主要区别在于，这些人将拥有更多数据来更快、更准确地做出决定。并非所有情况都需要处理，但有些情况需要。

可以有方法来检测不同类型的动机。一个帖子，如果作者长时间打开，并且在标签失去焦点后进行了多次粘贴，那可能不是人工智能文本注入。

Discourse 提供的数据已经使审核决策变得容易得多——即使是像 IP 地址位置、用户名、首次发帖内容、输入速度是否过快、typing_duration_msecs、composer_open_duration_msecs 等基本信息。

我认为，如果谷歌的功能取得成功，增加几个字段会很有用。即使 Discourse 不构建复杂的人工智能检测器，在数据库中收集这些数据也可以让其他人更容易开发插件。

我以前没注意到，但刚才看到一个“AI”的东西弹出，翻译成英文。我个人不会在我的论坛上这样做。我会让用户用他们自己的语言写原始内容，然后在呈现给其他用户之前运行翻译器。这就是我上面关于未来翻译软件将比今天更好的评论中所说的。通过存储用户的母语，2030 年代和 2040 年代更好的翻译软件可以用于此，并且内容可以被说该语言的用户阅读，而无需将其翻译成英语再翻译回来。

话题		回复	浏览量
Are you experiencing AI based spam? Community ai	23	1804	2025 年1 月 19 日
Experiments with AI based moderation on Discourse Meta Community moderation , ai	11	688	2025 年5 月 26 日
Introducing Discourse AI Blog	26	3628	2023 年5 月 4 日
Discourse AI Plugin official , included-in-core , ai	89	37617	2025 年10 月 14 日
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	3	404	2023 年7 月 7 日

屏蔽Google的“帮我写”

相关话题