用户选择退出自动翻译的可能性

编辑:这个话题最初是一个功能请求,它能让我(作为作者)更好地控制我的贡献(帖子)如何被处理。它引发了对内容 AI 翻译的未来以及在论坛(及类似场景)的背景下是否可行和有意义的更深入思考。以下是我的原始内容:


我想继续讨论我在讨论自动翻译的陷阱时所认识到的问题。大部分讨论都集中在 Discourse 管理员如何设置站点以便进行(或不进行)良好的翻译,以及当进行翻译时,用户应该如何被告知他们正在阅读的内容(原文是什么语言,是否是翻译等)。

但我的观点不同:

有人认为代理会进行一些翻译以带来流量:

但我想谈论的是信息来源,也就是说,当你最终看到作者写的帖子时,你会看到什么?

所以,以 Meta 为例,让我们从这些不同的观点和目标来看:

  • 网站所有者 (CDCK):我们希望与尽可能多的人交流,所以我们开启了 AI 本地化。
  • 读者:我希望轻松地用我自信的语言阅读所有内容(我的母语以及我学会的其他语言,我想阅读原文,否则就自动翻译成我的母语)。
  • 作者:现在有两种选择:
    A) 我用任何语言写作,并且我乐意让你们翻译成任何你们想要的语言
    B) 我非常谨慎地选择我写的内容和写作方式(在这里的 Meta 上,英语是论坛的原始主语言),并且我希望选择退出你们提供的自动翻译

所以,B 是我的观点。作为贡献者,我想对你们如何处理我的贡献拥有一定的控制权,无论你们如何设想论坛的运作方式。我接受有些人无法理解我说的话。如果我写英语,我可能会期望人们也学习英语来理解我——我当初自己也必须学习英语。我不想仅仅为了让尽可能多的人听到我的声音而产生误解。

所以这个功能是为了让作者能够控制他们帖子的翻译程度。

如果你设想实现它,当然会变得更复杂——如果我掌握多种语言,我甚至可以手动本地化我的帖子。不太可能,但理论上是这样。

4 个赞

这……真是个想法。你真的要地球上的每个人都这样做,仅仅因为你学会了英语吗?:flushed_face:

当然。这可以做到。那么,所有作者说读者必须做什么的帖子,都应该从所有翻译的主题中隐藏起来。因为那样才公平。

当每个意大利人、西班牙语使用者、葡萄牙人、俄罗斯人、中国人、越南人……都遵循你的想法时,这个世界将变得很有趣。

1 个赞

我们是在讨论翻译的技术和哲学方面,还是在讨论彼此的品味和生活经历?

1 个赞

为什么你认为那些不相关?你刚才用非常哲学的理由告诉你为什么想得到某样东西,现在有些理由却不合适了?

我真的很讨厌双重标准。但你无权说我能做什么或不能做什么。你选择写或不写,仅此而已。

我走了。

如果人们停止学习彼此的语言,那将是一个非常悲伤的世界。五年内就会爆发全球战争。即使人工智能没有恶意。而我在这里是乐观的。

正是如此,这篇帖子完全是关于我的选择以及 CDCK 是否选择让我加入。

1 个赞

感谢您的反馈,但我认为,仅仅因为您不认同作者的观点而对某个话题做出回应,这本身就可能违反社区规则。有很多 Discourse 功能我不会使用,但我不会在每个功能上都宣布这一点,更不用说告诉作者他们有多愚蠢了。

如果您作为作者,不在乎您的内容如何呈现——我完全没意见。我不是,我来这里也不是为了听别人说我是个错误的人,而且我认为这甚至不是本论坛的目标。我非常乐意听到“这不会被完成”,或者“我的问题有其他解决方案”。进行文明和建设性的讨论。谢谢。


至于您的问题:我是否要求每个人都学英语?不。我不希望每个人都读我写的东西。但如果他们读了,我希望他们只看到原文。如果他们想看翻译,我希望他们自己使用工具,这样他们就知道翻译并非完美。我担心,随着 AI 自动翻译的实现和使用,人们会变得懒惰,不愿意学习原文。也会懒惰到用我能理解的语言回复我。我想在这个网站上作为作者选择退出。我曾非常高兴与来自世界各地的英语社区交流,我强烈感觉,如果我们每个人都开始用自己的语言交谈,而让 AI 自动翻译给其他人,内容质量就会下降。对于非常技术性的主题可能不会,但对于像这样的更深层次的话题肯定会。

我认为自动翻译应该在 SupportBug 等类别中启用,但在 FeatureSite feedback 等更深层次的类别中应明智考虑,并在 DocumentationCommunity wiki 等类别中启用但手动编辑。否则,即使作为读者,我也可能开始担心内容质量。

基本上,Discourse 现在已经从 100% 超高质量 UGC(用户生成内容)的业务转向了半 AIGC(一篇帖子是 UGC——即原文,所有翻译基本上都是 AI 生成的,尽管每个人都期望它们是正确的——但仍然——它们完全是 AI 生成的,没有人会通读所有内容以确保没有出错)。而且由于人们将开始回应 AIGC,情况可能会变得非常混乱。

这是一个重要的转变。

我的问题是:我想成为其中的一部分吗?或者至少有一个选择可以远离它?

6 个赞

这是一个很好的话题,我同意在不告知读者的情况下自动翻译文本会成为一个问题。另一种可能的解决方案是设置一个警报横幅,通知读者他们正在阅读的原文是什么语言,以及用于翻译的系统是什么。

英语是有史以来最奇特的语言之一,其中句子结构或语法的微小改动会极大地改变句子的含义或读者解读它的方式。

1 个赞

照你这么说,也许这并不能解决我的问题。

假设我是一个英语非母语者。现在我们有一个主题,内容如下:

  1. 主题:某种语言
  2. 回复:英语
  3. 回复:某种语言
  4. 回复:完全不同的语言

所有内容都被翻译成英语,但只有第一个回复是英语母语者发出的。

现在这个帖子是什么语言?没有任何警告会让我更容易理解。这种帖子的质量如何?基本上每个人都在回应 AI 的翻译。如果原始主题本来质量就不高,它只会变得越来越糟……而且我认为我回复“仅限英语”并不能解决这个问题。

也许我的观点可以大大简化。一场由机器人连接的混合语言的讨论能否有意义地进行下去?放宽限制,让任何语言技能的人都能参与,并将门槛降至最低,真的能改善讨论吗?

我必须强调:我很高兴这个社区里有很多人投入精力去:

  1. 学习新技术
  2. 学习一门新语言(如果适用)
  3. 学习如何进行讨论

现在其中一项将不再必要。但不仅仅是这样。它将被机器人取代。是赢还是输?

它也可以用于外语的年长或成人学习者,因为说话清晰和理解更困难,因为音量低,因此需要更高的发音技巧。[21]

1 个赞

我在这里尝试写点东西(我用捷克语写)——今天我老师给了我一个不及格。

这很有趣。我用捷克语写了这句话。我们在学校的成绩是 1-5,1 是最好的,5 是最差的。

我写的是:

今天我从老师那里得到了 5 分。

翻译成英语实际上相当不错,保留了意思(尽管不是事实本身)。我简单查看了其他语言,效果并不那么好。

德语说“Fünf”,但他们在德国有 6 个等级。所以 5 意味着不及格——但他们有比这更糟糕的东西(想象一下!)。

但如果一个说德语的瑞士人读到它,他们的意思就相反了(5 是仅次于最好的分数)!

日语中仍然提到了数字 5,在日本,5 实际上意味着“最好”。

现在想象一下捷克人、德国人、瑞士人和日本人去酒吧……

哦,我还查了芬兰,那里的情况甚至更有

1 个赞

请稍等……

我们可以在 Discourse 中添加什么功能来禁止“复制粘贴”到谷歌翻译的往返操作???

我们是否应该为最终用户提供通过键盘覆盖 CTRL-C 来禁用“复制”的功能???

这场讨论很大程度上感觉像是一次智力游戏。绝大多数论坛的服务条款的一部分是“您将权利授予论坛运营商,以换取他们通过提供在线社区为您提供的价值”


我强烈支持的是“标签”,我们希望清楚地表明内容是经过翻译的,并确保始终可以轻松访问原始内容,我当然支持迭代我们的用户界面。

“最初用德语写成 - 单击此处查看原文”

在每条帖子中添加这些内容有点太啰嗦了,但我相信我们可以想出一个友好且清晰的标签方式。

另外……“我说多种语言 1/2/3,所以请用这些语言显示原文”很有价值。我在 X 上也有同样的问题,因为我是多语种者。

9 个赞

我不认为有人建议过要阻止这种行为。我的印象是,大家更倾向于这样做,因为它能引起人们的注意,让他们知道这是一次翻译。

而且,我的印象是,目前并非所有用户都意识到了这一点。这会导致误解,就像在 Edit of hidden entry blocked period setting 中一样,我提供的网站设置名称被翻译了,而用户没有注意到,所以这并没有帮助到他们。

我能理解那种想要选择退出让自己的帖子被翻译,以避免误解的心情。正如我在另一个主题中所说的那样:我想知道,如果我用德语写下引起误解的帖子,然后人工智能将其翻译成我发布的样子,会发生什么?我的意图会被以不同的方式解读吗?还是会有同样的反应?

3 个赞

我想在这里退一步。

如果它是:

  1. 清晰明了地表明这是一个翻译
  2. 以某种方式更容易获取原文(它已经是一键可达)

还剩下什么问题?

2 个赞

这个帖子本应更长,但只是简单的反馈和功能建议。在讨论过程中,我意识到这是一个复杂得多的问题,可能根本没有解决方案,或者需要很长时间才能找到解决方案。

许多细微的问题可能需要一段时间才会显现,一次又一次地让用户感到沮丧。我非常重视 CDCK 创建 Discourse 的主要动机——支持文明的讨论。我从 10 年前第一次安装它时就喜欢上了它。这是我的卖点,无论产品好坏。我相信凭借这个使命,你们会创造出伟大的产品。我认为我是对的。

还有不少。

产品本地化问题

我本地化了几个软件包,Discourse 是其中两个大的之一。我还创建了几个大型软件包。如果你想正确地处理语言,这是一项艰巨的工作。不一致地命名会使用户感到沮丧。无论是在应用程序中还是在文档中。有时我会找到一个比你们现在使用的简单英语术语更好的捷克语单词(但我们没有),我必须检查整个 Discourse 翻译,以确保它被一致地使用。

所以,你看到了 @Moin 仅仅因为一个小的设置——一个引用的设置——就遇到了麻烦。如果有一天你们支持捷克语,并且每个捷克人都能用他们的语言阅读所有元内容,我就会担心。因为我敢打赌,50% 的翻译会很糟糕。所有站点设置等名称都会不正确。因为找到与你们在另一种语言中的意思相似的词并不容易。有几种选择,我必须做出选择。有时是违背翻译 AI 的建议。

更深入的讨论

然后就是这样的讨论。从我的角度来看,这是一个复杂的讨论。这很重要,所以我真的需要仔细思考,并考虑到一些文化视角来写作。我大概知道我写给谁看,因为我读过你们的个人资料,知道你们来自哪个国家。我们都懂英语这一事实本身就说明了一些问题。这意味着我们已经走得更近了,并且已经分享了一些共同的文化。我们大概知道在英语中什么听起来很有趣,所以不必总是说“ FYI,那是捷克笑话”。

我们已经知道找到我们想说的词语的障碍,我们过去犯过错误,现在我们尽量不再犯。看看我刚才在这里做的测试

如果我使用外语,我很有可能也意识到不仅仅是翻译问题。我可能已经了解到(也许是艰难地)学校的成绩在世界各地并不相同。所以我不会告诉你我的成绩是多少,因为在美国你们有字母。AI 也知道,所以它将“不及格的成绩”翻译成了英语。但对于其他语言,它却彻底失败,只给了你数字。但这正是我用捷克语在捷克论坛上与捷克人交流时会写的内容(你们突然看起来都像捷克人)。所以我根本不会担心你们不理解。从第三个帖子开始,对话就会变得非常奇怪。

这是一个非常简单的问题。想象一下,在一次重要的讨论中,你开始一个词接一个词地失去意义。

就像我提到的传话游戏一样。AI 翻译在这里就像“噪音”。你开始时说的话,最后却变成了完全不同的东西。

我,作者

所以我想建议的是,我开始在这里感到不舒服。我想做出贡献,但我希望有更多的控制权。就像一个作者必须同意他们书籍的翻译一样。即使再小心,翻译也永远不会听起来像原作。作者知道这一点。所以,并不是任何人都可以随时翻译他们的书。他们至少会选择翻译者,并检查这本书在新语言中的效果。

我在这里对此没有任何控制权。我真的想被理解,我真的很在乎。也许这里 95% 的帖子都是简单的技术问题。但是,如果我知道我的帖子被随意地(通过 AI)翻译成多种语言和文化,我就会灰心丧失开始任何更深入、更有意义的事情。没有任何警告能解决这个问题。它就在那里,人们会使用它,因为它很简单。没有人会读原文。人们会根据那些糟糕的翻译来回应我的帖子,而我也会读到他们写的帖子的糟糕翻译。我会非常不高兴。

4 个赞

嗯,如果你在德国写作,我敢保证我们即使没有翻译也不会有误解。如果我使用芬兰语也是一样。

这有什么赢家的情况吗?

这不是一个可以通过简单询问就能轻易解决的翻译问题。这是关于尽可能打破国界进行沟通,并强制使用通用语——因为以前没有其他办法,因为没有翻译。现在我们有了这样的工具。

而且我问,为什么有人觉得他/她/它有权利决定我用什么语言阅读——如果我没猜错的话,这就是Sam关于复制粘贴的观点。

如果有人想阅读原文,已经有工具了。有一个标记可以显示何时是联合的(哦天哪,即使在那里有人可以使用翻译并误解事情😏),希望每个人在使用AI时都会使用某种标记。我们也有一个翻译标记。

但现在重点不是这个。重点是赋予作者在翻译是否被制作时发言的权利。这与标签和按钮无关。

1 个赞

这正是我开始的地方。回答你的问题“我凭什么说?”答案很简单:这里内容的作者。驱动论坛的内容。这里实际“销售”的产品。

但现在我提出了一个更复杂的问题:多语言化会扼杀元(meta)吗?降低入门门槛会带来更多质量吗?这更让我担忧。我知道你认为“当然!每个人都应该加入!”而我却低语“我不确定,也许语言障碍曾是一个过滤掉所有噪音的好方法……”。

我记得我们曾有过内容农场(content farms)的时代。许多网站上的人们生成大量文本以欺骗搜索引擎优化(SEO)。使用这些网站的网站在搜索结果中迅速下降。因为我们都知道这不是真实内容,人们是付费生成它的。我有一种感觉(不是知识,无法证明)是自动翻译会以某种方式落入这个范畴。不是真实内容。

我将感觉自己像是支持内容农场的人。我在这里写一些东西,然后自动出现另外20个版本。人们开始回复胡言乱语……对此无能为力。

事实上,我也担心元(meta)最终会像我们在 StackOverflow 出现之前使用的那些廉价问答网站一样,而 StackOverflow 提供了优秀的精选内容。当然,我知道这与 Discourse 有共同的历史。

1 个赞

Meta 主要是一个讨论论坛,用于讨论 Discourse 的功能/错误/用户体验上的小问题等。

如果一个错误是用德语仔细描述的,然后我用英语阅读它——我很有可能理解这个错误是什么。通过正确的提示,我们还可以让 AI 将这个错误呈现给更广泛的受众,让他们清楚这是一个错误并且已经被修复。

另一个值得探讨的问题……只有 8% 的日本人会说英语,相比之下,捷克人有 45% 会说英语。

英语作为“有能力进行文明的在线讨论的人”的筛选器,在一些“高质量的人都说流利的英语”的国家可能是一种试金石,但绝不是在所有国家都如此。

是的,一些细微的讨论很难翻译。但需要注意的是,今天的人工智能翻译是最差的时候。随着时间的推移,我们可以捕捉到更好的细微差别和更好的表达方式。事实上,我刚刚用希伯来语读了你的帖子,它相当忠实,你所有的主要观点都被准确地捕捉到了,得分 8/10。

5 个赞

但是这种特定的用例将不再发生。您知道,我们保留英文线程,同时翻译可以在整个通信的上下文中进行(我不知道是否如此,但有可能)。只进行从英文到其他语言的翻译。因此,我们整个线程的翻译质量稳定在 8/10。这非常好!

假设捷克语到希伯来语的翻译质量是 7/10。

那么我将用捷克语开始,您将阅读 7/10 的希伯来语翻译。

然后您将用希伯来语回复,我将阅读 7/10 的捷克语翻译。

为了更有趣,现在日语也将加入,提供 7/10 的版本(但这是不同的 7/10——一些特殊的语言怪癖,不同于捷克语到希伯来语)。

假设 @Jagster 也愿意贡献他非常特殊的语言。

英文将不参与。一点也不。

人们在自己的领域交谈,没有任何共同点,甚至没有这种感觉。并且有一些违背他们意愿的东西试图让他们相互理解。(实际上不是——只是在做它的工作——翻译。工作不是“让他们相互理解”。)

您真的认为这在任何情况下都能奏效吗?我相信即使是人类翻译也会拒绝这样做。这与人工智能是否足够好无关。如果在一个有 100 个帖子的线程中,它的质量是 9.8/10,我相信它无论如何都会失败。

也许可以在帖子旁边的历史/时间图标旁边加上一个翻译/语言图标?

:+1: Firefox 会显示“对此语言从不翻译”的选项

另外:始终显示原文也可能很有价值。我发现去那些我不会说当地语言的地方旅行,可以让我免受广告的干扰……而现在的网络也变得像那样了。

注意:也许可以将此主题上现有的评论从原始公告移到这里?

5 个赞