AI翻译进度图

我昨天在我的自托管 Discourse 服务器上启用了 AI 翻译功能。一切进展顺利……或者说,勉强算顺利。

翻译进度图要么没有刷新,要么数据不准确。以下是我看到的界面:

这显示自 2026 年 2 月 23 日以来,所有帖子的翻译进度都达到了 99%。

这并不准确。在这个时间段内,我大约有 3,000 个帖子。根据翻译日志,目前它正在处理大约 6 天前的帖子。

所以,有人知道吗:

  • 这个图表的刷新频率是多少?
  • 等待翻译的帖子的数据探索器(Data Explorer)查询语句是什么?
  • 已翻译帖子的数据探索器查询语句是什么?
  • 尝试翻译但失败(由于某种错误或原因)的帖子的数据探索器查询语句是什么?

提前感谢。

由于该页面在大型网站上会出现超时,我们不得不对其进行缓存。

翻译基本上分为两个步骤:

  1. 检测帖子的原始语言
  2. 翻译成其他所有语言

在初期,您的站点将主要停留在第一步,我们最初在这个翻译进度页面中展示了这一步,但后来因为反馈称其“信息量过大”而将其移除。

话虽如此,这是一个很好的反馈。进度页面的缓存以及缺乏语言环境检测信息,使得该过程初期的体验非常糟糕。

最后一点,我们设置的回填速率非常保守,您可能需要根据您的预算进行调整。

我建议考虑采用更简单的报告方式。

根据我的理解,翻译流程分为两个阶段:

  1. 翻译符合条件的主题数据。
  2. 翻译符合条件的帖子数据。

从管理和报告的角度来看,我对当前正在处理的内容不太感兴趣,更关心的是相对于符合条件的总工作量的整体进度。我希望看到的报告应基于配置的翻译资格规则。

例如:

状态

回填设置已配置为翻译2026年2月23日之后创建的所有内容。

区域 总数 符合条件 已翻译 已完成
主题 25,000 540 450 83%
帖子 400,000 3,700 800 22%

翻译失败

帖子 ID 原因
34543 第 xxxx 行存在格式错误的字符

当前的图表似乎显示的是操作活动,这确实很有用。然而,我真正想了解的是符合条件的已完成工作量有多少。

就我个人而言,我对按语言划分的完成百分比并不太感兴趣。一个主题或帖子要么已翻译,要么未翻译。对我来说,关键问题是已成功处理了多少配置的积压工作。

这种方法似乎对数据库也更友好,因为它侧重于聚合计数,而不是跟踪每种语言组合的进度。

如果特定语言的报告仍然有价值,也许可以通过过滤器来展示。管理员可以选择一种语言,仅查看该语言的相同进度表。

仅是一些想法。

附注:

当前的缓存时间范围是多少?