我昨天在我的自托管 Discourse 服务器上启用了 AI 翻译功能。一切进展顺利……或者说,勉强算顺利。
翻译进度图要么没有刷新,要么数据不准确。以下是我看到的界面:
这显示自 2026 年 2 月 23 日以来,所有帖子的翻译进度都达到了 99%。
这并不准确。在这个时间段内,我大约有 3,000 个帖子。根据翻译日志,目前它正在处理大约 6 天前的帖子。
所以,有人知道吗:
- 这个图表的刷新频率是多少?
- 等待翻译的帖子的数据探索器(Data Explorer)查询语句是什么?
- 已翻译帖子的数据探索器查询语句是什么?
- 尝试翻译但失败(由于某种错误或原因)的帖子的数据探索器查询语句是什么?
提前感谢。
Falco
(Falco)
2
由于该页面在大型网站上会出现超时,我们不得不对其进行缓存。
翻译基本上分为两个步骤:
- 检测帖子的原始语言
- 翻译成其他所有语言
在初期,您的站点将主要停留在第一步,我们最初在这个翻译进度页面中展示了这一步,但后来因为反馈称其“信息量过大”而将其移除。
话虽如此,这是一个很好的反馈。进度页面的缓存以及缺乏语言环境检测信息,使得该过程初期的体验非常糟糕。
最后一点,我们设置的回填速率非常保守,您可能需要根据您的预算进行调整。
我建议考虑采用更简单的报告方式。
根据我的理解,翻译流程分为两个阶段:
- 翻译符合条件的主题数据。
- 翻译符合条件的帖子数据。
从管理和报告的角度来看,我对当前正在处理的内容不太感兴趣,更关心的是相对于符合条件的总工作量的整体进度。我希望看到的报告应基于配置的翻译资格规则。
例如:
状态
回填设置已配置为翻译2026年2月23日之后创建的所有内容。
| 区域 |
总数 |
符合条件 |
已翻译 |
已完成 |
| 主题 |
25,000 |
540 |
450 |
83% |
| 帖子 |
400,000 |
3,700 |
800 |
22% |
翻译失败
| 帖子 ID |
原因 |
| 34543 |
第 xxxx 行存在格式错误的字符 |
当前的图表似乎显示的是操作活动,这确实很有用。然而,我真正想了解的是符合条件的已完成工作量有多少。
就我个人而言,我对按语言划分的完成百分比并不太感兴趣。一个主题或帖子要么已翻译,要么未翻译。对我来说,关键问题是已成功处理了多少配置的积压工作。
这种方法似乎对数据库也更友好,因为它侧重于聚合计数,而不是跟踪每种语言组合的进度。
如果特定语言的报告仍然有价值,也许可以通过过滤器来展示。管理员可以选择一种语言,仅查看该语言的相同进度表。
仅是一些想法。
附注:
当前的缓存时间范围是多少?