翻译和爬虫流量

我在两个网站上安装了该插件,Google Translate API 的使用情况似乎与爬虫流量高度相关。该插件是否仅在用户点击 :globe_with_meridians: 时才会翻译帖子?

是的,我认为这正是它的工作原理。

更具体地说,该插件对每个帖子的每种语言只翻译一次。但是,如果帖子被修订,则需要重新翻译。

您好。我负责 @yanokwa 在上方帖子中提到的其中一个站点。在安装此插件后的前两个月,我们的翻译成本远高于预期,考虑到我们网站的正常流量规模以及我们对社区成员使用该插件比例的预期。

当我对比该插件在八月份产生的 Google 翻译 API 支出图表与同期 Discourse 站点的流量报告时,我看到以下情况:

这似乎表明,我们的 API 支出每日波动与访问我们 Discourse 站点的网络爬虫流量之间存在非常强(几乎为 1:1)的相关性。这一点在 8 月 2-3 日和 14-15 日的图表中尤为明显。

这让我认为,大部分 API 请求实际上是由某种机器人流量触发的。我们将继续监控这一情况,但如果趋势持续,我们可能会禁用该插件,除非我们能识别出其他可能促成此问题的配置因素。您能否在您的端点上对此进行调查,或者您是否有任何建议,或我们应该再次检查的插件/Discourse 配置?

在 Google 的控制面板中,您能否分解所请求的翻译类型?该插件使用了语言检测端点和翻译端点。

好问题。过去 30 天内,绝大多数(99%)的 API 请求都是用于检测语言:

这是可以预料的,因为自插件安装以来,当帖子首次被创建或读取时,我们会将检测帖子语言的任务加入队列。我们无法推迟检测,因为我们需要知道帖子的语言,才能决定是否向用户显示翻译按钮。