クローラーのトラフィックを翻訳

プラグインを 2 つのサイトにインストールしていますが、Google 翻訳の API の使用状況は、クローラーのトラフィックと非常に相関しているようです。このプラグインは、ユーザーが :globe_with_meridians: をクリックしたときだけ投稿を翻訳するのでしょうか?

はい、まさにその通りだと思います。

より正確に言うと、このプラグインは投稿ごとに言語別で一度だけ翻訳を行います。ただし、投稿が編集された場合は、再度翻訳が行われます。

こんにちは。上記の @yanokwa の投稿で言及されていたサイトのひとつを担当しております。このプラグインをインストールしてからの最初の2ヶ月間の翻訳コストは、当サイトの通常のトラフィック量や、コミュニティのどの程度の割合がこのプラグインを利用すると想定していたかを考慮すると、予想よりもはるかに高くなってしまいました。

8月のこのプラグインによる Google 翻訳 API の支出グラフと、同じ期間の Discourse サイトのトラフィックレポートを比較すると、以下のようになります。

これは、API 支出の日々の変動と Discourse サイトへのウェブクローラーのトラフィックの間に、非常に強い(ほぼ1対1の)相関関係があることを示しているように見えます。特に、これらのチャートでは8月2日〜3日と14日〜15日に顕著です。

これにより、これらの API リクエストの大部分は何らかの形でボットトラフィックによってトリガーされていると考えています。状況を継続して監視していますが、この傾向が続く場合、別の構成上の要因がこれに寄与していない限り、プラグインを無効にする可能性があります。こちら側で調査していただくことは可能でしょうか、あるいは確認すべき他の設定やプラグイン/Discourse の構成についてご提案はありますか?

Google のダッシュボードで、リクエストされた翻訳の種類を内訳として確認することはできますか?このプラグインは、言語検出エンドポイントと翻訳エンドポイントを利用します。

良い質問ですね。過去 30 日間の API リクエストの大部分(99%)が「言語の検出」であるようです。

これはある程度想定されることで、プラグインのインストール後に投稿が作成された、または初めて読み込まれた際に、その投稿の言語を検出するジョブをキューに投入するためです。翻訳ボタンの表示可否を判断するには投稿の言語を知る必要があるため、検出を遅らせることはできません。