Google Analytics を使用したボットの疑いのあるトラフィックの調査
このガイドでは、Google Analytics 4 (GA4) を使用して、疑わしいボットの活動を特定および調査する手順を説明します。
1. GA4 のデフォルトのボットフィルタリングの理解
GA4 は、既知のボットやスパイダーからのトラフィックをデフォルトで自動的に除外します。[1] このフィルタリングは、Google の調査と IAB の International Spiders & Bots List に基づいています。
このガイドの手順は、このリストにない、より高度または未知のボットを特定するのに役立ちます。
2. 通常とは異なるパターンのトラフィックの分析
ボットは、通常のユーザーパターンから大きく逸脱するトラフィックを生成することがよくあります。
手順:
-
リアルタイム レポートを確認する:
- レポート > リアルタイム ページ に移動します。「過去 30 分間のアクティブ ユーザー数」の突然の、説明のつかない急増を探します。これは、ボットの活動の増加の最初の兆候となる可能性があります。
スパム攻撃を受けていると思われる場合は、Immediate actions you can take during a spam attack のガイドを使用してください。 -
地理的位置を調査する:
- レポート > デモグラフィック > ユーザー > ユーザー属性 > デモグラフィックの詳細 に移動します。
- 表示されるデフォルトのグラフは「デモグラフィックの詳細: 国」であるはずです。ターゲットにしていない国、ビジネス拠点がない国、または通常はトラフィックが少ない国からのユーザー数が非常に多いことを探します。単一の予期しない場所からの突然の急増は、大きな警告信号です。
-
参照元スパムのトラフィックソースを分析する:
- レポート > アクイジション > トラフィック アクイジション に移動します。
- レポートはデフォルトで「セッションのデフォルト チャネル グループ」になっています。プライマリ ディメンションの横にあるドロップダウン矢印をクリックし、「セッションの参照元 / メディア」を選択します。疑わしい、または意味不明な参照元(例:
\"free-traffic-seo.com,\"“buttons-for-your-website.com”)をスキャンします。これらは、参照元スパムの典型的な兆候です[2]。
3. ユーザー行動指標の精査
行動指標は、人間とボットを分離するための GA4 の最も強力なツールとなる可能性があります。
手順:
-
エンゲージメント時間の短さを見る:
- レポート > エンゲージメント > ページとスクリーン に移動します。
GA4 では、エンゲージメント率は、10 秒以上持続したセッション、コンバージョン イベントが発生したセッション、または少なくとも 2 ページビューがあったセッションの割合です。これは、以前の「直帰率」測定よりもニュアンスのあるセッションのビューです。- 「平均エンゲージメント時間」指標は、ユーザーにとってサイトがフォアグラウンドにあった時間を示します。ボットは通常、ページに滞在する時間が非常に短いです。「平均エンゲージメント時間」で(昇順に)テーブルを並べ替え、大幅な表示数にもかかわらずエンゲージメントが異常に短いページを見つけます。
- 「表示数」が多いが「エンゲージメント率」が非常に低いページを探します。これは、ユーザーがページにアクセスしてすぐに離脱していることを示しており、一般的なボットの行動です。
「エンゲージメント率」列が表示されない場合は、追加する必要があります。右上隅の鉛筆アイコン(レポートをカスタマイズ)をクリックし、「指標」を選択して、「エンゲージメント率」をレポートに追加します。変更を保存することを忘れないでください。 -
ランディングページを確認する:
- レポート > エンゲージメント > ランディングページ に移動します。
- 左側のナビゲーションで、レポート > エンゲージメント > ランディングページ に移動します。「新規ユーザー」数が非常に多いが、「平均エンゲージメント時間」が極端に短いページを探します。このパターンは、自動化されたトラフィックがサイトの特定の入り口にヒットし、すぐに離脱していることを示唆しています。
4. Google Analytics ではわからないこと 
- IP アドレス: Google Search Console と同様に、Google Analytics はユーザーの IP アドレスに関するレポートを生成しません。この情報は、サーバー ログでのみ見つけることができます。悪意のある IP をブロックするには、サーバー ログの分析が重要です。
結論
Google Analytics は疑わしいトラフィック パターンを特定するのに役立ちますが、Discourse フォーラムで不要なクローラーを減速またはブロックするには、管理 > サイト設定 で crawler を検索したときに見つかる設定の一部を調整する必要があります。
完全にブロックしたいボットについては、そのユーザー エージェントを Blocked crawler user agents に追加します。それほど攻撃的ではないが、リソースを大量に消費するボットについては、Slow down crawler user agents に追加して、完全にブロックすることなくクロール速度を低下させることができます。遅延速度は、Slow down crawler rate サイト設定で管理できます。
これらの設定を調整する際は、細心の注意を払ってください。たとえば、一部のサイト所有者は、この設定を誤って構成したために、正規の検索エンジンのすべてのトラフィックを誤ってブロックしています。
最後に、これらの対策が万能ではないことを覚えておいてください。クローラーは常に進化しており、ユーザー エージェント文字列を変更したり、複数の IP アドレスにリクエストを分散してこれらの制限を回避したりする可能性があるため、うまく動作しない場合があります。したがって、これらの設定は強力な最初の防御線を提供できますが、新しいまたは通常とは異なるパターンについて、アナリティクスとサーバー ログを引き続き監視する必要があります。