Googlebot のフィーチャー検出を無効にするかバイパスする方法(クローラーに JS アプリを提供する際)

最初から私のロジックが間違っていたのではないかと思い始めています。誰も返信しなかったのはそのためかもしれません。おそらく何も問題はないのでしょう。

Googleがスクリーンショットで白いページを表示するのは正常であることについての新しい記事はこちらです。

ホームページの「クロールされた」HTMLを見ることができます。これは「ライブテスト」からのものではなく、インデックスされたバージョンです。ページ全体が表示されます。Googleは、完全なJSアプリを提供しながらこれを理解したことに留意してください。

興味深いのは、インデックス作成に関しては、ホームページの約27番目の投稿まで下がったことです。したがって、無限スクロールはGoogleが理解しているものです。

役立つかわかりませんが、管理設定のajax設定のチェックを外しました。これにより、Googleは以下のようなURLを見つけることができました(そしてクローラーバージョンを提供しました)。チェックを外したところ、そのURLはJSバージョンを表示するようになりました。

https://discuss.flynumber.com/t/japan-phone-numbers-disconnect-notice/2351?_escaped_fragment_=

今、私が理解する必要があるのは、[Discourseがユーザーページ用に作成する余分な正規URL]をどのようにクリーンアップできるかということです。Canonical structure for /u/* causing many urls to be indexed