Google Search Consoleがサイトマップを読み込めません

こんにちは!

Google Search Console がサイトマップの 1 つを読み取れないようです。メインのサイトマップ sitemap.xml (https://forum.pragmaticentrepreneurs.com/sitemap.xml) は正しく読み取られていますが、sitemap_recent.xml のみがインポートされています。

Google Search Console に sitemap_1.xml を自分で追加しようとするとエラーが発生します。バリデーターで試すと問題なく表示されます。

GSE が sitemap_1.xml を読み取れない理由について、何か考えはありますか?

ご協力ありがとうございます。

編集:
Bing は両方のサイトマップを正しく読み取っているので、Google に固有の問題のようです。

また、sitemap_1.xml を検査しようとすると、すべて問題ありません。

昨年も同様の問題が発生していたようですね: Troubleshooting sitemap indexing issues in Google Search Console.

最終的に解決しましたか?

この件についてすでに質問を投稿したことに気づきました :slight_smile: しかし、解決策は得られませんでした。

何か追加情報が必要でしたら、お知らせください。

私も全く分かりません。

URLにはアクセスできます。XMLを検証するために様々なツールを試しましたが、問題ありませんでした。Manage your sitemaps using the Sitemaps report - Search Console Help を読むと、エラーの下に何が問題なのかを示す詳細ページが表示されるはずです(ただし、あなたの場合はそうではないようです)。

少なくとも、この記事を読むことをお勧めします。何か手がかりが見つかるかもしれません。

確かに、エラーに関する詳細は何もありません。言われた通りURLを調べようとしましたが、エラーはありませんでした :frowning:

他に何かお手伝いできることがあれば教えてください。

更新

正しいサイトマップエンドポイントを見つけました。Googlebotに対して正常に動作しています。

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

これは有効なサイトマップインデックスであり、以下を参照しています。

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

テストしたこと

  • Googlebotアクセス: Googlebotユーザーエージェントを使用すると、sitemap.xmlsitemap_recent.xmlsitemap_1.xmlのすべてがHTTP/2 200を返し、本文は本物のXML(HTMLチャレンジページではない)です。
  • ヘッダー/コンテンツタイプ:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • レスポンスには、x-discourse-route: sitemap/* および x-discourse-crawler-view: true(Discourseによってクローラーモードで提供される)が含まれています。
  • IPv4 + IPv6: 両方ともsitemap.xml200を返します。
  • 安定性: Googlebot UAを使用して、各サイトマップを連続して20回取得しました。403/429/5xxは発生しませんでした。
    • 通常の応答時間は、sitemap.xmlで約0.17〜0.28秒、sitemap_recent.xmlで約0.19〜0.60秒、sitemap_1.xmlでほとんどが約0.45〜0.99秒でした(1回だけ約2.9秒と遅い応答がありましたが、200でした)。
  • robots.txt: Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmlを含んでおり、/sitemap*.xmlをブロックしていません。

Search Consoleのステータス

Google Search Consoleでは、サイトマップインデックスの処理は成功と表示されますが、現在「読み取られたサイトマップ」の下にリスト/認識されているのはhttps://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlのみです。
sitemap_1.xmlはまだそこにはリストされていません

現状

サーバー側ではすべて正常に見えるため、これはSearch Console側の遅延または部分的な処理のように思われます。Googleはインデックスと少なくとも1つの子サイトマップを読み取っていますが、2つ目のサイトマップがUIにまだ表示されていません。