Google Search Consoleがサイトマップを読み込めません

更新

正しいサイトマップエンドポイントを見つけました。Googlebotに対して正常に動作しています。

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

これは有効なサイトマップインデックスであり、以下を参照しています。

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

テストしたこと

  • Googlebotアクセス: Googlebotユーザーエージェントを使用すると、sitemap.xmlsitemap_recent.xmlsitemap_1.xmlのすべてがHTTP/2 200を返し、本文は本物のXML(HTMLチャレンジページではない)です。
  • ヘッダー/コンテンツタイプ:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • レスポンスには、x-discourse-route: sitemap/* および x-discourse-crawler-view: true(Discourseによってクローラーモードで提供される)が含まれています。
  • IPv4 + IPv6: 両方ともsitemap.xml200を返します。
  • 安定性: Googlebot UAを使用して、各サイトマップを連続して20回取得しました。403/429/5xxは発生しませんでした。
    • 通常の応答時間は、sitemap.xmlで約0.17〜0.28秒、sitemap_recent.xmlで約0.19〜0.60秒、sitemap_1.xmlでほとんどが約0.45〜0.99秒でした(1回だけ約2.9秒と遅い応答がありましたが、200でした)。
  • robots.txt: Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmlを含んでおり、/sitemap*.xmlをブロックしていません。

Search Consoleのステータス

Google Search Consoleでは、サイトマップインデックスの処理は成功と表示されますが、現在「読み取られたサイトマップ」の下にリスト/認識されているのはhttps://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlのみです。
sitemap_1.xmlはまだそこにはリストされていません

現状

サーバー側ではすべて正常に見えるため、これはSearch Console側の遅延または部分的な処理のように思われます。Googleはインデックスと少なくとも1つの子サイトマップを読み取っていますが、2つ目のサイトマップがUIにまだ表示されていません。