更新
正しいサイトマップエンドポイントを見つけました。Googlebotに対して正常に動作しています。
https://forum.pragmaticentrepreneurs.com/sitemap.xml
これは有効なサイトマップインデックスであり、以下を参照しています。
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
テストしたこと
- Googlebotアクセス: Googlebotユーザーエージェントを使用すると、
sitemap.xml、sitemap_recent.xml、sitemap_1.xmlのすべてがHTTP/2 200を返し、本文は本物のXML(HTMLチャレンジページではない)です。 - ヘッダー/コンテンツタイプ:
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- レスポンスには、
x-discourse-route: sitemap/*およびx-discourse-crawler-view: true(Discourseによってクローラーモードで提供される)が含まれています。
- IPv4 + IPv6: 両方とも
sitemap.xmlで200を返します。 - 安定性: Googlebot UAを使用して、各サイトマップを連続して20回取得しました。403/429/5xxは発生しませんでした。
- 通常の応答時間は、
sitemap.xmlで約0.17〜0.28秒、sitemap_recent.xmlで約0.19〜0.60秒、sitemap_1.xmlでほとんどが約0.45〜0.99秒でした(1回だけ約2.9秒と遅い応答がありましたが、200でした)。
- 通常の応答時間は、
- robots.txt:
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmlを含んでおり、/sitemap*.xmlをブロックしていません。
Search Consoleのステータス
Google Search Consoleでは、サイトマップインデックスの処理は成功と表示されますが、現在「読み取られたサイトマップ」の下にリスト/認識されているのはhttps://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlのみです。
sitemap_1.xmlはまだそこにはリストされていません。
現状
サーバー側ではすべて正常に見えるため、これはSearch Console側の遅延または部分的な処理のように思われます。Googleはインデックスと少なくとも1つの子サイトマップを読み取っていますが、2つ目のサイトマップがUIにまだ表示されていません。
