Google Search Console 无法读取站点地图

您好!

看起来 Google Search Console 无法读取其中一个站点地图。主站点地图 sitemap.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap.xml)可以正确读取,但只导入了 sitemap_recent.xml

如果我尝试自己将 sitemap_1.xml 添加到 Google Search Console,我会收到一个错误。如果我在验证器中尝试,它看起来没问题。

您是否知道 GSE 为什么无法读取 sitemap_1.xml

感谢您的帮助。

编辑:
必应(Bing)可以正确读取这两个站点地图,所以这似乎是谷歌特有的问题。

另外,当我尝试检查 sitemap_1.xml 时,一切都正常。

看起来您去年也遇到了同样的问题:https://meta.discourse.org/t/troubleshooting-sitemap-indexing-issues-in-google-search-console/332799。

最终解决了吗?

我刚看到我已经发过一个关于这个问题的帖子了 :slight_smile: 但我还没有得到解决方案。

如果需要更多信息来帮助解决问题,请告诉我。

我也不知道。

URL对我来说是可访问的。我尝试了各种工具来验证XML,没有问题。阅读Manage your sitemaps using the Sitemaps report - Search Console Help

至少,我鼓励您阅读这篇文章。您可能会找到线索。

确实,我没有关于错误的详细信息。我尝试按照他们说的检查了 URL,但这里没有错误 :(\n\n如果我能做些什么来帮忙,请告诉我。

更新

我找到了正确的站点地图端点,它对 Googlebot 的行为正常:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

它是一个有效的 站点地图索引,它引用了:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

我测试的内容

  • Googlebot 访问:使用 Googlebot 用户代理访问 sitemap.xmlsitemap_recent.xmlsitemap_1.xml 时,均返回 HTTP/2 200,并且主体是真实的 XML(而不是 HTML 挑战页面)。
  • 标头/内容类型
    • sitemap.xmlContent-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xmlContent-Type: text/xml; charset=utf-8
    • 响应包括 x-discourse-route: sitemap/*x-discourse-crawler-view: true(由 Discourse 在爬虫模式下提供)。
  • IPv4 + IPv6:访问 sitemap.xml 时均返回 200
  • 稳定性:我连续 20 次使用 Googlebot UA 获取每个站点地图——没有出现 403/429/5xx 错误。
    • sitemap.xml 的典型响应时间约为 \~0.17–0.28 秒,sitemap_recent.xml 约为 \~0.19–0.60 秒,而 sitemap_1.xml 大多在 \~0.45–0.99 秒(有一个较慢的响应约为 \~2.9 秒,仍为 200)。
  • robots.txt:包含 Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml 并且没有阻止 /sitemap*.xml

Search Console 状态

在 Google Search Console 中,站点地图索引处理显示为成功,但目前在“已读取的站点地图”下仅列出/识别了 https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
sitemap_1.xml 仍然没有在那里列出。

现状

从服务器端来看一切正常,所以这感觉像是 Search Console 端的延迟或部分处理:Google 正在读取索引和至少一个子站点地图,但尚未在用户界面中显示第二个。