您好!
看起来 Google Search Console 无法读取其中一个站点地图。主站点地图 sitemap.xml(https://forum.pragmaticentrepreneurs.com/sitemap.xml)可以正确读取,但只导入了 sitemap_recent.xml。
如果我尝试自己将 sitemap_1.xml 添加到 Google Search Console,我会收到一个错误。如果我在验证器中尝试,它看起来没问题。
您是否知道 GSE 为什么无法读取 sitemap_1.xml?
感谢您的帮助。
编辑:
必应(Bing)可以正确读取这两个站点地图,所以这似乎是谷歌特有的问题。
另外,当我尝试检查 sitemap_1.xml 时,一切都正常。
我刚看到我已经发过一个关于这个问题的帖子了
但我还没有得到解决方案。
如果需要更多信息来帮助解决问题,请告诉我。
确实,我没有关于错误的详细信息。我尝试按照他们说的检查了 URL,但这里没有错误 :(\n\n如果我能做些什么来帮忙,请告诉我。
更新
我找到了正确的站点地图端点,它对 Googlebot 的行为正常:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
它是一个有效的 站点地图索引,它引用了:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
https://forum.pragmaticentrepreneurs.com/sitemap_1.xml
我测试的内容
- Googlebot 访问:使用 Googlebot 用户代理访问
sitemap.xml、sitemap_recent.xml 和 sitemap_1.xml 时,均返回 HTTP/2 200,并且主体是真实的 XML(而不是 HTML 挑战页面)。
- 标头/内容类型:
sitemap.xml:Content-Type: application/xml; charset=utf-8
sitemap_recent.xml + sitemap_1.xml:Content-Type: text/xml; charset=utf-8
- 响应包括
x-discourse-route: sitemap/* 和 x-discourse-crawler-view: true(由 Discourse 在爬虫模式下提供)。
- IPv4 + IPv6:访问
sitemap.xml 时均返回 200。
- 稳定性:我连续 20 次使用 Googlebot UA 获取每个站点地图——没有出现 403/429/5xx 错误。
sitemap.xml 的典型响应时间约为 \~0.17–0.28 秒,sitemap_recent.xml 约为 \~0.19–0.60 秒,而 sitemap_1.xml 大多在 \~0.45–0.99 秒(有一个较慢的响应约为 \~2.9 秒,仍为 200)。
- robots.txt:包含
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml 并且没有阻止 /sitemap*.xml。
Search Console 状态
在 Google Search Console 中,站点地图索引处理显示为成功,但目前在“已读取的站点地图”下仅列出/识别了 https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml。
sitemap_1.xml 仍然没有在那里列出。
现状
从服务器端来看一切正常,所以这感觉像是 Search Console 端的延迟或部分处理:Google 正在读取索引和至少一个子站点地图,但尚未在用户界面中显示第二个。