Atualização
Encontrei o endpoint correto do sitemap e ele está se comportando normalmente para o Googlebot:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
É um índice de sitemap válido e ele referencia:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
O que eu testei
- Acesso do Googlebot:
sitemap.xml,sitemap_recent.xmlesitemap_1.xmlretornam HTTP/2 200 com um user-agent do Googlebot, e o corpo é XML real (não uma página de desafio HTML). - Cabeçalhos / tipo de conteúdo:
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- As respostas incluem
x-discourse-route: sitemap/*ex-discourse-crawler-view: true(servido pelo Discourse no modo crawler).
- IPv4 + IPv6: ambos retornam 200 em
sitemap.xml. - Estabilidade: Busquei cada sitemap 20 vezes seguidas com um UA do Googlebot — sem 403/429/5xx.
- Os tempos de resposta típicos foram de ~0.17–0.28s para
sitemap.xml, ~0.19–0.60s parasitemap_recent.xmle, na maioria, ~0.45–0.99s parasitemap_1.xml(uma resposta mais lenta em ~2.9s, ainda 200).
- Os tempos de resposta típicos foram de ~0.17–0.28s para
- robots.txt: inclui
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmle não bloqueia/sitemap*.xml.
Status do Search Console
No Google Search Console, o processamento do índice do sitemap mostra como bem-sucedido, mas apenas https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml está atualmente listado/reconhecido em “Sitemaps lidos”.
sitemap_1.xml ainda não está listado lá.
Onde isso nos deixa
Do lado do servidor, tudo parece normal, então isso parece ser um atraso ou processamento parcial do lado do Search Console: o Google está lendo o índice e pelo menos um sitemap filho, mas ainda não exibiu o segundo na interface do usuário.
