O Google Search Console não consegue ler o sitemap

Atualização

Encontrei o endpoint correto do sitemap e ele está se comportando normalmente para o Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

É um índice de sitemap válido e ele referencia:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

O que eu testei

  • Acesso do Googlebot: sitemap.xml, sitemap_recent.xml e sitemap_1.xml retornam HTTP/2 200 com um user-agent do Googlebot, e o corpo é XML real (não uma página de desafio HTML).
  • Cabeçalhos / tipo de conteúdo:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • As respostas incluem x-discourse-route: sitemap/* e x-discourse-crawler-view: true (servido pelo Discourse no modo crawler).
  • IPv4 + IPv6: ambos retornam 200 em sitemap.xml.
  • Estabilidade: Busquei cada sitemap 20 vezes seguidas com um UA do Googlebot — sem 403/429/5xx.
    • Os tempos de resposta típicos foram de ~0.17–0.28s para sitemap.xml, ~0.19–0.60s para sitemap_recent.xml e, na maioria, ~0.45–0.99s para sitemap_1.xml (uma resposta mais lenta em ~2.9s, ainda 200).
  • robots.txt: inclui Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml e não bloqueia /sitemap*.xml.

Status do Search Console

No Google Search Console, o processamento do índice do sitemap mostra como bem-sucedido, mas apenas https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml está atualmente listado/reconhecido em “Sitemaps lidos”.
sitemap_1.xml ainda não está listado lá.

Onde isso nos deixa

Do lado do servidor, tudo parece normal, então isso parece ser um atraso ou processamento parcial do lado do Search Console: o Google está lendo o índice e pelo menos um sitemap filho, mas ainda não exibiu o segundo na interface do usuário.