Google Search Console no puede leer el sitemap

Actualización

Encontré el endpoint de mapa del sitio correcto y se está comportando normalmente para Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

Es un índice de mapa del sitio válido y hace referencia a:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

Lo que probé

  • Acceso de Googlebot: sitemap.xml, sitemap_recent.xml y sitemap_1.xml devuelven HTTP/2 200 con un agente de usuario de Googlebot, y el cuerpo es XML real (no una página de desafío HTML).
  • Encabezados / tipo de contenido:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • Las respuestas incluyen x-discourse-route: sitemap/* y x-discourse-crawler-view: true (servido por Discourse en modo crawler).
  • IPv4 + IPv6: ambos devuelven 200 en sitemap.xml.
  • Estabilidad: Recuperé cada mapa del sitio 20 veces seguidas con un UA de Googlebot: sin 403/429/5xx.
    • Los tiempos de respuesta típicos fueron de ~0.17–0.28s para sitemap.xml, ~0.19–0.60s para sitemap_recent.xml y mayormente ~0.45–0.99s para sitemap_1.xml (una respuesta más lenta a ~2.9s, todavía 200).
  • robots.txt: incluye Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml y no bloquea /sitemap*.xml.

Estado de Search Console

En Google Search Console, el procesamiento del índice del mapa del sitio se muestra como exitoso, pero solo https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml se enumera/reconoce actualmente en “Mapas del sitio leídos”. sitemap_1.xml todavía no aparece allí.

Dónde deja esto las cosas

Desde el lado del servidor todo parece estar bien, por lo que esto parece ser un retraso o procesamiento parcial del lado de Search Console: Google está leyendo el índice y al menos un mapa del sitio hijo, pero aún no ha mostrado el segundo en la interfaz de usuario.