Actualización
Encontré el endpoint de mapa del sitio correcto y se está comportando normalmente para Googlebot:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
Es un índice de mapa del sitio válido y hace referencia a:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
Lo que probé
- Acceso de Googlebot:
sitemap.xml,sitemap_recent.xmlysitemap_1.xmldevuelven HTTP/2 200 con un agente de usuario de Googlebot, y el cuerpo es XML real (no una página de desafío HTML). - Encabezados / tipo de contenido:
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- Las respuestas incluyen
x-discourse-route: sitemap/*yx-discourse-crawler-view: true(servido por Discourse en modo crawler).
- IPv4 + IPv6: ambos devuelven 200 en
sitemap.xml. - Estabilidad: Recuperé cada mapa del sitio 20 veces seguidas con un UA de Googlebot: sin 403/429/5xx.
- Los tiempos de respuesta típicos fueron de ~0.17–0.28s para
sitemap.xml, ~0.19–0.60s parasitemap_recent.xmly mayormente ~0.45–0.99s parasitemap_1.xml(una respuesta más lenta a ~2.9s, todavía 200).
- Los tiempos de respuesta típicos fueron de ~0.17–0.28s para
- robots.txt: incluye
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmly no bloquea/sitemap*.xml.
Estado de Search Console
En Google Search Console, el procesamiento del índice del mapa del sitio se muestra como exitoso, pero solo https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml se enumera/reconoce actualmente en “Mapas del sitio leídos”. sitemap_1.xml todavía no aparece allí.
Dónde deja esto las cosas
Desde el lado del servidor todo parece estar bien, por lo que esto parece ser un retraso o procesamiento parcial del lado de Search Console: Google está leyendo el índice y al menos un mapa del sitio hijo, pero aún no ha mostrado el segundo en la interfaz de usuario.
