Google Search Console ne peut pas lire le sitemap

Mise à jour

J’ai trouvé le bon point de terminaison de sitemap et il se comporte normalement pour Googlebot :

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

C’est un index de sitemap valide et il référence :

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

Ce que j’ai testé

  • Accès Googlebot : sitemap.xml, sitemap_recent.xml et sitemap_1.xml retournent tous HTTP/2 200 avec un agent utilisateur Googlebot, et le corps est du vrai XML (pas une page de défi HTML).
  • En-têtes / type de contenu :
    • sitemap.xml : Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml : Content-Type: text/xml; charset=utf-8
    • Les réponses incluent x-discourse-route: sitemap/* et x-discourse-crawler-view: true (servi par Discourse en mode crawler).
  • IPv4 + IPv6 : les deux retournent 200 sur sitemap.xml.
  • Stabilité : J’ai récupéré chaque sitemap 20 fois de suite avec un UA Googlebot — pas de 403/429/5xx.
    • Les temps de réponse typiques étaient d’environ 0,17–0,28s pour sitemap.xml, environ 0,19–0,60s pour sitemap_recent.xml, et principalement environ 0,45–0,99s pour sitemap_1.xml (une réponse plus lente à environ 2,9s, toujours 200).
  • robots.txt : inclut Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml et ne bloque pas /sitemap*.xml.

Statut de la Search Console

Dans Google Search Console, le traitement de l’index de sitemap s’affiche comme réussi, mais seul https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml est actuellement listé/reconnu sous « Sitemaps lus ». sitemap_1.xml n’est toujours pas listé là-bas.

Où cela nous mène

Du côté du serveur, tout semble correct, donc cela ressemble à un délai ou à un traitement partiel du côté de la Search Console : Google lit l’index et au moins un sitemap enfant, mais n’a pas encore affiché le second dans l’interface utilisateur.