Mise à jour
J’ai trouvé le bon point de terminaison de sitemap et il se comporte normalement pour Googlebot :
https://forum.pragmaticentrepreneurs.com/sitemap.xml
C’est un index de sitemap valide et il référence :
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
Ce que j’ai testé
- Accès Googlebot :
sitemap.xml,sitemap_recent.xmletsitemap_1.xmlretournent tous HTTP/2 200 avec un agent utilisateur Googlebot, et le corps est du vrai XML (pas une page de défi HTML). - En-têtes / type de contenu :
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- Les réponses incluent
x-discourse-route: sitemap/*etx-discourse-crawler-view: true(servi par Discourse en mode crawler).
- IPv4 + IPv6 : les deux retournent 200 sur
sitemap.xml. - Stabilité : J’ai récupéré chaque sitemap 20 fois de suite avec un UA Googlebot — pas de 403/429/5xx.
- Les temps de réponse typiques étaient d’environ 0,17–0,28s pour
sitemap.xml, environ 0,19–0,60s poursitemap_recent.xml, et principalement environ 0,45–0,99s poursitemap_1.xml(une réponse plus lente à environ 2,9s, toujours 200).
- Les temps de réponse typiques étaient d’environ 0,17–0,28s pour
- robots.txt : inclut
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmlet ne bloque pas/sitemap*.xml.
Statut de la Search Console
Dans Google Search Console, le traitement de l’index de sitemap s’affiche comme réussi, mais seul https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml est actuellement listé/reconnu sous « Sitemaps lus ». sitemap_1.xml n’est toujours pas listé là-bas.
Où cela nous mène
Du côté du serveur, tout semble correct, donc cela ressemble à un délai ou à un traitement partiel du côté de la Search Console : Google lit l’index et au moins un sitemap enfant, mais n’a pas encore affiché le second dans l’interface utilisateur.
