Aggiornamento
Ho trovato l’endpoint sitemap corretto e si sta comportando normalmente per Googlebot:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
È un indice di sitemap valido e fa riferimento a:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
Cosa ho testato
- Accesso di Googlebot:
sitemap.xml,sitemap_recent.xmlesitemap_1.xmlrestituiscono tutti HTTP/2 200 con un user-agent Googlebot, e il corpo è XML reale (non una pagina di sfida HTML). - Intestazioni / tipo di contenuto:
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- Le risposte includono
x-discourse-route: sitemap/*ex-discourse-crawler-view: true(servito da Discourse in modalità crawler).
- IPv4 + IPv6: entrambi restituiscono 200 su
sitemap.xml. - Stabilità: Ho recuperato ogni sitemap 20 volte di seguito con un UA Googlebot — nessun 403/429/5xx.
- I tempi di risposta tipici erano di circa 0,17–0,28s per
sitemap.xml, circa 0,19–0,60s persitemap_recent.xmle per lo più circa 0,45–0,99s persitemap_1.xml(una risposta più lenta a circa 2,9s, ancora 200).
- I tempi di risposta tipici erano di circa 0,17–0,28s per
- robots.txt: include
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmle non blocca/sitemap*.xml.
Stato di Search Console
In Google Search Console, l’elaborazione dell’indice della sitemap risulta riuscita, ma solo https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml è attualmente elencato/riconosciuto sotto “Sitemap lette”.
sitemap_1.xml non è ancora elencato lì.
Dove ci troviamo
Dal lato server sembra tutto a posto, quindi questo sembra essere un ritardo o un’elaborazione parziale lato Search Console: Google sta leggendo l’indice e almeno una sitemap secondaria, ma non ha ancora visualizzato la seconda nell’interfaccia utente.
