Google Search Console non riesce a leggere la mappa del sito

Aggiornamento

Ho trovato l’endpoint sitemap corretto e si sta comportando normalmente per Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

È un indice di sitemap valido e fa riferimento a:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

Cosa ho testato

  • Accesso di Googlebot: sitemap.xml, sitemap_recent.xml e sitemap_1.xml restituiscono tutti HTTP/2 200 con un user-agent Googlebot, e il corpo è XML reale (non una pagina di sfida HTML).
  • Intestazioni / tipo di contenuto:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • Le risposte includono x-discourse-route: sitemap/* e x-discourse-crawler-view: true (servito da Discourse in modalità crawler).
  • IPv4 + IPv6: entrambi restituiscono 200 su sitemap.xml.
  • Stabilità: Ho recuperato ogni sitemap 20 volte di seguito con un UA Googlebot — nessun 403/429/5xx.
    • I tempi di risposta tipici erano di circa 0,17–0,28s per sitemap.xml, circa 0,19–0,60s per sitemap_recent.xml e per lo più circa 0,45–0,99s per sitemap_1.xml (una risposta più lenta a circa 2,9s, ancora 200).
  • robots.txt: include Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml e non blocca /sitemap*.xml.

Stato di Search Console

In Google Search Console, l’elaborazione dell’indice della sitemap risulta riuscita, ma solo https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml è attualmente elencato/riconosciuto sotto “Sitemap lette”.
sitemap_1.xml non è ancora elencato lì.

Dove ci troviamo

Dal lato server sembra tutto a posto, quindi questo sembra essere un ritardo o un’elaborazione parziale lato Search Console: Google sta leggendo l’indice e almeno una sitemap secondaria, ma non ha ancora visualizzato la seconda nell’interfaccia utente.