Google Search Console non riesce a leggere la mappa del sito

Ciao!

Sembra che Google Search Console non riesca a leggere una delle sitemap. La sitemap principale sitemap.xml (https://forum.pragmaticentrepreneurs.com/sitemap.xml) viene letta correttamente, ma viene importata solo sitemap_recent.xml.

Se provo ad aggiungere manualmente sitemap_1.xml a Google Search Console, ricevo un errore. Se provo nel validatore, sembra tutto a posto.

Hai qualche idea sul perché GSE non riesca a leggere sitemap_1.xml?

Grazie per l’aiuto.

MODIFICA:
Bing sta leggendo correttamente entrambe le sitemap, quindi sembra essere specifico di Google.

Inoltre, tutto va bene quando provo a ispezionare sitemap_1.xml

Sembra che tu abbia avuto lo stesso problema l’anno scorso: Troubleshooting sitemap indexing issues in Google Search Console.

Alla fine ha funzionato?

Ho appena visto che ho già pubblicato una domanda a riguardo :slight_smile: Ma no, non ho trovato una soluzione.

Fatemi sapere se posso fornire ulteriori informazioni per aiutare.

Non ho idea neanche io.

L’URL è accessibile per me. Ho provato vari strumenti per convalidare l’XML, nessun problema. Leggendo Manage your sitemaps using the Sitemaps report - Search Console Help, dovresti vedere una pagina di dettaglio sotto l’errore che ti dice cosa c’è che non va (anche se non sembra essere il tuo caso).

Almeno, ti incoraggerei a leggere questo articolo. Potresti trovare un indizio.

In effetti, non ho dettagli sull’errore. Ho provato a ispezionare l’URL come dicevano, ma non ci sono errori qui :frowning:

Fammi sapere se posso fare qualcos’altro per aiutare.

Aggiornamento

Ho trovato l’endpoint sitemap corretto e si sta comportando normalmente per Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

È un indice di sitemap valido e fa riferimento a:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

Cosa ho testato

  • Accesso di Googlebot: sitemap.xml, sitemap_recent.xml e sitemap_1.xml restituiscono tutti HTTP/2 200 con un user-agent Googlebot, e il corpo è XML reale (non una pagina di sfida HTML).
  • Intestazioni / tipo di contenuto:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • Le risposte includono x-discourse-route: sitemap/* e x-discourse-crawler-view: true (servito da Discourse in modalità crawler).
  • IPv4 + IPv6: entrambi restituiscono 200 su sitemap.xml.
  • Stabilità: Ho recuperato ogni sitemap 20 volte di seguito con un UA Googlebot — nessun 403/429/5xx.
    • I tempi di risposta tipici erano di circa 0,17–0,28s per sitemap.xml, circa 0,19–0,60s per sitemap_recent.xml e per lo più circa 0,45–0,99s per sitemap_1.xml (una risposta più lenta a circa 2,9s, ancora 200).
  • robots.txt: include Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml e non blocca /sitemap*.xml.

Stato di Search Console

In Google Search Console, l’elaborazione dell’indice della sitemap risulta riuscita, ma solo https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml è attualmente elencato/riconosciuto sotto “Sitemap lette”.
sitemap_1.xml non è ancora elencato lì.

Dove ci troviamo

Dal lato server sembra tutto a posto, quindi questo sembra essere un ritardo o un’elaborazione parziale lato Search Console: Google sta leggendo l’indice e almeno una sitemap secondaria, ma non ha ancora visualizzato la seconda nell’interfaccia utente.