Come usare correttamente la sitemap?

Ciao. Qualcuno può chiarirmi come utilizzare correttamente la sitemap di Discourse?
Nelle impostazioni di Discourse ho abilitato la sitemap:

Questo è il contenuto del mio file sitemap:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://*******/sitemap_recent.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
<sitemap>
<loc>https://******/sitemap_1.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
</sitemapindex>

Ho aggiunto questa sitemap a GSC e sembra che il file sia stato importato con successo, ma mostra sempre solo una pagina trovata:

Se provo ad aggiungere a GSC il file sitemap_1.xml che in realtà contiene tutte (o molte) delle mie pagine, GSC non lo importa con un errore.

Quindi… qual è il modo corretto per aiutare GSC a indicizzare il mio sito? O non devo fare nulla e Google importa la sitemap durante la scansione del file robot.txt e in seguito dovrò solo aspettare?

Ehi, quale URL stai inserendo in GSC? tuodominio/sitemap.xml?

[quote=“David_Ghost, post:2, topic:321496”]nyourdomain/sitemap.xml ?
[/quote]
Grazie! Sì, immagino ))
Ho compilato il modulo su GSC, così:


e penso che significhi che il nome del dominio è stato incluso.
Nello stesso modo ho provato ad aggiungere sitemap_1.xml:

e non ha funzionato.

Prova con httpS

https://wedframe.ru/sitemap.xml

2 Mi Piace

Grazie ancora, David! Non sapevo che in GSC fosse necessario aggiungere separatamente http e https. Ho aggiunto questo dominio a GSC molti anni fa, quando i certificati non venivano praticamente utilizzati da nessuna parte. Apparentemente per questo motivo non era possibile utilizzare l’indirizzo httpS nel modulo di aggiunta della sitemap. Ma questo non è un problema. Ora ho aggiunto di nuovo la mia risorsa e ora posso usare httpS in questo modulo.

Tuttavia, al momento, anche questo non risolve il problema. Quando apro l’elaborazione dei dati di questo file, vedo altri due file sitemap. E quello che contiene tutti gli argomenti e le categorie ancora non viene importato a causa di un errore:

Potrebbe esserci un problema in questo file? Forse i nomi degli argomenti/categorie contengono simboli incompatibili che violano la sintassi xml? L’ho controllato in Notepad++ e sembra che xml sia corretto.

Aspetta un po’. Si sistemerà da solo. Mi succede a volte. Riprova tra mezz’ora.

Ho appena controllato il tuo sitemap_1.xml. Per me sembra a posto.

2 Mi Piace

Non dovresti usare sitemap_1.xml perché non sai mai quanti sitemap secondari otterrai. Usa semplicemente sitemap normale.

2 Mi Piace

Sì. Al momento aggiungo solo il file sitemap.xml. I file sitemap_1.xml e sitemap_recent.xml appaiono in GSC da soli, a quanto ho capito, dopo la scansione del contenuto del file sitemap.xml da parte di Google.

Sembra che qualcosa sia andato storto tra sitemap_1.xml e GSC. A questo punto (dopo quasi due giorni) questo file presenta ancora un errore e, allo stesso tempo, Yandex importa questo file senza alcun problema.

sitemap.xml importato correttamente

anche sitemap_recent.xml seguito correttamente ma sitemap_1.xml è “Non ricevuto”

Poi controllo questo file in url-validation, sembra che tutto vada bene:

magia…

Non riesco ancora a capire perché invii _1 e recent quando dovresti usare solo sitemap.xml.

Basta guardare il contenuto del file sitemap.xml e capirai.
Invio SOLO sitemap.xml, e i file sitemap_recent.xml e sitemap_1.xml vengono aggiunti automaticamente come risultato della scansione di Google dei contenuti del file sitemap.xml.
Sono sicuro che questo fosse inteso dagli sviluppatori di Discourse, perché il file sitemap.xml NON contiene alcuna informazione su argomenti e categorie, contiene SOLO collegamenti a questi due file, che a loro volta contengono informazioni su argomenti e categorie.
Cioè, in definitiva, la scansione del file sitemap.xml porta Google a importare sitemap_recent.xml e sitemap_1.xml.

Me ne sono accorto. Certo che intendevo sitemap_index.xml. E il suo unico scopo è guidare googlebot verso le sotto-sitemap. Ecco perché non si indica la posizione di sitemap_x.xml (perché ce ne possono essere diverse e non sai mai quante) e sitemap_recent.xml.

Dovresti inviare solo la sitemap indice, nient’altro. In pratica, stai sprecando il tuo tempo cercando di inviare sitemap che Google non ha né bisogno né vuole.

Ancora…
È esattamente quello che faccio. Invio solo sitemap.xml e non sitemap_x.xml e non sitemap_recent.xml, ma questi file appaiono in GSC dopo che ho inviato solo sitemap.xml
E non c’è sitemap_index.xml.

Beh… perché stai chiedendo queste cose se non le stai usando :flushed_face:

Penso che tu non abbia compreso l’essenza di come Google funziona con il file sitemap.xml da Discourse e quindi fai la stessa domanda in un cerchio. Google stesso importa questi file dopo aver scansionato il file sitemap.xml, ma nel mio caso il file sitemap_recent.xml viene importato correttamente, e il file sitemap_x.xml viene importato con un errore.

Lo so bene, ma:

  • quella sitemap “rotta” non è di Google, l’hai inviata anche se non avresti dovuto
  • il cerchio deriva dalla tua domanda; stessa domanda, stessa risposta ogni volta

Comunque. Stai ancora perdendo il tuo tempo.

Te l’ho detto molte volte. NON invio nulla tranne sitemap.xml. Cos’altro posso fare per te, presta attenzione a questo? Devo registrare un video?? O altro?

Penso che solo tu stia sprecando il mio tempo. Meglio non provare ad “aiutarmi” per favore :open_hands:

Ciao,

Puoi eliminare completamente la sitemap e inviarne un’altra?

Ho ricontrollato e ho notato che la sitemap impiega diversi secondi per caricarsi correttamente. Ma penso che questo abbia a che fare con i suoi 6 mila thread.

Ho cercato di aiutare come potevo e penso che per me sia tutto normale. Hai altre sitemap in questo account GSC?

È una proprietà del dominio o un prefisso URL? se è un prefisso URL, prova con una proprietà del dominio.

1 Mi Piace

Ok. Elimino la sitemap:

e ne invio una nuova:

Google dice: tutto a posto

E ora, quando clicco sulla sitemap.xml appena inviata, vedo due nuovi file e c’è ancora un file con errore “Non ricevuto”


Vi ricordo che, allo stesso tempo, un altro motore di ricerca (Yandex) ha accettato la stessa sitemap.xml senza problemi e ha letto il contenuto del file sitemap_1.xml senza problemi.
Quindi… il problema è da qualche parte tra Google e questa sitemap.

Al momento no. In precedenza, in questo account c’era una sitemap creata con vbulletin. E non c’erano problemi. Ma al momento, ho eliminato la vecchia sitemap.

Prima ho provato con l’URL, ma poi ho usato un dominio.

Mi sembra strano. Non vedo alcun problema. Tutto è corretto. Spero che qualcun altro qui ti porti una soluzione. Non riesco più a vedere cosa c’è che non va.

1 Mi Piace