¿Cómo usar correctamente el sitemap?

Hola. ¿Alguien puede aclararme cómo usar el sitemap de Discourse de la manera correcta?
En la configuración de Discourse habilité el sitemap:

Este es el contenido de mi archivo sitemap:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://*******/sitemap_recent.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
<sitemap>
<loc>https://******/sitemap_1.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
</sitemapindex>

Agregué este sitemap a GSC y parece que este archivo se importó correctamente, pero siempre muestra solo una página encontrada:

Si intento agregar a GSC el archivo sitemap_1.xml, que en realidad contiene todas (o muchas) de mis páginas, GSC no lo importa con un error.

Entonces… ¿cuál es la forma correcta de ayudar a GSC a indexar mi sitio? ¿O no necesito hacer nada y Google importa el sitemap al escanear el archivo robot.txt y más adelante solo tendré que esperar?

Oye, ¿qué URL estás poniendo en GSC? ¿tudominio/sitemap.xml?

[quote=“David_Ghost, post:2, topic:321496”]¿nyourdomain/sitemap.xml?
[/quote]
¡Gracias! Sí, supongo ))
Rellené el formulario en GSC, así:


y creo que eso significa que se incluyó el nombre de dominio.
De la misma manera, intento agregar sitemap_1.xml:

y no funcionó.

Prueba con httpS

https://wedframe.ru/sitemap.xml

2 Me gusta

¡Gracias de nuevo, David! No sabía que en GSC era necesario añadir http y https por separado. Añadí este dominio a GSC hace muchos años, cuando los certificados prácticamente no se usaban en ningún sitio. Al parecer, por esta razón era imposible utilizar la dirección httpS en el formulario de adición del sitemap. Pero eso no es un problema. Ahora he añadido mi recurso de nuevo y ahora puedo usar httpS en este formulario.

Sin embargo, en este momento, esto tampoco resuelve el problema. Cuando abro los datos de procesamiento de este archivo, veo otros dos archivos sitemap. Y el que contiene todos los temas y categorías todavía no se importa debido a un error:

¿Podría haber un problema en este archivo? ¿Quizás los nombres de los temas/categorías puedan contener algunos símbolos incompatibles que violen la sintaxis xml? Lo he comprobado en Notepad++ y parece que el xml es correcto.

Espera un momento. Se resolverá solo. A mí me pasa a veces. Vuelve a comprobarlo en media hora.

Acabo de revisar tu sitemap_1.xml. A mí me parece bien.

2 Me gusta

No deberías usar sitemap_1.xml porque nunca sabes cuántos sub-mapas de sitio obtendrás. Usa solo un mapa de sitio normal.

2 Me gusta

Sí. En este momento solo agrego el archivo sitemap.xml. Los archivos sitemap_1.xml y sitemap_recent.xml aparecen en GSC por sí solos, según entiendo, después de que Google escanea el contenido del archivo sitemap.xml.

Parece que algo salió mal entre sitemap_1.xml y GSC. En este momento (después de casi dos días), este archivo todavía tiene un error y, al mismo tiempo, Yandex importa este archivo sin ningún problema.

sitemap.xml importado correctamente

también siguió sitemap_recent.xml correctamente, pero sitemap_1.xml está “No recibido”

Luego, reviso este archivo en la validación de URL y parece que todo está bien:

magia…

Todavía no entiendo por qué envías _1 y recent cuando solo deberías usar sitemap.xml.

Solo mira el contenido del archivo sitemap.xml y lo entenderás.
Envío SOLAMENTE sitemap.xml, y los archivos sitemap_recent.xml y sitemap_1.xml se añaden automáticamente como resultado de que Google escanee el contenido del archivo sitemap.xml.
Estoy seguro de que esto fue intencionado por los desarrolladores de Discourse, porque el archivo sitemap.xml NO contiene ninguna información sobre temas y categorías, SÓLO contiene enlaces a estos dos archivos, que a su vez contienen información sobre temas y categorías.
Es decir, en última instancia, el escaneo del archivo sitemap.xml lleva a que Google importe sitemap_recent.xml y sitemap_1.xml.

Lo siento. Por supuesto que me refería a sitemap_index.xml. Y su único propósito es guiar a Googlebot a los sub-sitemaps. Por eso no se indica la ubicación de sitemap_x.xml (porque puede haber varios y nunca se sabe cuántos) y sitemap_recent.xml.

Se supone que solo debes enviar el sitemap índice, nada más. Básicamente, estás perdiendo el tiempo intentando enviar sitemaps que Google no necesita ni quiere.

Otra vez…
Eso es exactamente lo que hago. Envío solo sitemap.xml y no sitemap_x.xml y no sitemap_recent.xml, pero estos archivos aparecen en GSC después de que envío solo sitemap.xml.
Y no hay sitemap_index.xml.

Bueno… ¿por qué preguntas esto si no los estás usando? :flushed_face:

Creo que no entendiste la esencia de cómo Google trabaja con el archivo sitemap.xml de Discourse y por eso haces la misma pregunta en círculo. Google mismo importa estos archivos después de escanear el archivo sitemap.xml, pero en mi caso el archivo sitemap_recent.xml se importa correctamente y el archivo sitemap_x.xml se importa con un error.

Lo sé muy bien, pero:

  • ese sitemap “roto” no es de Google, lo has enviado aunque no deberías
  • el círculo proviene de tu pregunta; misma pregunta, misma respuesta cada vez

Lo que sea. Sigues perdiendo tu tiempo.

Te lo he dicho muchas veces. NO envío nada más que sitemap.xml. ¿Qué más puedo hacer por ti, presta atención a esto? ¿Necesito grabar un video? ¿O qué?

Creo que eres tú quien me hace perder el tiempo. Mejor no intentes “ayudarme” por favor :open_hands:

Hola,

¿Puedes eliminar el sitemap por completo y reenviar uno más?

Lo revisé una vez más y noté que el sitemap tarda varios segundos en cargarse correctamente. Pero creo que eso tiene que ver con sus 6 mil hilos.

Intenté ayudar en lo que pude y creo que todo parece normal para mí. ¿Tienes otros sitemaps en esta cuenta de GSC?

¿Es una propiedad de dominio o un prefijo de URL? Si es un prefijo de URL, intenta con una propiedad de dominio.

1 me gusta

Ok. Elimino el sitemap:

y lo envío una vez más:

Google dice: todo está bien

Y ahora, cuando hago clic en este sitemap.xml recién enviado, veo dos archivos nuevos y todavía hay un archivo con el error “No recibido”.


Les recuerdo que al mismo tiempo, otro motor de búsqueda (yandex) aceptó el mismo sitemap.xml sin ningún problema y luego leyó el contenido del archivo sitemap_1.xml sin ningún problema.
Entonces… el problema está en algún lugar entre Google y este sitemap.

En este momento no. Anteriormente, en esta cuenta había un sitemap creado en vbulletin. Y no hubo problemas con él. Pero en este momento, eliminé el sitemap antiguo.

Primero intenté con URL, pero luego usé un dominio.

Esto me suena extraño. No veo ningún problema. Todo está correcto. Espero que alguien más aquí te traiga una solución. Ya no veo qué está mal.

1 me gusta