El archivo XML del mapa del sitio no puede mostrar el tema completo y las publicaciones

La consulta muestra un total de 887.652 registros en discourse.

Cuando veo un archivo XML de sitemap en el navegador, muestra diez archivos. Cada archivo contiene 50.000 registros, pero el conjunto completo de registros no es visible. Puede consultar la captura de pantalla anterior para ver el recuento total de “887.652” registros.

¿Puede proporcionar orientación sobre cómo incluir todos los registros en un archivo XML de sitemap?

Tengo más de 800000 temas en mi sitio web, pero el sitemap solo incluye hasta aproximadamente 500000 registros. ¿Se necesita alguna configuración específica?

He compartido tu publicación en este tema @Ashwani_Kumar ya que hacen una pregunta muy similar y deberías poder beneficiarte de las mismas respuestas. :+1:

2 Me gusta

Los sitemaps XML que Discourse está generando no incluyen todas las publicaciones de mi sitio. Realicé una consulta de publicaciones y veo alrededor de 800 000 publicaciones. Pero los sitemaps XML solo incluyen 347 000. Me faltan alrededor del 55 % de las URL de las publicaciones en el sitemap.

También he movido tu tema, @Marc_S, ya que suena a una pregunta muy similar.

¿Los temas que faltan están en categorías privadas?

2 Me gusta

Además, la consulta en el OP extraería todos los MP y temas eliminados también.

Creo que necesitaría ser más como:

SELECT 
    COUNT(*)
FROM topics t
  JOIN categories c ON c.id = t.category_id
WHERE c.read_restricted IS FALSE 
  AND t.archetype = 'regular'
  AND t.deleted_at IS NULL
4 Me gusta

¡Buen trabajo! Supongo que las publicaciones y los mensajes privados eliminados explican los temas que faltan.

1 me gusta

@JammyDodger
Gracias por proporcionar la consulta anterior. Entonces, ¿eso significa que los temas con el tipo “Mensajes privados” no se incluirían en el sitemap xml?
¿Correcto?

1 me gusta

Es correcto, incluso si estuvieran en el sitemap, Google no podría acceder a ellas.

2 Me gusta

Gracias por la rápida respuesta @RGJ