XML-карта сайта не отображает полные темы и сообщения

Запрос отображает в общей сложности 887 652 записи в Discourse.

При просмотре XML-файла карты сайта в браузере отображается десять файлов. Каждый файл содержит 50 000 записей, но полный набор записей не виден. Вы можете обратиться к предыдущему скриншоту для получения общего количества записей — «887 652».

Можете ли вы дать рекомендации о том, как включить все записи в XML-файл карты сайта?

У меня на сайте более 800 000 тем, но карта сайта включает только примерно 500 000 записей. Требуется ли какая-то специальная конфигурация?

Я перенёс ваш пост в эту тему @Ashwani_Kumar, так как здесь задают очень похожий вопрос, и вы тоже сможете воспользоваться теми же ответами. :+1:

XML-карты сайта, которые генерирует Discourse, не включают все публикации на моём сайте. Я выполнил запрос на получение публикаций и обнаружил около 800 тысяч записей. Однако в XML-картах сайта указано только 347 тысяч. В карте сайта отсутствует примерно 55% ссылок на публикации.

Я также переместил вашу тему, @Marc_S, так как звучит это как очень похожий вопрос.

Отсутствующие темы находятся в закрытых категориях?

Кроме того, запрос из исходного сообщения извлекал бы все личные сообщения и удалённые темы.

По-моему, он должен выглядеть примерно так:

SELECT 
    COUNT(*)
FROM topics t
  JOIN categories c ON c.id = t.category_id
WHERE c.read_restricted IS FALSE 
  AND t.archetype = 'regular'
  AND t.deleted_at IS NULL

Отличная работа! Я уверен, что удалённые сообщения и личные сообщения объясняют отсутствие тем.

@JammyDodger
Спасибо за предоставленный выше запрос. То есть темы с типом «Личные сообщения» не будут включены в sitemap.xml?
Верно?

Это верно: даже если они есть в карте сайта, Google не сможет получить к ним доступ.

Спасибо за быстрый ответ @RGJ