При просмотре XML-файла карты сайта в браузере отображается десять файлов. Каждый файл содержит 50 000 записей, но полный набор записей не виден. Вы можете обратиться к предыдущему скриншоту для получения общего количества записей — «887 652».
XML-карты сайта, которые генерирует Discourse, не включают все публикации на моём сайте. Я выполнил запрос на получение публикаций и обнаружил около 800 тысяч записей. Однако в XML-картах сайта указано только 347 тысяч. В карте сайта отсутствует примерно 55% ссылок на публикации.
Кроме того, запрос из исходного сообщения извлекал бы все личные сообщения и удалённые темы.
По-моему, он должен выглядеть примерно так:
SELECT
COUNT(*)
FROM topics t
JOIN categories c ON c.id = t.category_id
WHERE c.read_restricted IS FALSE
AND t.archetype = 'regular'
AND t.deleted_at IS NULL