Как правильно использовать карту сайта?

Здравствуйте. Не могли бы вы прояснить для меня, как правильно использовать карту сайта в Discourse?

В настройках Discourse я включил карту сайта:

Вот содержимое моего файла карты сайта:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://*******/sitemap_recent.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
<sitemap>
<loc>https://******/sitemap_1.xml</loc>
<lastmod>2024-08-13T00:43:48Z</lastmod>
</sitemap>
</sitemapindex>

Я добавил эту карту сайта в GSC, и похоже, что файл был успешно импортирован, но он всегда показывает только одну найденную страницу:

Если я пытаюсь добавить в GSC файл sitemap_1.xml, который фактически содержит все (или многие) мои страницы, GSC не импортирует его и выдает ошибку.

Так что… какой правильный способ помочь GSC проиндексировать мой сайт? Или мне не нужно ничего делать, и Google импортирует карту сайта при сканировании файла robots.txt, и дальше мне останется только ждать?

Привет, какой URL вы указываете в GSC? yourdomain/sitemap.xml?

Спасибо! Да, я так думаю ))
Я заполнил форму в GSC вот так:


и, думаю, это означает, что доменное имя было включено.
Таким же образом я попытался добавить sitemap_1.xml:

но это не сработало.

Try with httpS

https://wedframe.ru/sitemap.xml

Спасибо ещё раз, Дэвид! Я не знал, что в GSC нужно добавлять отдельные версии http и https. Я добавил этот домен в GSC много лет назад, когда сертификаты практически нигде не использовались. Видимо, по этой причине невозможно было использовать https-адрес в форме добавления карты сайта. Но это не проблема. Сейчас я снова добавил свой ресурс, и теперь я могу использовать https в этой форме.

Однако на данный момент это тоже не решает проблему. Когда я открываю данные обработки этого файла, я вижу два других файла карты сайта. А тот, который содержит все темы и категории, по-прежнему не импортируется из-за ошибки:

Может ли проблема быть в этом файле? Возможно, названия тем/категорий содержат какие-то несовместимые символы, нарушающие синтаксис XML? Я проверил это в Notepad++, и XML выглядит корректно.

Подождите немного. Оно само урегулируется. Со мной такое иногда случается. Проверьте через полчаса.

Я только что проверил ваш sitemap_1.xml. На мой взгляд, всё в порядке.

Не следует использовать sitemap_1.xml, так как невозможно заранее знать, сколько подкарт сайта у вас будет. Используйте обычную карту сайта.

Да. На данный момент я добавляю только файл sitemap.xml. Файлы sitemap_1.xml и sitemap_recent.xml появляются в GSC самостоятельно, как я понимаю, после сканирования содержимого файла sitemap.xml Google.

Похоже, что-то пошло не так между sitemap_1.xml и GSC. На данный момент (спустя почти два дня) этот файл всё ещё содержит ошибку, в то время как Яндекс импортирует его без каких-либо проблем.

Файл sitemap.xml успешно импортирован

Также успешно импортирован sitemap_recent.xml, но sitemap_1.xml имеет статус «Не получен»

Затем я проверил этот файл в инструменте проверки URL — всё выглядит в порядке:

Магия…

Я всё ещё не могу понять, почему вы отправляете _1 и recent, когда следует использовать только sitemap.xml.

Просто посмотрите на содержимое файла sitemap.xml, и всё станет понятно.
Я отправляю ТОЛЬКО sitemap.xml, а файлы sitemap_recent.xml и sitemap_1.xml добавляются автоматически в результате сканирования содержимого файла sitemap.xml поисковой системой Google.
Я уверен, что это задумано разработчиками Discourse, поскольку файл sitemap.xml НЕ содержит никакой информации о темах и категориях; он ТОЛЬКО содержит ссылки на эти два файла, которые, в свою очередь, содержат информацию о темах и категориях.
То есть в итоге сканирование файла sitemap.xml приводит к тому, что Google импортирует sitemap_recent.xml и sitemap_1.xml.

Моя ошибка. Конечно, я имел в виду sitemap_index.xml. И его единственная цель — направлять googlebot к под-картам сайта. Вот почему вы не указываете расположение sitemap_x.xml (потому что их может быть несколько, и вы никогда не знаете, сколько именно) и sitemap_recent.xml.

Вы должны отправлять только индексную карту сайта, ничего больше. По сути, вы тратите время, пытаясь отправить карты сайта, которые Google не нуждается и не хочет.

Опять же…
Именно это я и делаю. Я отправляю только sitemap.xml и не sitemap_x.xml и не sitemap_recent.xml, но эти файлы появляются в GSC после того, как я отправляю только sitemap.xml.
При этом файла sitemap_index.xml нет.

Ну… зачем вы спрашиваете об этом, если вы их не используете? :flushed_face:

Я думаю, вы не поняли суть того, как Google работает с файлом sitemap.xml от Discourse, и поэтому задаете один и тот же вопрос по кругу. Сам Google импортирует эти файлы после сканирования файла sitemap.xml, но в моем случае файл sitemap_recent.xml импортируется успешно, а файл sitemap_x.xml импортируется с ошибкой.

Я прекрасно понимаю, но:

  • эта «сломанная» карта сайта — не от Google, вы её отправили, хотя не должны были
  • круг появился из вашего вопроса; один и тот же вопрос — один и тот же ответ каждый раз

В любом случае. Вы всё равно тратите своё время впустую.

Я уже много раз говорил вам. Я НЕ отправляю ничего, кроме sitemap.xml. Что ещё я могу сделать, чтобы вы обратили на это внимание? Мне нужно записать видео? Или что-то ещё?

Кажется, тратите моё время только вы. Лучше не пытайтесь мне «помогать», пожалуйста :open_hands:

Привет,

Можешь полностью удалить карту сайта и отправить её снова?

Я ещё раз проверил и заметил, что загрузка карты сайта занимает несколько секунд. Но, думаю, это связано с её 6 тысячами записей.

Я постарался помочь, насколько мог, и мне всё кажется нормальным. Есть ли у тебя другие карты сайта в этом аккаунте GSC?

Это свойство домена или префикс URL? Если это префикс URL, попробуй использовать свойство домена.

Хорошо. Я удалил карту сайта:

и отправил её ещё раз:

Google говорит, что всё в порядке:

А теперь, когда я кликаю на эту вновь отправленную карту сайта sitemap.xml, я вижу два новых файла, и при этом всё ещё есть один файл с ошибкой «Не получено»:


Напомню, что в то же время другой поисковый движок (Яндекс) принял ту же карту сайта sitemap.xml без каких-либо проблем, а затем без проблем прочитал содержимое файла sitemap_1.xml.
Так что… проблема где-то между Google и этой картой сайта.

На данный момент нет. Ранее в этом аккаунте была карта сайта, созданная в vbulletin. С ней не было никаких проблем. Но сейчас я удалил старую карту сайта.

Сначала я пробовал с URL, но затем использовал домен.

Мне это кажется странным. Я не вижу никаких проблем. Всё верно. Надеюсь, кто-то другой здесь предложит вам решение. Я больше не могу понять, в чём ошибка.