Google Search Console не может прочитать карту сайта

Привет!

Похоже, что Google Search Console не может прочитать одну из карт сайта. Основная карта sitemap.xml (https://forum.pragmaticentrepreneurs.com/sitemap.xml) считывается корректно, но импортируется только sitemap_recent.xml.

Если я пытаюсь добавить sitemap_1.xml в Google Search Console вручную, получаю ошибку. При проверке валидатором всё выглядит хорошо.

У вас есть какие-либо идеи, почему GSC не может прочитать sitemap_1.xml?

Спасибо за помощь.

РЕДАКТИРОВАНИЕ:
Bing корректно читает обе карты сайта, поэтому проблема, похоже, специфична для Google.

Кроме того, при проверке sitemap_1.xml всё в порядке.

Похоже, у вас была такая же проблема в прошлом году: Troubleshooting sitemap indexing issues in Google Search Console.

В итоге всё заработало?

Только что увидел, что я уже задавал вопрос по этому поводу :slight_smile: Но нет, решение так и не нашёл.

Дайте знать, если смогу предоставить дополнительную информацию для помощи.

Я тоже не знаю.

URL-адрес для меня доступен. Я пробовал различные инструменты для проверки XML — проблем не обнаружено. Согласно Sitemaps report - Search Console Help, под ошибкой должна отображаться подробная страница с объяснением, в чём дело (хотя у вас, похоже, этого нет).

В любом случае, настоятельно рекомендую прочитать эту статью. Возможно, вы найдёте там подсказку.

Действительно, у меня нет подробностей об ошибке. Я попытался проверить URL, как они и говорили, но ошибки здесь нет :frowning:

Дайте знать, если я могу что-то еще сделать, чтобы помочь.

Обновление

Я нашел правильный endpoint карты сайта, и он работает нормально для Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

Это валидный индекс карты сайта, который ссылается на:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

Что я проверил

  • Доступ Googlebot: sitemap.xml, sitemap_recent.xml и sitemap_1.xml возвращают HTTP/2 200 с user-agent Googlebot, а тело ответа — это реальный XML (а не HTML-страница с вызовом проверки).
  • Заголовки / тип содержимого:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • В ответах присутствуют заголовки x-discourse-route: sitemap/* и x-discourse-crawler-view: true (отправлены Discourse в режиме краулинга).
  • IPv4 + IPv6: оба протокола возвращают 200 для sitemap.xml.
  • Стабильность: я запрашивал каждую карту сайта 20 раз подряд с user-agent Googlebot — ошибок 403/429/5xx не было.
    • Типичное время ответа составляло ~0,17–0,28 с для sitemap.xml, ~0,19–0,60 с для sitemap_recent.xml и в основном ~0,45–0,99 с для sitemap_1.xml (один медленный ответ ~2,9 с, но статус всё равно 200).
  • robots.txt: содержит запись Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml и не блокирует /sitemap*.xml.

Статус в Search Console

В Google Search Console обработка индекса карты сайта отображается как успешная, но в разделе «Прочитанные карты сайта» в настоящее время указан только
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml.
sitemap_1.xml там всё ещё не отображается.

Текущая ситуация

С точки зрения сервера всё выглядит нормально, поэтому это похоже на задержку или частичную обработку на стороне Search Console: Google читает индекс и как минимум одну дочернюю карту сайта, но пока не отобразил вторую в интерфейсе.