جوجل Search Console لا يستطيع قراءة خريطة الموقع

تحديث

لقد وجدت نقطة النهاية الصحيحة لخريطة الموقع وهي تتصرف بشكل طبيعي لـ Googlebot:

  • https://forum.pragmaticentrepreneurs.com/sitemap.xml

إنها فهرس خريطة موقع صالح وتشير إلى:

  • https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml
  • https://forum.pragmaticentrepreneurs.com/sitemap_1.xml

ما قمت باختباره

  • وصول Googlebot: تُرجع sitemap.xml و sitemap_recent.xml و sitemap_1.xml جميعها HTTP/2 200 باستخدام وكيل مستخدم Googlebot، والجسم هو XML حقيقي (وليس صفحة تحدي HTML).
  • الرؤوس / نوع المحتوى:
    • sitemap.xml: Content-Type: application/xml; charset=utf-8
    • sitemap_recent.xml + sitemap_1.xml: Content-Type: text/xml; charset=utf-8
    • تتضمن الاستجابات x-discourse-route: sitemap/* و x-discourse-crawler-view: true (يتم تقديمها بواسطة Discourse في وضع الزاحف).
  • IPv4 + IPv6: كلاهما يُرجع 200 على sitemap.xml.
  • الاستقرار: قمت بجلب كل خريطة موقع 20 مرة متتالية باستخدام وكيل مستخدم Googlebot — لا يوجد 403/429/5xx.
    • كانت أوقات الاستجابة النموذجية حوالي 0.17-0.28 ثانية لـ sitemap.xml، وحوالي 0.19-0.60 ثانية لـ sitemap_recent.xml، وفي الغالب حوالي 0.45-0.99 ثانية لـ sitemap_1.xml (استجابة واحدة أبطأ عند حوالي 2.9 ثانية، ولا تزال 200).
  • robots.txt: يتضمن Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xml ولا يحظر /sitemap*.xml.

حالة Search Console

في Google Search Console، تظهر معالجة فهرس خريطة الموقع على أنها ناجحة، ولكن فقط https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml مُدرجة/معترف بها حاليًا ضمن “خرائط المواقع التي تمت قراءتها”. لا يزال sitemap_1.xml غير مُدرج هناك.

الوضع الحالي للأمور

من جانب الخادم يبدو كل شيء على ما يرام، لذلك يبدو هذا وكأنه تأخير أو معالجة جزئية من جانب Search Console: يقرأ Google الفهرس وخريطة موقع فرعية واحدة على الأقل، ولكنه لم يعرض الثانية بعد في واجهة المستخدم.