تحديث
لقد وجدت نقطة النهاية الصحيحة لخريطة الموقع وهي تتصرف بشكل طبيعي لـ Googlebot:
https://forum.pragmaticentrepreneurs.com/sitemap.xml
إنها فهرس خريطة موقع صالح وتشير إلى:
https://forum.pragmaticentrepreneurs.com/sitemap_recent.xmlhttps://forum.pragmaticentrepreneurs.com/sitemap_1.xml
ما قمت باختباره
- وصول Googlebot: تُرجع
sitemap.xmlوsitemap_recent.xmlوsitemap_1.xmlجميعها HTTP/2 200 باستخدام وكيل مستخدم Googlebot، والجسم هو XML حقيقي (وليس صفحة تحدي HTML). - الرؤوس / نوع المحتوى:
sitemap.xml:Content-Type: application/xml; charset=utf-8sitemap_recent.xml+sitemap_1.xml:Content-Type: text/xml; charset=utf-8- تتضمن الاستجابات
x-discourse-route: sitemap/*وx-discourse-crawler-view: true(يتم تقديمها بواسطة Discourse في وضع الزاحف).
- IPv4 + IPv6: كلاهما يُرجع 200 على
sitemap.xml. - الاستقرار: قمت بجلب كل خريطة موقع 20 مرة متتالية باستخدام وكيل مستخدم Googlebot — لا يوجد 403/429/5xx.
- كانت أوقات الاستجابة النموذجية حوالي 0.17-0.28 ثانية لـ
sitemap.xml، وحوالي 0.19-0.60 ثانية لـsitemap_recent.xml، وفي الغالب حوالي 0.45-0.99 ثانية لـsitemap_1.xml(استجابة واحدة أبطأ عند حوالي 2.9 ثانية، ولا تزال 200).
- كانت أوقات الاستجابة النموذجية حوالي 0.17-0.28 ثانية لـ
- robots.txt: يتضمن
Sitemap: https://forum.pragmaticentrepreneurs.com/sitemap.xmlولا يحظر/sitemap*.xml.
حالة Search Console
في Google Search Console، تظهر معالجة فهرس خريطة الموقع على أنها ناجحة، ولكن فقط https://forum.pragmaticentrepreneurs.com/sitemap_recent.xml مُدرجة/معترف بها حاليًا ضمن “خرائط المواقع التي تمت قراءتها”. لا يزال sitemap_1.xml غير مُدرج هناك.
الوضع الحالي للأمور
من جانب الخادم يبدو كل شيء على ما يرام، لذلك يبدو هذا وكأنه تأخير أو معالجة جزئية من جانب Search Console: يقرأ Google الفهرس وخريطة موقع فرعية واحدة على الأقل، ولكنه لم يعرض الثانية بعد في واجهة المستخدم.
