باختصار، من الممكن للبشر تكرار زحف Googlebot إلى Discourse. إليك كيفية البدء…
كن واحدًا مع Googlebot
افتح نافذة متصفح متخفٍ (ابدأ دائمًا من جديد)
افتح DevTools
افتح Network Conditions في DevTools
ألغِ تحديد “استخدام إعدادات المتصفح الافتراضية”
في قائمة التحديد، اختر Googlebot Smartphone
ثم انتقل إلى https://meta.discourse.org (يبدو مختلفًا تمامًا؛ لا تقلق لأن Googlebot الخاص بك والروبوتات لا تهتم)
انتقل إلى View > Developer > View Source
انسخها والصقها في ملف .html
عمل جيد! لقد أنشأت الملف الذي يشير إليه البشر لرؤية ما قام Googlebot بـ زحفه و تخزينه مؤقتًا.
انتهت مهمة Googlebot. حان الوقت الآن لعرض الملف المخزن مؤقتًا في المتصفح.
كن واحدًا مع Chrome
افتح الطرفية وشغّل npx http-server
انتقل إلى الملف
افتح Chrome DevTools
في لوحة Elements، انقر بزر الماوس الأيمن على <html>... وحدد Copy outerHTML.
هذا هو المحتوى الذي سيتم فهرسته، وليس تخزينه مؤقتًا، بل فهرسته.
باختصار، يسترد Googlebot ملف HTML ويعرضه Chrome. ملف HTML المعروض هو الذهب. تأكد من ظهور المحتوى والروابط القيمة الخاصة بك هناك.
يتم عرض HTML المخزن مؤقتًا في Chrome (بدون واجهة رسومية). عند العرض، قد يتم إدخال نصوص وروابط إضافية عبر JavaScript، في نموذج الكائن للمستند (DOM). ستأخذ Google المعلومات التي تعرضها في الاعتبار للفهرسة.
هذه هي الطريقة التي يحصل بها Googlebot على المحتوى من التطبيقات التي تعتمد بشكل كبير على JavaScript. انتقل إلى Google وابحث عن شيء تعرف أنه يعرض المحتوى باستخدام JavaScript فقط > انقر فوق الأيقونة المكونة من 3 نقاط > انقر فوق الزر المخزن مؤقتًا > انقر فوق عرض المصدر > انسخه وقم بعرضه في Chrome لمعرفة المحتوى الذي يظهر في نموذج الكائن للمستند (DOM).
ملاحظة: قم بتحديث أي مسارات نسبية (موارد CSS و JS) إلى مسارات مطلقة قبل عرضها في Chrome ^^
تأكد من تضمين سلسلة وكيل مستخدم Googlebot، على سبيل المثال، Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html). قد يرسل الخادم لـ Googlebot ترميز HTML مختلفًا.
أعتقد أن هذا هو نفس الإخراج، لكن لا يضر إضافة وكيل المستخدم. لست متأكدًا من Chrome، ولكن في Firefox يمكنك النقر بزر الماوس الأيمن على الطلب في علامة التبويب “الشبكة” واختيار “نسخ كـ curl” للحصول على مجموعة كاملة من الرؤوس التي ستحاكي طلب المتصفح.