تم ربط لوحتي بموقعي منذ بضعة أسابيع وقمت بتقديم الرابط إلى Google. لقد تلقيت تحذيرًا بشأن عدم الفهرسة، لكنه يبدو مخصصًا لصفحات الملفات الشخصية، وهو أمر جيد.
ومع ذلك، لم يظهر أي شيء في Google حتى الآن، هل هناك أي شيء عليّ فعله من جانب اللوحة، أم أن الأمر يتعلق فقط بانتظار قيام Google بفهرستها الآن؟
إن Googlebot مزعج إلى حد ما. لا يمكنك إخباره في ملف robots.txt بعدم فهرسة شيء معين. نحن نعمل على إصلاح لتهدئة Googlebot، لكن سيستغرق الأمر بعض الوقت لانتشار الإصلاح.
نخبر Googlebot في ملف robots.txt … “مرحبًا … لا تذهب لفهرسة جميع صفحات .rss على الموقع”
يجد Googlebot رابطًا في مكان ما لملف .rss على الموقع
ثم يشتكي Googlebot إلى مشغلي الموقع من وجود ملف .rss على الموقع، لكنه لا يستطيع معرفة ما يجب فعله بالرابط لأنه غير مسموح له بفهرسته. وأحيانًا يتضمن حتى هذا المحتوى في نتائج البحث.
ثم يشتكي مشغلو الموقع في قسم الميتا
إصلاحنا العام هنا هو ببساطة السماح لـ Googlebot بزيارة كل صفحة على الموقع واستخدام الإشارات المرجعية وتلميحات الفهرسة في رؤوس HTTP لتوجيهه إلى نقطة النجاح.
أعمل مع @jomaxro على هذا الأمر، وقد أحرزنا بالفعل بعض التقدم الجيد.
شكرًا لك على التحديث يا سام، كل هذا منطقي وأشعر بما تمر به. لست خبيرًا في تحسين محركات البحث، لكنني كنت أدير مواقع ويب أكبر وعملت مع فرق تحسين محركات البحث، وفي المنتديات كانت الأمور غالبًا شائكة للغاية!
يمكن أن تظل الصفحة المحظورة بواسطة robots.txt مفهرسة إذا كانت مرتبطة من مواقع أخرى
في حين أن جوجل لن تقوم بجمع أو فهرسة المحتوى المحظور بواسطة ملف robots.txt، فقد نجد ونفهرس عنوان URL غير مسموح به إذا كان مرتبطًا من أماكن أخرى على الويب. ونتيجة لذلك، قد يظهر عنوان URL ومعلومات عامة أخرى متاحة علنًا، مثل نص الرابط في الروابط المؤدية إلى الصفحة، في نتائج بحث جوجل. لمنع ظهور عنوان URL الخاص بك في نتائج بحث جوجل بشكل صحيح، يجب عليك حماية الملفات على خادمك بكلمة مرور أو استخدام وسم meta noindex أو رأس الاستجابة (أو إزالة الصفحة بالكامل).
لقد قمنا منذ فترة طويلة بتضمين الصفحات التي لا نرغب في فهرستها في ملف robots.txt الافتراضي الذي يحتويه كل موقع Discourse. كان هذا يعمل بشكل جيد سابقًا. في وقت غير معروف في الماضي، لم يعد هذا كافيًا، حيث قررت جوجل فهرسة الصفحات المرتبطة من أماكن أخرى حتى لو كانت ممنوعة عبر ملف robots.txt.
مهم! لكي يكون توجيه noindex فعالاً، يجب ألا تكون الصفحة محظورة بواسطة ملف robots.txt. إذا كانت الصفحة محظورة بواسطة ملف robots.txt، فلن يرى الزاحف توجيه noindex أبدًا، وقد تظهر الصفحة في نتائج البحث، على سبيل المثال إذا كانت هناك صفحات أخرى تربط بها.
وهو ما يقودنا إلى اليوم. نحن نختبر إزالة صفحات معينة من ملف robots.txt. يجب أن نكون حذرين، حيث نقوم بإجراء جميع هذه التغييرات بناءً على توثيق جوجل، لذا نعلم أننا على ما يرام مع Googlebot، لكننا بحاجة أيضًا إلى التحقق من الزواحف الرئيسية الأخرى للتأكد من أننا لا نتسبب في مشاكل هناك.
مرحبًا جيف، كل هذا منطقي بالنسبة لي وأفهمه. كنت أرغب فقط في التأكد من أنني لم أقم بأي شيء لإخفاء صفحات الموضوعات من إعداداتي في Google. تظهر الصفحة الرئيسية والفئات الرئيسية في Google، لكن لا تظهر أي من صفحات الموضوعات، وقد مرّ بضعة أشهر الآن. هذا موقعي: https://community.jackwallington.com/
أعتقد أننا قمنا بإجراء جميع التعديلات من جانبنا للتكيف مع تغييرات سلوك جوجل الأخيرة.. ربما يمكن لـ @jomaxro التأكيد؟ ستحتاج إلى استخدام أحدث إصدار من Discourse.
ما لم تكن قد قمت بتثبيت إضافة لإضافة ذلك، فلا أستطيع التفكير في طريقة لإضافة مثل هذا الرأس. لا تتجاهل جوجل رأس noindex. تتجاهل جوجل ملف robots.txt عندما تشير مواقع أخرى إلى صفحتك. تحترم جوجل ذلك عند الزحف، ولهذا السبب تزيل الإضافة المذكورة أعلاه إدخالات ملف robots.txt لصالح رؤوس noindex المضافة سابقًا.
أقترح عليك التسجيل في Google Search Console حتى تتمكن من رؤية ما تراه جوجل بنفسك. ربما هناك مشكلة أخرى تمنع رؤية المواضيع.
شكرًا لك يا جوشوا، يبدو أن Google Search Console سعيدة وتقول إن جميع المواضيع مدرجة. من الغريب جدًا أنه عند البحث عنها، لا تظهر صفحات المواضيع، بينما تظهر الصفحة الرئيسية وصفحات التصنيفات.