فهرسة بحث Google والنقاش

مرحبًا بالجميع!

قرأت المنشورات المختلفة حول عدم وجود صعوبات لدى عناكب بحث Google في فهرسة منتديات Discourse. لكن سؤالي مختلف قليلاً. هل يعتبر كل موضوع “صفحة” قابلة للفهرسة من قبل Google؟ والسبب في سؤالي هو أن جزءًا كبيرًا من المواضيع في منتدانا غير موجود في قاعدة بيانات Google. وقد تأكدنا من ذلك بمراجعة بيانات Google Search Console:

فلا توجد سوى حوالي 17 ألف مدخلة، بينما يحتوي المنتدى على مئات الآلاف من المواضيع (وربما الملايين؟). أما أخطاء ملف robots.txt فهي تتعلق بصفحات لا ينبغي فهرستها بشكل شرعي. ويبدو أن العنكبوت لا يزور تلقائيًا جميع المواضيع القديمة كما ينبغي.

هل هناك إعداد يجب تفعيله لضمان فهرسة المزيد من المواضيع القديمة في الوقت المناسب؟ فبالنسبة للعناصر الظاهرة في الجزء العلوي من الصفحة، فإن الفهرسة ونتائج البحث من Google ممتازة. والمشكلة تؤثر فقط على المواضيع التي تقع في الأجزاء السفلية من الصفحة.

شكرًا لكم،
كيروبا

لأغراض تجربة، قمت بتحميل ميتا باستخدام عرض الزحف مع سلسلة وكيل المستخدم GoogleBot. ثم انتقلت إلى الصفحة 666 من قائمتنا الأحدث، وهي مواضيع تم رفعها آخر مرة في منتصف عام 2017، أي منذ ما يقرب من 3 سنوات.

إحدى المواضيع في القائمة هي التكامل العميق لـ Discourse داخل تطبيق Ionic. ذهبت إلى بحث جوجل بدون تسجيل دخول، وبحثت عن “integration discourse ionic” فظهرت النتيجة الأولى!!

ميتا هي مثيلة “صغيرة” تحتوي على أقل من 30 ألف موضوع، لكن يبدو أن جميعها مفهرسة بشكل صحيح. وبما أنها نطاق قديم ونحن النتيجة الأولى في كل ما يتعلق بـ Discourse، فإننا نحصل على ما يكفي من “الكارما” لدى GoogleBot، مما يسمح له بالعمل على نطاقنا لفترة كافية لزرع كل ما هو مطلوب.

هل تم نقل منتداك من برنامج قديم إلى Discourse؟

إذا كنت بحاجة إلى تسريع الفهرسة، يمكنك تجربة إضافة خريطة الموقع.

ستلتقط عملية الزحف العادية كل شيء، لكن خريطة الموقع قد تجعل المحتوى يُفهرس بشكل أسرع.

يرجى نشر النتائج إذا قمت بذلك.

أيضًا، هل يمكنك نشر 5 أمثلة على محتوى فريد ومميز موجود في منتداك وغير موجود تمامًا على جوجل؟

ربما ينظر جوجل أيضًا إلى نشاط الموضوع (إذا كان هناك عداد) أو أن الموضوع يحتوي على روابط توجد بها انتقالات نشطة. قد لا يزور جوجل بعض الصفحات التي يعتبرها

@فالكو - نعم، انتقلت المنتديات من vBulletin، لكن ذلك كان في أواخر عام 2014. لقد أزلت أي روابط عامة للمنتديات القديمة، لذا لا يوجد خطر من تكرار المحتوى مما يؤثر سلبًا على فهرسة محركات البحث.

@سام - نعم، إليك بعض الأمثلة:

كل هذه المنشورات كانت قد نُشرت من قِبلي على تويتر أو صفحة فيسبوك عامة في السنوات الثلاث الماضية، لذا فهي ليست موضوعات مدفونة ومخفية إلى الأبد.

بشأن إضافة خريطة الموقع، دعني أجرب ذلك. سأشارك أي بيانات أستطيع العثور عليها. شكرًا لكم جميعًا على وقتكم ومساعدتكم :slight_smile:

تحياتي،
كيروبا

هذا هو ناتجي الثالث عن “js using generators animate example”.

قد يكون هذا مثالاً سيئًا لنشره اليوم، حيث قمت بتقديمه يدويًا للفهرسة قبل بضع ساعات كاختبار. هذا ما رآه أحد مشرفي منتداي سابقًا لهذا مصطلح البحث قبل 7 ساعات:

أنت محق في أنه أحد النتائج الرئيسية حاليًا. أتساءل ما إذا كان للفهرسة اليدوية علاقة بذلك.

تعديل: لقد قمت للتو بإعداد إضافة خريطة الموقع وسأقدم خريطة الموقع إلى جوجل للفهرسة!

مرحبًا @kirupa،

تنبيهًا: عندما تقوم جوجل بفهرسة موقعين في نفس النطاق، مثل المثال الخاص بك kirupa.com مع محتوى مشابه، فإن ما يحدث عادةً ليس “عقوبة” بالمعنى الحرفي، بل هو أكثر من “اختيار للصفحة الأساسية” (canonical selection)، حيث تختار خوارزمية جوجل إحدى الصفحات كصفحة أساسية (canonical) وتحتل هذه الصفحة ترتيبًا أعلى في نتائج البحث. (قد تقوم جوجل حتى بإسقاط الصفحة التي تقرر أنها ليست أساسية من الفهرس).

توضح جوجل بوضوح أن فكرة “عقوبة المحتوى المكرر” هي في الغالب أسطورة. الأمر يتعلق حقًا بـ “التعيين الأساسي” (canonicalization) و"الاختيار":

إذا كان موقعك يحتوي على صفحات متعددة ذات محتوى متطابق إلى حد كبير، فهناك عدة طرق يمكنك من خلالها الإشارة إلى عنوان URL المفضل لديك لجوجل. (يُعرف هذا بـ “التعيين الأساسي”.) مزيد من المعلومات حول التعيين الأساسي. (المرجع 1)

على سبيل المثال، إذا أبقيت موقعك القديم نشطًا إلى جانب موقعك الجديد، فيمكنك استخدام وسم link canonical لإخبار جوجل بأن موقعك الجديد هو الموقع الأساسي، وعندها سيعطي جوجل الأولوية لموقعك الجديد.

الحل الأفضل هو السماح لمحركات البحث بالزحف إلى هذه عناوين URL، ولكن الإشارة إليها كمحتوى مكرر باستخدام عنصر الرابط rel="canonical"، أو أداة معالجة معلمات عنوان URL، أو إعادة التوجيه 301. في الحالات التي يؤدي فيها المحتوى المكرر إلى زحف جوجل لجزء كبير جدًا من موقعك، يمكنك أيضًا تعديل إعداد معدل الزحف في وحدة تحكم البحث. (المرجع 1)

مثال:

<link rel="canonical" href="https://forum.kirupa.com/t/js-tip-of-the-day-using-generators-to-animate/643058" />

@kirupa، سألت أيضًا:

هل يعتبر كل موضوع “صفحة” قابلة للفهرسة من قبل جوجل؟ والسبب في سؤالي هو أن جزءًا كبيرًا من المواضيع في منتدانا غير موجود في قاعدة بيانات جوجل.

لنقاش رائع (لكنه قديم بعض الشيء) حول جوجل والتمرير اللانهائي، أنصحك بمراجعة مدونة مركز ويبماستر الرسمي لجوجل، (المرجع 2):

https://webmasters.googleblog.com/2014/02/infinite-scroll-search-friendly.html

@kirupa، إحدى الطرق للتحقق (عمليًا وليس نظريًا) هي استخدام وحدة تحكم البحث (GSC) والنظر في “لقطة الشاشة” التي تظهر كيف تمثل جوجل صفحتك. يمكن القيام بذلك بسهولة باستخدام وظيفة “التحقق من توافق الجوال” في وحدة تحكم البحث؛ وإذا كان لديك منشور طويل جدًا في Discourse، فيمكنك التحقق لمعرفة مقدار الصفحة الذي تقوم جوجل بفهرسته (قراءته وفهرسته). هناك العديد من الآراء حول التمرير اللانهائي وكيف تقوم جوجل بفهرسة هذه الصفحات. يمكنك استخدام وحدة تحكم البحث للتحقق من صفحاتك ورؤية ذلك بنفسك.

وفقًا لما ذكره مارتن سبليت من جوجل (انظر المرجع 3) في 14 أبريل 2020:

قدم سبليت مثالًا على موقع إخباري يعتمد على التمرير اللانهائي (المعروف أيضًا بـ “التحميل الكسول”) لتحميل محتوى جديد.

هذا يعني أن صفحة الويب، في هذه الحالة الصفحة الرئيسية، لا تقوم بتحميل محتوى إضافي إلا عندما يقوم الزائر بالتمرير إلى أسفل الشاشة.

يشرح سبليت سبب كون ذلك مشكلة: “ما الذي لا يفعله Googlebot؟ إنه لا يتمرر.”

ما يفعله Googlebot هو الوصول إلى صفحة ما والزحف إلى ما هو ظاهر فورًا.

وفقًا لما ذكره سبليت، لا يستطيع Googlebot الزحف إلى المحتوى الذي يتم تحميله فقط بعد التمرير في الصفحة.

كما ذُكر، @kirupa، يمكنك التحقق من صفحاتك بنفسك باستخدام الأدوات في وحدة تحكم البحث التي ستظهر لك لقطةSnapshot لكيفية عرض جوجل (وفهرسة) صفحاتك.

وفقًا لما قاله سبليت من جوجل في أبريل 2020: “Googlebot لا يتمرر.” (بمعنى آخر)

بخصوص سؤال موضوع “فهرسة بحث جوجل وDiscourse”، يمكن لكل مالك موقع بسهولة استخدام وحدة تحكم البحث لتحديد كيفية قيام Googlebot بفهرسة صفحة معينة.

توصيتي، وأتمنى أن تساعدك هذه المعلومة ولو بشكل بسيط، هي استخدام وحدة تحكم البحث (Google Search Console) للتحقق من صفحاتك بنفسك إذا كان لديك أي أسئلة حول كيفية فهرسة Googlebot لصفحاتك.

المراجع:

  1. How to Specify a Canonical with rel="canonical" and Other Methods | Google Search Central  |  Documentation  |  Google for Developers

  2. https://webmasters.googleblog.com/2014/02/infinite-scroll-search-friendly.html

  3. Google’s Martin Splitt Explains Why Infinite Scroll Causes SEO Problems

شكرًا لك على الرد الرائع حقًا @neounix! سأراجع اقتراحاتك وأتبعها قريبًا :slight_smile:

يبدو أن إعادة إظهار المنتديات القديمة (kirupaForum) ووضع وسم الميتا الكنسي في المنتدى الجديد/النشط فكرة جيدة. سأقوم بتجربة ذلك هذا الأسبوع.

في هذه الأثناء، قمت بإرسال خريطة موقع تحتوي على حوالي 300 ألف إدخال إلى Google Search Console.

عزيزي @kirupa،

أهلاً وسهلاً بك.

للعلم:

تضيف منتديات Discourse تلقائيًا علامة canonical إلى المواضيع.

إليك رابطًا من منتدياتك، مع عرض الكود المصدري لإحدى أمثلتك (أعلى):

Screen Shot 2020-06-09 at 1.48.45 PM

يمكنك أن ترى أن صفحة Discourse الخاصة بك تحتوي بالفعل على علامة canonical.

إحدى “الحيل” (غير المدعومة رسميًا ولكنها ممكنة) هي إضافة نفس العلامة في “المنتديات القديمة” (موجهة إلى المنتديات الجديدة)، أو على الأقل التأكد من أن منتدياتك القديمة لا تحتوي على علامة canonical.

ومع ذلك، بصراحة، للحصول على معرف الموضوع الصحيح لمنتديات Discourse في قاعدة بيانات منتدياتك القديمة يتطلب بعض العمل (لقد قمنا بذلك لأسباب أخرى، لذا أعرف من تجربتنا الخاصة أنه ممكن لأننا نستخدم هذه المعلومات في كلا المنتدىين حاليًا).

توجد في Discourse جدول قاعدة بيانات لحقول مخصصة للمواضيع يحتوي على التحويل من منتدياتك القديمة (معرفات المواضيع والمشاركات)، ويمكنك (إذا أردت) تصدير هذه البيانات من Discourse وإضافتها إلى منتدياتك القديمة.

ثم يمكنك (إذا أردت، وأنا لا أوصي بطريقة معينة على أخرى) إنشاء علامة canonical بسهولة في منتدياتك القديمة تشير إلى منتديات Discourse الجديدة، إذا رغبت في ذلك (بناءً على تحسين محركات البحث لديك وكيف ترغب في التعامل مع هذا الأمر).

يفضل بعض الأشخاص إعادة توجيه صفحات المنتدى القديمة عبر 301. الأمر كله يعود إليك ولطريقة إدارتك للأمور! تذكر أنه إذا كنت ترغب في إعادة التوجيه عبر 301، فستحتاج أيضًا إلى التحويلات بين معرفات الموضوع (والمشاركات) في Discourse ومعرفات المواضيع والمشاركات في منتدياتك القديمة.

أتمنى أن يساعدك هذا المتابعة السريعة يا @kirupa.

أطيب التمنيات واستمتع!