اكتشاف مواضيع قديمة: شرب بحيرة من خلال قمع

TL؛DR: هل هناك أي إضافات أو إعدادات تضيف مجموعة من المواضيع العشوائية إلى أسفل الموضوع (ليس فقط الأحدث) حتى عند عدم تسجيل الدخول حتى يتمكن الزاحف من اكتشاف جميع المواضيع القديمة.

بعد دمج منتدى قديم في المنتدى الحالي، لدي مشكلة غريبة تتمثل في “قابلية الظهور” / “قابلية الاكتشاف”.

في طرق عرض الفئة والأحدث، يمكنك رؤية أحدث المواضيع فقط. مثل سطح البحيرة. يحتوي العرض على عدد محدود من المشاركات ويجعل التمرير اللانهائي من الصعب “التعمق”.

وجود فئات متعددة يوسع “القش”، ولكن حتى لو كان لديك، على سبيل المثال، 50 فئة وتنظر إلى عمق 100، فهذا لا يزال 5000 موضوع فقط.

يمكن الوصول إلى 1٪ -2٪ فقط من المواضيع، والباقي مخفي تحت السطح.

اعتقدت أن sitemaps.xml يمكن أن يساعد، لكن هذه تكشف عن عدد قليل فقط من المواضيع في التكوين الافتراضي.

تُحظر أجزاء ضخمة من المحتوى فعليًا من الزواحف.

كنت أتساءل، هل هناك أي إضافات أو إعدادات تضيف مجموعة من المواضيع العشوائية إلى أسفل الموضوع (ليس فقط الأحدث) حتى عند عدم تسجيل الدخول حتى يتمكن الزاحف من اكتشاف جميع المواضيع القديمة.

إعجاب واحد (1)

يجب على الزواحف استخدام خريطة الموقع. لا يتم الكشط عشوائيًا.

إعجابَين (2)

هل فكرت في ترقية المواضيع القديمة؟ يبدو أنها طريقة أسهل لإعادة إحياء المواضيع القديمة دون إنشاء إضافات أو ما شابه ذلك.

في إعدادات الفئة يمكنك العثور على هذه الإعدادات

يعمل هذا بشكل جيد هنا في meta حيث يعيد المواضيع القديمة التي يمكن بعد ذلك “تحديثها” بأحدث المعلومات / إغلاقها. إنها طريقة جيدة لتنظيم المحتوى الخاص بك أيضًا. إليك مثال من عام 2020 تم ترقيته

إعجاب واحد (1)

مسألة ذوق مدى جودة نظام الرفع. أو إذا تم ذلك بسبب الروبوتات، وليس للبشر.

هنا المواضيع المرفوعة تزعجني كثيرًا. لا أعرف لماذا يجب أن أرى مواضيع قديمة جدًا بسبب وجود حاجة غير فعلية لإغلاقها.

إعجاب واحد (1)

انتظر.. ماذا؟ لماذا تعتقد ذلك؟

نظرت إلى خريطة الموقع التي تم إنشاؤها ووجدت أنها تحتوي على نصف شهر فقط من المنشورات في sitemap_1.xml. يحتوي sitemap_recent.xml على عدد أقل.

وهل تحققت من sitemap_2.xml وما إلى ذلك؟

ومن هنا جاءت كلمة “recent” في الاسم.

هذه هي المشكلة، لا توجد صفحات خريطة موقع إضافية بخلاف sitemap_1.xml وهذه الصفحة تحتوي على أقل من 10 آلاف عنوان URL كحد أقصى المحدد في الإعدادات.

أعلم، أذكر ذلك في حال اعتقد الناس أنني أشير إلى هذا الملف.

ربما سأرى ما إذا كان بإمكاني إعادة تشغيل إنشاء خريطة الموقع بطريقة ما.

وهل كل هذه المواضيع المفقودة عامة؟ هل يمكنك نشر المنتدى الذي يدور حوله هذا الموضوع أو إرساله عبر رسالة خاصة؟

الغالبية العظمى من المواضيع عامة.

أرى أن sitemap_1 يحتوي على 10 آلاف رابط كحد أقصى (تم إنشاؤه قبل أقل من ساعة). لا توجد صفحات خرائط مواقع أخرى. سأنتظر 15 دقيقة عندما يتم الإنشاء المجدول التالي لمعرفة ما إذا كانت الصفحات الأخرى ستظهر.

أرى في Sidekiq أن مهمة إعادة الإنشاء قد تم تشغيلها، لكنني لا أعرف لماذا تنتج فقط sitemap_1.xml ولا تنتج صفحات أخرى.

Jobs::RegenerateSitemaps قبل 48 دقيقة موافق 257 مللي ثانية في 11 دقيقة افتراضي

يمكنني إرسال رابط المنتدى إليك عبر رسالة خاصة إذا لم تقم مهمة إعادة الإنشاء المجدولة في غضون 11 دقيقة بإصلاح المشكلة. لقد قمت أيضًا بزيادتها إلى 50 ألف رابط، لذلك حتى لو لم يتم إنشاء المزيد من الصفحات، فإن تلك الصفحة الواحدة ستحتوي على 5 أضعاف عدد الروابط على الأقل.

تعديل: مجرد تحديث. تم تشغيل المهمة وتم إنشاء خريطة الموقع الجديدة الأكبر بحجم 50 ألف رابط، ولكن مرة أخرى صفحة واحدة فقط.

تعديل 2: بعد تركها تستقر قليلاً، يسعدني أن أبلغ أنه تم إنشاء صفحات خرائط المواقع الإضافية في المهمة الأخيرة. لست متأكدًا من سبب عدم إنشائها في الوظائف السابقة.

نعم، لكن الرفع غير منظم وهو مجرد قشة رفيعة مرة أخرى: حتى لو قمت برفع 100 مشاركة يوميًا في 50 فئة (مما سيجعل المنتدى عديم الفائدة لأنه سيؤدي إلى رفع كل المحتوى الحديث)، فإن ذلك لا يزال يمنحك نفس 2٪ من المواضيع.

أعتقد أنني أستطيع محاولة تنفيذ شيء مثل “المواضيع المقترحة” في أسفل كل موضوع ولكن بخوارزمية مختلفة للميل نحو الاستكشاف.

أنت تتجاوز شيئًا واحدًا. الرفع يساعد فقط إذا

  • كان روبوت مفيد يقوم بالمسح في تلك اللحظة
  • كان روبوت مفيد سيتبع مثل هذه الروابط

في معظم الحالات لن يحدث ذلك. الشيء الوحيد الذي تحصل عليه هو المستخدمون المنزعجون - ما لم تحدث كل هذه الرفعات في إصدارات غير جافا سكريبت فقط.

ولكن سؤال واحد: هل تريد كل هذا فقط لأن خرائط مواقعك قد تكون معطلة، أم أنك لا تثق في خرائط المواقع؟


المواضيع المتعلقة بالذكاء الاصطناعي التي أجدها هي أفضل طريقة لاكتشاف المواضيع القديمة

إعجابَين (2)

أعتقد أن خرائط المواقع تحل مشكلة الزاحف. لقد بدأت موضوعًا مختلفًا لمناقشة كيفية زيادة إمكانية التصفح والاكتشاف في هذا الموضوع: Easy ways to navigate and browse large categories? - #2 by Jagster

هناك نوع من التقاطع بين قابلية البحث ولكنها مختلفة قليلاً.

كان تأثير خرائط الموقع الثابتة فوريًا:

تعديل: فقط لأقول إن التعليق بالذكاء الاصطناعي جيد بشكل مخيف. لم أتوقع أن يفسر الرسم البياني بشكل جيد!

إعجاب واحد (1)