ارتفاع غير عادي في عدد المشاهدات المجهولة

لا أعرف أبدًا ماذا أفكر في أرقام المشاهدات المجهولة ولكنها لا تتوافق أبدًا مع بيانات تحليلات جوجل بأي شكل ذي معنى.

جلبت الأيام الأربعة الأخيرة هذا إلى التركيز لأنه كان هناك زيادة هائلة ومستمرة في المشاهدات المجهولة وهو أمر غير عادي.

قد يكون ذلك مصادفة منذ الترقية إلى 3/3.1 ولكن هل يمكن أن يكون مرتبطًا لأنه بدأ بعد فترة وجيزة.

مع رؤية أن إحصائيات تسجيل الدخول تبدو قد انخفضت بشكل كبير، فهذا مقلق.

بشكل عام، من الصعب معرفة عدد الزيارات إلى عدد المشاهدات المسجلة أيضًا لأنها لا تتوافق مع أرقام التحليلات ولكن بالنظر فقط إلى لوحة المعلومات، هناك اتجاه جديد غريب.

فيما يتعلق بالتفاوت بين تحليلات جوجل وإحصائيات لوحة المعلومات، إليك مثال بسيط - ترى 500 زيارة فريدة لتحليلات جوجل ليوم واحد ولكن على لوحة معلومات Discourse هناك 2000 تسجيل دخول، و 50000 مشاهدة مجهولة، و 5000 زاحف.

ما الذي يحدث بشكل عام مع هذه الإحصائيات؟

كيف يجب أن نتعامل مع البيانات وما الذي يمكن أن تخبرنا به فيما يتعلق بإدارة منتدى Discourse؟

هل المشاهدات المجهولة مؤشر على حركة مرور مجمعة غير مرغوب فيها وإهدار للموارد؟

يتم تصفية مثل هذه الزيارات من تحليلات جوجل إذا اخترت الخيار الصحيح - ربما لا يكون الأمر من جانب Discourse ويمكن أن يشير إلى أنه نوع من حركة المرور منخفضة المستوى من نوع DDOS لأي أسباب غريبة وغير صحيحة، مما يهدر الموارد مرة أخرى ولكن ربما يؤثر على تسجيلات الدخول الحقيقية؟

لا يوجد تقرير حتى الآن عن مشاكل تسجيل الدخول.

بشكل عام، كيف نفسر أرقام لوحة المعلومات!

شكراً على أي رؤى ونصائح.

4 إعجابات

مرحباً @agemo!

أرى سلوكًا مشابهًا في الأشهر القليلة الماضية. هل تمكنت من اكتشاف شيء حيال هذا؟

ربما تكون روبوتات، وربما تكون روبوتات مسح بالذكاء الاصطناعي.

ما ساعدني بشكل كبير هو تقارير زاحف الويب في لوحة التحكم بعد أن تم إخباري بوجودها (لم ألاحظها من قبل) باستخدام هذا حظرت زواحف مختلفة. مما أدى إلى انخفاض المشاهدات المجهولة. أعتقد أن الزواحف تأتي أيضًا من المشاهدات المجهولة. ليس لدي فكرة عن كيفية حدوث ذلك.

تمنحك التقارير أيضًا أسماء الزواحف (وكلاء المستخدم) للبحث عنها في كل زاحف لمعرفة ما إذا كانت ذات قيمة.

قد يكون هذا الموضوع مفيدًا أيضًا

3 إعجابات

قد يكون ذلك صحيحًا، ولا أعرف أيضًا كيف يحدث ذلك بخلاف التخمين فقط يعتمد على كيفية تحديد النظام للروبوتات مقابل المستخدمين.

لقد رأيت ارتفاعات في الزواحف عندما يتم نشر المزيد من النصوص، وأيضًا ارتفاعًا عشوائيًا للمشاهدات المجهولة قبل بضعة أيام.

لدينا الآن مقياس جديد يقسم طرق العرض للصفحات المجهولة إلى “من المحتمل أن يكون بشريًا” و “من المحتمل أن يكون روبوتًا” حتى يتمكن الأشخاص من التفكير في الأخير بشكل أكبر مثل الزواحف (وهو ما من المحتمل أن يكونوا عليه، ولكنهم لا يعرفون أنفسهم على هذا النحو).

التقرير هو جزء من التقارير القياسية ويمكن العثور عليه في /admin/reports/consolidated_page_views_browser_detection

هناك أيضًا بعض الأعمال الأخرى قيد التنفيذ لتطبيق هذا على مقاييس طرق عرض الموضوع أيضًا لمنع تضخم الروبوتات.

3 إعجابات

هذا الرسم البياني الجديد مفيد، يبدو أن فئة “ربما روبوت” تم تصنيفها على أنها “طرق عرض أخرى للصفحة”:

مع الروبوتات الجديدة الماكرة التي لا تقدم نفسها بشكل صحيح، هل هناك أي طريقة لإبطائها أو تحديد مصدرها؟

يمكن التحقق من تقارير وكيل مستخدم زاحف الويب، ولكن إذا لم تظهر هناك، فلست متأكدًا مما يجب التحقيق فيه.

إعجاب واحد (1)

لا. إذا عمل مبرمج هذا الروبوت كما يفعلون غالبًا، مما يعني أن هناك جزءًا من النص في وكيل المستخدم أو الجهاز أو النظام وما إلى ذلك، وهو نفسه طوال الوقت، فيمكنك حظره تمامًا، ولكنك تحتاج إلى وكيل عكسي. robots.txt هو مجرد دليل للروبوتات ذات السلوك الجيد.

سجلات Discourse تعطي صورة كبيرة بشكل أو بآخر. مثل هذه البيانات التفصيلية يجب أن تستخرجها من سجلات Nginx، مما يعني مرحبًا بك في وحدة التحكم :smirking_face:

يمكن أن يتعثر ووردبريس بسهولة بسبب الروبوتات، ولكن مع Discourse، الوضع مزعج أكثر. سرقة المحتوى هي القاعدة اليوم، وكانت كذلك منذ فترة طويلة.

إعجابَين (2)

يبدو أن الوكيل العكسي (Reverse Proxy) خطوة أولى جيدة، هل Cloudflare جيد لذلك؟

أعرف صديقًا مطور ويب محليًا أوصى باستخدام خوادم أسماء Cloudflare للأمان، وقد يكون ذلك جيدًا.

لست قلقًا جدًا بشأن “سرقة” المحتوى المنشور، فعندما يُنشر النص علنًا، يحق للناس تسجيله طالما أنهم لا يحاولون بيعه على أنه إبداعهم الخاص، عندها سيصبح ذلك مشكلة.

إعجاب واحد (1)

أقترح Nginx أو Varnish. ولكن ربما يعمل Cloudflare أيضًا، أنا لا أعرفه، ولم أستخدمه قط.

إعجابَين (2)

شهدت يوم أمس 17 أغسطس ارتفاعًا غير عادي في عدد مشاهدات الصفحات “الأخرى” الناتجة عن الروبوتات بلغ 152، وهو أمر عشوائي للغاية لموقع غير نشط في الغالب، والذي عادة ما يكون لديه حوالي 15-20 مشاهدة فقط من هذا النوع يوميًا.

طبيعي تمامًا. بالنسبة لي، حصلت على أفضل النتائج باستخدام حظر أسوأ وكلاء المستخدم معًا والمدونات الجغرافية (ليس لدي منتدى عالمي، لذا يمكنني القيام بذلك بسهولة).

هل تقصد الحظر الجغرافي لـ I.P.s من بلدان أخرى غير فنلندا؟ هذا يبدو فكرة جيدة للمواقع ذات التركيز المحلي.

نعم. حاليًا أحصل على الكثير من الزيارات من روسيا وسنغافورة والصين. سابقًا كانت الهند وباكستان ومصر وإيران والعراق. وأراهن أنهم لا يستطيعون إنهاء الأمر :wink: من الممكن مع روسيا، ولكن… لا.

أكبر ثلاثة هم الولايات المتحدة وفرنسا وهولندا، وألمانيا تنمو. ولكن هذا بسبب مراكز البيانات ولهذا السبب لا يمكنني حظرها.

ولكن مرة أخرى، مع Discourse، فإن هذه في الغالب مجرد إزعاج. مع WordPress (وغيرها من مكدسات LAMP أود أن أقول) فإنها تخلق حملًا كبيرًا لدرجة أن الوضع يبدأ في الاقتراب من هجمات الحرمان من الخدمة (DDoS).

والأغلب هم من أطفال البرامج النصية الأغبياء الذين يحاولون إسقاط Discourse باستخدام مشكلات WordPress القديمة.

ولكن في الوقت الحاضر، بدأت محركات البحث وروبوتات الذكاء الاصطناعي في أن تكون علامة استفهام حقيقية.

ولكن إذا كان لدى المرء منتدى محلي، فإن حظر المنطقة الجغرافية هو مجرد خطوة حكيمة.

إعجاب واحد (1)

قد يكون هذا يكتسب وتيرة إشكالية.

لقد رأيت ما أظنه حركة مرور روبوتات مدعومة بالذكاء الاصطناعي تقترب من تعطيل مستوى هجمات الحرمان من الخدمة (DDOS) حيث بدأت خدمة المناقشة في الشكوى.

ليست إعدادات قوية للغاية ولكن للطلب الطبيعي المتوقع هناك بعض المساحة، عادةً.

  • هذه المرة ظهرت كحركة مرور مجهولة ضخمة و أخرى. *

هذا تطابق تمامًا مع زيادة إحصائيات وحدة المعالجة المركزية للخادم والحمل ومعدل إدخال/إخراج القرص.

كمستخدم هنا، تعرضت للكثير من الانتقادات والعديد من الحظر (المؤقت) بسبب انتقاد التبني الحماسي للغاية للذكاء الاصطناعي، والذي عاد الآن ليؤذي بطرق عديدة (مثل فقدان الوظائف، ولكن وهذا الآن، والذي قد يكون استمرارًا للموضوع الأصلي وليس سوى أحدث حركة مرور روبوتات الويب المدعومة بالذكاء الاصطناعي التي تعرف عن نفسها، يا إلهي.

في ذلك الوقت، كان رأيي أنه كان (أيضًا) الوقت المناسب للتفكير في جميع الاستراتيجيات للتخفيف من حدة التأثير على العميل/المستخدم النهائي، وليس مجرد الانضمام إلى سباق التسلح كشريك فرعي، فإن منطق أسلوب ماسك هو أنه إذا لم تتمكن من هزيمتهم، فانضم إليهم في هذه الحالة، من السهل قوله، ولكنه ليس الخيار الصحيح والدعوة إلى التنظيم ساذجة.

تراجع؟

ربما فات الأوان الآن.

قد تأتي حركة مرور الذكاء الاصطناعي بشكل أكثر شبهاً بالبشر: تقنيًا لا أعرف كيف يعمل ذلك (لكنني أعرف كيف وصلنا إلى هنا) بخلاف أنه ربما يمرر نفسه كحركة مرور بشرية بسهولة أكبر ويقدم حركة مرور أكثر صعوبة في الكشف عنها والتي تبدو أيضًا مرغوبة من وجهة نظر جوجل، ولكن يا إلهي، قد تكون هذه مشكلة جديدة أكبر.

لا شيء مجاني أبدًا، لا أعرف كم (مرة أخرى) تم خداعهم بهذا ولم يطبقوا الحذر البشري ويختاروا خيار التراجع.

في الوقت الحالي، لا تزال حركة المرور هذه تأتي من مناطق محددة جدًا وحتى كتل ASN كافية لإزالة الحرارة جراحيًا.

  • إلى متى؟ *

هذا أمر طبيعي إلى حد كبير، أدير مجموعة من المواقع وعادةً ما تعرض CloudFlare حوالي 10 إلى 30 ضعف حركة المرور الحقيقية لدي. إذا لم يقوموا بتشغيل التحليلات، فهي روبوتات أو زواحف محركات البحث، حيث أن معظم الروبوتات لا تقوم بتشغيل جافاسكريبت المستخدم للتحليلات.

إعجاب واحد (1)

CloudFlare مجاني :wink:

إعجابَين (2)

ظهرت هذه في تحليلات جوجل. هذا ما كان مختلفًا، على ما أذكر.

إذا كنت قلقًا حقًا، فاحصل على CloudFlare وقم بإنشاء جدار ناري للدول المخالفة. إذا كان عنوان IP الخاص بك موجودًا بالفعل في نظام أسماء النطاقات (DNS)، فاحصل على عنوان IP جديد. هذا إذا كنت تتعرض للهجوم.

إعجاب واحد (1)

بالفعل، كان الخادم موجودًا بالفعل على نظام أسماء النطاقات الخاص بـ CF ولكنه لم يكن موجهًا حيث كنت لا أزال أعتقد أن ذلك لم ينجح بناءً على نصائح الإعداد القديمة. أنت تعرف أن الخوف من السحابة البرتقالية قوي. :sweat_smile:

ومع ذلك، جربت ذلك خلال إحدى الموجات وتمكنت من تخفيف الحجم بسهولة نسبية بعد بعض المراقبة. يبدو أنه قد تم تجريد الكثير من حركة المرور بالإضافة إلى ذلك.

هل الطريقة الوحيدة للحصول على عنوان IP جديد هي الانتقال إلى خادم جديد؟

يعتمد على خدمة الاستضافة الخاصة بك. بعضها مثل DigitalOcean يمكنها ببساطة تعيين عنوان IP ثابت جديد في لوحة التحكم، وبعضها الآخر. قد تحتاج إلى سؤالهم. أنا لا أقوم بإيقافه أبداً. إذا قمت بإيقاف السحابة البرتقالية، أعتبر أن عنوان IP هذا قد تم اختراقه. إذا فقدت حركة المرور عند تشغيله، فمن المحتمل أن إعداد SSL الخاص بك غير صحيح. أو أن التخزين المؤقت ليس صحيحاً. قد يكون إجراء تبديلات مباشرة إلى Cloudflare أمراً صعباً إذا لم تكن قد ضبطت إعدادات SSL بالفعل. لأنه من الصعب الحصول على عنوان IP غير مخزن مؤقتاً من نظام أسماء النطاقات (DNS) للاختبار به.

إعجاب واحد (1)