حظر Oneboxing بواسطة فحص الروبوت

أرى هذا في بعض المواقع وبدأ للتو. عندما يحاول Discourse سحب المعلومات من الموقع، يتم حظره. كان هذا يعمل في الإصدارات السابقة.
لقد أدرجت رابطًا كمثال

Bloomberg - هل أنت روبوت؟

يبدو أن هناك تحديدًا لمعدل الطلبات من قبل بلومبرغ. على الأرجح لا يوجد الكثير مما يمكنك فعله سوى استنتاج حدود المعدل والعمل على البقاء ضمنها.

ما الذي تحاول بالضبط تضمينه هنا؟ الرابط غريب جدًا.

مقال إخباري من بلومبرغ. إذا نقرت على الرابط، فهذا هو المقال.

جرّب "Onebox Assistant", crawl for those previews reliably!

يعمل مع روابط بلومبرغ، حسب ما أذكر.

ما هو الرابط الأصلي؟ الرابط الذي ألصقته أعلاه ليس مقالًا، بل وجهة تم إعادة توجيهك إليها، على ما أظن.

https://www.bloomberg.com/opinion/articles/2020-01-29/peer-review-is-science-s-wheel-of-misfortune

هذا هو الرابط.

أرى، إليك الرابط

http://www.bloomberg.com/opinion/articles/2020-01-29/peer-review-is-science-s-wheel-of-misfortune

يبدو أنهم يطبقون إجراءات صارمة لمنع الزحف الآني، بما أننا نقوم فقط بالتحقق من رؤوس البيانات الوصفية..

كما أن هذا مثال آخر على أنه لا ينبغي لنا عرض الروابط بشكل منفرد لأن ليس لدينا صورة ولا وصف cc @techAPJ @sam .. يجب علينا حقًا نقل هذا التغيير إلى النسخة المستقرة بمجرد إدخاله الأسبوع المقبل.

لقد جربت للتو الرابط الذي ينتهي بامتداد HTML (مع استبعاد جميع الأحرف اللاحقة) باستخدام متصفح فايرفوكس فقط، وليس Onebox الخاص بـ Discourse. رسالة الخطأ الموسعة مذكورة أسفل الخط. الرابط الأول (الذي يحتوي على رسالة الخطأ أدناه) محاط بـ <> هنا. أما الرابط الثاني فغير محاط بـ <> ويعرض عنوان URL كما هو موضح.
https://www.bloomberg.com/tosv2.html
Bloomberg - Are you a robot?


لقد رصدنا نشاطًا غير عادي من شبكة حاسوبك

للاستمرار، يرجى النقر على المربع أدناه لإخبارنا بأنك لست روبوتًا.

لماذا حدث ذلك؟

تأكد من أن متصفحك يدعم JavaScript وملفات تعريف الارتباط (cookies) وأنك لا تمنع تحميلهما. لمزيد من المعلومات، يمكنك مراجعة شروط الخدمة وسياسة ملفات تعريف الارتباط.

تحتاج إلى مساعدة؟

بالنسبة للاستفسارات المتعلقة بهذه الرسالة، يرجى التواصل مع فريق الدعم مع تزويدهم بمعرف المرجع أدناه.

معرف مرجع الكتلة: 13215fd0-4285-11eb-8faf-b7e9262e99b2