فشل CNN في OneBoxing

على منتدى آخر من منتديات Discourse، اقترح @sam أن أقدم تقرير خطأ هنا: يبدو أن هناك فشلاً متقطعًا (على الأقل) في Oneboxing لمقالات CNN. نظرًا لأن هذا موقع بارز، يبدو الأمر مهمًا جدًا. من غير الواضح ما إذا كانت المشكلة تتعلق بتحديد المعدل، أو حظر وكيل المستخدم، أو مشكلة من جانب Discourse، أو مشكلة فعلية في بيانات oEmbed، أو ما شابه ذلك.

أمثلة:

(تمت إزالة أمثلة إضافية بسبب كون المستخدم جديدًا.)

4 إعجابات

مرحباً @wazroth :wave: أهلاً بك في ميتا. :slight_smile: شكراً على التقرير.

نعم، تمكنت من إعادة إنتاج هذا على نسختي التطويرية وموقع مستضاف. روابط CNN لا تعمل على الإطلاق.

3 إعجابات

شكرا @wazroth لقد قمنا بتصحيح هذا الأمر في وقت ما خلال الأسابيع الأربعة القادمة

4 إعجابات

@ted هل تتذكر لماذا قللنا max_download_kb لـ onebox من 10 ميجابايت إلى 2 ميجابايت في https://github.com/discourse/discourse/commit/95a82d608d6377faf68a0e2c5d9640b043557852؟

لا يتم عرض روابط CNN المبلغ عنها كـ onebox لأن حجم الاستجابة هو 2.7 ميجابايت وهو أكبر من الحد الحالي البالغ 2 ميجابايت. يمكننا إصلاح ذلك عن طريق زيادة الحجم الافتراضي ولكن أود أن أفهم بشكل أفضل مخاطر القيام بذلك.

4 إعجابات

هممم، أيضًا… للمتابعة، أليست كل المعلومات التي نحتاجها في أول 2 ميجابايت على أي حال؟

إعجابَين (2)

انظر أيضًا https://meta.discourse.org/t/amazon-onebox-broken/307120، هل هذا مرتبط؟

هل هذا الإعداد max_download_kb مبرمج بشكل ثابت؟ لا يمكنني تغييره عبر قائمة المسؤول، أليس كذلك؟

يعتمد على محرك onebox. تقوم بعض محركات onebox مثل Amazon بكشط معلومات معينة مثل سعر العنصر من داخل <body>. بالنسبة لمحركات opengraph، يجب أن نحتاج نظريًا فقط إلى علامات معينة مثل <meta> في <head>.

ستكون الطريقة الأكثر كفاءة هي تحليل الاستجابة للمعلومات الضرورية أثناء تدفق الاستجابة، ولكن تغيير جميع محركاتنا للقيام بذلك من المحتمل أن يتطلب قدرًا كبيرًا من الجهد وهو حل أكثر تعقيدًا.

في الواقع، Nokogiri، الذي نستخدمه لتحليل استجابة HTML، قادر على تحليل نص HTML غير مكتمل، لذلك لا داعي للتخلص من الاستجابة بأكملها عندما تكون كبيرة جدًا. أعتقد أنه يمكننا الاستمرار في تحديد حجم نص الاستجابة بـ 2 ميجابايت، وإذا تجاوز حجم الاستجابة ذلك، فسنحاول فقط تحليل أول 2 ميجابايت.

إعجاب واحد (1)

تم إصلاح هذا بواسطة

محليًا، لم تعد عناوين URL “المشكلة” التي تم الإبلاغ عنها في هذا الموضوع تعرض خطأ عند محاولة تضمينها.

5 إعجابات

رائع، شكرًا @tgxworld :smiley:

إعجابَين (2)