نافورة السم في Discourse

:information_source: ملخص إضافة روابط مخفية إلى المحتوى يمكن أن تسمم كاشطات الويب التي لا تتعاون.
:hammer_and_wrench: رابط المستودع \u003chttps://github.com/elmuerte/discourse-poison-fountain\u003e
:open_book: دليل التثبيت كيفية تثبيت الإضافات في Discourse

الميزات

إلى كل صفحة تم إنشاؤها، ستتم إضافة روابط إلى صفحات تحتوي على محتوى مسموم. إذا قامت كاشطة ويب سيئة باستهلاك هذا المحتوى واستخدمته لتدريب نموذج لغوي كبير (LLM)، فسيؤثر ذلك سلبًا على النموذج الناتج.

هذه الروابط مخفية عن المستخدمين، ويتم تمييزها بـ rel="nofollow" وبشكل افتراضي سيخبر ملف robots.txt عناكب الويب بعدم استهلاك هذا المحتوى. تتم إضافة الروابط المخفية فقط للطلبات غير المصادق عليها.

تستخدم الإضافة بشكل افتراضي المحتوى المسموم من RNSAFFN. راجع تلك الصفحة لمزيد من المعلومات. يمكنك تغيير مصدر السم في الإعدادات.

يتم تقديم المحتوى المسموم من صفحات ذات عناوين URL مثل /dpf/ متبوعًا بـ \u003csome-random-slug\u003e/ متبوعًا بـ \u003cid\u003e. باستخدام التكوين الافتراضي، يمكنك إنشاء قاعدة fail2ban على هذا المسار لعنوان IP الذي يطلب صفحات من /dpf/ عدة مرات لصد كاشطات الويب السيئة.

الإعدادات

تحتاج فقط إلى تثبيت الإضافة وتمكينها لتبدأ في القيام بعملها في الخلفية. يمكنك ضبط بعض الإعدادات الإضافية.

الإعدادات

تضمين جدول بالإعدادات وأوصاف الإعدادات

الاسم الوصف
poison_fountain_source الموقع الإلكتروني الذي ينشئ المحتوى الذي سيتم تقديمه من الصفحات المسمومة.
poison_fountain_textual_only قبول المحتوى النصي فقط من مصدر السم. سيمنع هذا تقديم محتوى ثنائي.
poison_fountain_force_plain_text تقديم المحتوى دائمًا كـ text/plain حتى لو ذكر المصدر أنه شيء مثل HTML.
poison_fountain_update_robots_txt ممكّن افتراضيًا، سيضيف هذا المحتوى المسموم إلى قائمة الاستبعاد. عناكب الويب التي تحترم robots.txt ستتجاهل المحتوى المسموم تمامًا.
poison_fountain_cache_hours عدد الساعات لتخزين المحتوى مؤقتًا قبل استرداد محتوى جديد. بحد أقصى 24 ساعة.
poison_fountain_entries عدد الإدخالات المسمومة التي سيتم الاحتفاظ بها
poison_fountain_link_count عدد الروابط التي ستتم إضافتها إلى صفحات HTML التي تم إنشاؤها
7 إعجابات