| ملخص | أضف روابط مخفية إلى المحتوى يمكنها تسميم كاشطات الويب التي لا تتعاون. | |
| رابط المستودع | https://github.com/elmuerte/discourse-poison-fountain | |
| دليل التثبيت | كيفية تثبيت الإضافات في Discourse |
الميزات
لكل صفحة تم إنشاؤها، ستتم إضافة روابط إلى صفحات تحتوي على محتوى مسموم. إذا قامت كاشطة ويب سيئة باستهلاك هذا المحتوى واستخدمته لتدريب نموذج لغوي كبير (LLM)، فسيؤثر ذلك سلبًا على النموذج الناتج.
هذه الروابط مخفية عن المستخدمين، ويتم تمييزها بـ rel="nofollow"، وبشكل افتراضي، سيخبر ملف robots.txt عناكب الويب بعدم استهلاك هذا المحتوى. تتم إضافة الروابط المخفية فقط للطلبات غير المصادق عليها.
تستخدم الإضافة بشكل افتراضي المحتوى المسموم من RNSAFFN. راجع تلك الصفحة لمزيد من المعلومات. يمكنك تغيير مصدر السم في الإعدادات.
يتم تقديم المحتوى المسموم من صفحات ذات عناوين URL مثل /dpf/<some-random-slug>/<id>. باستخدام التكوين الافتراضي، يمكنك إنشاء قاعدة fail2ban على هذا المسار لعنوان IP الذي يطلب صفحات من /dpf/ عدة مرات لصد كاشطات الويب السيئة.
الإعداد (Configuration)
تحتاج فقط إلى تثبيت الإضافة وتمكينها لتبدأ في العمل في الخلفية. يمكنك ضبط بعض الإعدادات الإضافية.
الإعدادات (Settings)
تضمين جدول بالإعدادات وأوصافها
| الاسم | الوصف |
|---|---|
poison_fountain_source |
الموقع الإلكتروني الذي ينشئ المحتوى الذي سيتم تقديمه من الصفحات المسمومة. |
poison_fountain_textual_only |
قبول المحتوى النصي فقط من مصدر السم. سيمنع هذا تقديم محتوى ثنائي. |
poison_fountain_force_plain_text |
تقديم المحتوى دائمًا كـ text/plain حتى لو ذكر المصدر أنه شيء ما، مثل HTML. |
poison_fountain_update_robots_txt |
ممكّن بشكل افتراضي، سيضيف هذا المحتوى المسموم إلى قائمة الاستبعاد. عناكب الويب التي تحترم robots.txt ستتجاهل المحتوى المسموم تمامًا. |
poison_fountain_cache_hours |
عدد الساعات لتخزين المحتوى مؤقتًا قبل استرداد محتوى جديد. الحد الأقصى 24 ساعة. |
poison_fountain_entries |
عدد الإدخالات المسمومة التي سيتم الاحتفاظ بها |
poison_fountain_link_count |
عدد الروابط التي ستتم إضافتها إلى صفحات HTML التي تم إنشاؤها |
هذا المشروع غير تابع لـ RNSAFFN. إنه يوفر تكاملاً مع خدمتهم. يمكن تكوين هذا التكامل لاستخدام خدمة أخرى تعمل بطريقة مماثلة.
يجب أن تدرك أنه باستخدام هذه الإضافة، فإنك تثق في المحتوى الذي تم إنشاؤه بواسطة نافورة السم المستخدمة، وأنك تقوم بإعادة توجيهه. بشكل افتراضي، ستحاول هذه الإضافة جعل هذا المحتوى “غير ضار في الغالب”، حيث تقدم المحتوى النصي فقط كنص عادي.