إعداد كشف المحتوى غير اللائق (NSFW) في مجتمعك

:bookmark: هذا دليل لإعداد كشف المحتوى غير اللائق (NSFW) في مجتمعك باستخدام أتمتة Discourse AI لتحديد الصور والنصوص غير الملائمة والإشراف عليها.

:person_raising_hand: مستوى المستخدم المطلوب: مسؤول

إعداد كشف المحتوى غير اللائق (NSFW) في مجتمعك

اكتشف المحتوى غير اللائق (NSFW - Not Safe for Work) وقم بالإشراف عليه تلقائيًا في مجتمع Discourse الخاص بك باستخدام الأتمتة المدعومة بالذكاء الاصطناعي. سيساعدك هذا الدليل في تكوين الكشف التلقائي لكل من الصور والنصوص غير الملائمة، مما يسمح لك بالحفاظ على معايير المجتمع بأقل قدر من التدخل اليدوي.

ملخص

تغطي هذه الوثائق تكوين أتمتة Discourse AI فرز المشاركات باستخدام الذكاء الاصطناعي (Triage posts using AI) من أجل:

  • كشف الصور غير اللائقة باستخدام نماذج الذكاء الاصطناعي التي تدعم الرؤية (Vision-enabled)
  • تحديد المحتوى واللغة غير الملائمين
  • وضع علامات على المشاركات الإشكالية وتصنيفها والإشراف عليها تلقائيًا
  • إعداد استجابات مخصصة وإجراءات الإشراف

تستخدم الأتمتة النماذج اللغوية الكبيرة (LLMs) لتحليل محتوى المشاركة واتخاذ إجراءات محددة مسبقًا عند اكتشاف مواد غير لائقة.

المتطلبات الأساسية

قبل إعداد كشف المحتوى غير اللائق، تأكد من تمكين ما يلي:

  • إضافة Discourse AI: الإضافة الأساسية لوظائف الذكاء الاصطناعي
  • إضافة Discourse Automation: مطلوبة لإنشاء قواعد الأتمتة
  • الوكيل (Agent): وكيل (Agent) مع موجه نظام يحدد ما يشكل محتوى غير لائق. استخدم لغة مميزة للتصنيفات الإيجابية والسلبية لتجنب الالتباس.
  • نموذج لغوي كبير يدعم الرؤية (Vision-enabled LLM): مطلوب فقط لكشف الصور؛ تعمل النماذج اللغوية الكبيرة القياسية لكشف النصوص فقط. تأكد من تشغيل “تمكين الرؤية (Vision enabled)” لكل من نموذج اللغة الكبير والوكيل.
    • يمكن للعملاء المستضافين من Discourse اختيار نموذج اللغة الكبير الصغير المستضاف من CDCK عند تكوين الوكلاء.
    • سيحتاج مستخدمو الاستضافة الذاتية لـ Discourse إلى تكوين نموذج لغوي كبير تابع لجهة خارجية.

أمثلة على الموجهات (Prompts):

لكشف الصور:

أنت روبوت متخصص في تصنيف الصور. أجب فقط بـ NSFW أو SAFE، ولا شيء آخر. تشمل NSFW المواد الإباحية أو الرعب، وتشمل SAFE كل شيء آخر. عند الشك، أجب بـ SAFE.

لكشف النصوص:

أنت نظام متقدم للإشراف على المحتوى بواسطة الذكاء الاصطناعي مصمم لفرز المشاركات التي ينشئها المستخدمون. مهمتك هي اكتشاف ووضع علامة على أي محتوى يتضمن لغة سيئة أو مصطلحات غير ملائمة أو محتوى غير لائق (NSFW).

يشمل المحتوى غير اللائق (NSFW) المحتوى الجنسي الصريح، أو العنف، أو خطاب الكراهية، أو اللغة البذيئة، أو التمييز، أو الإشارة إلى إيذاء النفس، أو النشاط غير القانوني.

أجب بكلمة واحدة بالضبط:
* "SAFE": المشاركة مناسبة ولا تحتوي على محتوى سيئ أو غير لائق (NSFW)
* "NSFW": إذا تم اكتشاف محتوى سيئ أو غير ملائم أو غير لائق (NSFW)

كن مدركًا للسياق وتجنب الإيجابيات الكاذبة.

خطوات التكوين

تمكين الإضافات المطلوبة

  1. انتقل إلى لوحة تحكم المسؤول في موقعك
  2. اذهب إلى Plugins > Installed Plugins
  3. قم بتمكين كل من إضافتي Discourse AI و Automation

إنشاء قاعدة الأتمتة

  1. في لوحة التحكم، انتقل إلى Plugins > Automation
  2. انقر على + Create لبدء إنشاء قاعدة أتمتة جديدة
  3. اختر Triage Posts Using AI (فرز المشاركات باستخدام الذكاء الاصطناعي)
  4. قم بتعيين اسم وصفي (على سبيل المثال، “كشف المحتوى غير اللائق”)

تكوين المشغلات (Triggers) والقيود (Restrictions)

تعيين المشغل:

  • اختر Post created/edited (تم إنشاء/تحرير المشاركة) كمشغل لفحص المشاركات الجديدة أو التي تم تعديلها
  • بدلاً من ذلك، اختر Stalled topic (موضوع متوقف) لفرز المواضيع التي لم يتم الرد عليها لفترة محددة
  • اختياريًا، حدد نوع الإجراء (Action type)، أو الفئات (Categories)، أو العلامات (Tags)، أو المجموعات (Groups)، أو مستويات الثقة (Trust Levels)، أو ميزات المشاركة (Post features) لتقييد نطاق الأتمتة
  • اترك الحقول فارغة لتطبيق الأتمتة على مستوى الموقع بأكمله

قيود اختيارية (مشغل إنشاء/تحرير المشاركة):
قم بتكوين إعدادات إضافية لتحديد نطاق الأتمتة بشكل أكبر:

  • First post only (المشاركة الأولى فقط) أو Original post only (المشاركة الأصلية فقط) لاستهداف المشاركات الجديدة فقط
  • First topic only (الموضوع الأول فقط) لاستهداف الموضوع الأول للمستخدم فقط
  • Post features (ميزات المشاركة) للتقييد على المشاركات التي تحتوي على صور، أو روابط، أو تعليمات برمجية، أو مرفقات - مفيد لكشف المحتوى غير اللائق المعتمد على الصور
  • Restricted archetype (النمط المقيد) للتقييد على المواضيع العادية، أو المواضيع العامة، أو الرسائل الخاصة

تكوين تصنيف الذكاء الاصطناعي

:spiral_notepad: تم إهمال حقل موجه النظام (system prompt) لصالح الوكلاء (Agents). إذا كان لديك أتمتة ذكاء اصطناعي قبل هذا التغيير، فسيتم إنشاء وكيل جديد تلقائيًا مع موجه النظام المرتبط به.

الوكيل (Agent):
حدد الوكيل المعرف لأتمتة كشف المحتوى غير اللائق.

نص البحث (Search text):
أدخل المخرج الدقيق من الموجه الخاص بك الذي يؤدي إلى تشغيل إجراءات الأتمتة. باستخدام الأمثلة أعلاه، أدخل NSFW.

خيارات متقدمة:

  • Max Post Tokens: حدد عدد الرموز المميزة للمشاركة التي سيتم إرسالها إلى النموذج اللغوي الكبير (LLM)
  • Max output tokens: حدد حداً أعلى لعدد الرموز المميزة التي يمكن للنموذج إنشاؤها
  • Stop Sequences: وجه النموذج إلى إيقاف التوليد عند مصادفته قيماً محددة

تحديد إجراءات الإشراف

التصنيف ووضع العلامات:

  • حدد الفئة التي يجب نقل المشاركات التي تم وضع علامة عليها إليها
  • حدد العلامات التي سيتم إضافتها إلى المحتوى غير اللائق الذي تم تحديده

خيارات وضع العلامات (Flagging options):

  • قم بتمكين Flag post (وضع علامة على المشاركة) لتنشيط وضع العلامات، ثم اختر نوع العلامة:
    • Add post to review queue (إضافة المشاركة إلى قائمة مراجعة المراجعين) — يرسل المشاركة إلى قائمة المراجعة للمراجعة اليدوية من قبل المشرف
    • Add post to review queue and hide post (إضافة المشاركة إلى قائمة المراجعة وإخفاء المشاركة) — قائمة مراجعة + إخفاء فوري للمشاركة
    • Add post to review queue and delete post (إضافة المشاركة إلى قائمة المراجعة وحذف المشاركة) — قائمة مراجعة + حذف ناعم للمشاركة
    • Add post to review queue, delete post and silence user (إضافة المشاركة إلى قائمة المراجعة، وحذف المشاركة وإسكات المستخدم) — قائمة مراجعة + حذف ناعم للمشاركة + إسكات المؤلف
    • Flag as spam and hide post (وضع علامة كرسالة غير مرغوب فيها وإخفاء المشاركة) — يضع علامة كرسالة غير مرغوب فيها (يخفي تلقائيًا)
    • Flag as spam, hide post and silence user (وضع علامة كرسالة غير مرغوب فيها، وإخفاء المشاركة وإسكات المستخدم) — علامة رسالة غير مرغوب فيها + إسكات المؤلف
  • قم بتمكين Hide Topic (إخفاء الموضوع) لإخفاء الموضوع بأكمله تلقائيًا

الاستجابات الآلية:

  • قم بتعيين Reply User (مستخدم الرد) و Reply (الرد الجاهز) لنشر رسالة ثابتة تشرح سبب وضع علامة على المشاركة
  • حدد Reply Agent (وكيل الرد) لاستخدام وكيل ذكاء اصطناعي منفصل لإنشاء استجابات ديناميكية (هذا له الأولوية على الرد الجاهز)
  • قم بتمكين Reply as Whisper (الرد كهمسة) لجعل الرد مرئيًا للموظفين فقط

إشعارات المؤلف:

  • قم بتمكين Notify author via PM (إخطار المؤلف عبر رسالة خاصة) لإرسال رسالة شخصية إلى مؤلف المشاركة عند وضع علامة على محتواه
  • حدد مستخدم PM sender (مرسل الرسالة الخاصة) (افتراضيًا هو النظام) واختياريًا قدم PM content (محتوى الرسالة الخاصة) مخصصًا

خيارات أخرى:

  • قم بتمكين Include personal messages (تضمين الرسائل الخاصة) لفحص وتصنيف الرسائل الخاصة أيضًا

محاذير

  • ضع في اعتبارك أن استدعاءات النماذج اللغوية الكبيرة قد تكون مكلفة. عند تطبيق المصنف، كن حذرًا في مراقبة التكاليف وفكر دائمًا في تشغيله فقط على مجموعات فرعية صغيرة.
  • في حين أن النماذج ذات الأداء الأفضل، مثل GPT-4o، ستؤدي إلى نتائج أفضل، فقد يأتي ذلك بتكلفة أعلى. ومع ذلك، فقد رأينا انخفاضًا في التكلفة بمرور الوقت مع تحسن النماذج اللغوية الكبيرة وأصبحت أرخص.

استخدامات أخرى

يمكن تخصيص الموجه لأداء جميع أنواع الكشف، مثل كشف تعرض المعلومات الشخصية التعريفية (PII) و كشف البريد العشوائي (spam detection). نود أن نعرف كيف تستخدم هذا التشغيل الآلي لإفادة مجتمعك!

8 إعجابات

تم تقسيم مشاركة إلى موضوع جديد: تأخير اكتشاف محتوى LLM والمحتوى غير اللائق