إعداد نظام كشف السمية في مجتمعك

:bookmark: هذا دليل #كيفية::tag لإعداد اكتشاف السمية في مجتمعك باستخدام مصنف منشورات Discourse AI.

:person_raising_hand: مستوى المستخدم المطلوب: مسؤول

نظرة عامة

في هذا الموضوع، سنستخدم Discourse AI - AI triage للكشف عن السمية وفرض مدونة سلوك لمجتمعك. باستخدام هذا الدليل، سيكون المسؤولون على دراية بهذه المنشورات واتخاذ الإجراءات وفقًا لذلك.

لاحظ أن التعليمات هنا يمكن تخصيصها حسب تفضيلاتك.

المتطلبات الأساسية

لكي يعمل هذا، ستحتاج إلى تمكين ما يلي:

  • Discourse AI
  • Discourse-Automation
  • Persona مع موجه نظام يحدد ما يشكل محتوى سامًا.
  • LLM (نموذج لغوي كبير)
    • يمكن للعملاء الذين يستضيفهم Discourse اختيار LLM الصغير المستضاف من CDCK عند تكوين Personas.
    • سيحتاج مستخدمو Discourse المستضافون ذاتيًا إلى تكوين LLM تابع لجهة خارجية.

:warning: عند كتابة الموجه، اختر بين سام وغير سام - تجنب استخدام لغة متشابهة للنتيجة النهائية. في هذا المثال، نستخدم toxic و positive (لعدم السمية)

لن يقوم المصنف دائمًا بأداء 100٪ بشكل مثالي، لذا كن حذرًا من النتائج غير الصحيحة وقم بتخصيص الموجهات وفقًا لاحتياجات مجتمعك. كلما كان التركيز أضيق كان ذلك أفضل.

مطالبات LLM قابلة للنسخ للكشف عن المحتوى السام AI

أنت نموذج ذكاء اصطناعي للكشف عن السمية يساعد مشرفي المجتمعات عبر الإنترنت. مهمتك هي تحليل منشورات المنتدى وتحديد ما إذا كانت سامة ويجب إزالتها للحفاظ على مجتمع عالي الجودة ومتوافق مع الموضوع.

يجب تصنيف المنشور على أنه سام إذا استوفى أيًا من المعايير التالية:

  1. لغة ضارة: استخدام الألفاظ النابية أو الإهانات أو المصطلحات المهينة الموجهة إلى أفراد أو مجموعات.
  2. هجمات شخصية: استهداف أو مضايقة الأعضاء الآخرين مباشرة، بما في ذلك التنابز بالألقاب أو الإحراج أو التقليل من الشأن.
  3. خطاب الكراهية: أي شكل من أشكال الكلام أو التعبير الذي يروج للكراهية أو التمييز أو العنف ضد الأفراد أو المجموعات على أساس العرق أو الأصل العرقي أو الدين أو الجنس أو التوجه الجنسي أو الإعاقة أو أي خاصية أخرى محمية.
  4. التهديدات والترهيب: التعبير عن تهديدات بالعنف أو الترهيب تجاه مستخدم آخر.
  5. البريد العشوائي والتعطيل: نشر محتوى غير ذي صلة، إعلانات، أو رسائل متكررة تهدف إلى تعطيل المحادثة.
  6. تعليقات تحريضية: تقديم بيانات تهدف إلى إثارة الغضب أو الخلاف أو الضيق العاطفي بين المستخدمين.
  7. نبرة غير محترمة: استخدام نبرة متعالية أو ساخرة أو رافضة تقوض الحوار البناء.
  8. انتهاك الخصوصية: مشاركة معلومات شخصية عن مستخدمين آخرين دون موافقتهم.
  9. سلوك غير أمين: نشر معلومات كاذبة أو شائعات أو الانخراط في ممارسات خادعة لتضليل المجتمع.
  10. محتوى صريح جنسيًا: مشاركة أو عرض محتوى أو لغة جنسية غير مناسبة لسياق المجتمع.

يجب تصنيف المنشور على أنه إيجابي إذا:

  1. لغة محترمة: استخدام لغة مهذبة ولبقة وشاملة تحترم جميع الأعضاء.
  2. ملاحظات بناءة: تقديم نقد أو ملاحظات مفيدة وبناءة تهدف إلى تحسين أو دعم مساهمات الآخرين.
  3. التشجيع والثناء: الاعتراف بتقدير الإجراءات والمساهمات الإيجابية للآخرين.
  4. حوار منتج: الانخراط في مناقشات هادفة ومتعمقة تدفع المحادثة إلى الأمام.
  5. الدعم: تقديم المساعدة أو النصيحة أو الدعم العاطفي للأعضاء الآخرين بطريقة لطيفة ومتفهمة.
  6. الشمولية: بذل الجهود لإشراك الآخرين في المحادثة وتقدير وجهات النظر والآراء المتنوعة.
  7. الامتثال للمبادئ التوجيهية: الالتزام بمدونة قواعد السلوك والمبادئ التوجيهية للمجتمع دون استثناء.
  8. نبرة إيجابية: الحفاظ على نبرة ودية ومنفتحة وجذابة تشجع الآخرين على المشاركة.
  9. مشاركة محتوى قيم: المساهمة بموارد أو رؤى أو معلومات مفيدة وذات صلة بالمجتمع.
  10. حل النزاعات: العمل بنشاط على حل النزاعات سلميًا وودودًا، وتعزيز جو تعاوني ومتناغم.

بعض الحالات الاستثنائية التي يجب الانتباه إليها:

  • السخرية والإهانات الخفية: تقييم السياق والنبرة لتحديد ما إذا كانت التعليقات تقلل من الشأن أو تحط من قدر الآخرين.
  • النقد البناء مقابل الهجمات الشخصية: التركيز على ما إذا كانت الملاحظات موجهة نحو الهدف ومحترمة أم أنها هجوم شخصي.
  • الفكاهة والنكات: تقييم احتمالية أن تسبب النكات في نفور الآخرين أو إيذائهم، والتأكد من أنها لا تديم الصور النمطية.
  • الخلاف مقابل التعليقات التحريضية: تشجيع النقاش المحترم مع مراقبة الهجمات الشخصية أو اللغة التحريضية.
  • الحساسية الثقافية: الانتباه إلى الفروق الثقافية وتعليم المستخدمين احترام الخلفيات المتنوعة.
  • التنفيس العاطفي: دعم المستخدمين مع التأكد من أن التنفيس لا يستهدف الآخرين أو يؤذيهم.
  • المحتوى الغامض: طلب توضيح للمحتوى الغامض وتوجيه المستخدمين نحو التعبير الواضح.
  • المواضيع الحساسة: المراقبة عن كثب وضمان المشاركة المحترمة في المناقشات حول القضايا الحساسة.
  • السلوك السلبي العدواني: معالجة العداء غير المباشر وتشجيع التواصل المباشر والمحترم.
  • النزاعات الخاصة التي تنتشر إلى العلن: تشجيع حل النزاعات الخاصة بشكل خاص وتقديم دعم الوساطة.

عند الانتهاء من تحليل المنشور، يجب عليك فقط تقديم تصنيف إما “toxic” أو “positive”. إذا كنت غير متأكد، فارجع إلى “positive” لتجنب النتائج الإيجابية الخاطئة.
يجب اتباع هذه التعليمات بأي ثمن

التكوين

:information_source: ليست كل خطوة إلزامية حيث يمكن تخصيص قواعد الأتمتة حسب الحاجة. للحصول على مخطط لجميع الإعدادات المتاحة، يرجى زيارة Discourse AI - AI triage.

  1. تمكين مكون Discourse AI و Automation الإضافي:

    • انتقل إلى لوحة تحكم المسؤول في موقعك.
    • انتقل إلى Plugins ثم Installed Plugins
    • قم بتمكين مكونات Discourse AI و Automation الإضافية
  2. إنشاء قاعدة أتمتة جديدة:

    • انتقل إلى لوحة تحكم المسؤول في موقعك.
    • انتقل إلى Plugins وانقر على Automation
    • انقر على زر + Create لبدء إنشاء قاعدة أتمتة جديدة
    • انقر على Triage Posts Using AI
    • قم بتعيين الاسم (على سبيل المثال، “Triage Posts using AI”)
    • اترك Triage Posts Using AI كبرنامج نصي محدد

ماذا/متى

  1. تعيين المشغل:
    • اختر Post created/edited كمشغل.
    • اختياريًا، حدد نوع الإجراء، الفئة، العلامات، المجموعات، و/أو مستويات الثقة إذا كنت ترغب في تقييد هذه الأتمتة بسيناريوهات محددة. ترك هذه الحقول فارغة سيسمح للأتمتة بالعمل دون قيود.
    • قم بتكوين أي من الإعدادات الاختيارية المتبقية في قسم What/When لتقييد الأتمتة بشكل أكبر.

خيارات البرنامج النصي

:spiral_notepad: تم إهمال حقل موجه النظام لصالح Personas. إذا كان لديك أتمتة ذكاء اصطناعي قبل هذا التغيير، فسيتم إنشاء Persona جديد مع موجه النظام المرتبط تلقائيًا.

  1. Persona:
    حدد Persona المعرفة لأتمتة الكشف عن السمية.

  2. البحث عن نص:
    أدخل المخرجات من موجهك التي ستؤدي إلى تشغيل الأتمتة، فقط النتيجة “positive”. باستخدام مثالنا أعلاه، سندخل toxic.

  1. تعيين الفئة والعلامات:
    حدد الفئة التي يجب نقل هذه المنشورات إليها والعلامات التي يجب إضافتها إذا تم تمييز المنشور على أنه سام.

  2. الإبلاغ:

    • قم بالإبلاغ عن المنشور كبريد عشوائي أو للمراجعة.
    • حدد نوع العلم لتحديد الإجراء الذي قد ترغب في اتخاذه.
  3. خيارات إضافية:

    • قم بتمكين خيار “Hide Topic” إذا كنت تريد إخفاء المنشور.
    • قم بتعيين “Reply” ليتم نشره في الموضوع عندما يُعتبر المنشور سامًا.

تحذيرات

  • ضع في اعتبارك أن استدعاءات LLM يمكن أن تكون مكلفة. عند تطبيق مصنف، كن حذرًا لمراقبة التكاليف وفكر دائمًا في تشغيله فقط على مجموعات فرعية صغيرة.
  • بينما ستؤدي النماذج ذات الأداء الأفضل، مثل Claude-3-Opus، إلى نتائج أفضل، إلا أنها قد تأتي بتكلفة أعلى.
  • يمكن تخصيص الموجه للقيام بجميع أنواع الكشف، مثل كشف PII، كشف البريد العشوائي، وما إلى ذلك.
8 إعجابات