إعداد كشف السمية في مجتمعك

Discourse · 7 أغسطس 2024، 4:02م

هذا هو دليل how-to لإعداد الكشف عن المحتوى السام في مجتمعك باستخدام أداة تصنيف منشورات Discourse AI.
:
مستوى المستخدم المطلوب: مسؤول

نظرة عامة

في هذا الموضوع، سنستخدم Discourse AI - AI triage للكشف عن السُمّية وإنفاذ مدونة قواعد السلوك لمجتمعك. باستخدام هذا الدليل، سيصبح المسؤولون على دراية بهذه المنشورات ويتخذون الإجراءات اللازمة وفقًا لذلك.

لاحظ أنه يمكن تخصيص التعليمات هنا لتناسب تفضيلاتك.

المتطلبات الأساسية

لكي يعمل هذا، ستحتاج إلى تفعيل ما يلي:

Discourse AI
Discourse-Automation
Agent مع مطالبة نظام تُعرّف ما يشكل محتوى سامًا.
نموذج لغة كبير (LLM)
- يمكن للعملاء المستضافين بواسطة Discourse اختيار نموذج CDCK المستضاف الصغير (CDCK Hosted Small LLM) عند تكوين الوكلاء (Agents).
- سيحتاج مستخدمو Discourse المستضافون ذاتيًا إلى تكوين نموذج لغة كبير (LLM) تابع لجهة خارجية.

عند كتابة المطالبة، عند الاختيار بين “سام” و “غير سام”، تجنب استخدام لغة متشابهة للنتيجة النهائية. في هذا المثال، نستخدم toxic (سام) و positive (إيجابي) (لغير السُمّية).

مطالبات نموذج اللغة الكبير القابلة للنسخ للكشف عن المحتوى السام AI

أنت نموذج ذكاء اصطناعي للكشف عن السُمّية يساعد مشرفي المجتمعات عبر الإنترنت. مهمتك هي تحليل منشورات المنتدى وتحديد ما إذا كانت سامة ويجب إزالتها للحفاظ على مجتمع عالي الجودة ومناسب للموضوع.

يجب تصنيف المنشور على أنه سام إذا استوفى أيًا من المعايير التالية:

اللغة الضارة: استخدام الألفاظ النابية أو الإهانات أو المصطلحات المهينة الموجهة ضد أفراد أو مجموعات.
الهجمات الشخصية: استهداف أو مضايقة الأعضاء الآخرين بشكل مباشر، بما في ذلك التنابز بالألقاب أو التشهير أو التقليل من الشأن.
خطاب الكراهية: أي شكل من أشكال الكلام أو التعبير الذي يروج للكراهية أو التمييز أو العنف ضد أفراد أو مجموعات بناءً على العرق أو الأصل العرقي أو الدين أو الجنس أو التوجه الجنسي أو الإعاقة أو أي خاصية أخرى محمية.
التهديدات والترهيب: التعبير عن تهديدات بالعنف أو الترهيب تجاه مستخدم آخر.
البريد العشوائي والإخلال بالنظام: نشر محتوى غير مرتبط بالموضوع أو غير ذي صلة أو إعلانات أو رسائل متكررة تهدف إلى تعطيل المحادثة.
التعليقات الاستفزازية: إدلاء تصريحات تهدف إلى إثارة الغضب أو الخلاف أو الضيق العاطفي بين المستخدمين.
النبرة غير المحترمة: استخدام نبرة متعالية أو ساخرة أو رافضة تقوض الحوار البناء.
انتهاك الخصوصية: مشاركة معلومات شخصية عن المستخدمين الآخرين دون موافقتهم.
السلوك غير النزيه: نشر معلومات كاذبة أو شائعات أو الانخراط في ممارسات خادعة لتضليل المجتمع.
المحتوى الصريح جنسيًا: مشاركة أو عرض محتوى أو لغة جنسية غير مناسبة لسياق المجتمع.

يجب تصنيف المنشور على أنه إيجابي إذا:

لغة محترمة: استخدام لغة مهذبة ومراعية وشاملة تحترم جميع الأعضاء.
ملاحظات بناءة: تقديم نقد أو ملاحظات بناءة تهدف إلى تحسين أو دعم مساهمات الآخرين.
التشجيع والثناء: الاعتراف بإجراءات ومساهمات الآخرين الإيجابية وتقديرها.
حوار منتج: الانخراط في مناقشات هادفة ومفصلة تدفع المحادثة إلى الأمام.
الدعم: تقديم المساعدة أو المشورة أو الدعم العاطفي للأعضاء الآخرين بطريقة لطيفة ومتفهمة.
الشمولية: بذل الجهود لإشراك الآخرين في المحادثة وتقدير وجهات النظر والآراء المتنوعة.
الامتثال للمبادئ التوجيهية: الالتزام بمدونة قواعد السلوك والمبادئ التوجيهية للمجتمع دون استثناء.
نبرة إيجابية: الحفاظ على نبرة ودية ومفتوحة وجذابة تشجع الآخرين على المشاركة.
مشاركة محتوى قيّم: المساهمة بموارد أو رؤى أو معلومات مفيدة وذات صلة بالمجتمع.
حل النزاعات: العمل بنشاط من أجل حل النزاعات سلمياً وودياً، وتعزيز جو تعاوني ومتناغم.

بعض الحالات القصوى التي يجب الانتباه إليها:

السخرية والإهانات الخفية: قم بتقييم السياق والنبرة لتحديد ما إذا كانت التعليقات تقلل من الشأن أو تنتقص من قيمة الآخرين.
النقد البناء مقابل الهجمات الشخصية: ركز على ما إذا كانت الملاحظات موجهة نحو الهدف ومحترمة أم أنها هجوم شخصي.
الفكاهة والنكات: تقييم احتمالية أن تنفر النكات الآخرين أو تضر بهم، والتأكد من أنها لا تديم الصور النمطية.
الخلاف مقابل التعليقات الاستفزازية: شجع على النقاش المحترم مع مراقبة الهجمات الشخصية أو اللغة الاستفزازية.
الحساسية الثقافية: انتبه إلى الفروق الثقافية وقم بتثقيف المستخدمين حول احترام الخلفيات المتنوعة.
التنفيس العاطفي: ادعم المستخدمين مع ضمان أن التنفيس لا يستهدف الآخرين أو يضر بهم.
المحتوى الغامض: اطلب التوضيح بشأن المحتوى الغامض وقم بتوجيه المستخدمين نحو التعبير الواضح.
المواضيع الحساسة: راقب عن كثب وتأكد من المشاركة المحترمة في المناقشات حول القضايا الحساسة.
السلوك السلبي العدواني: عالج العداء غير المباشر وشجع على التواصل المباشر والمحترم.
تضارب المصالح الخاصة في العلن: شجع على حل النزاعات الخاصة بشكل خاص وقدم دعم الوساطة.

عند الانتهاء من تحليل المنشور، يجب عليك فقط تقديم تصنيف إما “toxic” (سام) أو “positive” (إيجابي). إذا كنت غير متأكد، فارجع افتراضياً إلى “positive” لتجنب النتائج الإيجابية الكاذبة.

يجب اتباع هذه التعليمات بأي ثمن

الإعداد

ليست كل خطوة إلزامية حيث يمكن تخصيص قواعد الأتمتة حسب الحاجة. للحصول على مخطط لجميع الإعدادات المتاحة، يرجى زيارة Discourse AI - AI triage.

تفعيل مكونات Discourse AI الإضافية والأتمتة (Automation):

انتقل إلى لوحة مسؤول موقعك.
انتقل إلى المكونات الإضافية (Plugins) ثم المكونات الإضافية المثبتة (Installed Plugins)
قم بتفعيل مكونات Discourse AI و Automation الإضافية.

إنشاء قاعدة أتمتة جديدة:

انتقل إلى لوحة مسؤول موقعك.
انتقل إلى المكونات الإضافية (Plugins) وانقر على الأتمتة (Automation)
انقر على الزر + Create (إنشاء) لبدء إنشاء قاعدة أتمتة جديدة
انقر على Triage Posts Using AI (تصنيف المنشورات باستخدام الذكاء الاصطناعي)
اضبط الاسم (على سبيل المثال، “تصنيف المنشورات باستخدام الذكاء الاصطناعي”)
اترك Triage Posts Using AI كبرنامج نصي محدد.

ماذا/متى

تعيين المشغل (Trigger):

اختر Post created/edited (تم إنشاء/تحرير المنشور) كالمشغل.
اختياريًا، حدد نوع الإجراء (Action type) أو الفئة (Category) أو العلامات (Tags) أو المجموعات (Groups) و/أو مستويات الثقة (Trust Levels) إذا كنت ترغب في تقييد هذه الأتمتة لسيناريوهات محددة. ترك هذه الحقول فارغة سيسمح للأتمتة بالعمل دون قيود.
قم بتهيئة أي من الإعدادات الاختيارية المتبقية في قسم What/When (ماذا/متى) لتقييد الأتمتة بشكل أكبر.

خيارات البرنامج النصي (Script Options)

تم إهمال حقل مطالبة النظام (system prompt field) لصالح الوكلاء (Agents). إذا كان لديك أتمتة ذكاء اصطناعي سابقة لهذا التغيير، فسيتم إنشاء وكيل جديد تلقائيًا مع مطالبة النظام المرتبطة به.

الوكيل (Agent):

حدد الوكيل المحدد لأتمتة الكشف عن السُمّية.
البحث عن نص (Search for Text):

أدخل المخرجات من مطالبتك التي ستؤدي إلى تشغيل الأتمتة، فقط النتيجة “positive” (إيجابية). باستخدام مثالنا أعلاه، سنقوم بإدخال toxic (سام).

تعيين الفئة والعلامات (Set Category and Tags):

حدد الفئة التي يجب نقل هذه المنشورات إليها والعلامات التي سيتم إضافتها إذا تم وضع علامة على المنشور على أنه سام.
الوضع بالعلامة (Flagging):

قم بتمكين خيار “Flag post” (وضع علامة على المنشور) لوضع علامة على المنشور.
حدد نوع العلامة لتحديد الإجراء الذي سيتم اتخاذه. الخيارات المتاحة:
- Add post to review queue (إضافة المنشور إلى قائمة انتظار المراجعة) - يرسل المنشور إلى قائمة انتظار المراجعة لإجراء المشرف.
- Add post to review queue and hide post (إضافة المنشور إلى قائمة انتظار المراجعة وإخفاء المنشور) - يضع علامة للمراجعة ويخفي المنشور على الفور.
- Add post to review queue and delete post (إضافة المنشور إلى قائمة انتظار المراجعة وحذف المنشور) - يضع علامة للمراجعة ويحذف المنشور حذفًا ناعمًا.
- Add post to review queue, delete post and silence user (إضافة المنشور إلى قائمة انتظار المراجعة، وحذف المنشور وإسكات المستخدم) - يضع علامة للمراجعة، ويحذف المنشور حذفًا ناعمًا، ويُسكت المؤلف.
- Flag as spam and hide post (وضع علامة كبريد عشوائي وإخفاء المنشور) - يضع علامة كبريد عشوائي ويخفي المنشور.
- Flag as spam, hide post and silence user (وضع علامة كبريد عشوائي، وإخفاء المنشور وإسكات المستخدم) - يضع علامة كبريد عشوائي، ويخفي المنشور، ويُسكت المؤلف.

خيارات إضافية (Additional Options):

قم بتمكين خيار “Hide Topic” (إخفاء الموضوع) إذا كنت تريد إخفاء الموضوع.
عيّن “Reply” (رد) سيتم نشره في الموضوع عندما يتم اعتبار المنشور سامًا، مع تحديد “Reply User” (مستخدم الرد) اختياريًا.
استخدم خيار “Reply Agent” (وكيل الرد) لجعل وكيل ذكاء اصطناعي ينشئ ردًا ديناميكيًا بدلاً من رد مُعد مسبقًا. سيتم إعطاء الأولوية لهذا على الرد المعد مسبقًا إذا تم تعيين كليهما.
قم بتمكين “Reply as Whisper” (الرد كهمسة) لجعل الرد مرئيًا للموظفين فقط.
قم بتمكين “Notify author via PM” (إخطار المؤلف عبر رسالة خاصة) لإرسال رسالة خاصة إلى مؤلف المنشور عند وضع علامة على محتواه. يمكنك اختياريًا تحديد مرسل الرسالة الخاصة ورسالة مخصصة.

محاذير (Caveats)

ضع في اعتبارك أن استدعاءات نموذج اللغة الكبير (LLM) يمكن أن تكون مكلفة. عند تطبيق المصنف، كن حذرًا في مراقبة التكاليف وفكر دائمًا في تشغيل هذا على مجموعات صغيرة فقط.
في حين أن النماذج ذات الأداء الأفضل ستؤدي إلى نتائج أفضل، إلا أنها قد تأتي بتكلفة أعلى.
يمكن تخصيص المطالبة للقيام بكل أنواع الكشف، مثل كشف تسرب المعلومات الشخصية (PII)، أو الكشف عن البريد العشوائي، إلخ.

الموضوع		الردود	مرات العرض
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	2	482	7 يوليو 2023
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	0	1377	10 أكتوبر 2024
What's next for Toxicity detection in Discourse AI Announcements automation , ai , ai-toxicity	8	525	5 ديسمبر 2024
Experiments with AI based moderation on Discourse Meta Community Building moderation , ai	11	1244	26 مايو 2025
Discourse AI - AI triage Site Management automation , how-to , ai	49	5905	7 يوليو 2025