اكتشاف البريد العشوائي بالذكاء الاصطناعي كان ناجحًا للغاية وساعد العديد من مجتمعاتنا على النجاح.
في هذا المنشور، أود مشاركة تفاصيل حول تجربتنا “قيد التقدم”، في حال كانت مفيدة لمجتمعات أخرى.
أنوي الحفاظ على هذا المنشور محدثًا مع تقدم التجربة ومشاركة بعض المعلومات حول فئة المشكلات التي يمكنها اكتشافها.
لكن كن على علم: هذا نظام متطور، وليس منتجًا نهائيًا بعد.
لماذا الإشراف بالذكاء الاصطناعي؟
أحد الأساليب الرئيسية التي نتبعها مع تكامل الذكاء الاصطناعي في Discourse هو أنه يجب أن يضيف قيمة للمشرفين البشريين، بدلاً من استبدالهم. الوعد بالإشراف بالذكاء الاصطناعي هو أنه يمكنه إشارة للمشرفين بأن “هناك خطأ ما” وتقديم توصيات بشأن الإجراءات التي يجب عليهم اتخاذها. يجب أن تظل الوكالة بالكامل للمشرفين البشريين.
لماذا الدردشة كوسيلة لهذه التجربة؟
عندما قمت بتركيب تجربتي، اخترت استخدام الدردشة كوسيلة للإشعارات. هذا يسمح بقناة مخصصة للتجربة لا تتداخل مع الإشراف العام على المنتدى.
نظرًا لأن بناء وصقل المطالبات هو عمل قيد التقدم إلى حد كبير، فإن إزعاج فريق الإشراف الآخر على meta لم يكن يبدو نهجًا جيدًا.
عندما تعطي الناس مشاريع ذكاء اصطناعي غير مكتملة للغاية، يمكنك بسهولة فقدان كل الثقة والدعم المستقبلي.
ماذا عن الاختبار المجمع؟
أحد قيود نظام الأتمتة الحالي لدينا هو أنه لا يمكنك حاليًا اختبار التغييرات بشكل مجمع. هذا يعني أنه عندما تجري تغييرات على مطالبات الذكاء الاصطناعي، يكون هناك تأخير طويل حتى تكتشف مدى فائدتها.
هذا يمثل مشكلة بشكل خاص إذا كنت ترى عددًا قليلاً فقط من المشكلات في المنتدى خلال اليوم. وقت رد الفعل بطيء جدًا ويمكن أن يستغرق الأمر أشهرًا لصقل مطالبة.
أنا على دراية تامة بهذا القيد وآمل في حذف هذا القسم من المنشور خلال الأسابيع القليلة القادمة، لأن لدينا نظامًا للقيام بذلك.
كيف يتم تكوين هذا؟
تجربتي الحالية تبني على 3 ميزات:
- الأتمتة - مستجيب شخصية الذكاء الاصطناعي
- Discourse AI - شخصية الذكاء الاصطناعي
- Discourse AI - أدوات مخصصة
أتمتة المستجيب لدينا
الشيء الأكثر بروزًا في المستجيب هو أن المستجيب صامت، مما يعني أنه لن يهمس أو ينشر في الموضوع الذي يقوم بفرزه.
إشراف شخصيتنا
الشيء الأكثر بروزًا هنا هو الأداة الإجبارية، وهذا يعني أن كل مشاركة سيتم الحكم عليها باستخدام أداة حكم المشاركات.
مطالبتنا النظامية الحالية هي هذه: (سيتم تحديثها أثناء تقدمنا)
مطالبة النظام
أنت مشرف ذكاء اصطناعي لـ meta.discourse.org، منتدى مناقشة Discourse الرسمي. دورك هو المساعدة في الحفاظ على “مكان نظيف ومضاء جيدًا للحوار العام المتحضر” بما يتماشى مع إرشادات مجتمعنا.
فلسفة الإشراف:
- انظر إلى هذا المنتدى كمورد مجتمعي مشترك، مثل حديقة عامة
- استخدم الإرشادات للمساعدة في الحكم البشري، وليس كقواعد صارمة
- ركز على تحسين المناقشات بدلاً من مجرد فرض القواعد
- تحقيق التوازن بين التسهيل والإشراف
إطار تقييم المحتوى:
- تحسين المناقشة
- تقييم ما إذا كانت المشاركات تضيف قيمة للمحادثة
- التعرف على المشاركات التي تظهر الاحترام للمواضيع والمشاركين
- دعم استكشاف المناقشات الحالية قبل بدء مناقشات جديدة
- معايير الاختلاف
- التمييز بين انتقاد الأفكار (مقبول) وانتقاد الأشخاص (غير مقبول)
- الإشارة إلى حالات: تسمية الأشخاص، الهجمات الشخصية، ردود النبرة، التناقضات المفاجئة
- تقييم ما إذا كانت الحجج المضادة منطقية وتحسن المحادثة
- جودة المشاركة
- إعطاء الأولوية للمناقشات التي تجعل المنتدى مكانًا مثيرًا للاهتمام
- النظر في إشارات المجتمع (الإعجابات، الأعلام، الردود) في التقييم
- دعم المحتوى الذي يترك المجتمع “أفضل مما وجدناه”
- تحديد المشكلات
- التركيز على الإشارة إلى السلوك السيئ بدلاً من التفاعل معه
- التعرف على متى يجب أن تؤدي الأعلام إلى اتخاذ إجراء (تلقائيًا أو بواسطة مشرفين بشريين)
- تذكر أن المشرفين والمستخدمين على حد سواء يتحملون مسؤولية المنتدى
- فرض الحضارة
- تحديد الكلام المسيء أو المسيء أو خطاب الكراهية المحتمل
- الإشارة إلى المحتوى الفاحش أو الجنسي الصريح
- مراقبة المضايقات أو انتحال الشخصية أو كشف المعلومات الخاصة
- منع البريد العشوائي أو تخريب المنتدى
- صيانة التنظيم
- ملاحظة المواضيع المنشورة في فئات خاطئة
- تحديد النشر المتقاطع عبر مواضيع متعددة
- الإشارة إلى الردود التي لا تحتوي على محتوى وتحويلات المواضيع
- تثبيط تواقيع المشاركات
- ملكية المحتوى
- الإشارة إلى النشر غير المصرح به لمحتوى رقمي للآخرين
- تحديد انتهاكات الملكية الفكرية المحتملة
عند تقييم المحتوى، ضع في اعتبارك السياق وتاريخ المستخدم ومعايير المنتدى. هدفك هو التوجيه بدلاً من العقاب، والتعليم بدلاً من الإنفاذ، ولكن الحفاظ على معايير متسقة تحافظ على جودة المناقشة.
احكم على جميع المشاركات، إذا كانت المشاركة لا تتطلب إشرافًا، استخدم أولوية التجاهل.
أداة حكم المشاركات المخصصة لدينا
البرنامج النصي الذي يشغله
function invoke(params) {
let post,topic;
if (params.priority !== "ignore") {
// post_id للاختبار
const post_id = context.post_id || 1735240;
post = discourse.getPost(post_id);
topic = post.topic;
let statusEmoji = "";
if (params.priority === "urgent") {
statusEmoji = ":police_car_light:"; // دائرة حمراء للعاجل
} else if (params.priority === "medium") {
statusEmoji = ":warning:"; // دائرة برتقالية للمتوسط
} else if (params.priority === "low") {
statusEmoji = ":writing_hand:"; // دائرة خضراء للمنخفض
}
const message = `${statusEmoji} [${topic.title} - ${post.username}](${post.post_url}): ${params.message}`;
discourse.createChatMessage({ channel_name: "AI Moderation", username: "AI-moderation-bot", message: message});
}
chain.setCustomRaw("Post was classified");
return "done";
}
function details() {
return "Judge Post";
}
يستخدم البرنامج النصي عددًا قليلاً من التقنيات المتقدمة:
chain.setCustomRawهذا يخبر الشخصية بالتوقف عن تشغيل سلسلة LLM ويجعل المكالمة إلى الأداة هي المكالمة النهائية، مما يوفر الرموز.discourse.createChatMessageواجهة برمجة تطبيقات جديدة يمكن استخدامها من الأدوات لإنشاء رسائل دردشة.discourse.getPostوالتي تستخدم للحصول على معلومات المشاركة.
بالنظر إلى هذا، أنا قادر على اختبار الأداة باستخدام زر الاختبار والتأكد من أنها تعمل بشكل جيد:
ما هو النموذج الذي تستخدمه؟
في الوقت الحالي، نستخدم Sonnet 3.7، وهو نموذج رائد. ومع ذلك، نخطط للانتقال إلى Gemini Flash بمجرد إجراء بعض التحسينات على Discourse Automation، لا سيما القدرة على إخباره بمسح المحتوى العام فقط وتجنب الفئات الآمنة.
يسعدني الإجابة على الأسئلة هنا وسأستمر في التحديث مع تقدم التجربة وإطلاق المزيد من ميزات Discourse Automation.






