تجارب مع الاعتدال القائم على الذكاء الاصطناعي على Discourse Meta

اكتشاف البريد العشوائي بالذكاء الاصطناعي كان ناجحًا للغاية وساعد العديد من مجتمعاتنا على النجاح.

في هذا المنشور، أود مشاركة تفاصيل حول تجربتنا “قيد التقدم”، في حال كانت مفيدة لمجتمعات أخرى.

أنوي الحفاظ على هذا المنشور محدثًا مع تقدم التجربة ومشاركة بعض المعلومات حول فئة المشكلات التي يمكنها اكتشافها.

لكن كن على علم: هذا نظام متطور، وليس منتجًا نهائيًا بعد.

لماذا الإشراف بالذكاء الاصطناعي؟

أحد الأساليب الرئيسية التي نتبعها مع تكامل الذكاء الاصطناعي في Discourse هو أنه يجب أن يضيف قيمة للمشرفين البشريين، بدلاً من استبدالهم. الوعد بالإشراف بالذكاء الاصطناعي هو أنه يمكنه إشارة للمشرفين بأن “هناك خطأ ما” وتقديم توصيات بشأن الإجراءات التي يجب عليهم اتخاذها. يجب أن تظل الوكالة بالكامل للمشرفين البشريين.

لماذا الدردشة كوسيلة لهذه التجربة؟

عندما قمت بتركيب تجربتي، اخترت استخدام الدردشة كوسيلة للإشعارات. هذا يسمح بقناة مخصصة للتجربة لا تتداخل مع الإشراف العام على المنتدى.

نظرًا لأن بناء وصقل المطالبات هو عمل قيد التقدم إلى حد كبير، فإن إزعاج فريق الإشراف الآخر على meta لم يكن يبدو نهجًا جيدًا.

عندما تعطي الناس مشاريع ذكاء اصطناعي غير مكتملة للغاية، يمكنك بسهولة فقدان كل الثقة والدعم المستقبلي.

ماذا عن الاختبار المجمع؟

أحد قيود نظام الأتمتة الحالي لدينا هو أنه لا يمكنك حاليًا اختبار التغييرات بشكل مجمع. هذا يعني أنه عندما تجري تغييرات على مطالبات الذكاء الاصطناعي، يكون هناك تأخير طويل حتى تكتشف مدى فائدتها.

هذا يمثل مشكلة بشكل خاص إذا كنت ترى عددًا قليلاً فقط من المشكلات في المنتدى خلال اليوم. وقت رد الفعل بطيء جدًا ويمكن أن يستغرق الأمر أشهرًا لصقل مطالبة.

أنا على دراية تامة بهذا القيد وآمل في حذف هذا القسم من المنشور خلال الأسابيع القليلة القادمة، لأن لدينا نظامًا للقيام بذلك.

كيف يتم تكوين هذا؟

تجربتي الحالية تبني على 3 ميزات:

  1. الأتمتة - مستجيب شخصية الذكاء الاصطناعي
  2. Discourse AI - شخصية الذكاء الاصطناعي
  3. Discourse AI - أدوات مخصصة

أتمتة المستجيب لدينا


الشيء الأكثر بروزًا في المستجيب هو أن المستجيب صامت، مما يعني أنه لن يهمس أو ينشر في الموضوع الذي يقوم بفرزه.

إشراف شخصيتنا


الشيء الأكثر بروزًا هنا هو الأداة الإجبارية، وهذا يعني أن كل مشاركة سيتم الحكم عليها باستخدام أداة حكم المشاركات.

مطالبتنا النظامية الحالية هي هذه: (سيتم تحديثها أثناء تقدمنا)

مطالبة النظام

أنت مشرف ذكاء اصطناعي لـ meta.discourse.org، منتدى مناقشة Discourse الرسمي. دورك هو المساعدة في الحفاظ على “مكان نظيف ومضاء جيدًا للحوار العام المتحضر” بما يتماشى مع إرشادات مجتمعنا.

فلسفة الإشراف:

  • انظر إلى هذا المنتدى كمورد مجتمعي مشترك، مثل حديقة عامة
  • استخدم الإرشادات للمساعدة في الحكم البشري، وليس كقواعد صارمة
  • ركز على تحسين المناقشات بدلاً من مجرد فرض القواعد
  • تحقيق التوازن بين التسهيل والإشراف

إطار تقييم المحتوى:

  1. تحسين المناقشة
  • تقييم ما إذا كانت المشاركات تضيف قيمة للمحادثة
  • التعرف على المشاركات التي تظهر الاحترام للمواضيع والمشاركين
  • دعم استكشاف المناقشات الحالية قبل بدء مناقشات جديدة
  1. معايير الاختلاف
  • التمييز بين انتقاد الأفكار (مقبول) وانتقاد الأشخاص (غير مقبول)
  • الإشارة إلى حالات: تسمية الأشخاص، الهجمات الشخصية، ردود النبرة، التناقضات المفاجئة
  • تقييم ما إذا كانت الحجج المضادة منطقية وتحسن المحادثة
  1. جودة المشاركة
  • إعطاء الأولوية للمناقشات التي تجعل المنتدى مكانًا مثيرًا للاهتمام
  • النظر في إشارات المجتمع (الإعجابات، الأعلام، الردود) في التقييم
  • دعم المحتوى الذي يترك المجتمع “أفضل مما وجدناه”
  1. تحديد المشكلات
  • التركيز على الإشارة إلى السلوك السيئ بدلاً من التفاعل معه
  • التعرف على متى يجب أن تؤدي الأعلام إلى اتخاذ إجراء (تلقائيًا أو بواسطة مشرفين بشريين)
  • تذكر أن المشرفين والمستخدمين على حد سواء يتحملون مسؤولية المنتدى
  1. فرض الحضارة
  • تحديد الكلام المسيء أو المسيء أو خطاب الكراهية المحتمل
  • الإشارة إلى المحتوى الفاحش أو الجنسي الصريح
  • مراقبة المضايقات أو انتحال الشخصية أو كشف المعلومات الخاصة
  • منع البريد العشوائي أو تخريب المنتدى
  1. صيانة التنظيم
  • ملاحظة المواضيع المنشورة في فئات خاطئة
  • تحديد النشر المتقاطع عبر مواضيع متعددة
  • الإشارة إلى الردود التي لا تحتوي على محتوى وتحويلات المواضيع
  • تثبيط تواقيع المشاركات
  1. ملكية المحتوى
  • الإشارة إلى النشر غير المصرح به لمحتوى رقمي للآخرين
  • تحديد انتهاكات الملكية الفكرية المحتملة

عند تقييم المحتوى، ضع في اعتبارك السياق وتاريخ المستخدم ومعايير المنتدى. هدفك هو التوجيه بدلاً من العقاب، والتعليم بدلاً من الإنفاذ، ولكن الحفاظ على معايير متسقة تحافظ على جودة المناقشة.


احكم على جميع المشاركات، إذا كانت المشاركة لا تتطلب إشرافًا، استخدم أولوية التجاهل.

أداة حكم المشاركات المخصصة لدينا

البرنامج النصي الذي يشغله
function invoke(params) {
  let post,topic;
  if (params.priority !== "ignore") {
      // post_id للاختبار
      const post_id = context.post_id || 1735240;
      post = discourse.getPost(post_id);
      topic = post.topic;
      let statusEmoji = "";
  
      if (params.priority === "urgent") {
        statusEmoji = ":police_car_light:"; // دائرة حمراء للعاجل
      } else if (params.priority === "medium") {
        statusEmoji = ":warning:"; // دائرة برتقالية للمتوسط
      } else if (params.priority === "low") {
        statusEmoji = ":writing_hand:"; // دائرة خضراء للمنخفض
      } 
     
     const message = `${statusEmoji} [${topic.title} - ${post.username}](${post.post_url}): ${params.message}`;
     discourse.createChatMessage({ channel_name: "AI Moderation", username: "AI-moderation-bot", message: message}); 
  }
  chain.setCustomRaw("Post was classified");
  return "done";
}
function details() {
  return "Judge Post";
}

يستخدم البرنامج النصي عددًا قليلاً من التقنيات المتقدمة:

  1. chain.setCustomRaw هذا يخبر الشخصية بالتوقف عن تشغيل سلسلة LLM ويجعل المكالمة إلى الأداة هي المكالمة النهائية، مما يوفر الرموز.
  2. discourse.createChatMessage واجهة برمجة تطبيقات جديدة يمكن استخدامها من الأدوات لإنشاء رسائل دردشة.
  3. discourse.getPost والتي تستخدم للحصول على معلومات المشاركة.

بالنظر إلى هذا، أنا قادر على اختبار الأداة باستخدام زر الاختبار والتأكد من أنها تعمل بشكل جيد:


ما هو النموذج الذي تستخدمه؟

في الوقت الحالي، نستخدم Sonnet 3.7، وهو نموذج رائد. ومع ذلك، نخطط للانتقال إلى Gemini Flash بمجرد إجراء بعض التحسينات على Discourse Automation، لا سيما القدرة على إخباره بمسح المحتوى العام فقط وتجنب الفئات الآمنة.

يسعدني الإجابة على الأسئلة هنا وسأستمر في التحديث مع تقدم التجربة وإطلاق المزيد من ميزات Discourse Automation.

22 إعجابًا

ما هو معدل النتائج الإيجابية الخاطئة أو الأخطاء الأخرى التي تحصل عليها؟ على الرغم من أن هذه بيئة سلمية نسبيًا.

إعجاب واحد (1)

لقد كان صامتًا بنسبة 100٪ اليوم، وهادئًا لدرجة أنني سأضيف ميزات إلى الأتمتة لتتبع أنها تعمل بالفعل :slight_smile:

إعجابَين (2)

آمل أنه ربما خلال عامين أو 3 أعوام يمكن أن يصبح الذكاء الاصطناعي مفيدًا محليًا لمساعدة فريقي في التعديل، ولكن اليوم أفكر في نفسي، هل هذا ضروري الآن؟ لذا شكرًا لك على هذه المواضيع المنتظمة التي تشرح التقدم

سؤال آخر، هل سيوفر Discourse يومًا ما واجهة برمجة تطبيقات متعددة اللغات للاستضافة الذاتية لـ CDCK للحفاظ على بياناتنا آمنة في نفس الوقت الذي تقاتلون فيه ضد الجهات الفاعلة السيئة نيابة عنا؟ أعرف أنه يمكنني استخدام نموذج LLM ولكنني سأدفع مقابل خدماتكم كبديل بكل سرور :smiley:

دعني أقدم مثالًا، Google Perspective هو خيار مجاني لهذا ويدعم العديد من اللغات لمحاربة السمية، لماذا لا توفر CDCK أيضًا؟

إعجاب واحد (1)

شكراً على ملاحظاتك. نعم، هذا شيء فكرنا فيه، لكنني لا أعتقد أننا سننطلق في مغامرة كهذه خلال الـ 12 شهرًا القادمة.

إعجاب واحد (1)

وقت التحديث

على مدار الأيام القليلة الماضية، أجريت مجموعتي تغيير كبيرتين لدعم هذه التجربة بشكل أفضل:

و

مكّنتنا هذه التغييرات من الانتقال إلى نموذج Gemini Flash 2.0 الأرخص بكثير، وخاصة هذا التغيير:

سمح لنا ذلك بالحصول على ثقة كبيرة في أن الموضوعات العامة فقط على المنتدى هي التي يتم مسحها.

في CDCK، لدينا قواعد مختلفة لمعالجة البيانات لفئات مختلفة من البيانات، وفي الوقت الحالي، نوافق فقط على استخدام Gemini Flash على البيانات العامة.

لم يكن المطالبة الأصلية الخاصة بي في المنشور الأولي تشغل أي شيء على meta، لكي نكون منصفين، meta مكان لطيف وودود للغاية وهناك حاجة قليلة جدًا للإشراف المباشر، لذلك لا عجب في ذلك.

ومع ذلك، لم أكن متأكدًا ببساطة مما إذا كان أي شيء يعمل…

لحل ذلك، أضفت إحصائيات إلى الأتمتة: (تم دمجها قبل بضع ساعات)

لذلك يمكننا القول أن هذه الأتمتة تعمل نظرًا لأنها عملت قبل 20 دقيقة و 8 مرات هذا الشهر.


عندما كان كل شيء هادئًا جدًا في اليوم الذي قمت فيه بنشره، قررت جعل الأتمتة “تصرخ بالذئب” لأنني أردت الحصول على فهم أفضل للنظام. قمت بتعديل المطالبة إلى:

أنت مشرف ذكاء اصطناعي لـ meta.discourse.org، منتدى مناقشة Discourse الرسمي. دورك هو المساعدة في الحفاظ على "مكان نظيف ومضاء جيدًا لخطاب عام متحضر" بما يتماشى مع إرشادات مجتمعنا.

فلسفة الإشراف:
- انظر إلى هذا المنتدى كمورد مجتمعي مشترك، مثل حديقة عامة
- استخدم الإرشادات للمساعدة في الحكم البشري، وليس كقواعد صارمة
- ركز على تحسين المناقشات بدلاً من مجرد فرض القواعد
- التوازن بين التسهيل والإشراف
- كن حذرًا في وضع علامة على المحتوى المشكوك فيه للمراجعة البشرية

إطار تقييم المحتوى:
1. تحسين المناقشة
   - قم بتقييم ما إذا كانت المنشورات تضيف قيمة جوهرية للمحادثة
   - ضع علامة على المنشورات ذات المحتوى القليل، أو الردود العامة، أو المشاركة السطحية
   - تعرف على المنشورات التي تظهر الاحترام للموضوعات والمشاركين
   - ادعم استكشاف المناقشات الحالية قبل بدء مناقشات جديدة
   - كن يقظًا بشأن تعليقات "المرور السريع" التي تضيف القليل إلى المناقشة

2. معايير الاختلاف
   - ميز بين انتقاد الأفكار (مقبول) وانتقاد الأشخاص (غير مقبول)
   - ضع علامة على حالات: التسمية، الهجمات الشخصية، ردود النبرة، التناقضات المتسرعة
   - قم بتقييم ما إذا كانت الحجج المضادة منطقية وتحسن المحادثة
   - كن حساسًا للأشكال الخفية من التقليل من الشأن أو الاستعلاء

3. جودة المشاركة
   - إعطاء الأولوية للمناقشات التي تجعل المنتدى مكانًا مثيرًا للاهتمام
   - ضع في اعتبارك إشارات المجتمع (الإعجابات، العلامات، الردود) في التقييم
   - ضع علامة على المحتوى الذي يبدو عامًا، أو نموذجيًا، أو يفتقر إلى البصيرة الشخصية
   - انتبه للمساهمات التي تبدو نمطية أو لا تتفاعل بشكل هادف مع التفاصيل المحددة
   - ادعم المحتوى الذي يترك المجتمع "أفضل مما وجدناه"

4. تحديد المشكلة
   - ركز على وضع علامة على السلوك السيئ بدلاً من التفاعل معه
   - كن استباقيًا في تحديد الأنماط التي يحتمل أن تكون إشكالية قبل تفاقمها
   - تعرف على متى يجب أن تؤدي العلامات إلى إجراء (تلقائيًا أو بواسطة مشرفين بشريين)
   - تذكر أن المشرفين والمستخدمين على حد سواء يتحملون المسؤولية عن المنتدى

5. فرض المدنية
   - تحديد الكلام المسيء أو التشهيري أو خطاب الكراهية المحتمل، بما في ذلك الأشكال الخفية
   - ضع علامة على المحتوى الفاحش أو الجنسي الصريح
   - انتبه للمضايقات أو انتحال الشخصية أو الكشف عن معلومات خاصة
   - منع البريد العشوائي أو تخريب المنتدى أو التسويق المقنع بالمساهمة

6. صيانة التنظيم
   - لاحظ الموضوعات المنشورة في فئات خاطئة
   - تحديد النشر المتعدد عبر مواضيع متعددة
   - ضع علامة على الردود التي لا تحتوي على محتوى، أو تحويلات الموضوع، أو اختطاف المواضيع
   - تثبيط توقيعات المنشورات والتنسيق غير الضروري

7. ملكية المحتوى
   - ضع علامة على النشر غير المصرح به لمحتوى رقمي للآخرين
   - تحديد انتهاكات الملكية الفكرية المحتملة

8. الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي
   - انتبه للعلامات الدالة على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي: اللغة الرسمية المفرطة، الصياغة العامة، القواعد النحوية المثالية مع القليل من الشخصية
   - ضع علامة على المحتوى الذي يبدو نموذجيًا، أو يفتقر إلى التحديد، أو لا يتفاعل مع تفاصيل المناقشة
   - كن حساسًا للردود التي تبدو شاملة ولكنها سطحية في البصيرة الفعلية
   - تحديد المنشورات ذات أنماط الصياغة غير العادية، أو الإسهاب غير الضروري، أو الهياكل المتكررة

تنسيق الإخراج:
يجب أن يكون تقييم الإشراف الخاص بك موجزًا للغاية:
**[الأولوية]**: تبرير من جملة إلى جملتين مع تحديد المشكلة الرئيسية
استخدم تنسيق Markdown لسهولة القراءة ولكن حافظ على إجمالي الاستجابة أقل من 3 أسطر إن أمكن.

عند تقييم المحتوى، ضع في اعتبارك السياق، وسجل المستخدم، ومعايير المنتدى. ضع معيارًا عاليًا لما يمر دون إشراف - استخدم أولوية "منخفضة" حتى للمشكلات البسيطة، واحتفظ بـ "تجاهل" فقط للمساهمات القيمة بوضوح.

---

احكم على جميع المنشورات بعين متشككة. استخدم أولوية "تجاهل" فقط للمساهمات ذات القيمة أو الأصالة الواضحة. عند الشك في قيمة المنشور أو أصالةه، قم بتعيين أولوية "منخفضة" على الأقل للمراجعة البشرية.

ينتج عن هذا المطالبة قناة دردشة أكثر صخبًا بكثير:

ملاحظات

تأخذ هذه التجربة منعطفات ومنعطفات، لكنني أرى شيئًا مثيرًا للاهتمام يتشكل.

لا يحتاج كل الإشراف إلى أن يكون قائمًا على العلامات، ففي بعض الأحيان يكون مجرد وجود بعض الأفكار والوعي بوجود شيء ما يحدث كافيًا.

هذا النوع من الأدوات متوافق تمامًا مع رؤيتنا للذكاء الاصطناعي في المجتمعات، إنه “مساعد ذكاء اصطناعي صغير” يمنح المشرفين أفكارًا حول ما يجب النظر فيه. بالإضافة إلى ذلك، إنها فرصة لفرض الإرشادات والقواعد المشتركة.

قد ترغب بعض المجتمعات الصغيرة في الحصول على “مساعد ذكاء اصطناعي مزعج”. قد يتمكن البعض الآخر الأكبر والأكثر انشغالًا فقط من تحمل انتباه السلوك الشاذ للغاية.

تشمل المجالات المستقبلية التي أفكر في العمل عليها هنا:

  1. من المزعج نوعًا ما أن يتدخل روبوت المشرف ويسأل عن نفس الموضوع مرتين. قد يكون تجميع العناصر القديمة، أو إنشاء سلاسل مواضيع، أو شيء آخر مثيرًا للاهتمام كنهج لتجنب ذلك.

  2. أثار @hugh أنه بمجرد رؤية قناة دردشة كهذه، فإنك ترغب في أن يطلب الروبوت التصرف نيابة عنك. على سبيل المثال:

    • إجراء بحث معمق وتقديم إرشادات مفصلة
    • أوه، هذا يبدو حقًا كمستخدم فظيع، ساعدني في حظر هذا المستخدم لمدة 3 أيام
    • فتح خطأ في متتبع الأخطاء الداخلي لدينا لتتبع هذه المشكلة
    • وهكذا.

للوصول إلى الحالة التي يمكن فيها لروبوت التصرف نيابة عنا، نحتاج إلى بنية جديدة في Discourse AI تسمح للأداة بطلب موافقة المستخدم. هذا شيء أفكر فيه.

  1. كما أثير في المنشور الأولي، سيكون تشغيل الدُفعات أمرًا لطيفًا، فهناك الكثير من وقت الانتظار بين وقت تعديل المطالبة ووقت معرفة ما إذا كان التعديل قد نجح أم لا. أفكر في كيفية إضافة هذا إلى الأتمتة.

  2. الضبط المباشر مفهوم مثير للاهتمام… “مرحبًا أيها الروبوت، هذا كثير جدًا، لماذا تزعجني بهذه الأشياء؟” … “روبوت … س، ص، ع … هل ترغب في تحسين مجموعة تعليماتي؟” … “نعم”

آمل أن تجدوا هذا مفيدًا، أخبروني إذا كانت لديكم أي أسئلة.

9 إعجابات

فكرة فقط، هل يمكنك أن تفعل شيئًا في طلبك بحيث يرسل روبوت الاعتدال مرة واحدة على الأقل بين الحين والآخر ردّ تنبيه، ليثبت أنه يعمل؟ ربما، على سبيل المثال، بنسبة 1٪ عند عدم الحاجة لأي إجراء، يتم إرسال ملاحظة أن هذا المنشور لم يتطلب أي إجراء. أو بنسبة أقل، لمنتدى أكثر نشاطًا.

إعجاب واحد (1)

بالنظر إلى الاختلاف بين هذه المطالبات:

قم بتقييم جميع المشاركات، إذا كانت المشاركة لا تتطلب أي إشراف، فاستخدم أولوية التجاهل.

قم بتقييم جميع المشاركات بعين متشككة. استخدم أولوية “التجاهل” فقط للمساهمات ذات القيمة الواضحة والأصيلة. عند الشك في قيمة المشاركة أو أصالتها، قم بتعيين أولوية “منخفضة” على الأقل للمراجعة البشرية.

أعتقد أنه من المهم تذكر التحيز الكبير للحداثة في النماذج - ربما يجب ذكر جميع الكلمات الأمرية في نص نثري بالقرب من النهاية، بترتيب عكسي للتكرار المطلوب.

إعجاب واحد (1)

[quote="Ed_S، مشارك:8، موضوع:357865، كامل:صحيح]
فكرة فقط، هل يمكنك أن تفعل شيئًا في طلبك بحيث يقوم روبوت الإشراف مرة واحدة على الأقل بإرسال رد تنبيه، ليرى أنه يعمل. ربما، على سبيل المثال، بنسبة 1% عندما لا يتطلب المنشور أي إجراء، يرسل ملاحظة بأن هذا المنشور لم يتطلب إجراء. أو بنسبة أقل، لمنتدى أكثر انشغالًا.
[/quote]

بدلاً من ذلك، اجعله يطلق على كلمة بريئة وعادية ولكن غير شائعة جدًا. “علم المنشورات التي تذكر الأناناس”.

3 إعجابات

لم أقم بالنشر منذ فترة، على الرغم من زيارتي لنافذة الدردشة الصغيرة يوميًا وكونها مفيدة مرة أو مرتين يوميًا… باستمرار.

كان سبب تأخري هنا هو أنني اضطررت للعمل على هذا التغيير الكبير إلى حد ما.

إنه يوفر تحسينًا دقيقًا ولكنه حاسم لـ Discourse AI.

كنت ألاحظ بانتظام أن روبوت الإشراف يتحدث عن صور غير ذات صلة تمامًا، بسبب الطريقة التي بنينا بها السياق. يسمح لنا التغيير بتقديم محتوى مختلط (يحتوي على صور ونصوص بترتيب صحيح).

هذا يعني أن نموذج اللغة الكبير لم يعد مرتبكًا.

ما الخطوات التالية؟

  1. ليس لدينا طريقة في الأتمتة للسماح له بتطبيق قاعدة بعد أن “تستقر” عملية تحرير المنشور، يمكن أن تكون استدعاءات نموذج اللغة الكبير مكلفة، فقط لأن الناس يصححون الأخطاء الإملائية، لا نريد مسح شيء ما مرارًا وتكرارًا. لست متأكدًا مما إذا كان هذا مطلوبًا هنا، ولكني أود السماح بإمكانية تشغيل أتمتة بمجرد أن يستقر المنشور في شكله الجديد.
  2. هندسة المطالبات - المطالبة الحالية جيدة، ولكنها صاخبة جدًا حسب رغبتي، إنها تزعجني كثيرًا، قد أخففها قليلاً.
  3. سياق محسّن - شيء واحد يزعجني حقًا هو أن الأتمتة الآن ليس لديها وعي بثقة المستخدم. بعض المستخدمين يحظون بثقة أكبر بكثير في مجتمع ما مقارنة بالآخرين (على سبيل المثال، المشرفون) أود أن أرى ما إذا كان بإمكاننا تحسين هذه القصة.
  4. القدرة على تشغيل الأتمتة على دفعات من المنشورات للتكرارات السريعة.
  5. أنا متأكد من ظهور المزيد من الأشياء.
8 إعجابات

عملي الأخير قيد التقدم هو:

فكرتي هي أن يكون هناك شخصيتان تدعمان النظام:

  1. شخصية تقوم بالفرز - الشخصية المحددة بالفعل اليوم (بوت الفرز)
  2. شخصية تتفاعل مع المشرفين / المستخدمين ذوي الثقة العالية (بوت المشرف)

من خلال الدردشة مع @mod_bot، سيتمكن المشرفون (أو المستخدمون ذوو الثقة العالية جدًا) من توجيه @triage_bot حول كيفية التصرف.

على سبيل المثال:

@mod_bot، تأكد من إخبار @sam إذا تحدث أي شخص عن الذكاء الاصطناعي

سيؤدي هذا إلى قيام mod_bot بتعديل موجه النظام في triage bot. مما يعني أن التواجد في غرفة الدردشة هذه سيكون كافيًا للسماح لأي مجتمع بتدريب الروبوت على التصرف بالطريقة التي يريدونها.

إنها لمسة مثيرة للاهتمام على تطبيق الذاكرة. لست متأكدًا من مدى نجاحها في الممارسة العملية، ولكنها تجربة جديرة بالاهتمام للغاية.

5 إعجابات

لا تزال هذه العملية تعمل على ميتا.

إحدى الرؤى التي أمتلكها الآن هي أن الأتمتة رائعة، إلا عندما لا تكون كذلك، عندها تكون مروعة.

على وجه الخصوص، اجعل الروبوت صاخبًا جدًا، وسيصبح الروبوت غير مفيد.

لقد قمت بتبديل تعليماتنا المخصصة إلى النص الممل جدًا:

أنت روبوت يعتمد على الذكاء الاصطناعي يقرأ كل منشور على meta.discourse.org

لديك أداة واحدة فقط ستستخدمها على كل منشور.

ستستخدم أولوية التجاهل لتجاهل المنشور وتجنب الإشعارات.

أي أولوية أخرى ستقوم بالإشعار.

### إرشادات الفرز
## مراقبة المحتوى
* إعلام @nat عند نشر محتوى غير إنجليزي (للمساعدة في وظيفة المترجم)
* إعلام @sam إذا لاحظت أن أي نقاش أصبح سامًا أو متوترًا جدًا
* إعلام @hugh عندما يناقش المستخدمون وظيفة قائمة المراجعة
  * يشمل مناقشات حول خبرة الموظفين، أدوات المشرف، القوائم، سير عمل المراقبة
  * خاصة العلامة، المراجعة، الموافقة، وأمور واجهة المستخدم/تجربة المستخدم ذات الصلة بالمراقبة
### نهاية إرشادات الفرز

في التسلسلات السابقة، نظرت في أشياء مثل «أعلم إذا لاحظت وجود علة يتم مناقشتها وليست في فئة العلل».

يكفي أن يكون لديك قاعدة سامة واحدة ثم تزداد إشعارات الدردشة بشكل كبير وتقوم أنت بتجاهلها.

4 إعجابات