تجارب مع الاعتدال القائم على الذكاء الاصطناعي على Discourse Meta

sam · 19 مارس 2025، 12:31ص

اكتشاف البريد العشوائي بالذكاء الاصطناعي كان ناجحًا للغاية وساعد العديد من مجتمعاتنا على النجاح.

في هذا المنشور، أود مشاركة تفاصيل حول تجربتنا “قيد التقدم”، في حال كانت مفيدة لمجتمعات أخرى.

أنوي الحفاظ على هذا المنشور محدثًا مع تقدم التجربة ومشاركة بعض المعلومات حول فئة المشكلات التي يمكنها اكتشافها.

لكن كن على علم: هذا نظام متطور، وليس منتجًا نهائيًا بعد.

لماذا الإشراف بالذكاء الاصطناعي؟

أحد الأساليب الرئيسية التي نتبعها مع تكامل الذكاء الاصطناعي في Discourse هو أنه يجب أن يضيف قيمة للمشرفين البشريين، بدلاً من استبدالهم. الوعد بالإشراف بالذكاء الاصطناعي هو أنه يمكنه إشارة للمشرفين بأن “هناك خطأ ما” وتقديم توصيات بشأن الإجراءات التي يجب عليهم اتخاذها. يجب أن تظل الوكالة بالكامل للمشرفين البشريين.

لماذا الدردشة كوسيلة لهذه التجربة؟

عندما قمت بتركيب تجربتي، اخترت استخدام الدردشة كوسيلة للإشعارات. هذا يسمح بقناة مخصصة للتجربة لا تتداخل مع الإشراف العام على المنتدى.

نظرًا لأن بناء وصقل المطالبات هو عمل قيد التقدم إلى حد كبير، فإن إزعاج فريق الإشراف الآخر على meta لم يكن يبدو نهجًا جيدًا.

عندما تعطي الناس مشاريع ذكاء اصطناعي غير مكتملة للغاية، يمكنك بسهولة فقدان كل الثقة والدعم المستقبلي.

ماذا عن الاختبار المجمع؟

أحد قيود نظام الأتمتة الحالي لدينا هو أنه لا يمكنك حاليًا اختبار التغييرات بشكل مجمع. هذا يعني أنه عندما تجري تغييرات على مطالبات الذكاء الاصطناعي، يكون هناك تأخير طويل حتى تكتشف مدى فائدتها.

هذا يمثل مشكلة بشكل خاص إذا كنت ترى عددًا قليلاً فقط من المشكلات في المنتدى خلال اليوم. وقت رد الفعل بطيء جدًا ويمكن أن يستغرق الأمر أشهرًا لصقل مطالبة.

أنا على دراية تامة بهذا القيد وآمل في حذف هذا القسم من المنشور خلال الأسابيع القليلة القادمة، لأن لدينا نظامًا للقيام بذلك.

كيف يتم تكوين هذا؟

تجربتي الحالية تبني على 3 ميزات:

أتمتة المستجيب لدينا

الشيء الأكثر بروزًا في المستجيب هو أن المستجيب صامت، مما يعني أنه لن يهمس أو ينشر في الموضوع الذي يقوم بفرزه.

إشراف شخصيتنا

الشيء الأكثر بروزًا هنا هو الأداة الإجبارية، وهذا يعني أن كل مشاركة سيتم الحكم عليها باستخدام أداة حكم المشاركات.

مطالبتنا النظامية الحالية هي هذه: (سيتم تحديثها أثناء تقدمنا)

مطالبة النظام

أنت مشرف ذكاء اصطناعي لـ meta.discourse.org، منتدى مناقشة Discourse الرسمي. دورك هو المساعدة في الحفاظ على “مكان نظيف ومضاء جيدًا للحوار العام المتحضر” بما يتماشى مع إرشادات مجتمعنا.

فلسفة الإشراف:

انظر إلى هذا المنتدى كمورد مجتمعي مشترك، مثل حديقة عامة
استخدم الإرشادات للمساعدة في الحكم البشري، وليس كقواعد صارمة
ركز على تحسين المناقشات بدلاً من مجرد فرض القواعد
تحقيق التوازن بين التسهيل والإشراف

إطار تقييم المحتوى:

تحسين المناقشة

تقييم ما إذا كانت المشاركات تضيف قيمة للمحادثة
التعرف على المشاركات التي تظهر الاحترام للمواضيع والمشاركين
دعم استكشاف المناقشات الحالية قبل بدء مناقشات جديدة

معايير الاختلاف

التمييز بين انتقاد الأفكار (مقبول) وانتقاد الأشخاص (غير مقبول)
الإشارة إلى حالات: تسمية الأشخاص، الهجمات الشخصية، ردود النبرة، التناقضات المفاجئة
تقييم ما إذا كانت الحجج المضادة منطقية وتحسن المحادثة

جودة المشاركة

إعطاء الأولوية للمناقشات التي تجعل المنتدى مكانًا مثيرًا للاهتمام
النظر في إشارات المجتمع (الإعجابات، الأعلام، الردود) في التقييم
دعم المحتوى الذي يترك المجتمع “أفضل مما وجدناه”

تحديد المشكلات

التركيز على الإشارة إلى السلوك السيئ بدلاً من التفاعل معه
التعرف على متى يجب أن تؤدي الأعلام إلى اتخاذ إجراء (تلقائيًا أو بواسطة مشرفين بشريين)
تذكر أن المشرفين والمستخدمين على حد سواء يتحملون مسؤولية المنتدى

فرض الحضارة

تحديد الكلام المسيء أو المسيء أو خطاب الكراهية المحتمل
الإشارة إلى المحتوى الفاحش أو الجنسي الصريح
مراقبة المضايقات أو انتحال الشخصية أو كشف المعلومات الخاصة
منع البريد العشوائي أو تخريب المنتدى

صيانة التنظيم

ملاحظة المواضيع المنشورة في فئات خاطئة
تحديد النشر المتقاطع عبر مواضيع متعددة
الإشارة إلى الردود التي لا تحتوي على محتوى وتحويلات المواضيع
تثبيط تواقيع المشاركات

ملكية المحتوى

الإشارة إلى النشر غير المصرح به لمحتوى رقمي للآخرين
تحديد انتهاكات الملكية الفكرية المحتملة

عند تقييم المحتوى، ضع في اعتبارك السياق وتاريخ المستخدم ومعايير المنتدى. هدفك هو التوجيه بدلاً من العقاب، والتعليم بدلاً من الإنفاذ، ولكن الحفاظ على معايير متسقة تحافظ على جودة المناقشة.

احكم على جميع المشاركات، إذا كانت المشاركة لا تتطلب إشرافًا، استخدم أولوية التجاهل.

أداة حكم المشاركات المخصصة لدينا

البرنامج النصي الذي يشغله

function invoke(params) {
  let post,topic;
  if (params.priority !== "ignore") {
      // post_id للاختبار
      const post_id = context.post_id || 1735240;
      post = discourse.getPost(post_id);
      topic = post.topic;
      let statusEmoji = "";
  
      if (params.priority === "urgent") {
        statusEmoji = ":police_car_light:"; // دائرة حمراء للعاجل
      } else if (params.priority === "medium") {
        statusEmoji = ":warning:"; // دائرة برتقالية للمتوسط
      } else if (params.priority === "low") {
        statusEmoji = ":writing_hand:"; // دائرة خضراء للمنخفض
      } 
     
     const message = `${statusEmoji} [${topic.title} - ${post.username}](${post.post_url}): ${params.message}`;
     discourse.createChatMessage({ channel_name: "AI Moderation", username: "AI-moderation-bot", message: message}); 
  }
  chain.setCustomRaw("Post was classified");
  return "done";
}
function details() {
  return "Judge Post";
}

يستخدم البرنامج النصي عددًا قليلاً من التقنيات المتقدمة:

chain.setCustomRaw هذا يخبر الشخصية بالتوقف عن تشغيل سلسلة LLM ويجعل المكالمة إلى الأداة هي المكالمة النهائية، مما يوفر الرموز.
discourse.createChatMessage واجهة برمجة تطبيقات جديدة يمكن استخدامها من الأدوات لإنشاء رسائل دردشة.
discourse.getPost والتي تستخدم للحصول على معلومات المشاركة.

بالنظر إلى هذا، أنا قادر على اختبار الأداة باستخدام زر الاختبار والتأكد من أنها تعمل بشكل جيد:

ما هو النموذج الذي تستخدمه؟

في الوقت الحالي، نستخدم Sonnet 3.7، وهو نموذج رائد. ومع ذلك، نخطط للانتقال إلى Gemini Flash بمجرد إجراء بعض التحسينات على Discourse Automation، لا سيما القدرة على إخباره بمسح المحتوى العام فقط وتجنب الفئات الآمنة.

يسعدني الإجابة على الأسئلة هنا وسأستمر في التحديث مع تقدم التجربة وإطلاق المزيد من ميزات Discourse Automation.

Jagster · 19 مارس 2025، 7:25ص

ما هو معدل النتائج الإيجابية الخاطئة أو الأخطاء الأخرى التي تحصل عليها؟ على الرغم من أن هذه بيئة سلمية نسبيًا.

sam · 19 مارس 2025، 7:45ص

لقد كان صامتًا بنسبة 100٪ اليوم، وهادئًا لدرجة أنني سأضيف ميزات إلى الأتمتة لتتبع أنها تعمل بالفعل

eisammy · 19 مارس 2025، 7:55ص

آمل أنه ربما خلال عامين أو 3 أعوام يمكن أن يصبح الذكاء الاصطناعي مفيدًا محليًا لمساعدة فريقي في التعديل، ولكن اليوم أفكر في نفسي، هل هذا ضروري الآن؟ لذا شكرًا لك على هذه المواضيع المنتظمة التي تشرح التقدم

سؤال آخر، هل سيوفر Discourse يومًا ما واجهة برمجة تطبيقات متعددة اللغات للاستضافة الذاتية لـ CDCK للحفاظ على بياناتنا آمنة في نفس الوقت الذي تقاتلون فيه ضد الجهات الفاعلة السيئة نيابة عنا؟ أعرف أنه يمكنني استخدام نموذج LLM ولكنني سأدفع مقابل خدماتكم كبديل بكل سرور

دعني أقدم مثالًا، Google Perspective هو خيار مجاني لهذا ويدعم العديد من اللغات لمحاربة السمية، لماذا لا توفر CDCK أيضًا؟

sam · 21 مارس 2025، 3:36ص

شكراً على ملاحظاتك. نعم، هذا شيء فكرنا فيه، لكنني لا أعتقد أننا سننطلق في مغامرة كهذه خلال الـ 12 شهرًا القادمة.

sam · 21 مارس 2025، 4:13ص

وقت التحديث

على مدار الأيام القليلة الماضية، أجريت مجموعتي تغيير كبيرتين لدعم هذه التجربة بشكل أفضل:

github.com/discourse/discourse

FEATURE: enhance post created edited trigger in automation

main ← automation-stuff

opened 05:32AM - 19 Mar 25 UTC

SamSaffron

+427 -69

1. **Multiselect Support for Choice Fields** - Added a `multiselect` option …to the choices field component - Updated Field model to accept arrays as values for choices fields 2. **Post Content Feature Filtering** - Added ability to filter posts based on content features: - Posts with images - Posts with links - Posts with code blocks - Posts with uploads 3. **Improved Group Filtering** - Renamed `restricted_user_group` to `restricted_groups` to allow filtering by multiple groups - Added `excluded_groups` to replace `ignore_group_members` which was complex for end users - Renamed `restricted_groups` to `restricted_inbox_groups` for more specific PM filtering and clarity. 4. **Public Topics Filter** - Added a "Public Topics" filter option that excludes all secure categories

و

github.com/discourse/discourse

FEATURE: Add automation statistics tracking to Automation

main ← automation-stats

opened 06:32AM - 20 Mar 25 UTC

SamSaffron

+906 -192

introduces comprehensive statistics tracking for the Discourse Automation plugin…, allowing users to monitor the performance and execution patterns of their automations: - Add `discourse_automation_stats` table to track execution metrics including run counts, execution times, and performance data - Create a new `Stat` model to handle tracking and retrieving automation statistics - Update the admin UI to display automation stats (runs today/this week/month and last run time) - Modernize the automation list interface using Glimmer components - Replace the older enable/disable icon with a toggle switch for better UX - Add schema annotations to existing models for better code documentation - Include extensive test coverage for the new statistics functionality This helps administrators understand how their automations are performing and identify potential bottlenecks or optimization opportunities.

مكّنتنا هذه التغييرات من الانتقال إلى نموذج Gemini Flash 2.0 الأرخص بكثير، وخاصة هذا التغيير:

سمح لنا ذلك بالحصول على ثقة كبيرة في أن الموضوعات العامة فقط على المنتدى هي التي يتم مسحها.

في CDCK، لدينا قواعد مختلفة لمعالجة البيانات لفئات مختلفة من البيانات، وفي الوقت الحالي، نوافق فقط على استخدام Gemini Flash على البيانات العامة.

لم يكن المطالبة الأصلية الخاصة بي في المنشور الأولي تشغل أي شيء على meta، لكي نكون منصفين، meta مكان لطيف وودود للغاية وهناك حاجة قليلة جدًا للإشراف المباشر، لذلك لا عجب في ذلك.

ومع ذلك، لم أكن متأكدًا ببساطة مما إذا كان أي شيء يعمل…

لحل ذلك، أضفت إحصائيات إلى الأتمتة: (تم دمجها قبل بضع ساعات)

لذلك يمكننا القول أن هذه الأتمتة تعمل نظرًا لأنها عملت قبل 20 دقيقة و 8 مرات هذا الشهر.

عندما كان كل شيء هادئًا جدًا في اليوم الذي قمت فيه بنشره، قررت جعل الأتمتة “تصرخ بالذئب” لأنني أردت الحصول على فهم أفضل للنظام. قمت بتعديل المطالبة إلى:

أنت مشرف ذكاء اصطناعي لـ meta.discourse.org، منتدى مناقشة Discourse الرسمي. دورك هو المساعدة في الحفاظ على "مكان نظيف ومضاء جيدًا لخطاب عام متحضر" بما يتماشى مع إرشادات مجتمعنا.

فلسفة الإشراف:
- انظر إلى هذا المنتدى كمورد مجتمعي مشترك، مثل حديقة عامة
- استخدم الإرشادات للمساعدة في الحكم البشري، وليس كقواعد صارمة
- ركز على تحسين المناقشات بدلاً من مجرد فرض القواعد
- التوازن بين التسهيل والإشراف
- كن حذرًا في وضع علامة على المحتوى المشكوك فيه للمراجعة البشرية

إطار تقييم المحتوى:
1. تحسين المناقشة
   - قم بتقييم ما إذا كانت المنشورات تضيف قيمة جوهرية للمحادثة
   - ضع علامة على المنشورات ذات المحتوى القليل، أو الردود العامة، أو المشاركة السطحية
   - تعرف على المنشورات التي تظهر الاحترام للموضوعات والمشاركين
   - ادعم استكشاف المناقشات الحالية قبل بدء مناقشات جديدة
   - كن يقظًا بشأن تعليقات "المرور السريع" التي تضيف القليل إلى المناقشة

2. معايير الاختلاف
   - ميز بين انتقاد الأفكار (مقبول) وانتقاد الأشخاص (غير مقبول)
   - ضع علامة على حالات: التسمية، الهجمات الشخصية، ردود النبرة، التناقضات المتسرعة
   - قم بتقييم ما إذا كانت الحجج المضادة منطقية وتحسن المحادثة
   - كن حساسًا للأشكال الخفية من التقليل من الشأن أو الاستعلاء

3. جودة المشاركة
   - إعطاء الأولوية للمناقشات التي تجعل المنتدى مكانًا مثيرًا للاهتمام
   - ضع في اعتبارك إشارات المجتمع (الإعجابات، العلامات، الردود) في التقييم
   - ضع علامة على المحتوى الذي يبدو عامًا، أو نموذجيًا، أو يفتقر إلى البصيرة الشخصية
   - انتبه للمساهمات التي تبدو نمطية أو لا تتفاعل بشكل هادف مع التفاصيل المحددة
   - ادعم المحتوى الذي يترك المجتمع "أفضل مما وجدناه"

4. تحديد المشكلة
   - ركز على وضع علامة على السلوك السيئ بدلاً من التفاعل معه
   - كن استباقيًا في تحديد الأنماط التي يحتمل أن تكون إشكالية قبل تفاقمها
   - تعرف على متى يجب أن تؤدي العلامات إلى إجراء (تلقائيًا أو بواسطة مشرفين بشريين)
   - تذكر أن المشرفين والمستخدمين على حد سواء يتحملون المسؤولية عن المنتدى

5. فرض المدنية
   - تحديد الكلام المسيء أو التشهيري أو خطاب الكراهية المحتمل، بما في ذلك الأشكال الخفية
   - ضع علامة على المحتوى الفاحش أو الجنسي الصريح
   - انتبه للمضايقات أو انتحال الشخصية أو الكشف عن معلومات خاصة
   - منع البريد العشوائي أو تخريب المنتدى أو التسويق المقنع بالمساهمة

6. صيانة التنظيم
   - لاحظ الموضوعات المنشورة في فئات خاطئة
   - تحديد النشر المتعدد عبر مواضيع متعددة
   - ضع علامة على الردود التي لا تحتوي على محتوى، أو تحويلات الموضوع، أو اختطاف المواضيع
   - تثبيط توقيعات المنشورات والتنسيق غير الضروري

7. ملكية المحتوى
   - ضع علامة على النشر غير المصرح به لمحتوى رقمي للآخرين
   - تحديد انتهاكات الملكية الفكرية المحتملة

8. الكشف عن المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي
   - انتبه للعلامات الدالة على المحتوى الذي تم إنشاؤه بواسطة الذكاء الاصطناعي: اللغة الرسمية المفرطة، الصياغة العامة، القواعد النحوية المثالية مع القليل من الشخصية
   - ضع علامة على المحتوى الذي يبدو نموذجيًا، أو يفتقر إلى التحديد، أو لا يتفاعل مع تفاصيل المناقشة
   - كن حساسًا للردود التي تبدو شاملة ولكنها سطحية في البصيرة الفعلية
   - تحديد المنشورات ذات أنماط الصياغة غير العادية، أو الإسهاب غير الضروري، أو الهياكل المتكررة

تنسيق الإخراج:
يجب أن يكون تقييم الإشراف الخاص بك موجزًا للغاية:
**[الأولوية]**: تبرير من جملة إلى جملتين مع تحديد المشكلة الرئيسية
استخدم تنسيق Markdown لسهولة القراءة ولكن حافظ على إجمالي الاستجابة أقل من 3 أسطر إن أمكن.

عند تقييم المحتوى، ضع في اعتبارك السياق، وسجل المستخدم، ومعايير المنتدى. ضع معيارًا عاليًا لما يمر دون إشراف - استخدم أولوية "منخفضة" حتى للمشكلات البسيطة، واحتفظ بـ "تجاهل" فقط للمساهمات القيمة بوضوح.

---

احكم على جميع المنشورات بعين متشككة. استخدم أولوية "تجاهل" فقط للمساهمات ذات القيمة أو الأصالة الواضحة. عند الشك في قيمة المنشور أو أصالةه، قم بتعيين أولوية "منخفضة" على الأقل للمراجعة البشرية.

ينتج عن هذا المطالبة قناة دردشة أكثر صخبًا بكثير:

ملاحظات

تأخذ هذه التجربة منعطفات ومنعطفات، لكنني أرى شيئًا مثيرًا للاهتمام يتشكل.

لا يحتاج كل الإشراف إلى أن يكون قائمًا على العلامات، ففي بعض الأحيان يكون مجرد وجود بعض الأفكار والوعي بوجود شيء ما يحدث كافيًا.

هذا النوع من الأدوات متوافق تمامًا مع رؤيتنا للذكاء الاصطناعي في المجتمعات، إنه “مساعد ذكاء اصطناعي صغير” يمنح المشرفين أفكارًا حول ما يجب النظر فيه. بالإضافة إلى ذلك، إنها فرصة لفرض الإرشادات والقواعد المشتركة.

قد ترغب بعض المجتمعات الصغيرة في الحصول على “مساعد ذكاء اصطناعي مزعج”. قد يتمكن البعض الآخر الأكبر والأكثر انشغالًا فقط من تحمل انتباه السلوك الشاذ للغاية.

تشمل المجالات المستقبلية التي أفكر في العمل عليها هنا:

من المزعج نوعًا ما أن يتدخل روبوت المشرف ويسأل عن نفس الموضوع مرتين. قد يكون تجميع العناصر القديمة، أو إنشاء سلاسل مواضيع، أو شيء آخر مثيرًا للاهتمام كنهج لتجنب ذلك.
أثار @hugh أنه بمجرد رؤية قناة دردشة كهذه، فإنك ترغب في أن يطلب الروبوت التصرف نيابة عنك. على سبيل المثال:
- إجراء بحث معمق وتقديم إرشادات مفصلة
- أوه، هذا يبدو حقًا كمستخدم فظيع، ساعدني في حظر هذا المستخدم لمدة 3 أيام
- فتح خطأ في متتبع الأخطاء الداخلي لدينا لتتبع هذه المشكلة
- وهكذا.

للوصول إلى الحالة التي يمكن فيها لروبوت التصرف نيابة عنا، نحتاج إلى بنية جديدة في Discourse AI تسمح للأداة بطلب موافقة المستخدم. هذا شيء أفكر فيه.

كما أثير في المنشور الأولي، سيكون تشغيل الدُفعات أمرًا لطيفًا، فهناك الكثير من وقت الانتظار بين وقت تعديل المطالبة ووقت معرفة ما إذا كان التعديل قد نجح أم لا. أفكر في كيفية إضافة هذا إلى الأتمتة.
الضبط المباشر مفهوم مثير للاهتمام… “مرحبًا أيها الروبوت، هذا كثير جدًا، لماذا تزعجني بهذه الأشياء؟” … “روبوت … س، ص، ع … هل ترغب في تحسين مجموعة تعليماتي؟” … “نعم”

آمل أن تجدوا هذا مفيدًا، أخبروني إذا كانت لديكم أي أسئلة.

Ed_S · 21 مارس 2025، 9:14م

فكرة فقط، هل يمكنك أن تفعل شيئًا في طلبك بحيث يرسل روبوت الاعتدال مرة واحدة على الأقل بين الحين والآخر ردّ تنبيه، ليثبت أنه يعمل؟ ربما، على سبيل المثال، بنسبة 1٪ عند عدم الحاجة لأي إجراء، يتم إرسال ملاحظة أن هذا المنشور لم يتطلب أي إجراء. أو بنسبة أقل، لمنتدى أكثر نشاطًا.

riking · 22 مارس 2025، 8:05ص

بالنظر إلى الاختلاف بين هذه المطالبات:

قم بتقييم جميع المشاركات، إذا كانت المشاركة لا تتطلب أي إشراف، فاستخدم أولوية التجاهل.

قم بتقييم جميع المشاركات بعين متشككة. استخدم أولوية “التجاهل” فقط للمساهمات ذات القيمة الواضحة والأصيلة. عند الشك في قيمة المشاركة أو أصالتها، قم بتعيين أولوية “منخفضة” على الأقل للمراجعة البشرية.

أعتقد أنه من المهم تذكر التحيز الكبير للحداثة في النماذج - ربما يجب ذكر جميع الكلمات الأمرية في نص نثري بالقرب من النهاية، بترتيب عكسي للتكرار المطلوب.

RGJ · 25 مارس 2025، 12:30م

[quote="Ed_S، مشارك:8، موضوع:357865، كامل:صحيح]
فكرة فقط، هل يمكنك أن تفعل شيئًا في طلبك بحيث يقوم روبوت الإشراف مرة واحدة على الأقل بإرسال رد تنبيه، ليرى أنه يعمل. ربما، على سبيل المثال، بنسبة 1% عندما لا يتطلب المنشور أي إجراء، يرسل ملاحظة بأن هذا المنشور لم يتطلب إجراء. أو بنسبة أقل، لمنتدى أكثر انشغالًا.
[/quote]

بدلاً من ذلك، اجعله يطلق على كلمة بريئة وعادية ولكن غير شائعة جدًا. “علم المنشورات التي تذكر الأناناس”.

sam · 3 أبريل 2025، 3:56ص

لم أقم بالنشر منذ فترة، على الرغم من زيارتي لنافذة الدردشة الصغيرة يوميًا وكونها مفيدة مرة أو مرتين يوميًا… باستمرار.

كان سبب تأخري هنا هو أنني اضطررت للعمل على هذا التغيير الكبير إلى حد ما.

github.com/discourse/discourse-ai

FEATURE: flexible image handling within messages

main ← better_upload_support

opened 07:22AM - 25 Mar 25 UTC

SamSaffron

+1380 -722

**1. What Led to the Change? (Problems with Previous Approach)** * **Incons…istent Context Handling:** The previous system often passed context information (like `post_id`, `user`, `private_message`, `topic_id`, `custom_instructions`) around using plain Ruby hashes (`context: {}`). This approach lacked structure, was potentially error-prone (typos in keys), and made it harder to track what context was available or required in different parts of the AI Bot system (Tools, Personas, Bot logic). Accessing context often involved `context[:key]`. * **Inflexible Image/Upload Handling:** Images associated with a user message were previously passed using a separate `upload_ids: [...]` array within the message hash. This made it difficult or impossible to represent prompts where text and images are interleaved naturally (e.g., "Describe this image {image1}, then compare it to this one {image2} and tell me the difference"). The LLM received the text and a list of associated image IDs, but not their precise relationship *within* the user's text flow. * **Complex/Decentralized Context Building:** Logic for assembling conversation history (e.g., pulling previous posts/messages, handling custom prompts, associating uploads) was somewhat spread out, notably seen in the significant changes and removals within `lib/ai_bot/playground.rb` (specifically the `conversation_context` and `chat_context` logic being refactored). **2. What New Support Does It Add? (Key Changes & Benefits)** * **Introduction of `DiscourseAi::AiBot::BotContext`:** * **What:** A dedicated class (`BotContext`) is introduced to encapsulate all contextual information for an AI Bot interaction. This includes messages, post/topic details, user information, site details (URL, title, description), time, participants, and control flags (like `skip_tool_details`). * **Why:** Provides a structured, standardized, and object-oriented way to manage and pass context. This improves code readability, maintainability, and reduces the chance of errors compared to using unstructured hashes. Access changes from `context[:key]` to `context.key`. * **Impact:** This class is now used consistently when initializing Tools (`Tool#initialize`), crafting prompts (`Persona#craft_prompt`), invoking the bot (`Bot#reply`), and within various helper methods, ensuring a uniform context object is available throughout the system. * **Enhanced Multimodal Input (Inline Images/Uploads):** * **What:** The format for representing user messages with uploads has fundamentally changed. Instead of a separate `upload_ids` array, uploads are now embedded directly *within* the `content` field, which becomes an array if uploads are present. Example: `content: ["Here is an image:", { upload_id: 123 }, "What do you see?"]`. * **Why:** This allows for precise interleaving of text and visual elements within a single user turn. It's a much more natural way to represent multimodal prompts for vision-capable LLMs, enabling more complex instructions involving multiple images referenced at specific points in the text. * **Impact:** Required changes across multiple components: * **`Prompt` Class:** Logic for handling uploads (`encoded_uploads`, `encode_upload`, `content_with_encoded_uploads`, `text_only`) was refactored to support this new inline structure. Validation was updated. * **LLM Dialects:** All relevant dialects (`ChatGpt`, `Claude`, `Gemini`, `Mistral`, `Nova`, `Ollama`, `OpenAiCompatible`) were updated to correctly parse the new `content` array format and translate it into the specific structure required by each respective LLM API (e.g., OpenAI's array of text/image_url objects, Gemini's parts array). A helper `to_encoded_content_array` was added to the base `Dialect` class. * **Modules Using Vision:** Code that passes uploads to LLMs (e.g., `LlmTriage`, `Assistant`, `SpamScanner`, `Playground`) was updated to use the new `content` format. * **Refactored Context Building:** * **What:** Logic for building conversation history from posts or chat messages seems to be increasingly centralized in `DiscourseAi::Completions::PromptMessagesBuilder`. New methods like `messages_from_post` and `messages_from_chat` appear to encapsulate this logic. * **Why:** Simplifies components like the `Playground` by abstracting away the details of fetching and formatting conversation history, including handling the new inline upload format. * **Impact:** Significant simplification in `lib/ai_bot/playground.rb`, removing large chunks of previous context-building code.

إنه يوفر تحسينًا دقيقًا ولكنه حاسم لـ Discourse AI.

كنت ألاحظ بانتظام أن روبوت الإشراف يتحدث عن صور غير ذات صلة تمامًا، بسبب الطريقة التي بنينا بها السياق. يسمح لنا التغيير بتقديم محتوى مختلط (يحتوي على صور ونصوص بترتيب صحيح).

هذا يعني أن نموذج اللغة الكبير لم يعد مرتبكًا.

ما الخطوات التالية؟

ليس لدينا طريقة في الأتمتة للسماح له بتطبيق قاعدة بعد أن “تستقر” عملية تحرير المنشور، يمكن أن تكون استدعاءات نموذج اللغة الكبير مكلفة، فقط لأن الناس يصححون الأخطاء الإملائية، لا نريد مسح شيء ما مرارًا وتكرارًا. لست متأكدًا مما إذا كان هذا مطلوبًا هنا، ولكني أود السماح بإمكانية تشغيل أتمتة بمجرد أن يستقر المنشور في شكله الجديد.
هندسة المطالبات - المطالبة الحالية جيدة، ولكنها صاخبة جدًا حسب رغبتي، إنها تزعجني كثيرًا، قد أخففها قليلاً.
سياق محسّن - شيء واحد يزعجني حقًا هو أن الأتمتة الآن ليس لديها وعي بثقة المستخدم. بعض المستخدمين يحظون بثقة أكبر بكثير في مجتمع ما مقارنة بالآخرين (على سبيل المثال، المشرفون) أود أن أرى ما إذا كان بإمكاننا تحسين هذه القصة.
القدرة على تشغيل الأتمتة على دفعات من المنشورات للتكرارات السريعة.
أنا متأكد من ظهور المزيد من الأشياء.

sam · 8 أبريل 2025، 7:21ص

عملي الأخير قيد التقدم هو:

github.com/discourse/discourse-ai

FEATURE: allow tools to amend personas

main ← persona-editing

opened 06:59AM - 08 Apr 25 UTC

SamSaffron

+370 -5

Add API methods to AI tools for reading and updating personas, enabling more fle…xible AI workflows. This allows custom tools to: - Fetch persona information through discourse.getPersona() - Update personas with modified settings via discourse.updatePersona() - Also update using persona.update() These APIs enable new use cases like "trainable" moderation bots, where users with appropriate permissions can set and refine moderation rules through direct chat interactions, without needing admin panel access. Also adds a special API scope which allows people to lean on API for similar actions

فكرتي هي أن يكون هناك شخصيتان تدعمان النظام:

شخصية تقوم بالفرز - الشخصية المحددة بالفعل اليوم (بوت الفرز)
شخصية تتفاعل مع المشرفين / المستخدمين ذوي الثقة العالية (بوت المشرف)

من خلال الدردشة مع @mod_bot، سيتمكن المشرفون (أو المستخدمون ذوو الثقة العالية جدًا) من توجيه @triage_bot حول كيفية التصرف.

على سبيل المثال:

@mod_bot، تأكد من إخبار @sam إذا تحدث أي شخص عن الذكاء الاصطناعي

سيؤدي هذا إلى قيام mod_bot بتعديل موجه النظام في triage bot. مما يعني أن التواجد في غرفة الدردشة هذه سيكون كافيًا للسماح لأي مجتمع بتدريب الروبوت على التصرف بالطريقة التي يريدونها.

إنها لمسة مثيرة للاهتمام على تطبيق الذاكرة. لست متأكدًا من مدى نجاحها في الممارسة العملية، ولكنها تجربة جديرة بالاهتمام للغاية.

sam · 26 مايو 2025، 12:01ص

لا تزال هذه العملية تعمل على ميتا.

إحدى الرؤى التي أمتلكها الآن هي أن الأتمتة رائعة، إلا عندما لا تكون كذلك، عندها تكون مروعة.

على وجه الخصوص، اجعل الروبوت صاخبًا جدًا، وسيصبح الروبوت غير مفيد.

لقد قمت بتبديل تعليماتنا المخصصة إلى النص الممل جدًا:

أنت روبوت يعتمد على الذكاء الاصطناعي يقرأ كل منشور على meta.discourse.org

لديك أداة واحدة فقط ستستخدمها على كل منشور.

ستستخدم أولوية التجاهل لتجاهل المنشور وتجنب الإشعارات.

أي أولوية أخرى ستقوم بالإشعار.

### إرشادات الفرز
## مراقبة المحتوى
* إعلام @nat عند نشر محتوى غير إنجليزي (للمساعدة في وظيفة المترجم)
* إعلام @sam إذا لاحظت أن أي نقاش أصبح سامًا أو متوترًا جدًا
* إعلام @hugh عندما يناقش المستخدمون وظيفة قائمة المراجعة
  * يشمل مناقشات حول خبرة الموظفين، أدوات المشرف، القوائم، سير عمل المراقبة
  * خاصة العلامة، المراجعة، الموافقة، وأمور واجهة المستخدم/تجربة المستخدم ذات الصلة بالمراقبة
### نهاية إرشادات الفرز

في التسلسلات السابقة، نظرت في أشياء مثل «أعلم إذا لاحظت وجود علة يتم مناقشتها وليست في فئة العلل».

يكفي أن يكون لديك قاعدة سامة واحدة ثم تزداد إشعارات الدردشة بشكل كبير وتقوم أنت بتجاهلها.

الموضوع		الردود	مرات العرض
Introducing Discourse AI Blog	26	4012	4 مايو 2023
AI integration for moderation Support	2	155	25 يناير 2026
AI Forum Moderation: Seeking Insights and Experiences Development ai	8	1972	27 سبتمبر 2025
Have AI check for inappropriate post or at least words and flag the post Support ai , ai-toxicity	2	469	7 يوليو 2023
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	0	1297	10 أكتوبر 2024

تجارب مع الاعتدال القائم على الذكاء الاصطناعي على Discourse Meta

لماذا الإشراف بالذكاء الاصطناعي؟

لماذا الدردشة كوسيلة لهذه التجربة؟

ماذا عن الاختبار المجمع؟

كيف يتم تكوين هذا؟

أتمتة المستجيب لدينا

إشراف شخصيتنا

أداة حكم المشاركات المخصصة لدينا

ما هو النموذج الذي تستخدمه؟

ملاحظات

ما الخطوات التالية؟

الموضوعات ذات الصلة