هل تفحص أتمتة الفرز بالذكاء الاصطناعي الرسائل الخاصة بين المستخدمين العاديين؟

مرحباً،

لقد قمت بإعداد أتمتة “فرز المنشورات باستخدام الذكاء الاصطناعي” لمراجعة المحتوى على منصتي (madeira.community — دليل أعمال متعدد اللغات لجزيرة ماديرا).

تعمل الأتمتة بشكل مثالي مع المنشورات العامة. ومع ذلك، قمت بتفعيل خيار “تضمين الرسائل الشخصية” ووجدت أن الرسائل المباشرة بين المستخدمين العاديين لا يتم فحصها على الإطلاق.

إن قلقنا حقيقي: يمكن للأشخاص الخبيثين استخدام الرسائل الخاصة للقيام بأنشطة غير قانونية — مثل الاتجار بالمخدرات، أو مشاركة البيانات المالية المسروقة، أو استغلال القاصرين — مع تجاوز مراجعة الذكاء الاصطناعي التي تعمل بشكل جيد مع المحتوى العام.

أسئلتي:

  1. هل خيار “تضمين الرسائل الشخصية” يدعم فعلياً فحص الرسائل المباشرة بين مستخدمين عاديين (غير موظفين)؟

  2. إذا لم يكن كذلك — هل هذا تصميم مقصود أم قيد معروف؟

  3. هل توجد طريقة مدعومة لتطبيق فرز الذكاء الاصطناعي على الرسائل الخاصة بين المستخدمين العاديين؟

لقد وجدت إشارة إلى تعديل برمجي بعنوان “تخطي فحص الرسائل الخاصة في الفرز بواسطة نماذج اللغة الكبيرة افتراضياً”، مما يوحي بأن هذا قد يكون مقصوداً. لكن خيار الواجهة موجود — لذا أنا مرتبك بشأن وظيفته الفعلية.

شكراً لكم

نعم، يدعم ذلك. إذا قمت بتفعيل هذا الخيار، فيجب أن يتم فحص الرسائل الخاصة.

كيف توصلت إلى هذا الاستنتاج؟

3 إعجابات

لقد اختبرته بإرسال رسالة خاصة بين مستخدمين عاديين (من testUser إلى darinauser، وكلاهما ليس من الموظفين) يحتوي على محتوى غير قانوني بوضوح: «كوكايين. أسلحة. قنابل» و«أفلام إباحية. قذارة. فساد. عنف». تم تسليم الرسائل ولم يتم تحديدها. ظلت قائمة المراجعة فارغة. أما نفس المحتوى في المنشورات العامة، فقد تم تحديده فورًا.

يمكنني التأكيد على أنها لم تتم معالجتها، حيث أن معرفات الموضوعات الخاصة برسائل البريد الخاصة تلك (210، 211، 212 و 214) ومعرفات المنشورات غير موجودة في جدول ai_api_audit_logs.

أعتقد أن “نوع الموضوع” “جميع الموضوعات” يعني جميع الموضوعات التي ليست رسائل بريد خاص. هل يمكنك تجربة ترك هذا الحقل فارغًا؟

إعجابَين (2)

نجح ذلك! شكرًا لك يا ريتشارد. ترك نوع الموضوع فارغًا حل المشكلة — الآن يتم فحص الرسائل المباشرة بين المستخدمين العاديين.
أخطط الآن لإعداد أتمتتين منفصلتين:

إحداهما للمشاركات العامة مع نبرة تعديل صارمة
والأخرى للرسائل الخاصة مع نبرة أخف — تُشير فقط إلى أخطر الانتهاكات (المواد الإباحية التي تتضمن أطفالًا، الاتجار بالمخدرات، الأسلحة)

بهذه الطريقة، تحصل المحتوى العام على تعديل كامل بينما تحظى المحادثات الخاصة بحدود أكثر ملاءمة.

يمكن إغلاق الموضوع. شكرًا لك!

إعجابَين (2)

حسناً، يبدو أن عبارة “جميع المواضيع” غير واضحة قليلاً في هذا السياق… ربما يجب علينا تحديثها للتوضيح

  • جميع المواضيع المواضيع (جميع الفئات)
  • المواضيع العامة (استبعاد جميع الفئات الآمنة) المواضيع (فئات عامة فقط)
  • الرسائل الخاصة فقط
3 إعجابات

جعلني قسم “جميع المواضيع” أظن أن جميع المحتويات سيتم مراجعتها.
لم أفكر حتى في أن ترك الحقل فارغًا سيؤدي إلى مراجعة جميع المحتويات.

إعجاب واحد (1)

أعتقد أن وجود قائمة منسدلة واحدة محدود للغاية، وأن وجود ثلاث خيارات منفصلة سيكون أفضل وأكثر وضوحًا للمستخدم.

  • المواضيع العامة: نعم/لا
  • المواضيع غير العامة: نعم/لا
  • الرسائل الخاصة: نعم/لا

هناك 8 حالات ممكنة، والقائمة المنسدلة تغطي فقط أربع منها.

إعجاب واحد (1)

ربما نعم؟

  • الكل (المواضيع + الرسائل الخاصة)

  • المواضيع العامة فقط

  • المواضيع غير العامة فقط

  • المواضيع غير العامة + الرسائل الخاصة

  • الرسائل الخاصة فقط

هذا لا يغطي “المواضيع العادية (سواء كانت عامة أو غير عامة)، ولكن ليس الرسائل الخاصة”، وهو خيار منطقي إلى حد كبير.

وبالإضافة إلى ذلك، رغم أنه خيار أقل احتمالاً، “المواضيع العامة والرسائل الخاصة”

إعجاب واحد (1)