لقد قمت بإعداد أتمتة “فرز المنشورات باستخدام الذكاء الاصطناعي” لمراجعة المحتوى على منصتي (madeira.community — دليل أعمال متعدد اللغات لجزيرة ماديرا).
تعمل الأتمتة بشكل مثالي مع المنشورات العامة. ومع ذلك، قمت بتفعيل خيار “تضمين الرسائل الشخصية” ووجدت أن الرسائل المباشرة بين المستخدمين العاديين لا يتم فحصها على الإطلاق.
إن قلقنا حقيقي: يمكن للأشخاص الخبيثين استخدام الرسائل الخاصة للقيام بأنشطة غير قانونية — مثل الاتجار بالمخدرات، أو مشاركة البيانات المالية المسروقة، أو استغلال القاصرين — مع تجاوز مراجعة الذكاء الاصطناعي التي تعمل بشكل جيد مع المحتوى العام.
أسئلتي:
هل خيار “تضمين الرسائل الشخصية” يدعم فعلياً فحص الرسائل المباشرة بين مستخدمين عاديين (غير موظفين)؟
إذا لم يكن كذلك — هل هذا تصميم مقصود أم قيد معروف؟
هل توجد طريقة مدعومة لتطبيق فرز الذكاء الاصطناعي على الرسائل الخاصة بين المستخدمين العاديين؟
لقد وجدت إشارة إلى تعديل برمجي بعنوان “تخطي فحص الرسائل الخاصة في الفرز بواسطة نماذج اللغة الكبيرة افتراضياً”، مما يوحي بأن هذا قد يكون مقصوداً. لكن خيار الواجهة موجود — لذا أنا مرتبك بشأن وظيفته الفعلية.
لقد اختبرته بإرسال رسالة خاصة بين مستخدمين عاديين (من testUser إلى darinauser، وكلاهما ليس من الموظفين) يحتوي على محتوى غير قانوني بوضوح: «كوكايين. أسلحة. قنابل» و«أفلام إباحية. قذارة. فساد. عنف». تم تسليم الرسائل ولم يتم تحديدها. ظلت قائمة المراجعة فارغة. أما نفس المحتوى في المنشورات العامة، فقد تم تحديده فورًا.
يمكنني التأكيد على أنها لم تتم معالجتها، حيث أن معرفات الموضوعات الخاصة برسائل البريد الخاصة تلك (210، 211، 212 و 214) ومعرفات المنشورات غير موجودة في جدول ai_api_audit_logs.
أعتقد أن “نوع الموضوع” “جميع الموضوعات” يعني جميع الموضوعات التي ليست رسائل بريد خاص. هل يمكنك تجربة ترك هذا الحقل فارغًا؟
نجح ذلك! شكرًا لك يا ريتشارد. ترك نوع الموضوع فارغًا حل المشكلة — الآن يتم فحص الرسائل المباشرة بين المستخدمين العاديين.
أخطط الآن لإعداد أتمتتين منفصلتين:
إحداهما للمشاركات العامة مع نبرة تعديل صارمة
والأخرى للرسائل الخاصة مع نبرة أخف — تُشير فقط إلى أخطر الانتهاكات (المواد الإباحية التي تتضمن أطفالًا، الاتجار بالمخدرات، الأسلحة)
بهذه الطريقة، تحصل المحتوى العام على تعديل كامل بينما تحظى المحادثات الخاصة بحدود أكثر ملاءمة.