أنا حاصل على درجة الدكتوراه في تعلم الآلة، وقد فكّرت في بناء أداة تتيح لأي شخص تدريب ذكاء اصطناعي مخصص لمساعدة في مراقبة المحتوى على منتديات Discourse. هل تعتقدون أن هذا شيء يريده الناس هنا؟
أعلم أن هناك واجهة برمجة تطبيقات Google Perspective، لكنها عامة جداً. فكرتي هي أن يكون لديك إضافة تسمح لك بمراقبة المنشورات، حيث يتم تدريب مُصنِّف نصوص تلقائياً ليتعلم من عملية المراقبة التي تقوم بها. على سبيل المثال، إذا عيّنت منشوراً على أنه يحتوي على لغة سامة أو أنه خارج الموضوع، فإن النظام يتعلم منك ويمكنه تحديد منشورات مماثلة أو حتى مراقبتها مسبقاً.
تصنيفات النصوص (المستخدمة في المنتديات، على سبيل المثال) موجودة منذ فترة طويلة.
عادةً ما يتم تنفيذ هذا النوع من تصنيف النصوص والتقييم باستخدام المصنفات البايزية.
إذا قمت بالبحث في Google باستخدام الكلمات المفتاحية:
bayesian classifier ruby
و/أو
bayesian classifier javascript
ستجد عددًا كبيرًا من المكتبات والأمثلة لتصنيف النصوص باستخدام المصنفات البايزية.
لقد استخدمنا مصنفات بايزية مختلفة لمراجعة منشورات المنتدى، واكتشاف الرسائل المزعجة، وغيرها على مر السنين؛ وقمنا بتنفيذ كود مخصص لتدريب المصنف عندما يقوم المشرفون بإجراءات المراجعة.
إحدى المشكلات المحتملة هنا هي أن العديد من مهام الإشراف لا تقتصر على عقاب بسيط، بل تكون أكثر تعقيدًا، مثل “إغلاق الموضوع لمدة 12 ساعة” أو “يجب أن يكون هذا المنشور ويكي” أو “يجب نقله إلى فئة مختلفة”.