مرحباً بالجميع،
أود أن أقترح مرشحاً بمساعدة الذكاء الاصطناعي للردود ذات الإشارة المنخفضة / عديمة المعنى (“ردود الماء”، التعليقات العشوائية العامة) داخل المواضيع.
المشكلة
في العديد من المجتمعات الناطقة باللغة الإنجليزية، غالباً ما تغمر المواضيع بردود قصيرة ومنخفضة الجهد مثل:
- “شكراً / لطيف / منشور جيد”
- “أوافق”
- “متابعة”
- “أعلى”
- مجاملات عامة لا تحتوي على معلومات جديدة
تضيف هذه الردود ضوضاء، وتزيد من التمرير، وتقلل من تجربة القراءة للجميع - خاصة في المواضيع الطويلة.
يمكن للمشرفين محاربة هذا الأمر بالقواعد والإجراءات اليدوية، لكن هذا لا يتوسع بشكل جيد. كما أن التصفية القائمة على التعابير النمطية (regex) فقط تميل إلى أن يكون لها معدل إيجابيات خاطئة مرتفع.
ما بنيته / النموذج الأولي الحالي
أنا أجرب حالياً نهجاً شبيهاً بالإضافة (plugin-like approach):
- مرشح أولي بالتعابير النمطية (Regex pre-filter) للقبض على الردود القصيرة / المراوغة الأكثر وضوحاً
- ثم تمرير المرشحين المتبقين إلى نموذج لغوي كبير (LLM) للتصنيف
- يجب أن تكون واجهة المستخدم شفافة: عرض عدد الردود التي تم إخفاؤها
- يجب أن تكون الردود المخفية قابلة للعرض عند الطلب (“إظهار الردود المخفية”)
- (اختياري) للمحتوى المخفي، قم بتشغيل خطوة LLM أخرى لاستخلاص 2-3 جمل تمثيلية من الردود المخفية، حتى يتمكن القراء من رؤية “ما تم إخفاؤه” بسرعة دون توسيع كل شيء.
حتى مع التعابير النمطية وحدها، تتحسن تجربة القراءة كثيراً (تمرير أقل)، لكن معدل الإيجابيات الخاطئة مرتفع جداً - لذا أعتقد أن الحكم القائم على LLM ضروري.
السلوك المقترح للمنتج (للمستخدم)
داخل كل موضوع، سيرى القراء شيئاً مثل:
- “إخفاء 12 رداً (مرشح الإشارة المنخفضة: متوسط)”
- أزرار: إظهار الردود المخفية / تغيير مستوى المرشح
وتقديم عدة مستويات، على سبيل المثال:
- إيقاف: إظهار كل شيء
- منخفض: إخفاء الهراء الواضح (دقة عالية جداً)
- متوسط: إخفاء الردود الشائعة ذات الإشارة المنخفضة
- مرتفع: تصفية قوية (يختارها المستخدم)
والأهم من ذلك:
- يجب أن يكون هذا تفضيلًا لكل مستخدم (وربما يمكن تكوينه أيضاً لكل فئة/إعداد افتراضي للموقع).
- يجب أن يظل النظام شفافاً وقابلاً للعكس: لا يتم “حذف” أي شيء، بل يتم إخفاؤه افتراضياً فقط.
لماذا يناسب هذا Discourse (خاصة الآن)
لدى Discourse بالفعل العديد من الميزات المتعلقة بالذكاء الاصطناعي، ويتوسع نظام Discourse AI البيئي. أعتقد أن “منظف” الردود داخل الموضوع هو أحد أكثر الاستخدامات العملية وعالية التأثير لنماذج LLM لتجربة المستخدم في المجتمع.
إنه ليس بالضبط “كشف البريد العشوائي” (الذي يكون عادةً على مستوى الحساب). هذا يتعلق أكثر بجودة القراءة على مستوى الموضوع.
أسئلة للمسؤولين/المجتمع
- هل لدى Discourse بالفعل خطط لـ مرشح جودة الردود / الإشارة المنخفضة؟
- هل سيكون من المنطقي بناء هذا كتوسيع لـ Discourse AI، أو كإضافة منفصلة؟
- ما هي أفضل طريقة لتنفيذ واجهة المستخدم/تجربة المستخدم بحيث تكون شفافة ولا تربك المستخدمين؟
- أي مخاوف بشأن سياسة الإشراف، مستويات الثقة، أو الحالات القصوى (على سبيل المثال، الردود القصيرة ولكن القيمة مثل “تم الحل”، “+1 مع رابط”، إلخ)؟
إذا كان هذا الاتجاه منطقياً، فسأكون سعيداً بمشاركة المزيد من التفاصيل (قواعد التعابير النمطية، نموذج واجهة المستخدم، أفكار المطالبات) وربما العمل على طلب سحب/إضافة.
شكراً!