لقد قمنا بدمج نماذج GitHub - unitaryai/detoxify: Trained models & code to predict toxic comments on all 3 Jigsaw Toxic Comment Challenges. Built using ⚡ Pytorch Lightning and 🤗 Transformers. For access to our API, please email us at contact@unitary.ai. للتعامل مع التصنيف التلقائي للسمية وإجراء وضع علامة تلقائية عند تجاوز حد قابل للتكوين.
ما وجدناه هو أنه بينما يعمل بشكل رائع إذا كان لديك تسامح صفر مع السمية النموذجية في مثيلاتك، مثل ما تمتلكه المزيد من المثيلات “العلامات التجارية”، بالنسبة لمثيلات Discourse الأخرى الموجهة نحو المجتمع، كانت نماذج السمية صارمة للغاية، مما أدى إلى الكثير من العلامات في المثيلات الأكثر تساهلاً.
لهذا السبب، خطتنا الحالية هي إيقاف السمية ونقل هذه الميزة إلى المكون الإضافي الخاص بنا لفرز الذكاء الاصطناعي، حيث نقدم مطالبة قابلة للتخصيص للمسؤولين لتكييف اكتشاف السمية التلقائي الخاص بهم مع المستويات المسموح بها في مثيلاتهم.
نخطط أيضًا لتقديم نموذج LLM استضافة للإشراف لعملائنا، على غرار https://ai.google.dev/gemma/docs/shieldgemma أو https://arxiv.org/abs/2312.06674، والذي أدى أداءً جيدًا جدًا في تقييماتنا الداخلية مقابل نفس مجموعة البيانات المستخدمة في مسابقة Jigsaw Kaggle الأصلية التي أنتجت Detoxify.