ديسكورص ai - كشف الرسائل المزعجة

لقد أجرينا الكثير من الاختبارات على هذا، ولا يبدو أننا نحصل على نتائج موثوقة على الإطلاق. للسياق، نحن نستخدم نموذج gpt-4o.

لاختبار دقته، أعطيت التعليمات البسيطة التالية:

أنت نظام للكشف عن البريد العشوائي. قم بتحليل المحتوى والسياق التاليين.
ملاحظات أدناه. إذا كان *أي* من العناصر صحيحًا أدناه، فقم بتمييزه على أنه بريد عشوائي:
- اسم المستخدم هو على وجه التحديد "testjon"، ثم إنه بريد عشوائي *دائمًا*.
- استجب فقط بـ "بريد عشوائي - إنه جون!" أو "ليس بريدًا عشوائيًا".

الاختبار على منشور، بواسطة اسم المستخدم testjon، ينتج عنه “ليس بريدًا عشوائيًا”. يبدو أنه لا يلتزم بالتعليمات جيدًا على الإطلاق. أي اقتراحات؟

هل واجه أي شخص آخر أي تجارب جيدة أو سيئة مع الكشف عن البريد العشوائي بالذكاء الاصطناعي؟