قرار جيد، تم اقتراح ذلك كخيار محتمل فقط. كانت هناك نماذج أفضل مثل GPT4-Turbo و Claude 3 منذ تلك التدوينة التي يمكن أن تشير إلى أداء أفضل من الناحية النظرية.
لم يكن هذا انتقادًا للنهج العام هنا.
يعد استخدام نموذج لغوي كبير (LLM) للبحث عن ميزات في النص قد تشير إلى أنه بريد عشوائي هدفًا رائعًا حقًا وأنا أرحب بالإضافة بحماس.
مشكلتي الوحيدة كانت مع الادعاء بأنه يمكنك تحديد النص الذي تم إنشاؤه بواسطة الذكاء الاصطناعي تلقائيًا، وهي مشكلة صعبة للغاية.
لاحظ الفرق:
- هل تحديد البريد العشوائي العام باستخدام نموذج لغوي كبير (LLM) = رائع ويمكنني أن أرى كيف يمكن أن يكون هذا قابلاً للتتبع وجديرًا بالاهتمام للغاية
- هل تحديد أن البريد العشوائي تم إنشاؤه بواسطة الذكاء الاصطناعي - مع أو بدون استخدام نموذج لغوي كبير (LLM) هذا صعب. لا أعتقد أن النماذج الحالية قادرة على القيام بذلك بشكل جيد على وجه التحديد والإيجابيات هي على الأرجح مجرد هلوسات.
أتفهمك! نعم، إنها قضية أكثر دقة. في الواقع، في اختباري الأصلي، حاولت إعداده لكلا الأمرين، لكن التركيز على البريد العشوائي فقط قد يؤدي إلى نتائج أفضل هنا.
إذن نحن متفقون.
أعتقد أن هناك بعض العلامات الدالة على الذكاء الاصطناعي - مثل طول المنشور والاستخدام المفرط للغة المزخرفة بشكل استثنائي … لذلك ربما يمكن تحليل تلك الجوانب … قد يكون طول المنشور صعبًا على نموذج لغوي كبير ولكنه قد يكون “الزخرفة” أقل صعوبة. يمكنك استخدام دوال حتمية للإبلاغ عن طول المنشور بالطبع.
من ناحية أخرى، إذا استخدم شخص ما ChatGPT لتحسين لغته الإنجليزية (كلغة ثانية) على سبيل المثال، فإن الإبلاغ عن منشوره قد لا يكون مفيدًا للإدماج المجتمعي العام.
بالذهاب خطوة أبعد هنا، قد تكون تقنيات التعلم الآلي العامة مفيدة ولكنها أكثر تعقيدًا في التنفيذ من مجرد إرسال النص إلى نموذج لغوي كبير والحصول على النتيجة.