أفضل الممارسات للتعامل مع مستخدمي الـ Spam ومنشورات الردود من GPT

السياق: لقد بدأنا مجتمعًا قبل عدة سنوات، تمامًا عندما ضرب الوباء بقوة، ثم اضطررنا إلى تخصيص جميع الموارد لمبادرات أخرى لعدة سنوات. كان لدينا الكثير من المشاركة ثم عندما أوقفنا برامج وإدارة المجتمع، تباطأت المنتديات إلى حد التوقف. نحن على وشك استثمار المزيد من الوقت في تنفيذ استراتيجية وإدارة مجتمعنا، لذا فإن هذا السؤال هو الأكثر إلحاحًا!


نلاحظ حاليًا أن العديد من المستخدمين الذين ينضمون إلى المجتمع الآن هم إما:

  1. ينضمون لنشر رابط لموقعهم التسويقي الذي يركز على الكلمات المفتاحية.
  2. ينضمون وينشرون ما يبدو وكأنه رد/منشور تم إنشاؤه بواسطة LLM / GPT.

إليك مثال لمنشور وصل إلى قائمة الانتظار لدينا أمس:

ملاحظة: أنشأ المستخدم حسابه في نفس اليوم.

انقر لعرض لقطة شاشة للمنشور المعتمد

تم إرسال رسالة النظام الخاصة بنا إلى المستخدم:

انقر لعرض لقطة شاشة لرسالة النظام المعتمدة

كان هذا المنشور من مستخدم جديد ردًا على هذا المنشور الذي يعود لـ 3 سنوات من كريس أندرسون.

عندما تقرأ المنشور المعتمد من المستخدم الجديد، من الواضح جدًا أن هذه الرسالة غير صادقة وتم إنشاؤها بواسطة GPT أو شيء مشابه.

هل هناك طرق مثلى لمنع ظهور هؤلاء المستخدمين في المجتمع؟

هل هناك طرق لمنع المستخدمين من إدخال ردود جاهزة من LLM، لأي سبب شخصي أو خبيث قد يرغبون في القيام بذلك؟

أي مدخلات ستكون رائعة!

4 إعجابات

كم مرة يحدث هذا؟ أتساءل عما إذا كان موقعك مستهدفًا بشكل خاص لسبب ما.

أنا أخمن تخمينًا جريئًا بأن الأمر يتعلق بأحد هذين الموقعين أو كليهما: http://bestpickleballpaddle.com/، https://thepickleballpaddles.com/. (لاحظ، هذه مواقع حقيقية، لكن دعنا لا نعطيها الكثير من الزيارات من هنا.)

الدافع الأكثر وضوحًا الذي يمكنني التفكير فيه لإنشاء منشور مثل الذي في لقطة الشاشة الخاصة بك هو اكتساب بعض الثقة على الموقع من أجل نشر روابط البريد العشوائي في المستقبل. إذا كانت هذه هي المشكلة، فقد يكون من المفيد تغيير قيمة إعداد الحد الأدنى للثقة لنشر الروابط في موقعك من القيمة الافتراضية للمستوى 0 إلى المستوى 1 أو 2. إذا كانت هناك بعض المجالات التي يسعدك السماح للمستخدمين بأي مستوى ثقة بالنشر إليها، يمكنك إضافة تلك المجالات إلى إعداد الموقع المجالات المسموح بالروابط إليها.

أنا فقط أطرح أفكارًا، لكنني أتساءل عما إذا كان من الأفضل، بدلاً من بذل الكثير من الجهد لمحاولة اكتشاف المحتوى الذي تم إنشاؤه بواسطة LLMs، محاولة تقليل الدافع لإنشاء هذه الأنواع من المنشورات في المقام الأول. قلقي هو أن المحتوى الذي تم إنشاؤه بواسطة LLM سيصبح أكثر صعوبة في اكتشافه بمرور الوقت. قد تصبح مشكلة تحديد المحتوى بشكل خاطئ على أنه تم إنشاؤه بواسطة LLM.

نهج آخر قد يكون مفيدًا في بعض الحالات هو استخدام العضوية في منظمة، أو النشاط على منصة أخرى كمعيار لإنشاء حساب Discourse، أو كمعيار لاكتساب مستوى ثقة يسمح بنشر الروابط على موقع Discourse. على سبيل المثال، يحتوي نموذج التسجيل الخاص بك على حقل اختياري يسأل عن مستوى تصنيف المستخدم في USAPA. إذا كانت العضوية في USAPA تمنح الأعضاء صفحة ملف شخصي على موقعهم، يمكنك جعل العضوية في USAPA مطلبًا للتسجيل في موقعك عن طريق جعل “رابط ملف USAPA الشخصي” حقلًا مطلوبًا في نموذج التسجيل الخاص بك. يمكنك بعد ذلك تمكين إعداد موقع Discourse يجب الموافقة على المستخدمين والموافقة فقط على المستخدمين بعد تأكيد عضويتهم في USAPA. احتمال آخر هو أن Discourse يمكن أن تضيف ميزة تسمح بتقييد مستوى ثقة المستخدم بناءً على معيار مخصص. على سبيل المثال، لا تسمح للمستخدم بالتقدم إلى ما بعد مستوى الثقة 1 حتى يتم تأكيد عضويته في USAPA.

أنا فقط أستخدم عضوية USAPA كمثال هنا. يمكنني أن أفهم لماذا قد لا ترغب في طلب عضوية USAPA للمستخدمين على موقعك. فكرة إنشاء الثقة من خلال العضوية أو النشاط على موقع آخر تتعلق بالمكون الإضافي الذي تتم مناقشته هنا: $10k Bounty: Gitcoin Passport plug-in for Discourse.

6 إعجابات

هذا بالضبط.

يجب بالتأكيد أن يكون هناك بعض الأجندة، حتى لو لم تكن واضحة بعد.

لقد كان لدي مؤخرًا مستخدم مقنع للغاية ووصل إلى مستوى الثقة 2 قبل أن يصبح صريحًا بشأن الترويج لمنتجه، بعد أن أشار إليه في الأصل فقط.

إعداد رابط مستوى الثقة مفيد وستبدأ الحسابات المشبوهة في اقتراح البحث عن xyz عبر جوجل بدلاً من أن تكون قادرة على نشر الروابط: علامة حمراء أخرى.

في بعض الأحيان، عليك فقط الانتظار حتى يتراكم قدر كافٍ من الأدلة لتكون متأكدًا بما يكفي لحظر حساب.

لسوء الحظ، فإن تأخير الإجراء يعني أن عملية التنظيف تتطلب المزيد من العمل لاحقًا.

4 إعجابات

هل هناك فحص “تم النسخ واللصق بسرعة مريبة”؟ ما لم يكن كل شيء عبارة عن روبوت مصمم للكتابة ببطء لمحاكاة الإنسان…

إذًا (إذا فهمت الأمور بشكل صحيح) فالشيء الجيد هنا هو أن هذا الشخص تم اكتشافه بواسطة البنية التحتية الحالية. يزعج الموظفين، ولكن ليس المستخدمين.

أعتقد أن سيمون أصاب الهدف هنا:

سأكون مهتمًا بمعرفة مدى حدوث ذلك. حقيقة أن هذا الشخص قام بتعيين صورة رمزية ذات صلة، واسم مستخدم ذي صلة، في منتدى ذي صلة.. يجعلني أفترض أن هذا جزء بشري.
قد يكون مجرد متدرب تسويق متحمس للغاية؟

إعجاب واحد (1)

لقد واجهت مشكلة مماثلة. الطرف المخالف معلق حاليًا. هناك مواقع ويب يمكن أن تساعد في تحديد النصوص التي تم إنشاؤها بواسطة الذكاء الاصطناعي، وهو أمر مفيد ولكنه ليس حلاً طويل الأجل. – سيستمر الذكاء الاصطناعي في التحسن حتى لا يمكن تمييز الفرق.

ومع ذلك، يقترح راندال مونرو أنه قد يكون مشكلة تحل نفسها بنفسها.

3 إعجابات

للعلم

أنا مشرف فئة في منتدى OpenAI Discourse (ref) (لست موظفًا في OpenAI) لذا أرى التعليقات على المنتدى فيما يتعلق بتغييرات ChatGPT بمرور الوقت (ref) وبينما بيانك صحيح بشكل عام، فإنني أضيف بعض التوضيح فيما يتعلق بـ ChatGPT.

منذ أن أصبح ChatGPT متاحًا ولعدة أشهر كانت قدراته تتحسن، كانت الإكمالات:

  • أكثر ترابطًا
  • متوافقة مع الموجه
  • أصبحت أكثر إيجازًا، وقصيرة الطول

ثم تم إجراء تغيير أدى إلى إكمالات كانت:

  • أقل ترابطًا
  • أقل توافقًا مع الموجه
  • أقل إيجازًا وأطول طولًا

لاحظ العديد من المستخدمين في المنتدى أنه كان الأمر كما لو تم التراجع عن ChatGPT إلى إصدار سابق قبل بضعة أشهر. أولئك الذين يستخدمون ChatGPT لإنشاء التعليمات البرمجية، وهو استخدام أستخدم فيه ChatGPT أيضًا، لاحظوا ذلك بشكل أكثر وضوحًا حيث كانت تظهر المزيد من أخطاء بناء الجملة مع التغيير.

لذلك، فإن الفكرة التي يجب وضعها في الاعتبار هي أنه إذا كنت تحاول تحديد المحتوى الذي تم إنشاؤه بواسطة ChatGPT، فهو هدف متحرك وأنه لا يتحسن دائمًا. كمبرمج، إذا كنت أحاول تحديد المحتوى الذي تم إنشاؤه بواسطة ChatGPT، فسيكون هذا ذا قيمة.

أيضًا، ليس لدي أي معرفة داخلية بكوني مشرفًا على الموقع لأنني لست موظفًا في OpenAI، لذلك إذا سمعت عن أدوات تدمج معلومات لجعل محتوى ChatGPT هذا قابلاً للتعريف، فلا يمكنني تقديم معلومات لذلك.



بالنسبة لأولئك الذين لا يستخدمون ChatGPT، إليك مثال بسيط باستخدام النص أعلاه.

مثال (انقر على المثلث للتوسيع)

إصدار ChatGPT في يوليو 20
موجه

قم بتدقيق، استخدم نبرة لطيفة، كن موجزًا.

للعلم

أرغب في توضيح بعض النقاط المهمة المتعلقة بالتغييرات في ChatGPT بمرور الوقت. بصفتي مشرف فئة في منتدى OpenAI Discourse، كنت أراقب عن كثب ملاحظات المجتمع بشأن تطوير ChatGPT (ref).

في البداية، بعد إصداره، أظهر ChatGPT تحسنًا مستمرًا في قدراته على مدى عدة أشهر. أصبحت الإكمالات أكثر ترابطًا، وتتوافق بشكل أفضل مع الموجهات المعطاة، وأصبحت أكثر إيجازًا واختصارًا.

ومع ذلك، كان هناك تحديث لاحق أدى إلى بعض الانتكاسات. لاحظ المستخدمون أن الإكمالات أصبحت أقل ترابطًا، وأقل توافقًا مع الموجهات، وأطول طولًا. أدى هذا إلى مقارنات مع إصدار سابق من ChatGPT، والذي بدا وكأنه خطوة إلى الوراء. على وجه الخصوص، أولئك الذين يستخدمون ChatGPT لتوليد التعليمات البرمجية واجهوا تأثيرًا أكثر وضوحًا، حيث لاحظوا زيادة في أخطاء بناء الجملة مع التغيير.

من الضروري فهم أن تحديد المحتوى الذي تم إنشاؤه بواسطة ChatGPT أصبح هدفًا متحركًا. بينما كان يتحسن باستمرار من قبل، إلا أن هذا ليس هو الحال دائمًا الآن. كمبرمج بنفسي، أجد هذه المعلومات قيمة، خاصة عند محاولة التمييز بين المحتوى الذي أنشأه الإنسان والمحتوى الذي أنشأه الذكاء الاصطناعي.

يجب أن أوضح أنه على الرغم من كوني مشرفًا على الموقع، إلا أنني لست موظفًا في OpenAI ولا أمتلك أي معرفة داخلية. لذلك، إذا كانت هناك أي أدوات أو طرق تم تطويرها لتحديد محتوى ChatGPT، فلا يمكنني تقديم معلومات حول هذا الأمر.

شكرًا لاهتمامكم، وآمل أن يساعد هذا التوضيح في فهم الحالة الحالية لتطوير ChatGPT.

مع خالص التقدير،

[اسمك]


إعجابَين (2)

للعلم فقط

رأيت للتو هذا أغلقت OpenAI أداة اكتشاف الذكاء الاصطناعي الخاصة بها بهدوء وأكدت ذلك هنا

اعتبارًا من 20 يوليو 2023، لم يعد مصنف الذكاء الاصطناعي متاحًا بسبب انخفاض معدل دقته. نحن نعمل على دمج الملاحظات ونبحث حاليًا عن تقنيات إثبات أكثر فعالية للنصوص، وقد التزمنا بتطوير ونشر آليات تمكن المستخدمين من فهم ما إذا كان المحتوى الصوتي أو المرئي تم إنشاؤه بواسطة الذكاء الاصطناعي.

3 إعجابات

@EricGT نقاط ممتازة! نعم، إنه بالتأكيد هدف متحرك. أنا لست قلقًا بشأن ChatGPT على وجه الخصوص. لقد خرج القط من الحقيبة، كما يقولون، وأعتقد أنه مسألة وقت فقط قبل أن يستخدم شخص ما عديم الضمير التكنولوجيا بطريقة ضارة عن قصد. :cry:

إعجابَين (2)

نعم، هذا (بما في ذلك الترويج الخفي بدون روابط) بالإضافة إلى الروابط والإعلانات التي يمكنهم إضافتها إلى ملفاتهم الشخصية - إما للاستجابة المباشرة أو لتحسين محركات البحث. في حالات أخرى، لتجميع الحسابات للبريد العشوائي عبر الرسائل المباشرة. هذه هي الحالات الرئيسية على حد علمي.