استراتيجيات تصفية الرسائل المزعجة / حسابات المستخدمين المدعومة بالذكاء الاصطناعي؟

يواجه منتدى أساعد فيه موجة من تسجيلات الحسابات العشوائية في الأشهر الأخيرة. هذه على الأرجح روبوتات ذكاء اصطناعي، حيث يبدو أنها قادرة على ملء نموذج تسجيل (بشكل أساسي، تحديد مربعات)، وحل اختبار hCaptcha، والتعامل مع البريد الإلكتروني للتحقق، وحتى معلومات ملف تعريف المستخدم. يمكننا عادةً تخمين التسجيلات المزيفة بناءً على عدة عوامل (على سبيل المثال، وقت قراءة المقالات صفر، بعض الأشياء الدقيقة حول الأسماء/عناوين البريد الإلكتروني، معلومات المستخدم المزيفة الواضحة)، ولكن هذا ليس سهلاً (على سبيل المثال، غالبًا ما تكون عناوين Gmail شرعية). ومع ذلك، فإن هذه العملية غير مستدامة - فقد كان لدينا أحيانًا 10 حسابات مزيفة يوميًا، ومن السهل جدًا ارتكاب خطأ نظرًا لقدرتنا المحدودة على فرز هذه الحسابات.

أدى إضافة اختبارات CAPTCHA إلى تقليل عدد التسجيلات المزيفة، ولكن لا يزال لدينا عدد كبير من المستخدمين الذين يحتاجون إلى الموافقة، مما يعني غالبًا ما يستغرق الأمر أسبوعًا أو أسبوعين للمستخدمين الجدد للانضمام. لقد نظرنا في استبيانات نصية للمستخدمين الجدد، ولكن الواقع هو أننا لا نملك القدرة على قراءة مجموعة من الأسئلة وتخمين ما إذا كانت تم إنشاؤها بواسطة الذكاء الاصطناعي أم لا (بالإضافة إلى ذلك: هذه المشكلة ستصبح أصعب فقط).

أحد الخيارات هو ببساطة السماح لهؤلاء المستخدمين بالانضمام، ثم وضع علامة عليهم إذا نشروا شيئًا واضحًا أنه بريد عشوائي؟ أعتقد أننا مترددون في فتح الباب أمام هذا، لأنه ببساطة ينقل العملية من مكان (التسجيل) إلى مكان آخر (المنشورات التي تم وضع علامة عليها) ولا يمكن إعادة القط إلى الحقيبة: مائة مستخدم ذكاء اصطناعي كامن يبدأون جميعًا في النشر ببطء على مدى بضعة أشهر يمكن أن يدمروا المنتدى تمامًا.

هل لدى أي شخص استراتيجيات للمساعدة في التعامل مع هذا؟ نحن صغار نسبيًا لذا لا يمكنني تخيل أننا الوحيدون الذين يواجهون هذا…

4 إعجابات

لدي ما بين 5 و 10 حسابات مزعجة يوميًا على أكبر منتدى لدي.

أستخدم ما يلي للمساعدة:

لقد قمت بتثبيت هذا مؤخرًا قبل بضعة أيام، وهو فعال بشكل كبير:

يقوم بكتم الصوت تلقائيًا ولا ينشئ عناصر للمراجعة.

قد يساعد تعديل إعدادات البريد العشوائي لديك أيضًا: /admin/site_settings/category/spam

7 إعجابات

ربما تقاتل النار بالنار وتحاول استخدام خيار اكتشاف البريد العشوائي بالذكاء الاصطناعي؟ Discourse AI - Spam detection

7 إعجابات

فيما يتعلق بحسابات مستخدمي الذكاء الاصطناعي، هل يمكنك التوسع في “الضرر” الذي تسببه إذا لم ينشر المستخدمون أبدًا؟

لقد أجرينا تغييرًا قبل شهر حيث نقوم بإخفاء الملفات الشخصية من المستخدمين ذوي الثقة المنخفضة والمجهولين حتى ينشر المستخدم بالفعل، بحيث يتم إخفاء البريد العشوائي.

أحد الأساليب المثيرة للاهتمام في رأيي إذا كان الحجم مرتفعًا حقًا هو التخلص من الحسابات بعد 30 يومًا إذا لم ينشروا، فهم بحاجة إلى الكشف عن أنفسهم أو سيتم التخلص منهم.

لقد نجح اكتشاف البريد العشوائي بالذكاء الاصطناعي بشكل كبير في جميع المنتديات التي قمنا بتمكينه فيها، يمكنك استخدامه في منتدى الخاص بك مع بعض النماذج المجانية مثل gemini free tier. نحن نمنح عملائنا الوصول إلى نموذجنا، ولكن هذا غير متاح على نطاق واسع لمن يقومون بالاستضافة الذاتية.

4 إعجابات

هناك مشكلة صغيرة أراها مع Discourse.. وهي تجاهل القدرة على استخدام CloudFlare Turnstile فيه بشكل أصلي. إنه بصراحة أحد أفضل الحلول لـ Captcha التي وجدتها، وأنا أدير برنامجًا لمنتدى مدفوع يستخدمه ويحصل على القليل جدًا من البريد العشوائي فيه، على الرغم من أنني أحصل على الكثير من تسجيلات المستخدمين الجدد. يتم التقاط معظم الرسائل غير المرغوب فيها بواسطة Turnstile.
لا أفهم حقًا لماذا لم يقم Discourse، بعد كل هذا الوقت، بتمكين العروض المتاحة في النواة حتى الآن.

عندما كنا نتعرض للفيضانات، تجاوزت حسابات الذكاء الاصطناعي حسابات المستخدمين الجدد الحقيقيين بنسبة 10 إلى 1، مما جعل بعض مهام إدارة المنتدى غير عملية للغاية. كان هناك خوف على مستوى أعلى من قبل المشرفين من أن وجود منتدى حيث نسبة كبيرة أو غالبية المستخدمين هم روبوتات ذكاء اصطناعي / سبام يمكن أن يكون لديه القدرة على إحداث ضرر حقيقي في المستقبل، حتى لو كانوا يتسللون فقط في الوقت الحالي. على سبيل المثال، إذا بدأ مئات المستخدمين المزيفين بعد عام من الآن في نشر مشاركات معقولة ولكن عديمة الفائدة، تخيلنا أنه يمكن أن يطغى بسهولة على قدرتنا على المواكبة ويجعل المنتدى بأكمله عديم الفائدة تمامًا :slight_smile:

الأمر أفضل قليلاً الآن فيما يتعلق بالمنضمين الجدد، ولكن أعتقد أن تفضيل الجميع هو عدم وجود مشكلة المتسللين هذه إذا استطعنا تجنبها. تم بالفعل كشط لوحتنا بقوة لتدريب الذكاء الاصطناعي (إنها منطقة متخصصة، لذا على الأقل في إصدارات GPT الأقدم كان من الممكن أن تجعل GPT تكرر اقتباسات مباشرة تقريبًا من منشورات المنتدى إذا طرحت السؤال الصحيح)، لذا يشعر الجميع بالمرارة قليلاً حيال ذلك.