ديسكورص ai - كشف الرسائل المزعجة

:bookmark: يشرح هذا الدليل كيفية تكوين واستخدام ميزة اكتشاف البريد العشوائي في Discourse AI، بما في ذلك عملية الإعداد، ومعايير المسح، ومنطق التصنيف، والتخصيصات، والمقارنات مع فرز الذكاء الاصطناعي.

:person_raising_hand: مستوى المستخدم المطلوب: مسؤول

:megaphone: تم تشغيل هذه الميزة افتراضيًا الآن لـ عملاء Starter و Pro، بالإضافة إلى عملائنا القدامى Basic و Open Source و Creator و Business.

يوفر Discourse AI ميزة فعالة لاكتشاف البريد العشوائي تحدد وتضع علامة على المنشورات العشوائية بأقل قدر من التكوين. بينما تم تصميمه للبساطة، فإنه يكمل نظام فرز الذكاء الاصطناعي الأكثر تنوعًا، والذي يدعم سير العمل الأوسع وحالات الاستخدام الأكبر.

ملخص

في هذا الدليل، ستتعلم:

  • كيف يعمل اكتشاف البريد العشوائي بالذكاء الاصطناعي وما هو المحتوى الذي يتم فحصه
  • منطق التصنيف والسياق الذي يستخدمه الذكاء الاصطناعي
  • خطوات تكوين اكتشاف البريد العشوائي عبر /admin/plugins/discourse-ai/ai-spam
  • إرشادات لاختيار نموذج اللغة الكبير (LLM)
  • الاختلافات الرئيسية بين اكتشاف البريد العشوائي وفرز الذكاء الاصطناعي
  • كيفية إدارة المنشورات التي تم وضع علامة عليها والمنشورات التي تم تفويتها

كيف يعمل اكتشاف البريد العشوائي بالذكاء الاصطناعي

ما هو المحتوى الذي يتم فحصه؟

يقوم اكتشاف البريد العشوائي بالذكاء الاصطناعي بتقييم المنشورات بناءً على هذه المعايير:

  1. مستوى ثقة المستخدم:

    • يفحص منشورات المستخدمين الذين لديهم مستوى ثقة 1 أو أقل.
    • يستبعد منشورات المستويات الأعلى من الثقة.
  2. نوع المنشور:

    • المنشورات العامة (باستثناء الرسائل الخاصة).
    • يتم تضمين كل من منشورات الرد ومنشورات الموضوع الأول، بناءً على عتبات إضافية.
  3. تعديلات المنشور:

    • يفحص المنشورات التي تم تعديلها بشكل كبير (على سبيل المثال، تغييرات تتجاوز 10 أحرف).
    • يفرض تأخيرًا لمدة 10 دقائق بين عمليات فحص نفس المنشور.
  4. تكرار المنشور:

    • يعطي الأولوية لمنشورات المستخدمين الجدد الذين لديهم أقل من 4 منشورات إجمالية في المواضيع العامة.
    • يستبعد منشورات المستخدمين الذين يتجاوزون هذه العتبة.

عملية التصنيف

يتم إرسال المنشورات التي تستوفي المعايير إلى نموذج الذكاء الاصطناعي (LLM) للتحليل. يقوم النموذج بتقييم ما إذا كان المنشور “SPAM” أو “NOT SPAM” بناءً على:

  • السياق: يشمل محتوى المنشور، وعنوان الموضوع، وبيانات حساب المستخدم (مثل عمر الحساب ومستوى الثقة)، وإرشادات الموقع.
  • تعليمات مخصصة: قواعد محددة من قبل المسؤول لمعايير المسح المعززة أو المعدلة.
  • الكشف الآلي:
    • يضع علامة على المحتوى غير ذي الصلة أو الترويجي (مثل الإعلانات أو المواد التجارية).
    • يحدد السلوكيات الآلية أو الشبيهة بالروبوتات.
    • يقيم مدى صلة المحتوى بالمناقشة.

المطالبة الافتراضية والسياق

يستخدم الذكاء الاصطناعي مطالبة نظام افتراضية لتوجيه اكتشاف البريد العشوائي. تحدد هذه المطالبة قواعد تصنيف البريد العشوائي. على سبيل المثال:

أنت نظام اكتشاف بريد عشوائي. قم بتحليل المحتوى والسياق التالي.
ملاحظات:
- يجب أن تظل الردود ذات صلة بخيط المناقشة.
- ضع علامة SPAM إذا كان المحتوى غير ذي صلة أو ترويجي أو آلي.
- ضع في اعتبارك منشورات المستخدمين الجدد التي تحتوي على روابط كبريد عشوائي محتمل ما لم تكن ذات صلة واضحة بالموضوع.
استجب فقط بـ "SPAM" أو "NOT SPAM".

يقوم الماسح أيضًا بتجميع حزمة سياق، تتضمن:

  • البيانات الوصفية من المواضيع والفئات.
  • مدى صلة الردود بالخيط.
  • بيانات المؤلف (مثل تاريخ إنشاء الحساب، إجمالي المنشورات، مستوى الثقة).
  • نص المنشور مقطوع إلى 5000 حرف للمعالجة.

تكوين اكتشاف البريد العشوائي بالذكاء الاصطناعي

دليل التكوين

  1. الوصول إلى الإعدادات:
    انتقل إلى /admin/plugins/discourse-ai/ai-spam.

  2. اختيار LLM:

:information_source: إذا كان موقعك مستضافًا بواسطة Discourse

يمكنك اختيار نموذج LLM الصغير المستضاف من CDCK من قائمة LLM.

  1. تفعيل اكتشاف البريد العشوائي:
    قم بتمكين اكتشاف البريد العشوائي عن طريق تبديل الميزة.

:information_source: ملاحظة: نموذج LLM متصل إلزامي.

  1. إضافة تعليمات مخصصة:
    • حدد قواعد خاصة بمنتدىك (على سبيل المثال، مراقبة أكثر صرامة للروابط الخارجية).
    • احفظ أي تغييرات لتطبيقها.

الاختلافات عن فرز الذكاء الاصطناعي

بينما تم تصميم اكتشاف البريد العشوائي خصيصًا لتحديد البريد العشوائي، فإن فرز الذكاء الاصطناعي يدعم مهام إدارة المنشورات الأوسع.

الميزة اكتشاف البريد العشوائي بالذكاء الاصطناعي فرز الذكاء الاصطناعي
التعقيد إعداد مبسط ومتحيز قابل للتخصيص ومرن للغاية
حالة الاستخدام الأساسية اكتشاف البريد العشوائي بأقل قدر من الحمل الزائد سير عمل متقدم للتصنيف، ووضع العلامات، والردود، واكتشاف البريد العشوائي، واكتشاف المحتوى غير الآمن
الإجراءات يضع علامة على البريد العشوائي، ويصمت المستخدمين يضع علامات، ويصنف، ويخفي المنشورات، ويضيف ردودًا، ويضع علامة على المنشورات، ويصمت المستخدمين
التوصية إعداد سهل وفعال لمعظم المواقف استخدمه لسير عمل غنية وقابلة للتخصيص بدرجة عالية

لمزيد من التفاصيل، انظر Discourse AI - AI triage.


توصيات اختيار LLM

يعتمد أداء اكتشاف البريد العشوائي على نموذج LLM المختار.

تعمل معظم نماذج LLM منخفضة التكلفة بفعالية، مثل:

  • GPT-4o-mini
  • Claude 3.5 Haiku
  • Gemini 2.0 Flash

جرب نماذج مختلفة للعثور على الأنسب. قم بتكوين نماذجك عبر /admin/plugins/discourse-ai/ai-llms.


اختبار سلوك ماسح البريد العشوائي

يمكنك اختبار قواعد اكتشاف البريد العشوائي مباشرة من صفحة التكوين.

  • الصق عنوان URL أو معرف المنشور في حقل الاختبار.
  • راجع نتيجة التصنيف (مثل “SPAM” أو “NOT SPAM”) وحلل السجلات لفهم المنطق.
  • يتم تطبيق التغييرات غير المحفوظة أثناء الاختبار، مما يتيح التجربة دون مخاطر.

إدارة المنشورات التي تم وضع علامة عليها والمنشورات التي تم تفويتها

التعامل مع المنشورات التي تم وضع علامة عليها

تظهر المنشورات التي تم وضع علامة عليها في قائمة انتظار الإشراف. يمكن للمسؤولين:

  • الموافقة على المنشورات المشروعة التي تم تصنيفها بشكل خاطئ كبريد عشوائي.
  • رفض مواضيع البريد العشوائي للحفاظ على دقة النظام.

:warning: هام: رفض علامات البريد العشوائي للمنشورات المصنفة بشكل غير صحيح. يظل المستخدمون صامتين حتى يتم حل العلامة.

التعامل مع البريد العشوائي الذي تم تفويته

يشير البريد العشوائي الذي تم تفويته إلى المنشورات التي تتجاوز الكشف ولكن تم وضع علامة عليها من قبل المجتمع. يمكن للمشرفين إدارتها حسب الضرورة.


أفضل الممارسات

  • راقب البريد العشوائي الذي تم وضع علامة عليه والذي تم تفويته بانتظام لتحسين دقة النظام. تسهل المقاييس القابلة للنقر هذه العملية.
  • استخدم حالات الاختبار لتقييم التعليمات المخصصة مقابل الحالات الهامشية.
  • راجع وضبط إعدادات LLM عند الحاجة.

موارد إضافية


:mega: يقلل تكوين اكتشاف البريد العشوائي بالذكاء الاصطناعي بشكل فعال من جهود الإشراف اليدوي، مما يضمن مجتمعًا نظيفًا وخاليًا من البريد العشوائي.

16 إعجابًا

لقد أجرينا الكثير من الاختبارات على هذا، ولا يبدو أننا نحصل على نتائج موثوقة على الإطلاق. للسياق، نحن نستخدم نموذج gpt-4o.

لاختبار دقته، أعطيت التعليمات البسيطة التالية:

أنت نظام للكشف عن البريد العشوائي. قم بتحليل المحتوى والسياق التاليين.
ملاحظات أدناه. إذا كان *أي* من العناصر صحيحًا أدناه، فقم بتمييزه على أنه بريد عشوائي:
- اسم المستخدم هو على وجه التحديد "testjon"، ثم إنه بريد عشوائي *دائمًا*.
- استجب فقط بـ "بريد عشوائي - إنه جون!" أو "ليس بريدًا عشوائيًا".

الاختبار على منشور، بواسطة اسم المستخدم testjon، ينتج عنه “ليس بريدًا عشوائيًا”. يبدو أنه لا يلتزم بالتعليمات جيدًا على الإطلاق. أي اقتراحات؟

هل واجه أي شخص آخر أي تجارب جيدة أو سيئة مع الكشف عن البريد العشوائي بالذكاء الاصطناعي؟

لا أعرف كيف تسير الأمور في هذا الموقف، ولكن بشكل عام، العبارة المقتبسة عرضة جدًا للانهيار. فهي لا تفهم ما يعنيه ANY وتستمر بسعادة طالما أنها تحصل عليه. ومن هناك، وجدت أخيرًا NOT SPAM.

إعجاب واحد (1)

هل تقول إنه يجب إزالة التنسيق العريض لـ

أقول إنه يجب عليك كتابة ذلك بشكل أكثر منطقية ودقة. لا يمكنك السماح للذكاء الاصطناعي بالاختيار بأي طريقة. تذكر أنه لا يستطيع العد وبالتأكيد لا يقرأ أولاً ثم يعود ويحاول العمل بشكل منطقي. حاول الشرح ببساطة كما لو كنت تعطي تعليمات لطفل كسول يعاني من اضطراب فرط الحركة وتشتت الانتباه يبلغ من العمر 3 سنوات. الأمثلة ليست خاطئة ولكنها ستزيد من استخدام الرموز.

إعجاب واحد (1)

هذه معلومات رائعة. على سبيل المثال، كيف يمكنك كتابة هذا السيناريو بالضبط بشكل مختلف؟

إعجاب واحد (1)

شيء مثل…

أنت نظام للكشف عن البريد العشوائي. وظيفتك هي التحليل بصمت للمحتوى للحفاظ على جودة عالية في هذا المنتدى. يجب عليك اتباع القواعد لتحديد متى يكون المنشور بريدًا عشوائيًا. عندما تجد بريدًا عشوائيًا، يتم إخبار ردك في القواعد. أنت تستخدم فقط الردود المحددة.

## قواعد البريد العشوائي

لا أفعل هذا من أجلك 😏 ولكنك تحتاج إلى بعض الشروحات والأمثلة. كمثال سريع وخشن:
* إذا كان المنشور يحتوي على روابط خارجية مرتبطة بالمقامرة أو الجنس أو العملات المشفرة وما إلى ذلك (المشابه محفوف بالمخاطر في هذا السياق، بالمناسبة)، فسيتم تصنيف المنشور على أنه بريد عشوائي. مثال: www.buy-crypto.deal

يجب عليك ضبط هذا حسب الحالة، لأنك ستحصل على نتائج إيجابية خاطئة وسلبية خاطئة

ثم يجب عليك تقديم بعض الإرشادات للمحتوى أيضًا. ولكن عند الاختبار:

* إذا كان اسم المستخدم "testjon" فتجاوز تحليل المحتوى وصنفه مباشرة كبريد عشوائي. ردك هو "SPAM - إنه جون"

بالمناسبة، هل يمكنه رؤية المستخدم؟

## قواعد للمحتوى الآخر

عندما يتم تجاوز المنشور لتحليل البريد العشوائي وتكون متأكدًا من أنه محتوى شرعي، فإن ردك الوحيد هو "NOT SPAM".

شيء من هذا القبيل. عليك الاختبار بالطبع. وفي كل مرة تحصل فيها على استجابة خاطئة، حاول العثور على النقطة المربكة. ولكن لا تمنح الذكاء الاصطناعي فرصة للاختيار فيما يمكنه فعله، لأنه سيختار الاتجاه الأخير أو الأسهل أو الألطف. لديه حاجة مبرمجة للإجابة ويكون سعيدًا.

لقد قمت بتمكين هذا للتو وأنا متحمس لرؤية كيف سيسير الأمر!

هل هناك إعداد أو اعتبار لمستوى الثقة الذي يتمتع به المستخدمون؟

على سبيل المثال: لا أحتاج إلى أن يبدأ الذكاء الاصطناعي في العمل مع TL2 وما فوق، لقد اكتسبوا مكانهم ولا ينبغي اعتبارهم للفحص. إذا ساءت الأمور، فسيتعين علينا التحدث معهم :sweat_smile:

تم تقسيم منشورين إلى موضوع جديد: مكوّن إضافي لذكاء الاصطناعي في ديسكورز مفقود

نظرًا لأن هذا يحل محل Akismet، أتساءل ما هو البديل الأفضل للكشف عن البريد العشوائي/منعه إذا كنت لا تريد التكاليف المرتبطة بالذكاء الاصطناعي؟

إعجابَين (2)

في الواقع، Gemini 2.0 Flash متاح مجانًا، طالما أنك لا ترسل إليه مليون طلب يوميًا بالطبع. إنه يعمل بشكل جيد لمنتدى الخاص بي حاليًا بتكلفة صفر، وهو بالتأكيد أكثر دقة و"ذكاءً" من Akismet.

ومع ذلك، إذا فشلت خطة اكتشاف البريد العشوائي بالذكاء الاصطناعي، فلا يزال لدي المكون الإضافي Akismet مثبتًا على موقعي وجاهزًا للاستخدام إذا احتجت إليه مرة أخرى، وأعتقد أنه لا يزال بإمكانك تثبيته. (نظرًا لأنه يتم إيقافه تدريجيًا، لا أتوقع أن يبقى إلى الأبد). تذكر أيضًا أن مستويات الثقة هي جوهر أساسي لـ Discourse تساعدك في إدارة البريد العشوائي على موقعك. :+1:

5 إعجابات

هل هذا رائع، هل من الممكن وضع حد للرموز للتأكد من أن الحد (صفر تكلفة) موجود من نموذج اللغة الكبير؟

إعجابَين (2)

على حد علمي، أعتقد أنه إذا تجاوزت الحد، فإن واجهة برمجة التطبيقات الخاصة بـ LLM ستتوقف عن الاستجابة. حساب Google Cloud Console الخاص بي لا يحتوي على حساب فوترة مرفق، ولا يزال بإمكاني استخدام واجهة برمجة التطبيقات مجانًا ضمن الطبقة المجانية، لذلك يجب أن تكون بخير. :+1:

5 إعجابات

تم تقسيم منشور إلى موضوع جديد: تحسين اكتشاف البريد العشوائي بالذكاء الاصطناعي للتعديلات وعمليات الدمج

أين يمكنني الحصول على “مفتاح واجهة برمجة التطبيقات الخاص بالخدمة التي تستضيف النموذج”؟

إذا كنت تستخدم الاستضافة الخاصة بنا، فيمكنك استخدام LLM Small.

إذا لم يكن الأمر كذلك، فستحتاج إلى تكوين LLM والحصول على مفتاح من OpenAI/Google/Anthropic/X/أيًا كان…

إعجابَين (2)

أوه، مفتاح واجهة برمجة تطبيقات منهم، وليس من ديسكورس.

إعجابَين (2)

تمكين اكتشاف البريد العشوائي بالذكاء الاصطناعي باستخدام Gemini 2.0 Flash لم يساعد في حظر هذه الأشياء. لم يسبق لي أن مررت بريدًا عشوائيًا واضحًا بهذه السهولة عبر الفلتر. ربما تم تصميمه خصيصًا لمواقع Discourse؟

| خطأ QuickBooks Payroll بعد التحديث +1-800-223-1608 حل خطوة بخطوة جديد | الأمريكتان - كندا | | 1 | 2 | 1h |
|----|----|----|----|----|----|
| فهم خطأ تحديث جدول ضرائب QuickBooks Payroll +1-800-223-1608 جديد | الأمريكتان - كندا | | 1 | 2 | 1h |
| فهم خطأ QuickBooks Payroll PS107 +1-800-223-1608 جديد | الأمريكتان - كندا | | 1 | 2 | 2h |
| القائمة الكاملة لأرقام الاتصال بدعم QuickBooks®️ USA: دليلك الخبير جديد | الأمريكتان - كندا | | 1 | 2 | 5h |
| دليل مرجعي 2025 لأرقام دعم QuickBooks® Payroll والأخطاء جديد | آسيا | | 1 | 2 | 5h |
| {دليل الخبراء~} معلومات الاتصال بدعم QuickBooks® Payroll – دليل الولايات المتحدة الأمريكية 2025 جديد | الأمريكتان - كندا | | 1 | 4 | 5h |
| {اتصل على +1-855-510-6777} كيف يمكنني التحدث إلى دعم حجوزات باقات عطلات Expedia؟ جديد | لويزيانا | | 1 | 6 | 5h |
| القائمة الكاملة لدعم منطقة البحر الكاريبي™️ – الدليل الرسمي المفصل جديد | آسيا | | 1 | 2 | 6h |
| [اتصل^بالوكيل^مباشرة] ما هو الرقم الذي يربط بدعم باقات عطلات Expedia؟ {اطلب +1-855-510-6777} جديد | الأمريكتان - كندا |

مفتاح واجهة برمجة التطبيقات الخاص بك غير صالح، لذلك لا يتم إجراء أي اختبارات.

إذا أجريت اختبارًا على https://www.foodtalkcentral.com/admin/plugins/discourse-ai/ai-spam وألصقت هذا الرابط، فستحصل على خطأ 500. إذا تعمقت في السجلات في
/var/discourse/shared/web-only/log/rails/production.log وبحثت عن " 500 "، فسترى

Completed 200 OK in 399ms (Views: 123.1ms | ActiveRecord: 0.0ms (0 queries, 0 cached) | GC: 22.9ms)
DiscourseAi::Completions::Endpoints::Gemini: status: 400 - body: {
  "error": {
    "code": 400,
    "message": "API key not valid. Please pass a valid API key.",
    "status": "INVALID_ARGUMENT",
    "details": [
      {
        "@type": "type.googleapis.com/google.rpc.ErrorInfo",
        "reason": "API_KEY_INVALID",
        "domain": "googleapis.com",
        "metadata": {
          "service": "generativelanguage.googleapis.com"
        }
      },
      {
        "@type": "type.googleapis.com/google.rpc.LocalizedMessage",
        "locale": "en-US",
        "message": "API key not valid. Please pass a valid API key."
      }
    ]
  }
}
إعجاب واحد (1)

أوه ، شكرًا. لقد اخترت عن طريق الخطأ Gemini 2.0 Flash بدلاً من Gemini 2.0 Flash Lite. الآن تم الاختبار بنجاح.

إعجاب واحد (1)