Discourse AI - مواضيع ذات صلة

:bookmark: يشرح هذا الدليل كيفية تمكين وتكوين ميزة المواضيع ذات الصلة لمكون Discourse AI الإضافي.

:person_raising_hand: مستوى المستخدم المطلوب: مسؤول

تساعد المواضيع ذات الصلة المستخدمين على اكتشاف المحتوى ذي الصلة من خلال اقتراح مواضيع متشابهة دلاليًا بناءً على الموضوع الذي يقرؤونه حاليًا. هذا يعزز استكشاف المحتوى ويزيد من تفاعل المستخدم.

الميزات

  • التشابه الدلالي للنصوص: يتجاوز مطابقة الكلمات الرئيسية للعثور على محتوى ذي صلة حقيقية
  • التبديل بين مواضيع “مقترحة” و “ذات صلة”
  • متاح للمستخدمين المجهولين والمستخدمين المسجلين على حد سواء

تمكين المواضيع ذات الصلة

:information_source: المواضيع ذات الصلة مفعلة افتراضيًا لجميع عملاء Discourse المستضافين مع تمكين المكون الإضافي Discourse AI.

المتطلبات الأساسية

تتطلب المواضيع ذات الصلة التضمينات لتعمل.

إذا كنت تستخدم الاستضافة الخاصة بنا، يتم توفير التضمينات باستخدام نموذج مفتوح المصدر. لا يلزم إعداد إضافي.
ستحتاج المثيلات المستضافة ذاتيًا إلى توفير التضمينات الخاصة بها من خلال مزود طرف ثالث.

التكوين

  1. انتقل إلى المسؤول → الإعدادات → المكونات الإضافية
  2. ابحث عن “discourse-ai” وتأكد من تمكينه
  3. قم بتمكين ai_embeddings_enabled لتفعيل التضمينات
  4. قم بتمكين ai_embeddings_semantic_related_topics_enabled لتفعيل ميزة المواضيع ذات الصلة

تكوين إضافي

اعتمادًا على إعداداتك، قد تحتاج إلى تعديل الإعدادات التالية:

  • للمواقع غير الإنجليزية (المستضافة بواسطة Discourse أو المستضافة ذاتيًا مع نموذج خاص):
    قم بتعيين ai embeddings model إلى multilingual-e5-large
  • لـ Cloudflare Workers AI:
    قم بتعيين ai embeddings model إلى bge-large-en
  • لـ OpenAI أو Azure OpenAI:
    قم بتعيين ai embeddings model إلى text-embedding-ada-002

الأسئلة الشائعة التقنية

توسيع لعرض مخطط لبنية المواضيع ذات الصلة

النظرة العامة هي أنه عند إنشاء / تحديث موضوع يحدث هذا:

sequenceDiagram
    User->>Discourse: ينشئ موضوعًا
    Discourse-->>Embedding Microservice: ينشئ تضمينات
    Embedding Microservice-->>Discourse:
    Discourse-->>PostgreSQL: يخزن التضمينات

وأثناء زيارة الموضوع:

sequenceDiagram
    User->>Discourse: يزور موضوعًا
    Discourse-->>PostgreSQL: يستعلم عن أقرب المواضيع
    PostgreSQL-->>Discourse:
    Discourse->>User: يقدم مواضيع ذات صلة

كيف تعمل المواضيع ذات الصلة؟

  • عندما يزور المستخدم موضوعًا، يستعلم Discourse من قاعدة البيانات عن المواضيع الأكثر تشابهًا دلاليًا بناءً على تمثيلاتها المضمنة. ثم يتم تقديم هذه المواضيع ذات الصلة للمستخدم، مما يشجع على المزيد من استكشاف محتوى المجتمع.

كيف تتم معالجة بيانات الموضوع / المشاركة؟

  • بالنسبة للمواقع المستضافة بواسطة Discourse، تتم معالجة البيانات داخل مركز البيانات الافتراضي الآمن الخاص بنا. بالنسبة للمواقع المستضافة ذاتيًا، تعتمد معالجة البيانات على مزود الطرف الثالث الذي اخترته.

أين يتم تخزين بيانات التضمينات؟

  • يتم تخزين بيانات التضمينات في قاعدة بيانات Discourse الخاصة بك، جنبًا إلى جنب مع بيانات المنتدى الأخرى مثل المواضيع والمشاركات والمستخدمين.

ما هو النموذج الدلالي المستخدم، وكيف تم تدريبه؟

  • تستخدم المواقع المستضافة بواسطة Discourse نموذج all-mpnet-base-v2 افتراضيًا. يؤدي هذا النموذج أداءً جيدًا للمجتمعات المتخصصة والعامة على حد سواء. قد تستخدم المواقع المستضافة ذاتيًا نماذج مختلفة اعتمادًا على المزود الذي اختارته.
14 إعجابًا

شيء يستحق المراقبة.

عند مراجعة العديد من المشاركات في المواضيع ذات الصلة لموقع إنجليزي (OpenAI)، بدأت ألاحظ أن المواضيع باللغة الإسبانية تميل إلى التجمع معًا وأشتبه في أنه إذا تمت ترجمتها أولاً إلى اللغة الإنجليزية، فإن كل مشاركة سيكون لها متجه مختلف وبالتالي سيتم تجميعها مع مشاركات أخرى. :slightly_smiling_face:



فائدة جانبية لهذه الميزة للمشرفين هي التحقق من أن فئات المواضيع المدرجة في المواضيع ذات الصلة صحيحة.

عند مراجعة كل مشاركة جديدة، أقوم أيضًا بفحص المواضيع ذات الصلة. أصبح هذا طريقة فعالة لتحديد المواضيع التي تم إنشاؤها بفئة خاطئة.

للعلم - تم ملاحظة فكرة ذات صلة في طلب الميزة هذا.



ابحث عن هذا الموضوع عندما تحتاج غالبًا إلى متابعة الرابط الذي ليس من السهل العثور عليه، لذا أشير إليه هنا.

إعجابَين (2)

يتم التحكم في هذا السلوك بواسطة النموذج، ويبدو أنه مشكلة معروفة:

أعتقد أن نموذج المصدر المفتوح الذي نوصي به للمواقع متعددة اللغات يقوم بعمل أفضل في هذا، ولكن لا يزال يتعين علينا طرحه على المزيد من العملاء للتحقق من صحة ذلك.

إعجابَين (2)

لن يسمح لي بتمكين هذا الخيار:

هل هناك شيء مفقود هنا أم أن Gemini وحده لا يكفي؟

تحديث: قد تحتاج التعليمات ووصف الخطأ إلى التحديث لإضافة أنه يجب أيضًا تحديث نموذج التضمينات الذكاء الاصطناعي لمطابقة المزود وإلا لا يمكن تمكين ai_embeddings_enabled. الوصف للمعامل مفقود Gemini كخيار.

إعجاب واحد (1)

تم تقسيم 7 مشاركات إلى موضوع جديد: “أخطاء Net::HTTPBadResponse” في تضمينات Gemini

ماذا يجب أن أملأ هنا من فضلك:

أريد ملء ما سبق، لأنني أريد تمكين الخيار الأول من بين الخيارات الأربعة المعروضة أدناه:

إذا كنت تستخدم OpenAI، فلا شيء.

إعجاب واحد (1)

إذًا، هذا الخيار الأول (وحدة التضمين) يزعجني، ولا يسمح لي بتمكينه:

معظم هذه فارغة. ولكن ai embeddings discourse service api key هو مفتاح واجهة برمجة تطبيقات OpenAI الخاص بك و ai embeddings discourse service api endpoint هو https://api.openai.com/v1/embeddings. يجب أن يكون النموذج text-embedding-3-large (بالتأكيد، يمكن أن يكون small أيضًا ولكنه يواجه بعض المشكلات).

إعجاب واحد (1)

تم تقسيم 3 مشاركات إلى موضوع جديد: كيفية عرض كل من المواضيع المقترحة والمواضيع ذات الصلة

ما كانت نتائجك من مقارنة small و large؟ أعرف أن هناك فرقًا في الأبعاد يؤثر على دقة النموذج. إصدار small أرخص بـ 5 مرات. هل هو غير قابل للاستخدام حقًا في العالم الحقيقي لتشابه الموضوع؟ منتدانا 99٪ باللغة الإنجليزية.

سأكون مهتمًا جدًا بسماع المزيد. هل يمكنك من فضلك توضيح مكان all-mpnet-base-v2 مقارنة بنماذج OpenAI لموقع إنجليزي بحت؟

تعتبر التضمينات رخيصة جدًا لدرجة أن السعر لا يهم - إلا إذا كان هناك عدد لا يحصى من المنشورات حيث تكون تكلفة 0.01 سنت مهمة في التكاليف الإجمالية.

ولكن بصراحة… لم أر أي اختلافات. وبالنسبة لي، نظرًا لوجود فرصة لعدم قدرتي على استخدام RAG والتضمينات بشكل صحيح، فإن كلاهما عديم الفائدة على حد سواء. أعرف أن هذا يتعارض بشدة مع الرأي العام، ولكن في موقعي هذا النظام لا يجد ويستخدم أي شيء مفيد.

ربما يأتي هذا من نماذج OpenAI ولكن ليس لدي ما يكفي من المال لاستخدام تلك الحلول الأكثر احترافية.

إعجاب واحد (1)

لقد كنت أستخدم نموذج text-embedding-3-small قبل قراءة هذا. هل نموذج text-embedding-ada-002 أفضل بكثير؟

آدا هو الجيل السابق

إعجاب واحد (1)