ما هو LLM الذي يجب استخدامه ل Discourse AI؟

من المهم فهم احتياجاتك كمسؤول مجتمع وأعضائك عند اختيار نموذج لغوي كبير (LLM) لتشغيل ميزات Discourse AI.

قد تؤثر عدة عوامل على قراراتك:

  1. الأداء لحالة الاستخدام: هل تبحث عن النموذج الأعلى أداءً؟ يمكن أن يختلف الأداء اعتمادًا على المهمة (مثل التلخيص، البحث، الاستدلال المعقد، اكتشاف البريد العشوائي). يعتمد التقييم على قدرة النموذج على إنشاء استجابات صحيحة وذات صلة ومتماسكة.
  2. طول السياق: نافذة السياق هي كمية النص التي يمكن للنموذج “رؤيتها” وأخذها في الاعتبار في وقت واحد. تسمح نوافذ السياق الأكبر بمعالجة المزيد من المعلومات (مثل الموضوعات الأطول للتلخيص) والحفاظ على التماسك خلال التفاعلات الأطول.
  3. التوافق: هل النموذج مدعوم بشكل مباشر بواسطة إضافة Discourse AI؟ هل سيتطلب نقاط نهاية API أو تكوينًا محددًا؟ تحقق من وثائق المكون الإضافي لموفري النماذج والخدمات المدعومة.
  4. دعم اللغة: بينما تتعامل العديد من نماذج LLM الرائدة مع لغات متعددة بشكل جيد، يمكن أن يختلف الأداء. إذا كان مجتمعك يستخدم بشكل أساسي لغة غير الإنجليزية، فيوصى باختبار نماذج محددة لتلك اللغة.
  5. القدرات متعددة الوسائط: تتطلب بعض الميزات، مثل فرز الذكاء الاصطناعي (اكتشاف NSFW)، نماذج يمكنها معالجة الصور (الرؤية). تأكد من أن النموذج المختار يدعم الوسائط المطلوبة.
  6. السرعة والأوضاع: يمكن أن تكون النماذج الأكبر والأكثر قوة أبطأ. بالنسبة للميزات في الوقت الفعلي مثل مساعد الذكاء الاصطناعي أو البحث، قد توفر النماذج الأسرع تجربة مستخدم أفضل. تقدم بعض النماذج (مثل Claude 3.7 Sonnet) أوضاعًا مختلفة، مما يسمح بالموازنة بين السرعة والاستدلال الأعمق.
  7. التكلفة: غالبًا ما تكون الميزانية عاملاً رئيسيًا. تختلف تكاليف النماذج بشكل كبير بناءً على المزود وفئة النموذج. تُقاس التكاليف عادةً لكل رمز (مدخلات ومخرجات). النماذج الأسرع/الأصغر أرخص بشكل عام من النماذج الكبيرة/عالية الأداء. غالبًا ما يمكن تشغيل النماذج مفتوحة المصدر بتكلفة أكثر فعالية اعتمادًا على الاستضافة.
  8. مخاوف الخصوصية: لدى مقدمي خدمات LLM المختلفين سياسات مختلفة لاستخدام البيانات والخصوصية. راجع شروط الخدمة، خاصة فيما يتعلق بما إذا كان يمكن استخدام بياناتك لأغراض التدريب. يقدم بعض الموفرين خيارات عدم الاحتفاظ بالبيانات.
  9. مفتوح المصدر مقابل مغلق المصدر: توفر النماذج مفتوحة المصدر الشفافية وإمكانية الاستضافة الذاتية أو الضبط الدقيق، على الرغم من أنها قد تتطلب المزيد من الجهد التقني. عادةً ما تكون النماذج مغلقة المصدر أسهل في الاستخدام عبر واجهات برمجة التطبيقات ولكنها توفر تحكمًا وشفافية أقل.

اختيار LLM لميزات Discourse AI

يتطور مشهد LLM بسرعة. يقدم الجدول أدناه نظرة عامة على النماذج الشائعة والقادرة حاليًا والمناسبة لميزات Discourse AI المختلفة، مصنفة حسب نقاط قوتها النموذجية وملفات تعريف تكلفتها. يتم سرد النماذج داخل كل فئة أبجديًا.

:warning: هذه إرشادات عامة. تحقق دائمًا من وثائق مكون Discourse AI الإضافي الرسم للحصول على أحدث قائمة بالنماذج المدعومة والتكوينات المطلوبة. يتغير الأداء والتكلفة بشكل متكرر؛ استشر وثائق مزود LLM للحصول على أحدث التفاصيل. يمكن أن يعتمد توفر وأداء نماذج المصدر المفتوح على المزود المحدد أو إعداد الاستضافة.

خيار بديل للعملاء المستضافين هو استخدام نماذج LLM مفتوحة الأوزان المعدة مسبقًا والمستضافة بواسطة Discourse. يمكن غالبًا تمكين هذه عبر Admin → Settings → AI → ai_llm_enabled_models أو إعدادات الميزات المحددة.

الفئة النموذج المزود نقاط القوة الرئيسية / حالات الاستخدام ملاحظات
أعلى أداء/استدلال Claude 3.7 Sonnet (Thinking) Anthropic أقصى قدرة استدلال، مهام معقدة، تحليل، إنشاء يستخدم المزيد من الموارد/الوقت من الوضع العادي، رؤية ممتازة
DeepSeek-R1 DeepSeek استدلال قوي، تنافسي مع أفضل المستويات، ترميز، رياضيات خيار مفتوح المصدر، تكلفة أقل محتملة من البدائل الخاصة
Gemini 2.5 Pro Google أداء عالٍ، نافذة سياق كبيرة جدًا، متعدد الوسائط قوي شامل ممتاز، يتكامل جيدًا مع نظام Google البيئي
OpenAI o1 / o1-pro OpenAI استدلال حديث، مهام معقدة، إنشاء أعلى تكلفة، من المحتمل أن يكون o1-pro مطلوبًا لتحقيق أقصى قدرة عبر API
متوازن (متعدد الأغراض) Claude 3.7 Sonnet (Regular) Anthropic أداء عالٍ، استدلال جيد، سياق كبير، رؤية، وضع أسرع خيار افتراضي ممتاز، يوازن بين السرعة والقدرة
DeepSeek-V3 DeepSeek أداء عام قوي، قيمة جيدة خيار مفتوح المصدر، فعال من حيث التكلفة للاستخدام الواسع
GPT-4o OpenAI شامل قوي جدًا، متعدد الوسائط جيد، متوافق على نطاق واسع توازن رائع بين الأداء والسرعة والتكلفة
OpenAI o3-mini OpenAI أداء واستدلال جيد مقابل التكلفة نموذج استدلال مرن وذكي مناسب للعديد من المهام
فعال من حيث التكلفة/السرعة Claude 3.5 Haiku Anthropic سريع للغاية ومنخفض التكلفة، مناسب للمهام الأبسط الأفضل لاحتياجات الحجم الكبير وزمن الاستجابة المنخفض مثل البحث، الملخصات الأساسية
Gemini 2.0 Flash Google سريع جدًا وفعال من حيث التكلفة، قدرات عامة جيدة جيد للتلخيص، البحث، مهام المساعدة
GPT-4o mini OpenAI نسخة سريعة وبأسعار معقولة من GPT-4o، جيدة للعديد من المهام توازن جيد بين التكلفة/الأداء للميزات الأبسط
Llama 3.3 (e.g., 70B) Meta نموذج قوي مفتوح المصدر، خيار متعدد الأغراض فعال من حيث التكلفة غالبًا يختلف الأداء حسب المزود/الاستضافة، يتطلب التحقق من التوافق
قادر على الرؤية Claude 3.7 Sonnet Anthropic قدرات رؤية قوية (كلا الوضعين) مطلوب لفرز الذكاء الاصطناعي/اكتشاف NSFW
Gemini 2.5 Pro / 2.0 Flash Google قدرات رؤية قوية مطلوب لفرز الذكاء الاصطناعي/اكتشاف NSFW
GPT-4o / GPT-4o mini OpenAI نص ورؤية متكاملان مطلوب لفرز الذكاء الاصطناعي/اكتشاف NSFW
Llama 3.2 Meta قدرات رؤية مفتوحة المصدر يتطلب التحقق من التوافق/الاستضافة/دعم المزود
Discourse Hosted LLM Discourse نموذج رؤية معد مسبقًا للمواقع المستضافة تحقق من إعدادات الميزات المحددة (مثل اكتشاف NSFW)
Qwen-VL / others Various تحقق من مكون Discourse AI الإضافي لنماذج الرؤية المدعومة المحددة قد يختلف التكوين

توصيات عامة مطابقة (مبسطة):

  • روبوت الذكاء الاصطناعي (أسئلة وأجوبة معقدة، شخصية): نماذج أعلى أداء/استدلال (Claude 3.7 Sonnet - Thinking، R1، Gemini 2.5 Pro، o1-pro) أو نماذج متوازنة قوية (GPT-4o، Claude 3.7 Sonnet - Regular، o3-mini).
  • بحث الذكاء الاصطناعي: نماذج فعالة من حيث التكلفة/السرعة (Haiku 3.5، Gemini 2.0 Flash، GPT-4o mini، Llama 3.3) أو نماذج متوازنة لفهم أفضل قليلاً (GPT-4o، DeepSeek-V3).
  • مساعد الذكاء الاصطناعي (اقتراحات العناوين، التدقيق اللغوي): نماذج فعالة من حيث التكلفة/السرعة أو نماذج متوازنة. غالبًا ما تكون السرعة مفضلة. Claude 3.7 Sonnet (Regular) أو GPT-4o mini مرشحان جيدان. يمكن أن يعمل Llama 3.3 بشكل جيد هنا أيضًا.
  • تلخيص: نماذج متوازنة (Claude 3.7 Sonnet - Regular، GPT-4o، o3-mini، DeepSeek-V3) أو نماذج فعالة من حيث التكلفة (Gemini 2.0 Flash، Llama 3.3). نوافذ السياق الأطول (Gemini 2.5 Pro، Sonnet 3.7) مفيدة للموضوعات الطويلة إذا سمحت الميزانية بذلك.
  • اكتشاف البريد العشوائي / فرز الذكاء الاصطناعي (نص): عادةً ما تكون النماذج الفعالة من حيث التكلفة/السرعة كافية وفعالة من حيث التكلفة (Haiku 3.5، Gemini 2.0 Flash، GPT-4o mini، Llama 3.3).
  • فرز الذكاء الاصطناعي (اكتشاف صور NSFW): يتطلب نموذجًا قادرًا على الرؤية (GPT-4o/mini، Sonnet 3.7، Gemini 2.5 Pro/2.0 Flash، Llama 3.2، نماذج Discourse المستضافة/المدعومة المحددة).

تذكر تكوين LLM (النماذج) المحددة في إعدادات مسؤول Discourse ضمن ميزات الذكاء الاصطناعي ذات الصلة.

17 إعجابًا