Discourse AI - دليل الاستضافة الذاتية

Discourse · 24 أبريل 2023، 7:40م

هذا دليل يهدف إلى تشغيل مثيلاتك الخاصة للخدمات التي تشغل وحدات Discourse AI.

مقدمة

إذا كنت ترغب في استخدام Discourse AI على مثيلك المستضاف ذاتيًا، فقد تحتاج أيضًا إلى تشغيل الخدمات المرافقة للوحدات التي ترغب في تمكينها.

كل وحدة لديها خدمة مرافقة واحدة أو أكثر مطلوبة، وتستخدم هذه الخدمات مزيدًا من موارد وحدة المعالجة المركزية / وحدة معالجة الرسوميات / مساحة القرص مقارنة بـ Discourse نفسه، لذا ضع في اعتبارك أن هذا لا يُنصح به للأشخاص غير المعتادين على إدارة خوادم Linux و Docker.

التلخيص / مساعد الذكاء الاصطناعي / روبوت الذكاء الاصطناعي

التضمينات

تحليل المشاعر

التشغيل في بيئة الإنتاج

قد ترغب في وضع هذه الخدمة خلف وكيل عكسي (reverse proxy) لتمكين ميزات مثل موازنة التحميل (load balancing)، و TLS، وفحوصات الصحة (health checks)، وحدود المعدل (rate limits)، وما إلى ذلك عند التشغيل في موقع مباشر.

بعد أن تصبح الخدمة قيد التشغيل، قم بتكوين الوحدة للاتصال بالنطاق الذي تعمل عليه الخدمة باستخدام واجهة المستخدم الإدارية (Admin > Plugins > Discourse AI) ثم قم بتمكين الوحدة.

satonotdead · 26 أبريل 2023، 12:10م

هل المساعد الملحن غير ممكن حاليًا بالاستضافة الذاتية؟

تحية للفريق على هذا التطوير والتنفيذ

Falco · 26 أبريل 2023، 1:06م

يعمل Composer Helper فقط مع واجهات برمجة تطبيقات OpenAI أو Anthropic في الوقت الحالي، لذا سيعمل بشكل جيد في المواقف المستضافة ذاتيًا شريطة أن يكون لديك إحدى واجهات برمجة التطبيقات هذه.

JoeD · 28 أبريل 2023، 5:44م

لدي أداة مساعدة Composer تعمل، شكرًا لك!

هل يتطلب التلخيص خدمة تصنيف محلية؟ أم أنه سيعمل فقط باستخدام مفتاح واجهة برمجة تطبيقات OpenAI إذا كنت تستخدم نموذج ChatGPT3.5؟ لقد قمت بتشغيله ولكني لا أراه في المواضيع.

Falco · 28 أبريل 2023، 5:48م

وفقًا لـ Discourse AI - Summarization يمكنك استخدامه مع OpenAI عن طريق تكوين مفتاح OpenAI (الذي قمت به بالفعل)، واختيار أحد نماذج GPT كنموذج تلخيص وتمكين وحدة التلخيص.

زر الملخص يظهر فقط للمواضيع التي تحتوي على أكثر من 50 ردًا في الوقت الحالي، ولكننا سنقوم بتمكينه لجميع المواضيع قريبًا.

nodomain · 29 أبريل 2023، 7:45م

هل يمكنك مشاركة بعض الطلبات النموذجية؟ أنا حاليًا أحاول إعداد هذا في AWS ASG على مثيل EC2 ولا يمكنني جعله يعمل؛ أنا فقط أرى 400 طلب سيئ في سجلات Discourse.

علاوة على ذلك، سيكون عنوان URL لفحص الحالة رائعًا، / يصدر خطأ 404.

Falco · 29 أبريل 2023، 7:58م

/srv/ok و /health هما نقطتا نهاية فحص الحالة الصحية.

على رأس ذاكرتي شيء مثل:

jo -p model=bart-large-cnn-samsum content="Long sentence to summarize goes here" | \
  curl --json @- -XPOST http://service/api/v1/classify

بالنسبة لخدمة التلخيص يجب أن تعمل.

satonotdead · 30 أبريل 2023، 10:04م

هل يمكنك اقتراح استخدام خدمة التلخيص على localhost مع فحص السلامة من وحدة Nginx إذا كنا راضين عن الحدود والحمل؟

أريد فقط تجربة النماذج مفتوحة المصدر، وقد نجحنا في تشغيلها باستخدام مفاتيح OpenAI API حتى الآن.

هل هناك خطط لتمكين دعم لغات متعددة في التلخيص باستخدام نماذج مثل ChatGPT3.5 التي تم جعلها متوافقة؟

Falco · 30 أبريل 2023، 10:11م

إذا كان هذا ما تريده، فيجب أن يعمل، نعم.

يعمل التلخيص بالفعل مع واجهات برمجة تطبيقات OpenAI و Anthropic، لذا سيوفر لك ذلك إمكانيات متعددة اللغات. قد تحتاج إلى بعض التعديلات لترجمة الموجه (prompt) للحفاظ عليه أكثر تركيزًا على لغة الموضوع.

nodomain · 3 مايو 2023، 7:59م

أخبار رائعة من AWS: Amazon RDS for PostgreSQL now supports pgvector for simplified ML model integration - AWS

Drew-ART · 15 يونيو 2023، 10:19م

@Falco هل تتكرم بتقديم مثال لتكوين خادم يحتوي على “الكثير من وحدات المعالجة المركزية / وحدات معالجة الرسومات / الأقراص” ويمكنه تشغيل الذكاء الاصطناعي المستضاف ذاتيًا جنبًا إلى جنب مع منتدى Discourse عادي؟

DonH · 16 يونيو 2023، 4:12م

أود رؤية ذلك أيضًا، من فضلك. أيضًا، بالنظر إلى متطلبات الموارد، هل سيكون من الأفضل (ممكن، أكثر فعالية من حيث التكلفة؟) تفريغ خدمات الذكاء الاصطناعي المصاحبة إلى خادم افتراضي خاص منفصل؟

مثال لتكوين خادم

Falco · 16 يونيو 2023، 4:19م

يعتمد على النماذج والوحدات النمطية الدقيقة لـ Discourse AI التي ترغب في تشغيلها. على سبيل المثال، تستخدم وحدة السمية 5 جيجابايت و NSFW تستخدم 1 جيجابايت من ذاكرة الوصول العشوائي. مساحة القرص متشابهة، ويتم استخدام وحدة المعالجة المركزية / وحدة معالجة الرسومات للاستدلال، لذا تعتمد احتياجاتك على عدد الطلبات في الثانية التي تتوقع الحصول عليها.

نعم، هذه ربما هي أفضل طريقة.

Drew-ART · 17 يونيو 2023، 4:04ص

تقديرات منديل الورقة:

واجهة برمجة تطبيقات ChatGPTv4

0.0008 دولار لكل 100 كلمة
يبلغ متوسط المستخدم 100 كلمة (أو رموز) يوميًا لكل وحدة ذكاء اصطناعي
تشغيل جميع وحدات الذكاء الاصطناعي الست
0.0008 دولار * 6 = 0.0048 دولار

إجمالي التكلفة الشهرية لكل مستخدم: 0.0048 دولار * 30 = 0.144 دولار

الحد الأدنى لمتطلبات الخادم للاستضافة الذاتية هي حوالي:

16 جيجابايت من ذاكرة الوصول العشوائي المجانية، ويفضل 32 جيجابايت
معالج بسرعة 3.5 جيجاهرتز أو أعلى و 8 نوى أو أكثر
100 جيجابايت SSD

أقل خادم تكلفة يلبي هذه المتطلبات على Digital Ocean هو:

16 جيجابايت رام
8 معالجات Intel vCPUs مميزة (أكثر من 3.5 جيجاهرتز)
عرض النطاق الترددي: 6000 جيجابايت
SSD: 2x 200 جيجابايت
التكلفة الشهرية: 244.00 دولار

لذلك، ستكون الاستضافة الذاتية لـ ChatGPT4 أكثر فعالية من حيث التكلفة من استخدام خدمة واجهة برمجة التطبيقات الخاصة بها عندما يكون لدى Discourse حوالي 2000 مستخدم نشط شهريًا.

مع بعض التقريب المترنح والسخي المتضمن. هل هذا يبدو صحيحًا @Falco

sam · 17 يونيو 2023، 5:39ص

لا يمكن استضافة GPT-4 أو 3.5 بنفسك.

بعض نماذج اللغات الكبيرة (LLMs) مفتوحة المصدر مثل Falcon أو نماذج مختلفة تعتمد على LLaMA (والتي تأتي مع أسئلة ترخيص) يمكن استضافتها بنفسك ولكن حتى الآن كلها أقل أداءً من GPT 4 أو حتى 3.5.

حساباتك التقريبية هناك خاطئة تمامًا، إذا كنت ستستضيف نموذج لغة كبير بنفسك فمن المحتمل أنك تريد A100 أو H100، ربما عدد قليل منها… حاول البحث عن الأسعار على جوجل…

Drew-ART · 17 يونيو 2023، 7:39ص

أعتقد أن هذا ما تحصل عليه عند استخدام ChatGPT لمساعدتك في حساب تكاليف استضافة ChatGPT بنفسك.

Drew-ART · 17 يونيو 2023، 8:12ص

على أي حال، سأحاول المساهمة بشيء والعودة لتحديثه عندما يكون لدي بعض بيانات المستخدم للمقارنة.

هذه هي الحسابات التي أجريتها لاستخدام واجهة برمجة تطبيقات ChatGPT3.5 مع الوحدات المذكورة أعلاه، بناءً على افتراض غامض جدًا بأن المستخدم النشط العادي في شهر واحد سيولد في المتوسط 100 كلمة في تنفيذ واحد:

تكاليف واجهة برمجة تطبيقات ChatGPT3.5

0.0003 دولار لكل 100 كلمة في تنفيذ واحد
يولد المستخدم النشط العادي حوالي 100 كلمة في اليوم على كل وحدة ذكاء اصطناعي

متوسط التكلفة الشهرية لكل مكون/إضافة ذكاء اصطناعي: 0.009

6 = 0.054 دولار
يمنح هذا تكلفة شهرية إجمالية لكل مستخدم لجميع المكونات الستة البالغة 0.054 دولار إذا كانت تعمل على ChatGPT3.5

Falco · 29 يونيو 2023، 4:14م

لقد بدأنا للتو في تشغيل خدمات الذكاء الاصطناعي هنا لـ Meta على g4dn.xlarge، لذا يمكنني الآن التوصية بذلك كنقطة انطلاق.

DonH · 29 يونيو 2023، 5:48م

شكرا لك. يتم تقديم التسعير الحالي هنا لأي شخص يتساءل عن ماهية g4dn.xlarge. نأمل أن تتمكن من نشر بيانات الاستخدام في وقت ما حتى نتمكن من فهم التكاليف الحقيقية.

Falco · 29 يونيو 2023، 5:55م

الجهاز خاملاً بشكل أساسي مع حركة مرور Meta فقط. يمكنه التعامل مع عدد قليل من حركة مرور Meta بشكل جيد.

الموضوع		الردود	مرات العرض
關於Discourse AI Support ai	5	841	1 أكتوبر 2024
Discourse AI plugin with self hosted discourse site Support ai	2	343	9 يوليو 2024
Self-Hosting an OpenSource LLM for DiscourseAI Self-Hosting ai	12	3832	6 يوليو 2026
Introducing Discourse AI Blog	26	4123	4 مايو 2023
I want to install Discourse AI on Discourse Self-hosting ai	12	593	19 مايو 2024