تقدير تكاليف استخدام نماذج اللغة الكبيرة (LLMs) لـ Discourse AI

Discourse · 16 مايو 2024، 6:53م

لاستخدام ميزات معينة من Discourse AI، يُطلب من المستخدمين استخدام مزود نموذج لغوي كبير (LLM). يرجى مراجعة كل ميزة من ميزات الذكاء الاصطناعي لتحديد نماذج اللغات الكبيرة المتوافقة.

إذا كانت التكلفة تشكل مصدر قلق كبير، فإن Discourse AI يوفر العديد من الأدوات المضمنة للمساعدة في إدارة الإنفاق:

لوحة معلومات استخدام الذكاء الاصطناعي — تتبع استهلاك الرموز (tokens) حسب الميزة والنموذج والمستخدم مع التكاليف المقدرة

حصص الاستخدام — تعيين حدود لكل نموذج ولكل مجموعة للرموز أو عدد الطلبات ضمن نوافذ زمنية قابلة للتكوين (ساعة، يوم، أسبوع)

تخصيصات الرصيد — تعيين ميزانيات رصيد إجمالية لكل نموذج بحدود ناعمة وصارمة

ميزانيات جانب البائع — تعيين حدود الاستخدام مباشرة من البائع كإجراء أمان إضافي

قيود المجموعة — السماح فقط لمستخدمين ومجموعات محددة بالوصول إلى ميزات الذكاء الاصطناعي

هناك عدة عوامل متغيرة يجب مراعاتها عند حساب تكاليف استخدام نماذج اللغات الكبيرة (LLMs)
عرض مبسط سيكون…

من المهم فهم ما هي الرموز (tokens) وكيفية عدها

نموذج اللغة الكبير (LLM) والتسعير → تحديد نموذج اللغة الكبير المحدد الذي تخطط لاستخدامه والعثور على أحدث تفاصيل التسعير الخاصة به لرموز الإدخال والإخراج
رموز الإدخال → متوسط طول مطالبات الإدخال الخاصة بك بالرموز
رموز الإخراج → استجابات النموذج بالرموز

لنتعرف الآن على مثال استخدام روبوت الذكاء الاصطناعي هنا في Meta

كانت هناك العديد من التبسيطات التي تم إجراؤها أثناء هذا الحساب مثل استخدام الرموز، والمستخدمين الذين يستخدمون روبوت الذكاء الاصطناعي، ومتوسط عدد الطلبات. يجب أخذ هذه الأرقام فقط كـ إرشادات عامة. خاصة وأننا نجري الكثير من التجارب على روبوت الذكاء الاصطناعي

استخدم لوحة معلومات استخدام الذكاء الاصطناعي المضمنة في /admin/plugins/discourse-ai/ai-usage لمراجعة استخدامك الفعلي لرموز الطلبات/الاستجابات، مقسمًا حسب الميزة والنموذج والمستخدم
في المتوسط، كانت رموز الاستجابة أكبر بـ 3 إلى 5 مرات من رموز الطلب ^[1]
افترض أن متوسط رمز طلب المستخدم هو 85، وهو ما يعادل أقل من فقرة واحدة ^[2]
افترض أن متوسط رمز الاستجابة هو 85 × 4 = 340 رمزًا، وهو ما يعادل 3 فقرات
باستخدام GPT-5.4 mini من OpenAI، ستكون تكلفة رموز الإدخال 0.75 دولار / مليون رمز = 0.00000075 دولار / رمز × 85 رمزًا = 0.000064 دولار للإدخال
بالنسبة لرموز الإخراج، ستكون 4.50 دولارات / مليون رمز = 0.0000045 دولار / رمز × 340 رمزًا = 0.00153 دولار للإخراج
التكلفة الإجمالية لكل طلب هي 0.000064 دولار + 0.00153 دولار = 0.0016 دولار
خلال فبراير 2024، كان حوالي 600 مستخدم يستخدمون روبوت الذكاء الاصطناعي، حيث قاموا بإجراء 10 طلبات في المتوسط لذلك الشهر. افترض الآن أن هذه الأرقام متسقة مع مجتمعك
هذا يعني أنه بالنسبة لشهر فبراير، ستكون تكلفة روبوت الذكاء الاصطناعي 0.0016 دولار × 600 مستخدم × 10 طلبات = 9.56 دولار
بالانتقال السريع إلى تكلفة تشغيل روبوت الذكاء الاصطناعي لمدة عام، ستكون 9.56 دولار × 12 = 115 دولارًا للسنة لتشغيل GPT-5.4 mini كنموذج اللغة الكبير الذي تختاره

للحصول على تكاليف أقل، فكر في نماذج الميزانية مثل GPT-5.4 nano (0.20 دولار/1.25 دولار لكل مليون رمز)، و Gemini 2.5 Flash (0.075 دولار/0.30 دولار لكل مليون رمز)، أو Claude Haiku 4.5 — والتي يمكن أن تقلل التكاليف بنسبة 75-95% إضافية مقارنة بالمثال أعلاه. تحقق دائمًا من أحدث الأسعار من البائع الخاص بك حيث تستمر التكاليف في الانخفاض.

تقدير بالنظر إلى مجتمع OpenAI وردنا الخاص على نسبة رموز الطلب إلى الاستجابة ↩︎
أثناء النظر في متوسط استخدام رمز طلب المستخدم، وجدت أرقامًا منخفضة تصل إلى 20 وإلى أكثر من 100. أردت أن أستوعب أن هناك المزيد من الطلبات القريبة من 100 والافتراض هو أن تلك الطلبات قد تكون أقرب إلى جمل كاملة وتشير إلى مطالبات مدروسة جيدًا مع الكثير من الأسئلة الموجهة إلى الروبوت ↩︎

Saif · 4 نوفمبر 2024، 9:43م

لقد شاركنا مؤخرًا ما يلي مع عميل كان يسأل عن استخدام البحث بالذكاء الاصطناعي في Meta ومقدار التكلفة التي تكبدناها:

في الشهر الماضي، أجرينا 1104 عمليات بحث في Meta

تسعير GPT-4o-mini، والذي سيكلف 0.25 دولار

استخدام haiku سيكلف 0.53 دولار

Gemini Flash سيكلف 0.06 دولار

يجب أن ننتبه إلى “رموز الطلب” التي كانت حوالي 85868 و “رموز الاستجابة” التي كانت حوالي 408417 من LLM.

Falco · 14 نوفمبر 2024، 4:00م

التكاليف المقدرة لشهر من تسميات الصور في Meta

1019 مكالمة
55 مليون رمز طلب
34 ألف رمز استجابة

والتي ستكلف، اعتمادًا على نموذج اللغة الكبير (LLM):

Claude Haiku 3: 13.86 دولارًا
GPT-4o Mini: 8.31 دولارًا
Gemini 1.5 Flash 8B: 2.07 دولارًا

الموضوع		الردود	مرات العرض
Cost based quotas for Discourse AI Announcements ai	0	129	30 يونيو 2026
Discourse AI - AI usage Site Management how-to , ai	0	572	23 يناير 2025
Estimating cost of enabling Discourse AI for related content and search Support ai	2	156	28 أكتوبر 2025
Unlock All Discourse AI Features with Our Hosted LLM Announcements ai	9	941	13 مارس 2026
Discourse AI - Large Language Model (LLM) settings page Site Management how-to , ai	20	3829	9 مايو 2026

تقدير تكاليف استخدام نماذج اللغة الكبيرة (LLMs) لـ Discourse AI

الموضوعات ذات الصلة