تقدير تكاليف استخدام نماذج اللغة الكبيرة (LLMs) لـ Discourse AI

:information_source: لاستخدام ميزات معينة من Discourse AI، يُطلب من المستخدمين استخدام مزود نموذج لغوي كبير (LLM). يرجى مراجعة كل ميزة من ميزات الذكاء الاصطناعي لتحديد نماذج اللغات الكبيرة المتوافقة.

:dollar: إذا كانت التكلفة تشكل مصدر قلق كبير، فإن Discourse AI يوفر العديد من الأدوات المضمنة للمساعدة في إدارة الإنفاق:

  • لوحة معلومات استخدام الذكاء الاصطناعي — تتبع استهلاك الرموز (tokens) حسب الميزة والنموذج والمستخدم مع التكاليف المقدرة
  • حصص الاستخدام — تعيين حدود لكل نموذج ولكل مجموعة للرموز أو عدد الطلبات ضمن نوافذ زمنية قابلة للتكوين (ساعة، يوم، أسبوع)
  • تخصيصات الرصيد — تعيين ميزانيات رصيد إجمالية لكل نموذج بحدود ناعمة وصارمة
  • ميزانيات جانب البائعتعيين حدود الاستخدام مباشرة من البائع كإجراء أمان إضافي
  • قيود المجموعة — السماح فقط لمستخدمين ومجموعات محددة بالوصول إلى ميزات الذكاء الاصطناعي

هناك عدة عوامل متغيرة يجب مراعاتها عند حساب تكاليف استخدام نماذج اللغات الكبيرة (LLMs)
عرض مبسط سيكون…

:information_source: من المهم فهم ما هي الرموز (tokens) وكيفية عدها

  • نموذج اللغة الكبير (LLM) والتسعير → تحديد نموذج اللغة الكبير المحدد الذي تخطط لاستخدامه والعثور على أحدث تفاصيل التسعير الخاصة به لرموز الإدخال والإخراج
  • رموز الإدخال → متوسط طول مطالبات الإدخال الخاصة بك بالرموز
  • رموز الإخراج → استجابات النموذج بالرموز

لنتعرف الآن على مثال استخدام روبوت الذكاء الاصطناعي هنا في Meta

:warning: كانت هناك العديد من التبسيطات التي تم إجراؤها أثناء هذا الحساب مثل استخدام الرموز، والمستخدمين الذين يستخدمون روبوت الذكاء الاصطناعي، ومتوسط عدد الطلبات. يجب أخذ هذه الأرقام فقط كـ إرشادات عامة. خاصة وأننا نجري الكثير من التجارب على روبوت الذكاء الاصطناعي

  1. استخدم لوحة معلومات استخدام الذكاء الاصطناعي المضمنة في /admin/plugins/discourse-ai/ai-usage لمراجعة استخدامك الفعلي لرموز الطلبات/الاستجابات، مقسمًا حسب الميزة والنموذج والمستخدم

  2. في المتوسط، كانت رموز الاستجابة أكبر بـ 3 إلى 5 مرات من رموز الطلب [1]

  3. افترض أن متوسط رمز طلب المستخدم هو 85، وهو ما يعادل أقل من فقرة واحدة [2]

  4. افترض أن متوسط رمز الاستجابة هو 85 × 4 = 340 رمزًا، وهو ما يعادل 3 فقرات

  5. باستخدام GPT-5.4 mini من OpenAI، ستكون تكلفة رموز الإدخال 0.75 دولار / مليون رمز = 0.00000075 دولار / رمز × 85 رمزًا = 0.000064 دولار للإدخال

  6. بالنسبة لرموز الإخراج، ستكون 4.50 دولارات / مليون رمز = 0.0000045 دولار / رمز × 340 رمزًا = 0.00153 دولار للإخراج

  7. التكلفة الإجمالية لكل طلب هي 0.000064 دولار + 0.00153 دولار = 0.0016 دولار

  8. خلال فبراير 2024، كان حوالي 600 مستخدم يستخدمون روبوت الذكاء الاصطناعي، حيث قاموا بإجراء 10 طلبات في المتوسط ​​لذلك الشهر. افترض الآن أن هذه الأرقام متسقة مع مجتمعك

  9. هذا يعني أنه بالنسبة لشهر فبراير، ستكون تكلفة روبوت الذكاء الاصطناعي 0.0016 دولار × 600 مستخدم × 10 طلبات = 9.56 دولار

  10. بالانتقال السريع إلى تكلفة تشغيل روبوت الذكاء الاصطناعي لمدة عام، ستكون 9.56 دولار × 12 = 115 دولارًا للسنة لتشغيل GPT-5.4 mini كنموذج اللغة الكبير الذي تختاره

للحصول على تكاليف أقل، فكر في نماذج الميزانية مثل GPT-5.4 nano (0.20 دولار/1.25 دولار لكل مليون رمز)، و Gemini 2.5 Flash (0.075 دولار/0.30 دولار لكل مليون رمز)، أو Claude Haiku 4.5 — والتي يمكن أن تقلل التكاليف بنسبة 75-95% إضافية مقارنة بالمثال أعلاه. تحقق دائمًا من أحدث الأسعار من البائع الخاص بك حيث تستمر التكاليف في الانخفاض.


  1. تقدير بالنظر إلى مجتمع OpenAI وردنا الخاص على نسبة رموز الطلب إلى الاستجابة ↩︎

  2. أثناء النظر في متوسط استخدام رمز طلب المستخدم، وجدت أرقامًا منخفضة تصل إلى 20 وإلى أكثر من 100. أردت أن أستوعب أن هناك المزيد من الطلبات القريبة من 100 والافتراض هو أن تلك الطلبات قد تكون أقرب إلى جمل كاملة وتشير إلى مطالبات مدروسة جيدًا مع الكثير من الأسئلة الموجهة إلى الروبوت ↩︎

9 إعجابات

لقد شاركنا مؤخرًا ما يلي مع عميل كان يسأل عن استخدام البحث بالذكاء الاصطناعي في Meta ومقدار التكلفة التي تكبدناها:

في الشهر الماضي، أجرينا 1104 عمليات بحث في Meta

  • تسعير GPT-4o-mini، والذي سيكلف 0.25 دولار
  • استخدام haiku سيكلف 0.53 دولار
  • Gemini Flash سيكلف 0.06 دولار

يجب أن ننتبه إلى “رموز الطلب” التي كانت حوالي 85868 و “رموز الاستجابة” التي كانت حوالي 408417 من LLM.

3 إعجابات

التكاليف المقدرة لشهر من تسميات الصور في Meta

  • 1019 مكالمة
  • 55 مليون رمز طلب
  • 34 ألف رمز استجابة

والتي ستكلف، اعتمادًا على نموذج اللغة الكبير (LLM):

  • Claude Haiku 3: 13.86 دولارًا
  • GPT-4o Mini: 8.31 دولارًا
  • Gemini 1.5 Flash 8B: 2.07 دولارًا
5 إعجابات