تقدير تكاليف استخدام LLMs لـ Discourse AI

:information_source: لاستخدام ميزات معينة في Discourse AI، يُطلب من المستخدمين استخدام مزود نموذج لغوي كبير (LLM). يرجى الاطلاع على كل ميزة من ميزات الذكاء الاصطناعي لتحديد نماذج LLM المتوافقة.

:dollar: إذا كانت التكلفة مصدر قلق كبير، فإن إحدى الطرق لمواجهة ذلك هي تعيين حدود الاستخدام مباشرة من الموفر واستخدام ميزانية شهرية. خيار آخر هو السماح فقط لمستخدمين ومجموعات محددة بالوصول إلى ميزات الذكاء الاصطناعي.

هناك العديد من العوامل المتغيرة التي يجب مراعاتها عند حساب تكاليف استخدام نماذج LLM.
عرض مبسط سيكون…

:information_source: من المهم فهم ما هي الرموز وكيفية عدها

  • نموذج LLM والتسعير → تحديد نموذج LLM المحدد الذي تخطط لاستخدامه والعثور على أحدث تفاصيل التسعير الخاصة به للرموز المدخلة والمخرجة.
  • الرموز المدخلة → متوسط طول استعلاماتك المدخلة بالرموز.
  • الرموز المخرجة → هذه هي استجابات النموذج بالرموز.

الآن دعنا نمر عبر مثال استخدام روبوت الذكاء الاصطناعي هنا على Meta.

:warning: تم إجراء الكثير من التبسيطات أثناء هذا الحساب مثل استخدام الرموز، والمستخدمين الذين يستخدمون روبوت الذكاء الاصطناعي، ومتوسط عدد الطلبات. يجب أخذ هذه الأرقام كـ إرشادات عامة فقط. خاصة وأننا نجري الكثير من التجارب مع روبوت الذكاء الاصطناعي.

  1. استخدام مستكشف البيانات لفهم متوسط الرموز المطلوبة/المستجابة وجميع البيانات الأخرى هنا.

  2. في المتوسط، كانت رموز الاستجابة أكبر بـ 3 إلى 5 مرات من رموز الطلب [1]

  3. افترض أن متوسط رمز طلب المستخدم هو 85، وهو ما يعادل أقل من فقرة [2]

  4. افترض أن متوسط رمز الاستجابة هو 85 × 4 = 340 رمزًا، أي ما يعادل 3 فقرات.

  5. باستخدام GPT-4 Turbo من OpenAI، تبلغ تكلفة الرموز المدخلة 10 دولارات / 1 مليون رمز = 0.00001 دولار / رمز × 85 رمزًا = 0.00085 دولار للمدخلات.

  6. بالنسبة لرموز المخرجات، ستكون 30.00 دولار / 1 مليون رمز = 0.00003 دولار / رمز × 340 رمزًا = 0.0102 دولار للمخرجات.

  7. التكلفة الإجمالية لكل طلب هي 0.00085 دولار + 0.0102 دولار = 0.01105 دولار.

  8. خلال فبراير 2024، كان حوالي 600 مستخدم يستخدمون روبوت الذكاء الاصطناعي، مما أدى إلى متوسط 10 طلبات لذلك الشهر. الآن افترض أن هذه الأرقام متسقة مع مجتمعك.

  9. هذا يعني أنه لشهر فبراير، ستكون تكلفة روبوت الذكاء الاصطناعي 0.01105 دولار × 600 مستخدم × 10 طلبات = 66 دولارًا.

  10. تسريع هذا إلى تكلفة تشغيل روبوت الذكاء الاصطناعي لمدة عام، سيكون 66 دولارًا × 12 = 792 دولارًا سنويًا لتشغيل GPT-4 Turbo كنموذج LLM الذي تختاره.

الآن مع GPT-4o يمكنك تقليل تلك التكلفة النهائية إلى النصف!


  1. تقدير بالنظر إلى مجتمع OpenAI واستجابتنا لنسبة رموز الطلب ↩︎

  2. كم عدد الكلمات التي تساوي 85 رمزًا؟ أثناء النظر إلى متوسط استخدام رموز طلبات المستخدم، وجدت أرقامًا منخفضة تصل إلى 20 إلى أكثر من 100. أردت أن ألخص أنه كانت هناك طلبات أكثر تقترب من 100 والافتراض هناك هو أن تلك الطلبات قد تكون أقرب إلى الجمل المكتملة وتشير إلى استعلامات مدروسة جيدًا مع الكثير من الأسئلة المطروحة على الروبوت ↩︎

9 إعجابات

لقد شاركنا مؤخرًا ما يلي مع عميل كان يسأل عن استخدام البحث بالذكاء الاصطناعي في Meta ومقدار التكلفة التي تكبدناها:

في الشهر الماضي، أجرينا 1104 عمليات بحث في Meta

  • تسعير GPT-4o-mini، والذي سيكلف 0.25 دولار
  • استخدام haiku سيكلف 0.53 دولار
  • Gemini Flash سيكلف 0.06 دولار

يجب أن ننتبه إلى “رموز الطلب” التي كانت حوالي 85868 و “رموز الاستجابة” التي كانت حوالي 408417 من LLM.

3 إعجابات

التكاليف المقدرة لشهر من تسميات الصور في Meta

  • 1019 مكالمة
  • 55 مليون رمز طلب
  • 34 ألف رمز استجابة

والتي ستكلف، اعتمادًا على نموذج اللغة الكبير (LLM):

  • Claude Haiku 3: 13.86 دولارًا
  • GPT-4o Mini: 8.31 دولارًا
  • Gemini 1.5 Flash 8B: 2.07 دولارًا
5 إعجابات