لاستخدام ميزات معينة من Discourse AI، يُطلب من المستخدمين استخدام مزود نموذج لغوي كبير (LLM). يرجى مراجعة كل ميزة من ميزات الذكاء الاصطناعي لتحديد نماذج اللغات الكبيرة المتوافقة.
إذا كانت التكلفة تشكل مصدر قلق كبير، فإن Discourse AI يوفر العديد من الأدوات المضمنة للمساعدة في إدارة الإنفاق:
- لوحة معلومات استخدام الذكاء الاصطناعي — تتبع استهلاك الرموز (tokens) حسب الميزة والنموذج والمستخدم مع التكاليف المقدرة
- حصص الاستخدام — تعيين حدود لكل نموذج ولكل مجموعة للرموز أو عدد الطلبات ضمن نوافذ زمنية قابلة للتكوين (ساعة، يوم، أسبوع)
- تخصيصات الرصيد — تعيين ميزانيات رصيد إجمالية لكل نموذج بحدود ناعمة وصارمة
- ميزانيات جانب البائع — تعيين حدود الاستخدام مباشرة من البائع كإجراء أمان إضافي
- قيود المجموعة — السماح فقط لمستخدمين ومجموعات محددة بالوصول إلى ميزات الذكاء الاصطناعي
هناك عدة عوامل متغيرة يجب مراعاتها عند حساب تكاليف استخدام نماذج اللغات الكبيرة (LLMs)
عرض مبسط سيكون…
من المهم فهم ما هي الرموز (tokens) وكيفية عدها
- نموذج اللغة الكبير (LLM) والتسعير → تحديد نموذج اللغة الكبير المحدد الذي تخطط لاستخدامه والعثور على أحدث تفاصيل التسعير الخاصة به لرموز الإدخال والإخراج
- رموز الإدخال → متوسط طول مطالبات الإدخال الخاصة بك بالرموز
- رموز الإخراج → استجابات النموذج بالرموز
لنتعرف الآن على مثال استخدام روبوت الذكاء الاصطناعي هنا في Meta
كانت هناك العديد من التبسيطات التي تم إجراؤها أثناء هذا الحساب مثل استخدام الرموز، والمستخدمين الذين يستخدمون روبوت الذكاء الاصطناعي، ومتوسط عدد الطلبات. يجب أخذ هذه الأرقام فقط كـ إرشادات عامة. خاصة وأننا نجري الكثير من التجارب على روبوت الذكاء الاصطناعي
-
استخدم لوحة معلومات استخدام الذكاء الاصطناعي المضمنة في
/admin/plugins/discourse-ai/ai-usageلمراجعة استخدامك الفعلي لرموز الطلبات/الاستجابات، مقسمًا حسب الميزة والنموذج والمستخدم -
في المتوسط، كانت رموز الاستجابة أكبر بـ 3 إلى 5 مرات من رموز الطلب [1]
-
افترض أن متوسط رمز طلب المستخدم هو 85، وهو ما يعادل أقل من فقرة واحدة [2]
-
افترض أن متوسط رمز الاستجابة هو 85 × 4 = 340 رمزًا، وهو ما يعادل 3 فقرات
-
باستخدام GPT-5.4 mini من OpenAI، ستكون تكلفة رموز الإدخال 0.75 دولار / مليون رمز = 0.00000075 دولار / رمز × 85 رمزًا = 0.000064 دولار للإدخال
-
بالنسبة لرموز الإخراج، ستكون 4.50 دولارات / مليون رمز = 0.0000045 دولار / رمز × 340 رمزًا = 0.00153 دولار للإخراج
-
التكلفة الإجمالية لكل طلب هي 0.000064 دولار + 0.00153 دولار = 0.0016 دولار
-
خلال فبراير 2024، كان حوالي 600 مستخدم يستخدمون روبوت الذكاء الاصطناعي، حيث قاموا بإجراء 10 طلبات في المتوسط لذلك الشهر. افترض الآن أن هذه الأرقام متسقة مع مجتمعك
-
هذا يعني أنه بالنسبة لشهر فبراير، ستكون تكلفة روبوت الذكاء الاصطناعي 0.0016 دولار × 600 مستخدم × 10 طلبات = 9.56 دولار
-
بالانتقال السريع إلى تكلفة تشغيل روبوت الذكاء الاصطناعي لمدة عام، ستكون 9.56 دولار × 12 = 115 دولارًا للسنة لتشغيل GPT-5.4 mini كنموذج اللغة الكبير الذي تختاره
للحصول على تكاليف أقل، فكر في نماذج الميزانية مثل GPT-5.4 nano (0.20 دولار/1.25 دولار لكل مليون رمز)، و Gemini 2.5 Flash (0.075 دولار/0.30 دولار لكل مليون رمز)، أو Claude Haiku 4.5 — والتي يمكن أن تقلل التكاليف بنسبة 75-95% إضافية مقارنة بالمثال أعلاه. تحقق دائمًا من أحدث الأسعار من البائع الخاص بك حيث تستمر التكاليف في الانخفاض.
تقدير بالنظر إلى مجتمع OpenAI وردنا الخاص على نسبة رموز الطلب إلى الاستجابة ↩︎
أثناء النظر في متوسط استخدام رمز طلب المستخدم، وجدت أرقامًا منخفضة تصل إلى 20 وإلى أكثر من 100. أردت أن أستوعب أن هناك المزيد من الطلبات القريبة من 100 والافتراض هو أن تلك الطلبات قد تكون أقرب إلى جمل كاملة وتشير إلى مطالبات مدروسة جيدًا مع الكثير من الأسئلة الموجهة إلى الروبوت ↩︎