\u003e يتطلب Discourse AI الربط بموفر واحد لنماذج اللغة الكبيرة (LLM) - هذا مرجع يربط بتسعير الخيارات المختلفة.
\u003e
\u003e مستوى المستخدم المطلوب: مسؤول
\u003e
في استخدام بعض ميزات Discourse AI، يُطلب من المستخدمين استخدام موفر طرف ثالث لنماذج اللغة الكبيرة (LLM). يرجى الاطلاع على كل ميزة من ميزات الذكاء الاصطناعي لتحديد نماذج LLM المتوافقة.
يربط الدليل التالي بتسعير موفري نماذج LLM المختلفين.
\u003e لاحظ أن التكاليف قد تختلف بناءً على عوامل متعددة مثل عدد الطلبات، وطول النص، والموارد الحسابية المستخدمة، والنماذج المختارة، وما إلى ذلك. للحصول على أحدث الأسعار وأكثرها دقة، تحقق بانتظام مع كل موفر.
تشغيل نموذج OSS شبيه بـ Llama2 الخاص بك باستخدام TGI: ستعتمد تكلفة تشغيل نموذج OSS شبيه بـ Llama2 الخاص بك باستخدام TGI على عوامل مختلفة مثل تكاليف البنية التحتية، والتكاليف المرتبطة بالضبط الدقيق للنموذج، وتكاليف إدارة النموذج وصيانته.
هذه بالتأكيد ليست مقارنة مكتسبة إحصائيًا، ولكن بناءً على اختباري القصير باستخدام OpenAI GPT-4، فهو أغلى بثلاث مرات من GPT-3.5 Turbo عند حساب استدعاءات واجهة برمجة التطبيقات وعدد الرموز المميزة المستخدمة - ولأن الرموز المميزة المستخدمة بواسطة GPT-4 أغلى من الناحية المالية، فإن هذا الاختلاف أكبر بكثير.
ولم أحصل على أي فوائد مع GPT-4 مقارنة بـ 3.5 Turbo.
وكإخلاء مسؤولية: لقد استخدمت اللغة الفنلندية، لذا قد تكون اللغة الإنجليزية شيئًا مختلفًا. بالإضافة إلى ذلك، فإن أي ذكاء اصطناعي عديم الفائدة تمامًا في استخدام الدردشة عند استخدام اللغة الفنلندية، ولكن هذه قصة مختلفة تمامًا - ولكن هذا يعني، من وجهة نظري، أن جميع روبوتات الدردشة هي مجرد مضيعة خالصة للمال عند استخدام لغات صغيرة.
التكاليف هنا تقديرية وتم الاتفاق على أن التكاليف يمكن أن تختلف بشكل كبير بناءً على الاستخدام!
من المهم ملاحظة أنه بالنسبة للعديد من المهام الأساسية، قد لا يكون الفرق بين نموذجي GPT-4 و GPT-3.5 كبيرًا. ومع ذلك، فإن GPT-4 لديه بعض الاختلافات المثبتة من حيث قدراته وفهمه الإبداعي ومدخلاته الخام.
أتفق أيضًا على أنه بالنسبة للغات غير الشائعة، هناك الكثير مما هو مرغوب فيه في قدرات النموذج.
أعتقد أننا نتحدث عن نفس الشيء، ولكن لكي أكون آمنًا : هذه مشكلة شركات الذكاء الاصطناعي ولا يمكنني أنا أو أي مطور تغيير هذه الحقيقة.
لكنني أسعى إلى شيء مثل أن نتبع جميعًا قليلاً مقدار ما ننفقه من المال (إذا لم نكن نستخدم المال من ميزانية أخرى غير جيوبنا ) ونحاول إيجاد توازن بين الفائدة الذاتية للغاية والمال.
ولا، لا أعرف ما أتحدث عنه. في الأساس، تستند ردود جميع روبوتات الدردشة بشكل أساسي إلى الضجيج الإنجليزي لملايين الطيران (الكمية على حساب الجودة). يمكن أن يتغير الوضع - للأفضل أو للأسوأ، يعتمد الأمر - إذا كان لدينا أدوات أفضل لتعليم الذكاء الاصطناعي ما هي المصادر التي يمكن استخدامه. بالتأكيد، لدينا، لكنها ستكلف أكثر بكثير من سعر الرموز.
ونعم، هذه صداع اللاعبين الصغار.
أتساءل … هل هناك فرصة للحصول على توازن أفضل بين التكلفة والدقة مع تحرير أكثر حرية للمطالبات؟
هل ستكون مرتاحًا للكشف تقريبًا عن التكلفة الحالية لـ Meta؟ حتى كتقدير تقريبي أو نطاق سيكون مفيدًا.
لقد طلبت من الروبوت تقديم تقدير وقدم ما يلي:
أشعر أن هذا الرقم منخفض جدًا، ولكن مع استبعاد العمل التجريبي والاستخدام من قبل الفريق وما إلى ذلك، ربما لا يكون هذا بعيدًا عما يمكن أن تتوقعه معظم الحالات ذات الحجم المماثل لـ Meta؟
سعر الرمز المميز الذي ذكره الروبوت غير دقيق. التسعير الحالي لـ gpt-3.5-turbo-0125 هو 0.50 دولار لكل مليون رمز إدخال و 1.50 دولار لكل مليون رمز إخراج. بالنظر إلى افتراض نصف إدخال ونصف إخراج، يجب أن يكلف 2.4 مليون رمز 2.40 دولار فقط. gpt-4 هو 30 دولارًا للإدخال و 60 دولارًا للإخراج، مما سيؤدي إلى 108 دولارات لـ 2.4 مليون رمز.