الدفاع عن ميزة الحد الأقصى الصارم لاستخدام مجموعة المستخدمين لروبوتات الذكاء الاصطناعي والمساعد الذكي

لقد أجريت بعض الحسابات ووصلت إلى استنتاج مفاده أنه بدون القدرة على تحديد مدخلات ومخرجات الرموز للمستخدم شهريًا أو يوميًا، يمكنك بسرعة الوقوع في بعض المشاكل. حاليًا، الطريقة الوحيدة للحد من تفاعل المستخدم مع روبوت الذكاء الاصطناعي هي السماح لروبوتات الذكاء الاصطناعي في الرسائل الخاصة فقط (تعطيل الدردشة لكل شخصية) وتحديد حد للرسائل الخاصة اليومية المسموح بها - ولكن بالطبع هذا غير واقعي. إليك مثال على تفصيل تكلفة “أسوأ سيناريو” يبرر الحاجة إلى هذه الميزة، باستخدام النهج الذي تتبعه OpenAI لأعضاء ChatGPT الخاص بهم:

GPT-4o mini مع سياق 32 ألف (ملاحظة: يتم تعيين طول السياق باستخدام إعداد “عدد الرموز للموجه” في صفحة إعدادات LLMs)
التكلفة الحالية: 0.15 دولار لكل مليون مدخل / 0.60 دولار لكل مليون مخرج

لنفترض أن المستخدم يدخل 32 ألف رمز ويخرج 16 ألف رمز كل يوم لمدة 30 يومًا (دورة فوترة واحدة لاشتراك نموذجي):
تكلفة المدخلات الشهرية = 960,000 رمز = ~0.14 دولار

تكلفة المخرجات الشهرية = 480,000 رمز = ~0.28 دولار

حسنًا، هذا ليس سيئًا في الواقع، أليس كذلك؟ أقل من نصف دولار. ومع ذلك، هذا في الواقع استخدام منخفض جدًا، خاصة وأن GPT-4o mini يمكنه إنشاء ما يصل إلى 16.4 ألف رمز في دفعة واحدة (على الرغم من أنه يمكنك بالتأكيد هندسة الموجه وإعدادات LLM لمنع ذلك). يمكنك البدء في مضاعفة هذه التكاليف حسب مقدار ما تعتقد أن المستخدمين سيستخدمون روبوت الذكاء الاصطناعي. الجزء الأسوأ هو أن هذا نموذج رخيص بشكل لا يصدق؛ التكاليف أعلى بشكل كبير لـ Claude 3.5 Sonnet (3 دولارات لكل مليون مدخل / 15 دولارًا لكل مليون مخرج) و GPT-4o (5 دولارات لكل مليون مدخل / 15 دولارًا لكل مليون مخرج) - ودعنا لا نتحدث حتى عن GPT-4 Turbo ههههه. إليك نفس التفصيل لـ Claude 3.5 Sonnet:

Claude 3.5 Sonnet مع سياق 32 ألف
تكلفة المدخلات الشهرية = ~2.88 دولار

تكلفة المخرجات الشهرية = ~7.20 دولار

الإجمالي = ~10.08 دولار

ولكن مرة أخرى؛ هذا استخدام منخفض. لذلك يصبح من الواضح مدى تكلفة استخدام LLM غير المقيد في روبوتات الذكاء الاصطناعي. إذا قمت بضرب هذا في 2، فستحتاج إلى فرض اشتراك بقيمة 25 دولارًا لتحقيق ربح أقل بقليل من 5 دولارات :grimacing:

:bullseye: إليك ما أقترحه رسميًا:

  1. إعداد يسمح بكمية محددة من مدخلات ومخرجات الرموز لمجموعة مستخدمين معينة كل شهر أو يوم لروبوتات الذكاء الاصطناعي.
  • لن تشمل استخدام الرموز هذا الموجه النظامي للشخصيات.
  • يمكن أن تكون حدود الرموز لكل LLM، أو لكل شخصية، أو عالمية/إجمالية.
  1. كبديل للنقطة 1، يمكن استخدام حد صحيح بسيط لاستخدام روبوتات الذكاء الاصطناعي في الرسائل المباشرة والرسائل الخاصة. مثال: حد 100 رسالة مباشرة لأي شخصية في اليوم.
  2. إعداد يسمح بكمية محددة من مخرجات الرموز لمجموعة مستخدمين معينة كل شهر أو يوم للمساعد الذكي.
  • يمكن عدم احتساب مدخلات الرموز نظرًا لأنه سيكون من غير العملي توقع أن يخمن المستخدم عدد الرموز التي يمثلها موضوع طويل عندما يقوم، على سبيل المثال، بإنشاء ملخص.
  • قد يكون من الحكمة أيضًا وضع حد صحيح صارم لطول (بالكلمات حتى لا يتم استخدام TikToken هنا) للموجهات المخصصة حتى لا يحاول المستخدمون التحايل على حدودهم الشهرية/اليومية باستخدام المنشئ كدردشة غير محدودة :smiling_face_with_sunglasses:
  1. عداد رموز في ملف تعريف المستخدم وربما حتى في رسائله الخاصة والرسائل المباشرة. سيكون من الرائع وجود نص صغير بجوار كل رسالة مستخدم وذكاء اصطناعي يعرض عدد الرموز التي تمثلها (لا نريد بالضرورة السماح للجميع بميزة التصحيح، وهذا يعمل فقط في الرسائل الخاصة على أي حال)
  • عداد رموز منفصل للمساعد الذكي (للمساعدة في فصل هاتين الميزتين) والذي يشارك عددًا بين الشرح، التدقيق اللغوي، الموجه المخصص، إلخ…

ملاحظة جانبية: أنا لا ألوم هذه الميزة ولا المطورين بأي شكل من الأشكال وأعتذر إذا بدا أي جزء من هذا كذلك. بصراحة، مكون Discourse AI الإضافي هو أحد أكثر التقنيات المفضلة لدي على الإطلاق. في الواقع، يسمح لي ببناء عملي الحلم كباحث ومعلم في مجال الذكاء الاصطناعي دون الحاجة إلى توظيف مهندسين إضافيين ودفع تكاليف بنية تحتية إضافية - يمكنني إعداد كل شيء بنفسي :heart:. أنا فقط أعتقد أن هذه الميزة هي القطعة الأخيرة من اللغز ليس فقط بالنسبة لي، ولكن للعديد من مستخدمي Discourse الآخرين الذين يرغبون في السماح لمستخدميهم بالاستمتاع بهذه التكنولوجيا الرائعة في حدود المعقول.

إعجاب واحد (1)

تم تطبيق هذا في Discourse Chatbot كنظام حصص أسبوعية في مارس 2023 وتم توسيعه منذ ذلك الحين بحيث يمكنك تحديد حصص لمجموعات ثلاث مجموعات مختلفة من المستخدمين. على سبيل المثال، يحصل الأعضاء الذين يدفعون على حصة أعلى.

يتم عرض رسالة مهذبة للمستخدمين الذين يتجاوزون حصتهم الأسبوعية (وهذا لا يكلفك شيئًا).

علاوة على ذلك، يمكن تنبيه المسؤولين عند تجاوز الحصة.

لقد أرسلت لك رسالة خاصة بشأن ذلك ردًا على أحد منشوراتك السابقة حول هذا الموضوع، لكنك لم ترد :thinking: ربما تستضيف بنفسك وليس لديك حق الوصول إلى المكون الإضافي الخاص بي؟

بصراحة، مع ظهور GPT 4o-mini، انخفضت تكاليف المحادثات اللائقة مع الروبوت بشكل كبير.

بالمناسبة، يتم استخدام Discourse Chatbot الآن من قبل عمل واحد على الأقل لدعم العملاء في الخطوط الأمامية، لذلك يمكنك التأكد من أنه مستقر وفعال.

إعجابَين (2)

اعتذاري عن عدم الرد! أتذكر قراءته الآن، لكن ليس لدي أي فكرة لماذا لم أعد بالكتابة :face_with_spiral_eyes:. وأنا على قطرة لذا هذه ليست المشكلة.

ليس لدي شك في استقراره وجودته؛ في الواقع، أنا معجب جدًا بالمكون الإضافي وأحترمك والجهد الذي بذلته فيه. ومع ذلك، فإن روبوت الدردشة يلبي حاجة جزئية فقط لمشروعي التجاري. مساعد الذكاء الاصطناعي ضرورة أساسية، وكذلك القدرة على التبديل الفوري بين النماذج. في المستقبل القريب، سأقوم بنشر نموذجي المُعدّل الخاص بي وإعداد نماذج اللغة الكبيرة الخاصة بي يدويًا وهذا أمر بالغ الأهمية.

أنا أشرح كل هذا فقط حتى لا تعتقد أن لدي شيئًا ضد عملك! :grin: بدلاً من ذلك، المشكلة من جانبي؛ أنا أحاول القيام بشيء متخصص للغاية.

إعجاب واحد (1)

نعم، أتفهم تمامًا نطاق الطلب الأوسع :+1:

أنا فقط أقدم حلاً جزئيًا (وإن كان مهمًا).

إعجاب واحد (1)

من المتوقع أن يتم طرح هذا هذا الأسبوع:

6 إعجابات

هذا رائع!

في التفاصيل أدناه، هل يعني هذا أن إجمالي الرموز (tokens) والطلبات مشتركة بين جميع المستخدمين في المجموعة، أم أن كل مستخدم في المجموعة يمكنه استخدام الكميات المحددة بشكل فردي؟

يوفر هذا النظام تحكمًا دقيقًا في استخدام واجهة برمجة تطبيقات نماذج اللغة الكبيرة (LLM API) من خلال السماح للمسؤولين بتحديد حدود لكل من إجمالي الرموز (tokens) وعدد الطلبات لكل مجموعة.

أوه، أحتاج إلى توضيح هذا في واجهة المستخدم… جميع الحدود لكل مستخدم ولا تتم مشاركتها أبدًا بين أعضاء المجموعة. حد حصة المجموعة المشتركة هو مفهوم مثير للاهتمام ولكني لست متأكدًا من أنه منطقي من الناحية العملية؟ هل يمكنك التفكير في أي وقت قد يكون هذا مفيدًا؟

في الوقت الحالي، تطبيقي هو:

  • اختيار الحصة الأكثر “مرونة” التي يمتلكها المستخدم اعتمادًا على المجموعات التي ينتمي إليها المستخدم
  • الإنفاذ لكل مستخدم.

(هذا يسمح للمسؤولين بالحصانة حتى لو كان لدى TL2 حصة صارمة)

كنت أسأل لأن الأمر بالتأكيد لن يكون منطقيًا في الممارسة العملية :grinning_face_with_smiling_eyes: . رأيي هو أن تطبيقك هنا هو الأكثر مثالية. أنا ومجتمعي نقدر حقًا العمل الذي يتم هنا :heart:

إعجاب واحد (1)

الحجة الوحيدة لـ “الحصة المطلقة” هي:

أريد أن يتمكن Tl1 من اللعب مع الذكاء الاصطناعي ولكن … كإجراء وقائي، حدد إنفاقي بمبلغ N$ في اليوم. لدى Tl1 عدد غير معروف من الأعضاء.

ولكن أعتقد أنه إذا كان هذا ما يبحث عنه الناس، فيمكنهم وضع الحصص المطلقة مباشرة في لوحات تحكم Anthropic / Open AI إلخ.

أنا لست ضد إضافة حصص مطلقة لاحقًا، ولكن ربما سأتخطى هذه الميزة في هذه الدورة.

إعجابَين (2)

@sam هذا تحديث رائع :partying_face: هل سيتم ربط حدود الرموز بالاشتراكات؟ سيكون من الرائع أن نتمكن من التحكم في الاستخدام والسماح باستخدام نماذج أكثر تكلفة مقابل رسوم.

نعم، يمكن أن يعمل هذا مع النظام، يمكنك إعداد حصص مختلفة لمجموعات مختلفة من المستخدمين.

إعجابَين (2)

تم تطبيق هذا وتوثيقه الآن:

إعجابَين (2)

تم إغلاق هذا الموضوع تلقائيًا بعد 5 أيام. لم يعد يُسمح بالردود الجديدة.