الدفاع عن ميزة الحد الأقصى الصارم لاستخدام مجموعة المستخدمين لروبوتات الذكاء الاصطناعي والمساعد الذكي

MachineScholar · 24 يوليو 2024، 10:43ص

لقد أجريت بعض الحسابات ووصلت إلى استنتاج مفاده أنه بدون القدرة على تحديد مدخلات ومخرجات الرموز للمستخدم شهريًا أو يوميًا، يمكنك بسرعة الوقوع في بعض المشاكل. حاليًا، الطريقة الوحيدة للحد من تفاعل المستخدم مع روبوت الذكاء الاصطناعي هي السماح لروبوتات الذكاء الاصطناعي في الرسائل الخاصة فقط (تعطيل الدردشة لكل شخصية) وتحديد حد للرسائل الخاصة اليومية المسموح بها - ولكن بالطبع هذا غير واقعي. إليك مثال على تفصيل تكلفة “أسوأ سيناريو” يبرر الحاجة إلى هذه الميزة، باستخدام النهج الذي تتبعه OpenAI لأعضاء ChatGPT الخاص بهم:

GPT-4o mini مع سياق 32 ألف (ملاحظة: يتم تعيين طول السياق باستخدام إعداد “عدد الرموز للموجه” في صفحة إعدادات LLMs)
التكلفة الحالية: 0.15 دولار لكل مليون مدخل / 0.60 دولار لكل مليون مخرج

لنفترض أن المستخدم يدخل 32 ألف رمز ويخرج 16 ألف رمز كل يوم لمدة 30 يومًا (دورة فوترة واحدة لاشتراك نموذجي):
تكلفة المدخلات الشهرية = 960,000 رمز = ~0.14 دولار

تكلفة المخرجات الشهرية = 480,000 رمز = ~0.28 دولار

حسنًا، هذا ليس سيئًا في الواقع، أليس كذلك؟ أقل من نصف دولار. ومع ذلك، هذا في الواقع استخدام منخفض جدًا، خاصة وأن GPT-4o mini يمكنه إنشاء ما يصل إلى 16.4 ألف رمز في دفعة واحدة (على الرغم من أنه يمكنك بالتأكيد هندسة الموجه وإعدادات LLM لمنع ذلك). يمكنك البدء في مضاعفة هذه التكاليف حسب مقدار ما تعتقد أن المستخدمين سيستخدمون روبوت الذكاء الاصطناعي. الجزء الأسوأ هو أن هذا نموذج رخيص بشكل لا يصدق؛ التكاليف أعلى بشكل كبير لـ Claude 3.5 Sonnet (3 دولارات لكل مليون مدخل / 15 دولارًا لكل مليون مخرج) و GPT-4o (5 دولارات لكل مليون مدخل / 15 دولارًا لكل مليون مخرج) - ودعنا لا نتحدث حتى عن GPT-4 Turbo ههههه. إليك نفس التفصيل لـ Claude 3.5 Sonnet:

Claude 3.5 Sonnet مع سياق 32 ألف
تكلفة المدخلات الشهرية = ~2.88 دولار

تكلفة المخرجات الشهرية = ~7.20 دولار

الإجمالي = ~10.08 دولار

ولكن مرة أخرى؛ هذا استخدام منخفض. لذلك يصبح من الواضح مدى تكلفة استخدام LLM غير المقيد في روبوتات الذكاء الاصطناعي. إذا قمت بضرب هذا في 2، فستحتاج إلى فرض اشتراك بقيمة 25 دولارًا لتحقيق ربح أقل بقليل من 5 دولارات

إليك ما أقترحه رسميًا:

إعداد يسمح بكمية محددة من مدخلات ومخرجات الرموز لمجموعة مستخدمين معينة كل شهر أو يوم لروبوتات الذكاء الاصطناعي.

لن تشمل استخدام الرموز هذا الموجه النظامي للشخصيات.
يمكن أن تكون حدود الرموز لكل LLM، أو لكل شخصية، أو عالمية/إجمالية.

كبديل للنقطة 1، يمكن استخدام حد صحيح بسيط لاستخدام روبوتات الذكاء الاصطناعي في الرسائل المباشرة والرسائل الخاصة. مثال: حد 100 رسالة مباشرة لأي شخصية في اليوم.
إعداد يسمح بكمية محددة من مخرجات الرموز لمجموعة مستخدمين معينة كل شهر أو يوم للمساعد الذكي.

يمكن عدم احتساب مدخلات الرموز نظرًا لأنه سيكون من غير العملي توقع أن يخمن المستخدم عدد الرموز التي يمثلها موضوع طويل عندما يقوم، على سبيل المثال، بإنشاء ملخص.
قد يكون من الحكمة أيضًا وضع حد صحيح صارم لطول (بالكلمات حتى لا يتم استخدام TikToken هنا) للموجهات المخصصة حتى لا يحاول المستخدمون التحايل على حدودهم الشهرية/اليومية باستخدام المنشئ كدردشة غير محدودة

عداد رموز في ملف تعريف المستخدم وربما حتى في رسائله الخاصة والرسائل المباشرة. سيكون من الرائع وجود نص صغير بجوار كل رسالة مستخدم وذكاء اصطناعي يعرض عدد الرموز التي تمثلها (لا نريد بالضرورة السماح للجميع بميزة التصحيح، وهذا يعمل فقط في الرسائل الخاصة على أي حال)

عداد رموز منفصل للمساعد الذكي (للمساعدة في فصل هاتين الميزتين) والذي يشارك عددًا بين الشرح، التدقيق اللغوي، الموجه المخصص، إلخ…

ملاحظة جانبية: أنا لا ألوم هذه الميزة ولا المطورين بأي شكل من الأشكال وأعتذر إذا بدا أي جزء من هذا كذلك. بصراحة، مكون Discourse AI الإضافي هو أحد أكثر التقنيات المفضلة لدي على الإطلاق. في الواقع، يسمح لي ببناء عملي الحلم كباحث ومعلم في مجال الذكاء الاصطناعي دون الحاجة إلى توظيف مهندسين إضافيين ودفع تكاليف بنية تحتية إضافية - يمكنني إعداد كل شيء بنفسي . أنا فقط أعتقد أن هذه الميزة هي القطعة الأخيرة من اللغز ليس فقط بالنسبة لي، ولكن للعديد من مستخدمي Discourse الآخرين الذين يرغبون في السماح لمستخدميهم بالاستمتاع بهذه التكنولوجيا الرائعة في حدود المعقول.

merefield · 24 يوليو 2024، 12:56م

تم تطبيق هذا في Discourse Chatbot كنظام حصص أسبوعية في مارس 2023 وتم توسيعه منذ ذلك الحين بحيث يمكنك تحديد حصص لمجموعات ثلاث مجموعات مختلفة من المستخدمين. على سبيل المثال، يحصل الأعضاء الذين يدفعون على حصة أعلى.

يتم عرض رسالة مهذبة للمستخدمين الذين يتجاوزون حصتهم الأسبوعية (وهذا لا يكلفك شيئًا).

علاوة على ذلك، يمكن تنبيه المسؤولين عند تجاوز الحصة.

لقد أرسلت لك رسالة خاصة بشأن ذلك ردًا على أحد منشوراتك السابقة حول هذا الموضوع، لكنك لم ترد ربما تستضيف بنفسك وليس لديك حق الوصول إلى المكون الإضافي الخاص بي؟

بصراحة، مع ظهور GPT 4o-mini، انخفضت تكاليف المحادثات اللائقة مع الروبوت بشكل كبير.

بالمناسبة، يتم استخدام Discourse Chatbot الآن من قبل عمل واحد على الأقل لدعم العملاء في الخطوط الأمامية، لذلك يمكنك التأكد من أنه مستقر وفعال.

MachineScholar · 25 يوليو 2024، 2:55م

اعتذاري عن عدم الرد! أتذكر قراءته الآن، لكن ليس لدي أي فكرة لماذا لم أعد بالكتابة . وأنا على قطرة لذا هذه ليست المشكلة.

ليس لدي شك في استقراره وجودته؛ في الواقع، أنا معجب جدًا بالمكون الإضافي وأحترمك والجهد الذي بذلته فيه. ومع ذلك، فإن روبوت الدردشة يلبي حاجة جزئية فقط لمشروعي التجاري. مساعد الذكاء الاصطناعي ضرورة أساسية، وكذلك القدرة على التبديل الفوري بين النماذج. في المستقبل القريب، سأقوم بنشر نموذجي المُعدّل الخاص بي وإعداد نماذج اللغة الكبيرة الخاصة بي يدويًا وهذا أمر بالغ الأهمية.

أنا أشرح كل هذا فقط حتى لا تعتقد أن لدي شيئًا ضد عملك! بدلاً من ذلك، المشكلة من جانبي؛ أنا أحاول القيام بشيء متخصص للغاية.

merefield · 25 يوليو 2024، 2:58م

نعم، أتفهم تمامًا نطاق الطلب الأوسع

أنا فقط أقدم حلاً جزئيًا (وإن كان مهمًا).

sam · 13 يناير 2025، 2:50ص

من المتوقع أن يتم طرح هذا هذا الأسبوع:

github.com/discourse/discourse-ai

FEATURE: llm quotas

main ← quotas2

opened 06:20AM - 02 Jan 25 UTC

SamSaffron

+1684 -152

Adds a comprehensive quota management system for LLM models that allows: - Se…tting per-group token and usage limits with configurable durations - Tracking and enforcing token/usage limits across user groups - Quota reset periods (hourly, daily, weekly, or custom) - Admin UI for managing quotas with real-time updates - Full test coverage for quota models and controllers This system provides granular control over LLM API usage by allowing admins to define limits on both total tokens and number of requests per group. Supports multiple concurrent quotas per model and automatically handles quota resets. ![image](https://github.com/user-attachments/assets/76375c76-889d-438b-b464-e65c7f7a41ed) ![image](https://github.com/user-attachments/assets/21752366-2b33-4fb7-8b3f-faee74c45413) ![image](https://github.com/user-attachments/assets/c7248930-0aa7-434e-805e-56adb7cbfb2f)

MachineScholar · 13 يناير 2025، 8:04ص

هذا رائع!

في التفاصيل أدناه، هل يعني هذا أن إجمالي الرموز (tokens) والطلبات مشتركة بين جميع المستخدمين في المجموعة، أم أن كل مستخدم في المجموعة يمكنه استخدام الكميات المحددة بشكل فردي؟

يوفر هذا النظام تحكمًا دقيقًا في استخدام واجهة برمجة تطبيقات نماذج اللغة الكبيرة (LLM API) من خلال السماح للمسؤولين بتحديد حدود لكل من إجمالي الرموز (tokens) وعدد الطلبات لكل مجموعة.

sam · 13 يناير 2025، 8:15ص

أوه، أحتاج إلى توضيح هذا في واجهة المستخدم… جميع الحدود لكل مستخدم ولا تتم مشاركتها أبدًا بين أعضاء المجموعة. حد حصة المجموعة المشتركة هو مفهوم مثير للاهتمام ولكني لست متأكدًا من أنه منطقي من الناحية العملية؟ هل يمكنك التفكير في أي وقت قد يكون هذا مفيدًا؟

في الوقت الحالي، تطبيقي هو:

اختيار الحصة الأكثر “مرونة” التي يمتلكها المستخدم اعتمادًا على المجموعات التي ينتمي إليها المستخدم
الإنفاذ لكل مستخدم.

(هذا يسمح للمسؤولين بالحصانة حتى لو كان لدى TL2 حصة صارمة)

MachineScholar · 13 يناير 2025، 8:27ص

كنت أسأل لأن الأمر بالتأكيد لن يكون منطقيًا في الممارسة العملية . رأيي هو أن تطبيقك هنا هو الأكثر مثالية. أنا ومجتمعي نقدر حقًا العمل الذي يتم هنا

sam · 13 يناير 2025، 8:29ص

الحجة الوحيدة لـ “الحصة المطلقة” هي:

أريد أن يتمكن Tl1 من اللعب مع الذكاء الاصطناعي ولكن … كإجراء وقائي، حدد إنفاقي بمبلغ N$ في اليوم. لدى Tl1 عدد غير معروف من الأعضاء.

ولكن أعتقد أنه إذا كان هذا ما يبحث عنه الناس، فيمكنهم وضع الحصص المطلقة مباشرة في لوحات تحكم Anthropic / Open AI إلخ.

أنا لست ضد إضافة حصص مطلقة لاحقًا، ولكن ربما سأتخطى هذه الميزة في هذه الدورة.

BrianC · 14 يناير 2025، 4:50ص

@sam هذا تحديث رائع هل سيتم ربط حدود الرموز بالاشتراكات؟ سيكون من الرائع أن نتمكن من التحكم في الاستخدام والسماح باستخدام نماذج أكثر تكلفة مقابل رسوم.

sam · 14 يناير 2025، 5:00ص

نعم، يمكن أن يعمل هذا مع النظام، يمكنك إعداد حصص مختلفة لمجموعات مختلفة من المستخدمين.

sam · 21 يناير 2025، 6:10ص

تم تطبيق هذا وتوثيقه الآن:

sam · 26 يناير 2025، 9:00م

تم إغلاق هذا الموضوع تلقائيًا بعد 5 أيام. لم يعد يُسمح بالردود الجديدة.

الموضوع		الردود	مرات العرض
Limit the number of AI tokens a user can use in a day? Feature completed , ai	11	939	3 أبريل 2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	843	21 يناير 2025
Configuring LLM Usage Quotas in Discourse AI Site Management official , how-to , ai	4	635	21 يناير 2025
LLM Quotas for Discourse AI Announcements ai	0	175	21 يناير 2025
Cost based quotas for Discourse AI Announcements ai	0	135	30 يونيو 2026

الدفاع عن ميزة الحد الأقصى الصارم لاستخدام مجموعة المستخدمين لروبوتات الذكاء الاصطناعي والمساعد الذكي

الموضوعات ذات الصلة