Аргументы в пользу жесткого лимита использования ИИ для групп пользователей в ИИ-ботах и ИИ-помощнике

MachineScholar · 24.Июль.2024 10:43:46

Я провёл некоторые расчёты и пришёл к выводу, что без возможности ограничивать количество входных и выходных токенов пользователя в день или в месяц можно быстро столкнуться с серьёзными проблемами. В настоящее время единственный способ ограничить взаимодействие пользователя с ботом на базе ИИ — разрешить использование ботов только в личных сообщениях (отключив чат для каждого персонажа) и установить лимит на количество разрешённых ежедневных личных сообщений, но, разумеется, это нереалистично. Вот пример разбивки затрат в «наихудшем сценарии», который обосновывает необходимость этой функции, используя подход, применяемый OpenAI для участников ChatGPT:

GPT-4o mini с контекстом 32 тыс. токенов (П.С. длина контекста задаётся настройкой «Количество токенов для промпта» на странице настроек LLM)

Текущая стоимость: $0,15 за 1 млн входных токенов / $0,60 за 1 млн выходных токенов

Предположим, что пользователь вводит 32 тыс. токенов и получает 16 тыс. выходных токенов каждый день в течение 30 дней (один биллинг-цикл типичной подписки):

Стоимость входных токенов за месяц = 960 000 токенов ≈ $0,14

Стоимость выходных токенов за месяц = 480 000 токенов ≈ $0,28

Всё не так уж плохо, верно? Менее полдоллара. Однако это довольно низкий уровень использования, особенно учитывая, что GPT-4o mini может генерировать до 16,4 тыс. токенов за один запрос (хотя, конечно, можно оптимизировать промпт и настройки LLM, чтобы предотвратить это). Вы можете начать умножать эти затраты в зависимости от того, насколько активно, по вашему мнению, пользователи будут использовать бота на базе ИИ. Самое неприятное в том, что это невероятно дешёвая модель; затраты экспоненциально выше для Claude 3.5 Sonnet ($3 за 1 млн входных токенов / $15 за 1 млн выходных токенов) и GPT-4o ($5 за 1 млн входных токенов / $15 за 1 млн выходных токенов) — и даже не будем говорить о GPT-4 Turbo, ха-ха. Вот та же разбивка для Claude 3.5 Sonnet:

Claude 3.5 Sonnet с контекстом 32 тыс. токенов

Стоимость входных токенов за месяц ≈ $2,88

Стоимость выходных токенов за месяц ≈ $7,20

Итого ≈ $10,08

Но, повторюсь, это низкий уровень использования. Становится очевидно, насколько дорогим может стать неограниченное использование LLM в ботах на базе ИИ. Если умножить это на два, то для получения прибыли чуть менее $5 придётся установить цену подписки на уровне $25

Вот что я официально предлагаю:

Настройка, позволяющая установить определённое количество входных и выходных токенов для конкретной группы пользователей в день или в месяц для ботов на базе ИИ.

Это использование токенов НЕ будет включать системный промпт для персонажей.
Лимиты токенов могут быть установлены для каждой LLM, для каждого персонажа или универсально/общие.

Альтернатива пункту 1: можно использовать простое целочисленное ограничение на использование ботов на базе ИИ в личных сообщениях (DM и PM). Пример: лимит 100 сообщений любому персонажу в день.
Настройка, позволяющая установить определённое количество выходных токенов для конкретной группы пользователей в день или в месяц для помощника на базе ИИ.

Входные токены можно не учитывать, так как было бы нереалистично ожидать от пользователя, чтобы он заранее угадал количество токенов в длинной теме, например, при генерации резюме.
Также разумно установить жёсткое целочисленное ограничение на длину (в словах, чтобы здесь не требовалось использовать TikToken) для пользовательских промптов, чтобы пользователи не пытались обходить свои дневные/месячные лимиты, используя Composer как неограниченный чат-бот

Счётчик токенов в профиле пользователя и, возможно, даже в его личных сообщениях (PM и DM). Было бы здорово, если бы рядом с каждым сообщением пользователя и ИИ отображался небольшой текст с количеством токенов (мы не обязательно хотим предоставлять всем функцию отладки, к тому же она работает только в личных сообщениях).

Отдельный счётчик токенов для помощника на базе ИИ (чтобы разделить эти две функции), который будет вести общий учёт для функций «объяснить», «проверить», «пользовательский промпт» и т. д.

Примечание: я никоим образом не критикую эту функцию или разработчиков, и приношу извинения, если какая-то часть этого текста может быть воспринята именно так. Честно говоря, плагин Discourse AI — один из моих любимых технологических продуктов за всё время. На самом деле, он позволяет мне строить свой бизнес мечты как исследователя и преподавателя в области ИИ без необходимости нанимать дополнительных инженеров и платить за дополнительную инфраструктуру — я могу всё настроить самостоятельно . Я просто считаю, что эта функция — последний недостающий элемент пазла не только для меня, но и для многих других участников Discourse, которые хотят предоставить своим пользователям возможность пользоваться этой замечательной технологией в разумных пределах.

merefield · 24.Июль.2024 12:56:07

Это было реализовано в Discourse Chatbot как еженедельная система квот в марте 2023 года, а затем расширена, чтобы вы могли определять квоты для трёх различных коллекций групп пользователей. Например, платные участники получают более высокую квоту.

Пользователям, превысившим свою еженедельную квоту, отображается вежливое сообщение (это не стоит вам ничего).

Кроме того, администраторы могут получать уведомления о превышении квоты.

Я отправлял вам личное сообщение по этому поводу в ответ на один из ваших предыдущих постов на эту тему, но вы не ответили Возможно, вы используете хостинг и у вас нет доступа к моему плагину?

Честно говоря, с появлением GPT 4o-mini стоимость приличных диалогов с ботами резко упала.

Кстати, Discourse Chatbot уже используется хотя бы одним бизнесом для фронт-лайн поддержки клиентов, так что вы можете быть уверены в его стабильности и эффективности.

MachineScholar · 25.Июль.2024 14:55:58

Приношу извинения за отсутствие ответа! Я вспомнил, что читал его, но не понимаю, почему не ответил . И я работаю на Droplet, так что это не проблема.

У меня нет сомнений в его стабильности и качестве; на самом деле мне очень нравится этот плагин, и я уважаю вас и ту работу, которую вы в него вкладываете. Однако чат-бот — это лишь частичное решение для моего бизнеса. AI Helper является критически важным, как и возможность мгновенно переключаться между моделями. В ближайшем будущем я разверну свою собственную дообученную модель и вручную настрою свои LLM, и это будет жизненно необходимо.

Я объясняю всё это только для того, чтобы вы не подумали, что у меня есть что-то против вашей работы! Скорее, проблема на моей стороне; я пытаюсь реализовать что-то довольно нишевое.

merefield · 25.Июль.2024 14:58:20

Да, полностью согласен, что масштаб запроса шире

Просто предлагаю частичное (хоть и существенное) решение.

sam · 13.Январь.2025 02:50:56

Ожидается, что это будет выпущено на этой неделе:

github.com/discourse/discourse-ai

FEATURE: llm quotas (#1047)

main ← quotas2

merged 04:54AM - 14 Jan 25 UTC

SamSaffron

+1684 -152

Adds a comprehensive quota management system for LLM models that allows: - Se…tting per-group token and usage limits with configurable durations - Tracking and enforcing token/usage limits across user groups - Quota reset periods (hourly, daily, weekly, or custom) - Admin UI for managing quotas with real-time updates - Full test coverage for quota models and controllers This system provides granular control over LLM API usage by allowing admins to define limits on both total tokens and number of requests per group. Supports multiple concurrent quotas per model and automatically handles quota resets. ![image](https://github.com/user-attachments/assets/76375c76-889d-438b-b464-e65c7f7a41ed) ![image](https://github.com/user-attachments/assets/21752366-2b33-4fb7-8b3f-faee74c45413) ![image](https://github.com/user-attachments/assets/c7248930-0aa7-434e-805e-56adb7cbfb2f)

MachineScholar · 13.Январь.2025 08:04:13

Это ОТЛИЧНО!

В деталях ниже это подразумевает, что общее количество токенов и запросов распределяется между всеми пользователями в группе, или же каждый пользователь в группе может использовать установленные лимиты индивидуально?

Эта система обеспечивает точный контроль над использованием API LLM, позволяя администраторам определять лимиты как по общему количеству токенов, так и по количеству запросов для каждой группы.

sam · 13.Январь.2025 08:15:27

О, мне нужно уточнить это в интерфейсе… все лимиты применяются к каждому пользователю индивидуально и никогда не разделяются между участниками группы. Общий лимит квоты для группы — интересная концепция, но не уверен, что она имеет смысл на практике? Можете ли вы придумать ситуации, когда это было бы полезно?

На данный момент моя реализация выглядит так:

Выбирается наиболее «свободная» квота, доступная пользователю в зависимости от групп, в которых он состоит.
Применяется ограничение на уровне пользователя.

(это позволяет администраторам иметь иммунитет, даже если у TL2 есть строгая квота)

MachineScholar · 13.Январь.2025 08:27:35

Я спрашивал, потому что на практике это действительно не имело бы смысла . По моему скромному мнению, ваша реализация здесь — самая идеальная. Моё сообщество и я искренне ценим проделанную здесь работу

sam · 13.Январь.2025 08:29:58

Один аргумент в пользу «абсолютного лимита» заключается в следующем:

Я хочу, чтобы Tl1 мог взаимодействовать с ИИ, но… в качестве меры безопасности ограничить его расходы до N$ в день. У Tl1 неизвестное количество участников.

Но, полагаю, если именно этого хотят люди, они могут установить абсолютные лимиты напрямую в панелях управления Anthropic, OpenAI и других.

Я не против добавления абсолютных лимитов в будущем, но, вероятно, пропущу эту функцию в текущей итерации.

BrianC · 14.Январь.2025 04:50:59

@sam Это фантастическое обновление Будут ли лимиты токенов привязаны к подпискам? Было бы здорово, если бы мы могли контролировать использование и разрешать более дорогие модели за дополнительную плату.

sam · 14.Январь.2025 05:00:35

Да, это может работать с системой: вы можете настроить различные квоты для разных групп пользователей.

sam · 21.Январь.2025 06:10:09

Это уже реализовано и задокументировано:

sam · 26.Январь.2025 21:00:34

Эта тема была автоматически закрыта через 5 дней. Новые ответы больше не принимаются.

Тема		Ответов	Просм.
Limit the number of AI tokens a user can use in a day? Feature completed , ai	11	915	03.04.2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	841	21.01.2025
Configuring LLM Usage Quotas in Discourse AI Site Management official , how-to , ai	4	632	21.01.2025
LLM Quotas for Discourse AI Announcements ai	0	175	21.01.2025
Cost based quotas for Discourse AI Announcements ai	0	127	30.06.2026

Аргументы в пользу жесткого лимита использования ИИ для групп пользователей в ИИ-ботах и ИИ-помощнике

Связанные темы