Аргументы в пользу жесткого лимита использования ИИ для групп пользователей в ИИ-ботах и ИИ-помощнике

Я провёл некоторые расчёты и пришёл к выводу, что без возможности ограничивать количество входных и выходных токенов пользователя в день или в месяц можно быстро столкнуться с серьёзными проблемами. В настоящее время единственный способ ограничить взаимодействие пользователя с ботом на базе ИИ — разрешить использование ботов только в личных сообщениях (отключив чат для каждого персонажа) и установить лимит на количество разрешённых ежедневных личных сообщений, но, разумеется, это нереалистично. Вот пример разбивки затрат в «наихудшем сценарии», который обосновывает необходимость этой функции, используя подход, применяемый OpenAI для участников ChatGPT:

GPT-4o mini с контекстом 32 тыс. токенов (П.С. длина контекста задаётся настройкой «Количество токенов для промпта» на странице настроек LLM)

Текущая стоимость: $0,15 за 1 млн входных токенов / $0,60 за 1 млн выходных токенов

Предположим, что пользователь вводит 32 тыс. токенов и получает 16 тыс. выходных токенов каждый день в течение 30 дней (один биллинг-цикл типичной подписки):

Стоимость входных токенов за месяц = 960 000 токенов ≈ $0,14

Стоимость выходных токенов за месяц = 480 000 токенов ≈ $0,28

Всё не так уж плохо, верно? Менее полдоллара. Однако это довольно низкий уровень использования, особенно учитывая, что GPT-4o mini может генерировать до 16,4 тыс. токенов за один запрос (хотя, конечно, можно оптимизировать промпт и настройки LLM, чтобы предотвратить это). Вы можете начать умножать эти затраты в зависимости от того, насколько активно, по вашему мнению, пользователи будут использовать бота на базе ИИ. Самое неприятное в том, что это невероятно дешёвая модель; затраты экспоненциально выше для Claude 3.5 Sonnet ($3 за 1 млн входных токенов / $15 за 1 млн выходных токенов) и GPT-4o ($5 за 1 млн входных токенов / $15 за 1 млн выходных токенов) — и даже не будем говорить о GPT-4 Turbo, ха-ха. Вот та же разбивка для Claude 3.5 Sonnet:

Claude 3.5 Sonnet с контекстом 32 тыс. токенов

Стоимость входных токенов за месяц ≈ $2,88

Стоимость выходных токенов за месяц ≈ $7,20

Итого ≈ $10,08

Но, повторюсь, это низкий уровень использования. Становится очевидно, насколько дорогим может стать неограниченное использование LLM в ботах на базе ИИ. Если умножить это на два, то для получения прибыли чуть менее $5 придётся установить цену подписки на уровне $25 :grimacing:

:bullseye: Вот что я официально предлагаю:

  1. Настройка, позволяющая установить определённое количество входных и выходных токенов для конкретной группы пользователей в день или в месяц для ботов на базе ИИ.
  • Это использование токенов НЕ будет включать системный промпт для персонажей.
  • Лимиты токенов могут быть установлены для каждой LLM, для каждого персонажа или универсально/общие.
  1. Альтернатива пункту 1: можно использовать простое целочисленное ограничение на использование ботов на базе ИИ в личных сообщениях (DM и PM). Пример: лимит 100 сообщений любому персонажу в день.
  2. Настройка, позволяющая установить определённое количество выходных токенов для конкретной группы пользователей в день или в месяц для помощника на базе ИИ.
  • Входные токены можно не учитывать, так как было бы нереалистично ожидать от пользователя, чтобы он заранее угадал количество токенов в длинной теме, например, при генерации резюме.
  • Также разумно установить жёсткое целочисленное ограничение на длину (в словах, чтобы здесь не требовалось использовать TikToken) для пользовательских промптов, чтобы пользователи не пытались обходить свои дневные/месячные лимиты, используя Composer как неограниченный чат-бот :smiling_face_with_sunglasses:
  1. Счётчик токенов в профиле пользователя и, возможно, даже в его личных сообщениях (PM и DM). Было бы здорово, если бы рядом с каждым сообщением пользователя и ИИ отображался небольшой текст с количеством токенов (мы не обязательно хотим предоставлять всем функцию отладки, к тому же она работает только в личных сообщениях).
  • Отдельный счётчик токенов для помощника на базе ИИ (чтобы разделить эти две функции), который будет вести общий учёт для функций «объяснить», «проверить», «пользовательский промпт» и т. д.

Примечание: я никоим образом не критикую эту функцию или разработчиков, и приношу извинения, если какая-то часть этого текста может быть воспринята именно так. Честно говоря, плагин Discourse AI — один из моих любимых технологических продуктов за всё время. На самом деле, он позволяет мне строить свой бизнес мечты как исследователя и преподавателя в области ИИ без необходимости нанимать дополнительных инженеров и платить за дополнительную инфраструктуру — я могу всё настроить самостоятельно :heart:. Я просто считаю, что эта функция — последний недостающий элемент пазла не только для меня, но и для многих других участников Discourse, которые хотят предоставить своим пользователям возможность пользоваться этой замечательной технологией в разумных пределах.

1 лайк

Это было реализовано в Discourse Chatbot как еженедельная система квот в марте 2023 года, а затем расширена, чтобы вы могли определять квоты для трёх различных коллекций групп пользователей. Например, платные участники получают более высокую квоту.

Пользователям, превысившим свою еженедельную квоту, отображается вежливое сообщение (это не стоит вам ничего).

Кроме того, администраторы могут получать уведомления о превышении квоты.

Я отправлял вам личное сообщение по этому поводу в ответ на один из ваших предыдущих постов на эту тему, но вы не ответили :thinking: Возможно, вы используете хостинг и у вас нет доступа к моему плагину?

Честно говоря, с появлением GPT 4o-mini стоимость приличных диалогов с ботами резко упала.

Кстати, Discourse Chatbot уже используется хотя бы одним бизнесом для фронт-лайн поддержки клиентов, так что вы можете быть уверены в его стабильности и эффективности.

2 лайка

Приношу извинения за отсутствие ответа! Я вспомнил, что читал его, но не понимаю, почему не ответил :face_with_spiral_eyes:. И я работаю на Droplet, так что это не проблема.

У меня нет сомнений в его стабильности и качестве; на самом деле мне очень нравится этот плагин, и я уважаю вас и ту работу, которую вы в него вкладываете. Однако чат-бот — это лишь частичное решение для моего бизнеса. AI Helper является критически важным, как и возможность мгновенно переключаться между моделями. В ближайшем будущем я разверну свою собственную дообученную модель и вручную настрою свои LLM, и это будет жизненно необходимо.

Я объясняю всё это только для того, чтобы вы не подумали, что у меня есть что-то против вашей работы! :grin: Скорее, проблема на моей стороне; я пытаюсь реализовать что-то довольно нишевое.

1 лайк

Да, полностью согласен, что масштаб запроса шире :+1:

Просто предлагаю частичное (хоть и существенное) решение.

1 лайк

Ожидается, что это будет выпущено на этой неделе:

6 лайков

Это ОТЛИЧНО!

В деталях ниже это подразумевает, что общее количество токенов и запросов распределяется между всеми пользователями в группе, или же каждый пользователь в группе может использовать установленные лимиты индивидуально?

Эта система обеспечивает точный контроль над использованием API LLM, позволяя администраторам определять лимиты как по общему количеству токенов, так и по количеству запросов для каждой группы.

О, мне нужно уточнить это в интерфейсе… все лимиты применяются к каждому пользователю индивидуально и никогда не разделяются между участниками группы. Общий лимит квоты для группы — интересная концепция, но не уверен, что она имеет смысл на практике? Можете ли вы придумать ситуации, когда это было бы полезно?

На данный момент моя реализация выглядит так:

  • Выбирается наиболее «свободная» квота, доступная пользователю в зависимости от групп, в которых он состоит.
  • Применяется ограничение на уровне пользователя.

(это позволяет администраторам иметь иммунитет, даже если у TL2 есть строгая квота)

Я спрашивал, потому что на практике это действительно не имело бы смысла :grinning_face_with_smiling_eyes:. По моему скромному мнению, ваша реализация здесь — самая идеальная. Моё сообщество и я искренне ценим проделанную здесь работу :heart:

1 лайк

Один аргумент в пользу «абсолютного лимита» заключается в следующем:

Я хочу, чтобы Tl1 мог взаимодействовать с ИИ, но… в качестве меры безопасности ограничить его расходы до N$ в день. У Tl1 неизвестное количество участников.

Но, полагаю, если именно этого хотят люди, они могут установить абсолютные лимиты напрямую в панелях управления Anthropic, OpenAI и других.

Я не против добавления абсолютных лимитов в будущем, но, вероятно, пропущу эту функцию в текущей итерации.

2 лайка

@sam Это фантастическое обновление :partying_face: Будут ли лимиты токенов привязаны к подпискам? Было бы здорово, если бы мы могли контролировать использование и разрешать более дорогие модели за дополнительную плату.

Да, это может работать с системой: вы можете настроить различные квоты для разных групп пользователей.

2 лайка

Это уже реализовано и задокументировано:

2 лайка

Эта тема была автоматически закрыта через 5 дней. Новые ответы больше не принимаются.