Ограничить количество токенов ИИ, которые пользователь может использовать в день?

Shauny · 11.Октябрь.2024 20:59:12

Если вы предоставляете определенным членам доступ к ИИ, что мешает им использовать его постоянно для работы и т. д.? Есть ли способ ограничить количество токенов, которые они могут использовать в день или неделю и т. д.?

Jagster · 11.Октябрь.2024 21:22:07

При использовании Discourse AI таких ограничений нет, поэтому ответ — абсолютно ничего.

Другое решение, Chatbot, имеет недельные лимиты на количество отправляемых запросов.

Так что вам нужно выбрать то, что лучше подходит именно вам. Я использую оба варианта. Chatbot — для более общих задач внутри моего форума ^[1], а DAI ограничен группой и (настроенными) целями с использованием персон. Таким образом, я как бы использую лучшие стороны обоих решений, поскольку они лишь частично перекрываются.

общие — это тип вопросов, иначе он настраивается более специализированным образом ↩︎

sam · 11.Октябрь.2024 22:23:11

Переношу это в фичу: мы планируем внедрить систему квот, так как этот вопрос постоянно возникает.

Я думаю, что стоит добавить селекторы групп с показателями количества входных/выходных запросов и длительностью для каждой LLM, чтобы можно было устанавливать опциональные квоты.

markschmucker · 12.Январь.2025 21:35:53

Мне сейчас нужны ограничения скорости для каждого пользователя (а не для группы), поэтому я пытаюсь создать временное решение самостоятельно. Ограничение количества запросов вместо токенов тоже подойдёт. Я думаю о вебхуке на событии post_event, который проверяет, является ли сообщение личным, и если пользователь пишет боту, увеличивает пользовательское поле ‘ai_query_count’ у пользователя. Думаю, эта часть сработает.

А что делать, если счётчик станет слишком высоким? Я попробовал добавить JavaScript в раздел администрирования > настройка > head, который читает счётчик пользователя и пытается отключить кнопку «Ответить», если счётчик слишком высок, но не могу подобрать селектор для этой кнопки.

Или, возможно, есть более подходящий подход. Любые идеи будут приняты с благодарностью!

sam · 13.Январь.2025 02:50:24

Технически это одно и то же — нужно просто создать группу из одного пользователя.

Это должно быть выпущено на этой неделе и решить проблему:

github.com/discourse/discourse-ai

FEATURE: llm quotas (#1047)

main ← quotas2

merged 04:54AM - 14 Jan 25 UTC

SamSaffron

+1684 -152

Adds a comprehensive quota management system for LLM models that allows: - Se…tting per-group token and usage limits with configurable durations - Tracking and enforcing token/usage limits across user groups - Quota reset periods (hourly, daily, weekly, or custom) - Admin UI for managing quotas with real-time updates - Full test coverage for quota models and controllers This system provides granular control over LLM API usage by allowing admins to define limits on both total tokens and number of requests per group. Supports multiple concurrent quotas per model and automatically handles quota resets. ![image](https://github.com/user-attachments/assets/76375c76-889d-438b-b464-e65c7f7a41ed) ![image](https://github.com/user-attachments/assets/21752366-2b33-4fb7-8b3f-faee74c45413) ![image](https://github.com/user-attachments/assets/c7248930-0aa7-434e-805e-56adb7cbfb2f)

markschmucker · 13.Январь.2025 13:45:35

Я понимаю, что квоты по группам хороши для управления бюджетом, но что мешает одному человеку в начале периода отхватить всю квоту группы? РЕДАКТИРОВАНО: И потенциально использовать её для своей нерелевантной работы, как спрашивал автор темы?

У нас 3000 участников. Значит, создавать 3000 групп? Не развалит ли это /g?

sam · 13.Январь.2025 19:50:25

Я немного запутался в этом вопросе: квоты сейчас определяются на уровне группы и применяются к каждому пользователю.

Если группе разрешено 1000 токенов, это означает, что ни одному отдельному пользователю не разрешено использовать более 1000 токенов.

Квота не разделяется между пользователями. Не противимся внедрению концепции абсолютной квоты, если она понадобится нам в будущем.

markschmucker · 13.Январь.2025 21:01:45

О, значит, я всё неправильно понял. Функция гласит:

Установка лимитов токенов и использования по группам с настраиваемой длительностью

Для меня «лимиты по группам» звучат так, будто лимит установлен на группу в целом.

Так что это именно то, что я ищу — буду ждать новую функцию.

oppman · 17.Январь.2025 19:01:06

Я планирую передать эту конфигурацию стажеру в следующую среду на самохостинговом сайте Discourse. Нужно ли мне сказать ему, чтобы он вытянул код из основной ветки на GitHub? Или достаточно, если он добавит эту строку в app.yml?

hooks:
  after_code:
    - exec:
        cd: $home/plugins
        cmd:
          - git clone https://github.com/discourse/docker_manager.git
          ...
          ...
          - git clone https://github.com/discourse/discourse-ai.git

Я хочу разрешить функции плагина Discourse AI только зарегистрированным пользователям. Является ли это поведением по умолчанию?

Мне кажется, что у поиска с улучшенным ИИ нет контроля по группам???

Что касается бота на базе ИИ, я думаю установить уровень доверия (trust) на 0 и установить лимит токенов для каждой группы, увеличивая его по мере роста уровня доверия. Это хорошая стратегия?

sam · 20.Январь.2025 04:39:02

Это уже слито. Мне осталось лишь потратить немного времени на документирование.

oppman · 22.Январь.2025 18:33:49

@sam Спасибо за вашу работу. Сегодня стажер установил квоты для каждого уровня доверия.

Они еще не провели полное тестирование.

Когда дневной лимит группы исчерпан, получает ли пользователь сообщение? Можно ли настроить это сообщение?

Я хочу, чтобы ИИ был полезным, но при этом защищал нас от злоупотреблений. Если кто-то хочет использовать больше поиска с ИИ, я хочу отправить ему уведомление о том, что он может связаться с человеком для увеличения лимита. Сотрудники затем могут вручную перевести его в предварительно настроенную группу.

В вашем примере я заметил, что вы используете Amazon Nova Pro v1. Стажер настроил нашу реализацию на OpenAI gpt-o4, вероятно, просто из-за узнаваемости бренда.

Стажер все еще пытается оценить эффективность и стоимость различных моделей. Любые советы от участников форума были бы очень кстати.

sam · 03.Апрель.2025 06:04:13

Да, сейчас это происходит.

В очень ограниченной степени: мы используем переведённую строку, поэтому вы можете изменить перевод.

Закрываю эту тему, так как задача выполнена. Не стесняйтесь задавать новые вопросы об ИИ!

Тема		Ответов	Просм.
Making the case for a hard cap feature on user group AI usage for AI bots and AI Helper Feature chat , completed , ai , ai-bot	11	421	21.01.2025
Configuring LLM Usage Quotas in Discourse AI Site Management official , how-to , ai	4	632	21.01.2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	840	21.01.2025
LLM Quotas for Discourse AI Announcements ai	0	175	21.01.2025
discourse论坛AI配置限额精确到每个人 Support ai	2	128	19.01.2026

Ограничить количество токенов ИИ, которые пользователь может использовать в день?

Связанные темы