为AI机器人和AI助手的用户组AI使用设定硬性上限功能辩护

MachineScholar · 2024 年7 月 24 日 10:43

我做了一些计算，得出的结论是，如果没有能力限制用户每月或每天的 token 输入和输出，很快就会陷入困境。目前，限制用户与 AI 机器人交互的唯一方法是仅允许 AI 机器人在私信中使用（禁用每个角色的聊天功能），并设置每日允许的私信数量限制——但这显然不现实。以下是一个“最坏情况”成本明细示例，它证明了此功能的需求，采用了 OpenAI 为其 chatGPT 会员使用的方法：

GPT-4o mini，32k 上下文（附注：上下文长度通过 LLM 设置页面上的“提示的 token 数量”设置来确定）

当前成本：100 万输入 0.15 美元 / 100 万输出 0.60 美元

假设用户每天输入 32k token，输出 16k token，持续 30 天（典型订阅的计费周期）：

每月输入成本 = 960,000 token = 约 0.14 美元

每月输出成本 = 480,000 token = 约 0.28 美元

好吧，这其实不算多，对吧？不到半美元。然而，这实际上是相当低的用量，尤其是考虑到 GPT-4o mini 单次最多可以生成 16.4k token（尽管是的，你当然可以设计提示和 LLM 设置来阻止这种情况）。你可以将这些成本乘以你认为用户会使用 AI 机器人的次数。最糟糕的是，这是一个非常便宜的模型；Claude 3.5 Sonnet（100 万输入 3 美元 / 100 万输出 15 美元）和 GPT-4o（100 万输入 5 美元 / 100 万输出 15 美元）的成本呈指数级增长——更不用说 GPT-4 Turbo 了，哈哈。这是 Claude 3.5 Sonnet 的相同明细：

Claude 3.5 Sonnet，32k 上下文

每月输入成本 = 约 2.88 美元

每月输出成本 = 约 7.20 美元

总计 = 约 10.08 美元

但同样：这是低用量。因此，可以清楚地看出，无限制地使用 AI 机器人中的 LLM 会有多昂贵。如果将其乘以 2，那么你需要收取 25 美元的订阅费才能获得略低于 5 美元的利润

我正式提出的建议是：

一项设置，允许为特定用户组在每月或每天为 AI 机器人设置特定的 token 输入和输出量。
- 此 token 用量不包括角色的系统提示。
- Token 限制可以是每个 LLM、每个角色或通用/全部。
作为点 1 的替代方案，可以使用一个简单的整数限制来使用 DM 和 PM 中的 AI 机器人。例如：每天限制向任何角色发送 100 条 DM。
一项设置，允许为特定用户组在每月或每天为 AI 助手设置特定的 token 输出量。
- Token 输入可以不计费，因为用户很难猜测一个长话题在生成摘要时有多少 token。
- 最好对自定义提示的长度（以单词为单位，这样就不需要使用 TikToken）设置一个硬性整数限制，这样用户就不会试图通过将 Composer 用作无限制的聊天机器人来规避他们的月度/每日限制
用户个人资料中的 token 计数器，甚至可能在他们的 PM 和 DM 中。如果每个用户和 AI 消息旁边都有一个文本显示其 token 数量，那就太好了（我们不一定希望每个人都能使用调试功能，而且该功能仅在 PM 中有效）
- 一个单独的 AI 助手 token 计数器（以帮助区分这两个功能），它在 explain、proofread、custom prompt 等之间共享计数……

题外话：我绝不是在批评此功能或开发人员，如果我的任何言论听起来像那样，我深表歉意。老实说，Discourse AI 插件是我最喜欢的技术之一。实际上，它使我能够在不雇佣额外工程师和支付额外基础设施费用的情况下，作为一名 AI 研究员和教育者来建立我的梦想业务——我可以自己完成所有设置。我仅仅认为，这个功能不仅对我来说，而且对许多其他希望让他们的用户在合理范围内享受这项出色技术的 Discoursers 来说，是最后一块拼图。

merefield · 2024 年7 月 24 日 12:56

此功能已在 Discourse Chatbot 中作为每周配额系统于 2023 年 3 月实施，此后已扩展，您可以为三组不同的用户定义配额。例如，付费会员可以获得更高的配额。

超出每周配额的用户会收到一条礼貌的消息（这不会产生任何费用）。

此外，当配额被超出时，管理员可以收到警报。

我之前就此主题回复您的一篇帖子时曾给您发过私信，但您没有回复也许您是托管用户，无法访问我的插件？

说实话，随着 GPT 4o-mini 的出现，一次体面的机器人对话成本已大大降低。

顺便说一句，Discourse Chatbot 现在已被至少一家企业用于一线客户支持，因此您可以确信它是稳定有效的。

MachineScholar · 2024 年7 月 25 日 14:55

抱歉没有回复！我现在想起来了，但我不知道为什么当时没有写回来。我使用的是 droplet，所以不是这个问题。

我对它的稳定性和质量毫无疑问；事实上，我相当喜欢这个插件，也很尊敬你以及你为它付出的努力。然而，聊天机器人只能满足我业务的部分需求。AI 助手是核心必需品，同样重要的是能够立即切换模型。在不久的将来，我将部署自己微调的模型并手动设置我的 LLM，这是任务的关键。

我解释这一切只是为了让你不要认为我针对你的工作！相反，问题出在我这边；我正在尝试做一些非常小众的事情。

merefield · 2024 年7 月 25 日 14:58

是的，完全理解请求的范围更广

只是提供一个部分（如果很重要的话）的解决方案。

sam · 2025 年1 月 13 日 02:50

预计本周将发布：

github.com/discourse/discourse-ai

FEATURE: llm quotas

main ← quotas2

opened 06:20AM - 02 Jan 25 UTC

SamSaffron

+1684 -152

Adds a comprehensive quota management system for LLM models that allows: - Se…tting per-group token and usage limits with configurable durations - Tracking and enforcing token/usage limits across user groups - Quota reset periods (hourly, daily, weekly, or custom) - Admin UI for managing quotas with real-time updates - Full test coverage for quota models and controllers This system provides granular control over LLM API usage by allowing admins to define limits on both total tokens and number of requests per group. Supports multiple concurrent quotas per model and automatically handles quota resets. ![image](https://github.com/user-attachments/assets/76375c76-889d-438b-b464-e65c7f7a41ed) ![image](https://github.com/user-attachments/assets/21752366-2b33-4fb7-8b3f-faee74c45413) ![image](https://github.com/user-attachments/assets/c7248930-0aa7-434e-805e-56adb7cbfb2f)

MachineScholar · 2025 年1 月 13 日 08:04

这真是太棒了！

在下面的详细信息中，这是否意味着总代币数和请求数是在组内所有用户之间共享的，还是说组内的每个用户都可以单独使用设定的数量？

该系统通过允许管理员为每个组定义总代币数和请求数的限制，从而提供对 LLM API 使用情况的精细控制。

sam · 2025 年1 月 13 日 08:15

哦，我需要在 UI 中澄清这一点……所有限制都是每个用户独有的，并且从不在组成员之间共享。共享组配额限制是一个有趣的概念，但我不确定它在实践中是否有意义？你能想到任何时候它会很有用吗？

目前我的实现是：

根据用户所属的组，选择用户拥有的最“宽松”的配额
按用户强制执行。

（这使得管理员即使在 TL2 有严格配额的情况下也能免疫）

MachineScholar · 2025 年1 月 13 日 08:27

我问这个问题是因为它确实在实践中没有意义😄。我个人认为你的实现是最理想的。我的社区和我非常感谢你在这里所做的工作❤️

sam · 2025 年1 月 13 日 08:29

“绝对配额”的一个论点是：

我希望 Tl1 能够与 AI 一起玩，但是……作为一种安全措施，将我每天的支出限制在 N$。Tl1 的成员数量未知。

但我想，如果人们想要的是这个，他们可以直接在 Anthropic / Open AI 等仪表板中设置绝对配额。

我并不反对以后添加绝对配额，但可能在本迭代中会跳过。

BrianC · 2025 年1 月 14 日 04:50

@sam 这是很棒的更新令牌限制是否会与订阅挂钩？如果我们可以控制使用量并允许为更昂贵的模型收费，那将是极好的。

sam · 2025 年1 月 14 日 05:00

是的，这可以与系统配合使用，您可以为不同的用户组设置不同的配额。

sam · 2025 年1 月 21 日 06:10

这已实现并记录在案：

sam · 2025 年1 月 26 日 21:00

此主题已自动关闭 5 天。不再允许回复。

话题		回复	浏览量
Limit the number of AI tokens a user can use in a day? Feature ai , completed	12	591	2025 年4 月 3 日
Balancing Costs and Functionality in AI-Powered Forums Feature ai-bot , ai	4	742	2025 年1 月 21 日
Configuring LLM Usage Quotas in Discourse AI Site Management how-to , ai , official	4	455	2025 年1 月 21 日
LLM Quotas for Discourse AI Announcements ai	0	145	2025 年1 月 21 日
Discourse AI - AI usage Site Management how-to , ai	0	448	2025 年1 月 23 日

为AI机器人和AI助手的用户组AI使用设定硬性上限功能辩护

相关话题