Limitar o número de tokens de IA que um usuário pode usar por dia

Shauny · Outubro 11, 2024, 8:59pm

Se você der acesso a certos membros à IA, o que os impede de usá-la o tempo todo para o trabalho deles, etc., existe alguma maneira de limitar quantos tokens eles podem usar por dia ou semana, etc.?

Jagster · Outubro 11, 2024, 9:22pm

Não há tais limitações ao usar o Discourse AI, então a resposta é simplesmente nada.

A outra solução, Chatbot, tem limites semanais de quantas solicitações podem ser feitas.

Portanto, você tem que escolher qual se adapta melhor a você. Eu uso ambos. Chatbot para uso mais geral dentro do meu fórum ^[1] e DAI é limitado com base em um grupo e propósitos (ajustados) usando personas. Então, eu meio que exploro os melhores lados de ambos, porque esses dois apenas se sobrepõem parcialmente.

geral significa tipo de perguntas, caso contrário, ele é ajustado de forma mais especializada ↩︎

sam · Outubro 11, 2024, 10:23pm

Movendo isso para feature, pretendemos adicionar um sistema de cotas, ele continua aparecendo

Estou pensando em apenas adicionar seletores de grupo com contagens de entrada/saída e duração em cada llm, para que você possa adicionar cotas opcionais.

markschmucker · Janeiro 12, 2025, 9:35pm

Eu meio que preciso de limites de taxa por usuário (não por grupo) agora, então estou tentando criar minha própria solução provisória. Limitar o número de prompts em vez de tokens seria bom. Estou pensando em um webhook em post_event que diga se é uma mensagem privada e um usuário está postando para um bot, para incrementar um campo personalizado ‘ai_query_count’ no usuário. Acho que essa parte funcionaria.

Então, o que fazer se a contagem ficar muito alta? Tentei um pouco de JavaScript em admin > customize > head que lê a contagem do usuário e tenta desabilitar o botão “Responder” se a contagem for muito alta, mas não consigo encontrar um termo seletor para obter o botão.

Ou talvez haja uma abordagem melhor. Qualquer ideia é bem-vinda!

sam · Janeiro 13, 2025, 2:50am

Tecnicamente são os mesmos, você apenas cria um grupo de 1.

Isso deve chegar esta semana e resolver:

github.com/discourse/discourse-ai

FEATURE: llm quotas

main ← quotas2

opened 06:20AM - 02 Jan 25 UTC

SamSaffron

+1684 -152

Adds a comprehensive quota management system for LLM models that allows: - Se…tting per-group token and usage limits with configurable durations - Tracking and enforcing token/usage limits across user groups - Quota reset periods (hourly, daily, weekly, or custom) - Admin UI for managing quotas with real-time updates - Full test coverage for quota models and controllers This system provides granular control over LLM API usage by allowing admins to define limits on both total tokens and number of requests per group. Supports multiple concurrent quotas per model and automatically handles quota resets. ![image](https://github.com/user-attachments/assets/76375c76-889d-438b-b464-e65c7f7a41ed) ![image](https://github.com/user-attachments/assets/21752366-2b33-4fb7-8b3f-faee74c45413) ![image](https://github.com/user-attachments/assets/c7248930-0aa7-434e-805e-56adb7cbfb2f)

markschmucker · Janeiro 13, 2025, 1:45pm

Entendo que as cotas por grupo são boas para gerenciar o orçamento, mas o que impede uma pessoa de monopolizar toda a cota do grupo no início do período? EDIT: E potencialmente monopolizá-la para seu próprio trabalho não relacionado, como o OP perguntou?

Temos 3000 membros. Então criar 3000 grupos? Isso não vai destruir o /g?

sam · Janeiro 13, 2025, 7:50pm

Estou um pouco confuso com esta pergunta, as cotas agora são definidas por grupo e aplicadas por usuário

Se o grupo tem permissão para 1000 tokens, isso significa que nenhum usuário individual tem permissão para mais de 1000 tokens

A cota não é compartilhada entre os usuários, não contra a adição do conceito de cota absoluta se precisarmos dela mais tarde

markschmucker · Janeiro 13, 2025, 9:01pm

Ah. Então eu entendi completamente errado. O recurso diz:

Definir limites de token e uso por grupo com durações configuráveis

Para mim, “limites por grupo” soa como se o grupo como um todo tivesse um limite.

Então é exatamente isso que estou procurando - aguardarei o novo recurso.

oppman · Janeiro 17, 2025, 7:01pm

Vou atribuir esta configuração a um estagiário na próxima quarta-feira em um site Discourse auto-hospedado. Preciso dizer a ele para fazer o pull do branch main no GitHub? Ou, se ele adicionar esta linha em app.yml, é suficiente?

hooks:
  after_code:
    - exec:
        cd: $home/plugins
        cmd:
          - git clone https://github.com/discourse/docker_manager.git
          ...
          ...
          - git clone https://github.com/discourse/discourse-ai.git

Quero permitir que os recursos do plugin Discourse AI sejam usados apenas por usuários registrados. Esse é o comportamento padrão?

Pelo que vejo, a busca aprimorada por IA não tem controle por grupo???

Para o bot de IA, estou pensando em defini-lo para confiar em 0 e definir um limite de tokens por grupo, aumentando conforme a confiança cresce. Essa é uma boa estratégia?

sam · Janeiro 20, 2025, 4:39am

Isso foi mesclado. Só preciso de um tempo para documentá-lo.

oppman · Janeiro 22, 2025, 6:33pm

@sam Obrigado pelo seu trabalho. O estagiário configurou cotas para cada nível de confiança hoje.

Eles ainda não testaram completamente.

Quando o limite do grupo for atingido no dia, o usuário receberá uma mensagem? Essa mensagem pode ser personalizada?

Quero que a IA seja útil, mas nos proteja de abusos. Se uma pessoa quiser usar mais pesquisas de IA, quero enviar uma nota a ela informando que pode entrar em contato com um humano para aumentar o limite. A equipe poderá então movê-la manualmente para um grupo pré-configurado.

No seu exemplo, notei que você está usando o amazon nova pro v1. O estagiário configurou nossa implementação com OpenAI gpt-o4, provavelmente apenas por causa do reconhecimento da marca.

O estagiário ainda está tentando descobrir a eficácia versus os custos de diferentes modelos. Qualquer conselho de alguém do fórum seria maravilhoso.

sam · Abril 3, 2025, 6:04am

Sim, isso acontece agora

Muito minimamente, usamos uma string traduzida para que você possa alterar a tradução.

Fechando este pois está completo, sinta-se à vontade para abrir novas perguntas sobre IA!

Tópico		Respostas	Visualizações
Making the case for a hard cap feature on user group AI usage for AI bots and AI Helper Feature chat , completed , ai , ai-bot	11	448	21 de Janeiro de 2025
Configuring LLM Usage Quotas in Discourse AI Site Management official , how-to , ai	4	646	21 de Janeiro de 2025
Balancing Costs and Functionality in AI-Powered Forums Feature ai , ai-bot	4	855	21 de Janeiro de 2025
LLM Quotas for Discourse AI Announcements ai	0	176	21 de Janeiro de 2025
discourse论坛AI配置限额精确到每个人 Support ai	2	137	19 de Janeiro de 2026

Limitar o número de tokens de IA que um usuário pode usar por dia

Tópicos relacionados