IA ultrapassa limites de tokens de LLM de forma aleatória e imprevisível

RBoy · Maio 6, 2026, 7:01pm

Só para sua informação, o problema começou quando o serviço de tradução travou e esgotou os tokens:

DiscourseAi::Completions::Endpoints::OpenAi: status: 429 - corpo: {“error”:{“message”:“Limite de taxa atingido para o modelo openai/gpt-oss-120b na organização org_01kccx1be8fffaz5sbe17, nível de serviço on_demand, em tokens por dia (TPD): Limite 200000, Usado 193487, Solicitado 7464. Por favor, tente novamente em 6m50.832s. Precisa de mais tokens? Atualize para o nível Dev hoje em https://console.groq.com/settings/billing",“type”:“tokens”,“code”:"rate_limit_exceeded”}}

Então, pausei o serviço por 24 horas para que os limites diários de taxa fossem redefinidos. Após reiniciá-lo, notei este erro:

DiscourseAi::Completions::Endpoints::OpenAi: status: 413 - corpo: {“error”:{“message”:“Solicitação muito grande para o modelo openai/gpt-oss-120b na organização org_01kccx1be8fffaz5sbe17, nível de serviço on_demand, em tokens por minuto (TPM): Limite 8000, Solicitado 8102, por favor reduza o tamanho da sua mensagem e tente novamente. Precisa de mais tokens? Atualize para o nível Dev hoje em https://console.groq.com/settings/billing",“type”:“tokens”,“code”:"rate_limit_exceeded”}}

Em seguida, reduzi os tokens de saída máximos de 7000 para 6800 na configuração do LLM e o serviço voltou a funcionar.

O que estou deixando passar? Você está sugerindo que isso está relacionado à janela de contexto e não tem nada a ver com os tokens de saída máximos? Estou apenas tentando entender como alinhar os números de configuração do Groq / limites do modelo com as configurações de LLM do Discourse.

Tópico		Respostas	Visualizações
Discourse AI - Large Language Model (LLM) settings page Site Management ai , how-to	20	3299	26 de Novembro de 2025
Discourse AI - AI usage Site Management how-to , ai	0	512	23 de Janeiro de 2025
Discourse AI Failing to translate large number of posts and topics Support content-localization , ai	8	230	10 de Novembro de 2025
Unlock All Discourse AI Features with Our Hosted LLM Announcements ai	9	754	13 de Março de 2026
Warning of embedding `input must have less than 8192 tokens` with discourse ai Support ai	5	153	3 de Novembro de 2025

IA ultrapassa limites de tokens de LLM de forma aleatória e imprevisível

Tópicos relacionados