Acabamos de implementar uma alteração que permite selecionar níveis de serviço em seus provedores OpenAI e Azure.
O nível de serviço da OpenAI permite que você obtenha grandes descontos no uso da API ou pague um valor maior por solicitações mais rápidas.
Para comparação (a partir de 9 de março de 2026), o preço do GPT 5.4 é:
- 2,50 por milhão de tokens de entrada no nível padrão
- 1,25 por milhão de tokens de entrada no nível flexível
- 5,00 por milhão para o nível prioritário (que é cerca de 1,5x mais rápido que o padrão)
Para escolher o modelo certo, certifique-se de acessar sua configuração de LLM.
E escolha um nível de serviço:
Note que o nível flexível, embora muito mais barato, também é menos confiável por design.
Além disso, se você estiver usando a OpenAI, certifique-se de selecionar o endpoint de respostas inserindo a URL https://api.openai.com/v1/responses para seu serviço.
Isso é particularmente importante em modelos de raciocínio recentes; sem isso, você não se beneficiará adequadamente do cache, o que reduz muito os custos.
Aproveite!
