Níveis de serviço em provedores Open AI

Acabamos de implementar uma alteração que permite selecionar níveis de serviço em seus provedores OpenAI e Azure.

O nível de serviço da OpenAI permite que você obtenha grandes descontos no uso da API ou pague um valor maior por solicitações mais rápidas.

Para comparação (a partir de 9 de março de 2026), o preço do GPT 5.4 é:

  • 2,50 por milhão de tokens de entrada no nível padrão
  • 1,25 por milhão de tokens de entrada no nível flexível
  • 5,00 por milhão para o nível prioritário (que é cerca de 1,5x mais rápido que o padrão)

Para escolher o modelo certo, certifique-se de acessar sua configuração de LLM.

E escolha um nível de serviço:

Note que o nível flexível, embora muito mais barato, também é menos confiável por design.

Além disso, se você estiver usando a OpenAI, certifique-se de selecionar o endpoint de respostas inserindo a URL https://api.openai.com/v1/responses para seu serviço.

Isso é particularmente importante em modelos de raciocínio recentes; sem isso, você não se beneficiará adequadamente do cache, o que reduz muito os custos.

Aproveite!

8 curtidas