Nous venons de déployer un changement qui vous permet de choisir des niveaux de service sur vos fournisseurs OpenAI et Azure.
Le niveau de service OpenAI vous permet d’obtenir de fortes réductions sur l’utilisation de l’API ou de payer un montant plus élevé pour des requêtes plus rapides.
À titre de comparaison (en date du 9 mars 2026), les tarifs de GPT 5.4 sont les suivants :
- 2,50 par million de jetons d’entrée sous le niveau standard
- 1,25 par million de jetons d’entrée sous le niveau flex
- 5,00 par million pour le niveau priority (qui est environ 1,5 fois plus rapide que le niveau standard)
Pour choisir le bon modèle, assurez-vous de vous rendre sur votre configuration LLM.
Et choisissez un niveau de service :
Notez que le niveau flex, bien que beaucoup moins cher, est également moins fiable par conception.
De plus, si vous utilisez OpenAI, assurez-vous de sélectionner le point de terminaison responses en entrant l’URL https://api.openai.com/v1/responses pour votre service.
Ceci est particulièrement important sur les modèles de raisonnement récents ; sans cela, vous ne bénéficierez pas correctement de la mise en cache, ce qui réduit considérablement les coûts.
Profitez-en !
