Abbiamo appena implementato una modifica che ti consente di scegliere i livelli di servizio sui tuoi provider OpenAI e Azure.
Il livello di servizio OpenAI ti consente di ottenere forti sconti sull’utilizzo dell’API o di pagare una somma maggiore per richieste più veloci.
A titolo di confronto (al 9 marzo 2026), i prezzi di GPT 5.4 sono:
- 2,50 per milione di token di input nel livello standard
- 1,25 per milione di token di input nel livello flessibile
- 5,00 per milione per il livello prioritario (che è circa 1,5 volte più veloce dello standard)
Per scegliere il modello giusto, assicurati di andare alla tua configurazione LLM.
E scegli un livello di servizio:
Nota che il livello flessibile, sebbene molto più economico, è anche meno affidabile per progettazione.
Inoltre, se stai utilizzando OpenAI, assicurati di selezionare l’endpoint responses inserendo l’URL https://api.openai.com/v1/responses per il tuo servizio.
Questo è particolarmente importante sui modelli di ragionamento recenti; senza di esso, non beneficerai correttamente della cache, il che riduce notevolmente i costi.
Buon divertimento!
