Livelli di servizio sui provider Open AI

Abbiamo appena implementato una modifica che ti consente di scegliere i livelli di servizio sui tuoi provider OpenAI e Azure.

Il livello di servizio OpenAI ti consente di ottenere forti sconti sull’utilizzo dell’API o di pagare una somma maggiore per richieste più veloci.

A titolo di confronto (al 9 marzo 2026), i prezzi di GPT 5.4 sono:

  • 2,50 per milione di token di input nel livello standard
  • 1,25 per milione di token di input nel livello flessibile
  • 5,00 per milione per il livello prioritario (che è circa 1,5 volte più veloce dello standard)

Per scegliere il modello giusto, assicurati di andare alla tua configurazione LLM.

E scegli un livello di servizio:

Nota che il livello flessibile, sebbene molto più economico, è anche meno affidabile per progettazione.

Inoltre, se stai utilizzando OpenAI, assicurati di selezionare l’endpoint responses inserendo l’URL https://api.openai.com/v1/responses per il tuo servizio.

Questo è particolarmente importante sui modelli di ragionamento recenti; senza di esso, non beneficerai correttamente della cache, il che riduce notevolmente i costi.

Buon divertimento!

8 Mi Piace