Wir haben gerade eine Änderung eingeführt, mit der Sie Service-Stufen für Ihre OpenAI- und Azure-Anbieter auswählen können.
Die OpenAI-Service-Stufe ermöglicht es Ihnen, hohe Rabatte auf die API-Nutzung zu erhalten oder einen erhöhten Betrag für schnellere Anfragen zu zahlen.
Zum Vergleich (Stand 9. März 2026) sind die Preise für GPT 5.4:
- 2,50 pro Million Eingabetoken in der Standard-Stufe
- 1,25 pro Million Eingabetoken in der Flex-Stufe
- 5,00 pro Million für die Prioritäts-Stufe (was etwa 1,5x schneller als Standard ist)
Um das richtige Modell auszuwählen, besuchen Sie bitte Ihre LLM-Konfiguration.
Und wählen Sie eine Service-Stufe aus:
Beachten Sie, dass die Flex-Stufe, obwohl sie viel billiger ist, auch von Natur aus weniger zuverlässig ist.
Wenn Sie außerdem OpenAI verwenden, stellen Sie sicher, dass Sie den responses-Endpunkt auswählen, indem Sie die URL https://api.openai.com/v1/responses für Ihren Dienst eingeben.
Dies ist besonders wichtig bei neueren Reasoning-Modellen; ohne dies profitieren Sie nicht richtig vom Caching, was die Kosten erheblich senkt.
Viel Spaß!
