Service-Stufen bei Open AI Anbietern

Wir haben gerade eine Änderung eingeführt, mit der Sie Service-Stufen für Ihre OpenAI- und Azure-Anbieter auswählen können.

Die OpenAI-Service-Stufe ermöglicht es Ihnen, hohe Rabatte auf die API-Nutzung zu erhalten oder einen erhöhten Betrag für schnellere Anfragen zu zahlen.

Zum Vergleich (Stand 9. März 2026) sind die Preise für GPT 5.4:

  • 2,50 pro Million Eingabetoken in der Standard-Stufe
  • 1,25 pro Million Eingabetoken in der Flex-Stufe
  • 5,00 pro Million für die Prioritäts-Stufe (was etwa 1,5x schneller als Standard ist)

Um das richtige Modell auszuwählen, besuchen Sie bitte Ihre LLM-Konfiguration.

Und wählen Sie eine Service-Stufe aus:

Beachten Sie, dass die Flex-Stufe, obwohl sie viel billiger ist, auch von Natur aus weniger zuverlässig ist.

Wenn Sie außerdem OpenAI verwenden, stellen Sie sicher, dass Sie den responses-Endpunkt auswählen, indem Sie die URL https://api.openai.com/v1/responses für Ihren Dienst eingeben.

Dies ist besonders wichtig bei neueren Reasoning-Modellen; ohne dies profitieren Sie nicht richtig vom Caching, was die Kosten erheblich senkt.

Viel Spaß!

8 „Gefällt mir“