OpenAI プロバイダーと Azure プロバイダーでサービス階層を選択できる変更を導入しました。
OpenAI サービス階層では、API 使用量の大幅な割引を受けるか、リクエストを高速化するために高額を支払うことができます。
比較として(2026年3月9日現在)、GPT 5.4 の価格設定は次のとおりです。
- 標準階層では、入力トークン 100 万あたり 2.50
- フレックス階層では、入力トークン 100 万あたり 1.25
- 優先階層では、5.00(標準より約 1.5 倍高速)
適切なモデルを選択するには、LLM 設定にアクセスしてください。
そして、サービス階層を選択します。
フレックス階層は、はるかに安価ですが、設計上信頼性も低いことに注意してください。
さらに、OpenAI を使用している場合は、サービス URL として https://api.openai.com/v1/responses を入力して、responses エンドポイントを選択するようにしてください。
これは、最新の推論モデルで特に重要です。これがないと、キャッシュから適切にメリットを得られず、コストが大幅に削減されます。
お楽しみください!
