OpenAI 供应商的服务层级

我们刚刚推出了一项更改,允许您在 OpenAI 和 Azure 提供商上选择服务层级。

OpenAI 服务层级允许您在 API 使用量上获得大幅折扣,或者为更快的请求支付更高的费用。

作为比较(截至 2026 年 3 月 9 日),GPT 5.4 的定价如下:

  • 标准层级下每百万输入 token 2.50 美元
  • 灵活层级下每百万输入 token 1.25 美元
  • 优先层级下每百万 5.00 美元(比标准层级快约 1.5 倍)

要选择正确的模型,请务必前往您的 LLM 配置

然后选择一个服务层级:

请注意,灵活层级虽然便宜得多,但按设计也可靠性较低。

此外,如果您使用的是 OpenAI,请确保选择 responses 端点,方法是在您的服务中输入 URL https://api.openai.com/v1/responses

这对于最新的推理模型尤其重要;如果没有它,您将无法从缓存中获得适当的好处,而缓存可以大幅降低成本。

祝您使用愉快!

8 个赞