我们刚刚推出了一项更改,允许您在 OpenAI 和 Azure 提供商上选择服务层级。
OpenAI 服务层级允许您在 API 使用量上获得大幅折扣,或者为更快的请求支付更高的费用。
作为比较(截至 2026 年 3 月 9 日),GPT 5.4 的定价如下:
- 标准层级下每百万输入 token 2.50 美元
- 灵活层级下每百万输入 token 1.25 美元
- 优先层级下每百万 5.00 美元(比标准层级快约 1.5 倍)
要选择正确的模型,请务必前往您的 LLM 配置。
然后选择一个服务层级:
请注意,灵活层级虽然便宜得多,但按设计也可靠性较低。
此外,如果您使用的是 OpenAI,请确保选择 responses 端点,方法是在您的服务中输入 URL https://api.openai.com/v1/responses。
这对于最新的推理模型尤其重要;如果没有它,您将无法从缓存中获得适当的好处,而缓存可以大幅降低成本。
祝您使用愉快!
