Мы только что внедрили изменение, позволяющее выбирать уровни обслуживания для провайдеров OpenAI и Azure.
Уровень обслуживания OpenAI позволяет получать значительные скидки на использование API или платить больше за более быстрые запросы.
Для сравнения (по состоянию на 9 марта 2026 года) цены на GPT 5.4 следующие:
- 2,50 за миллион входных токенов в стандартном уровне
- 1,25 за миллион входных токенов в уровне flex
- 5,00 за миллион токенов в приоритетном уровне (что примерно в 1,5 раза быстрее стандартного)
Чтобы выбрать правильную модель, перейдите на страницу настройки LLM.
И выберите уровень обслуживания:
Обратите внимание, что уровень flex, хотя и значительно дешевле, также менее надёжен по дизайну.
Кроме того, если вы используете OpenAI, обязательно выберите конечную точку responses, указав URL https://api.openai.com/v1/responses для вашего сервиса.
Это особенно важно для современных моделей рассуждения; без этого вы не сможете полноценно использовать кэширование, которое значительно снижает затраты.
Приятного использования!
