Уровни обслуживания у провайдеров Open AI

Мы только что внедрили изменение, позволяющее выбирать уровни обслуживания для провайдеров OpenAI и Azure.

Уровень обслуживания OpenAI позволяет получать значительные скидки на использование API или платить больше за более быстрые запросы.

Для сравнения (по состоянию на 9 марта 2026 года) цены на GPT 5.4 следующие:

  • 2,50 за миллион входных токенов в стандартном уровне
  • 1,25 за миллион входных токенов в уровне flex
  • 5,00 за миллион токенов в приоритетном уровне (что примерно в 1,5 раза быстрее стандартного)

Чтобы выбрать правильную модель, перейдите на страницу настройки LLM.

И выберите уровень обслуживания:

Обратите внимание, что уровень flex, хотя и значительно дешевле, также менее надёжен по дизайну.

Кроме того, если вы используете OpenAI, обязательно выберите конечную точку responses, указав URL https://api.openai.com/v1/responses для вашего сервиса.

Это особенно важно для современных моделей рассуждения; без этого вы не сможете полноценно использовать кэширование, которое значительно снижает затраты.

Приятного использования!

12 лайков