Оценка затрат на использование LLM для Discourse AI

:information_source: Для использования определённых функций Discourse AI пользователям необходимо подключить провайдера больших языковых моделей (LLM). Пожалуйста, ознакомьтесь с описанием каждой функции ИИ, чтобы узнать, какие модели LLM с ней совместимы.

:dollar: Если стоимость является существенным фактором, в Discourse AI есть несколько встроенных инструментов для управления расходами:

  • Панель использования ИИ — отслеживание потребления токенов по функциям, моделям и пользователям с оценкой затрат
  • Квоты использования — установка лимитов по токенам или количеству запросов для каждой модели и группы в настраиваемые временные интервалы (ежечасно, ежедневно, еженедельно)
  • Выделение кредитов — установка общих бюджетов кредитов для каждой модели с мягкими и жёсткими лимитами
  • Бюджеты со стороны провайдераустановка лимитов использования непосредственно у провайдера в качестве дополнительной меры безопасности
  • Ограничения для групп — предоставление доступа к функциям ИИ только выбранным пользователям и группам

При расчёте стоимости использования LLM необходимо учитывать несколько переменных факторов.

Упрощённый взгляд на процесс выглядит так…

:information_source: Важно понять что такое токены и как их считать

  • Модель LLM и её тарифы — определение конкретной модели LLM, которую вы планируете использовать, и поиск актуальной информации о ценах на входные и выходные токены
  • Входные токены — средняя длина ваших входных запросов в токенах
  • Выходные токены — ответы модели в токенах

Теперь рассмотрим пример использования AI Bot прямо здесь, на Meta.

:warning: При проведении этого расчёта было сделано множество упрощений, касающихся использования токенов, числа пользователей AI Bot и среднего количества запросов. Эти цифры следует рассматривать только как общие рекомендации, особенно учитывая, что мы активно экспериментируем с AI Bot.

  1. Используйте встроенную панель использования ИИ, чтобы просмотреть фактическое потребление токенов запросов и ответов, разбитое по функциям, моделям и пользователям.

  2. В среднем количество выходных токенов в 3–5 раз превышает количество входных токенов [1](GPT-3.5 and GPT-4 API response time measurements - FYI - API - OpenAI Developer Community).

  3. Предположим, что среднее количество входных токенов на один запрос пользователя составляет 85, что эквивалентно менее чем одному абзацу [2].

  4. Предположим, что среднее количество выходных токенов составляет 85 × 4 = 340 токенов, что примерно равно трём абзацам.

  5. Используя GPT-5.4 mini от OpenAI, стоимость входных токенов составит $0,75 за 1 млн токенов = $0,00000075 за токен × 85 токенов = $0,000064 за вход.

  6. Для выходных токенов стоимость составит $4,50 за 1 млн токенов = $0,0000045 за токен × 340 токенов = $0,00153 за выход.

  7. Общая стоимость одного запроса: $0,000064 + $0,00153 = $0,0016.

  8. В феврале 2024 года около 600 пользователей использовали AI Bot, делая в среднем 10 запросов в месяц. Предположим, что эти показатели соответствуют вашей сообществу.

  9. Это означает, что затраты на AI Bot в феврале составят $0,0016 × 600 пользователей × 10 запросов = $9,56.

  10. Если экстраполировать эти данные на год, то годовые расходы на запуск AI Bot составят $9,56 × 12 = $115 при использовании GPT-5.4 mini в качестве выбранной модели LLM.

Для ещё более низких затрат рассмотрите бюджетные модели, такие как GPT-5.4 nano ($0,20/$1,25 за 1 млн токенов), Gemini 2.5 Flash ($0,075/$0,30 за 1 млн токенов) или Claude Haiku 4.5, которые могут снизить расходы на 75–95% по сравнению с приведённым примером. Всегда проверяйте актуальные тарифы у вашего провайдера, так как цены продолжают снижаться.


  1. Оценка на основе данных сообщества OpenAI и нашего собственного соотношения выходных и входных токенов ↩︎

  2. Анализируя среднее потребление входных токенов пользователями, я обнаружил значения от 20 до более 100. Я хотел отразить, что большинство запросов ближе к 100, и исхожу из предположения, что такие запросы представляют собой хорошо сформулированные предложения с множеством вопросов, адресованных боту ↩︎

9 лайков

We recently shared the following with a customer who was asking about AI search use in Meta and how much that costed us

Last month we did 1104 searches in Meta

  • GPT-4o-mini pricing, which would cost $0.25
  • Using haiku would be $0.53
  • Gemini Flash would be $0.06

We have to pay attention to request tokens which was around 85868 and response tokens which was around 408417 from the LLM

3 лайка

Estimated costs for a month of Image Captions in Meta

  • 1019 calls
  • 55M request tokens
  • 34K response tokens

Which would cost, depending on the LLM:

  • Claude Haiku 3: $13.86
  • GPT-4o Mini: $8.31
  • Gemini 1.5 Flash 8B: $2.07
5 лайков