Discourse AI - страница настроек большой языковой модели (LLM)

:bookmark: Это руководство посвящено странице настроек LLM, которая является частью плагина Discourse AI.

:person_raising_hand: Требуемый уровень пользователя: Администратор

Выделенная страница настроек предназначена для того, чтобы разместить все, что связано с большими языковыми моделями (LLM), используемыми в функциях Discourse AI, в одном месте.

:raised_hand_with_fingers_splayed: В зависимости от включенной функции Discourse AI может потребоваться LLM. Пожалуйста, проверьте каждую функцию Discourse AI, чтобы узнать, является ли LLM обязательным условием.


Возможности

  • Добавление новых моделей с предварительно заполненной информацией
  • Добавление пользовательских моделей, не указанных в списке
  • Настройка параметров LLM
  • Разрешение использования конкретной LLM для AI Bot
    • Просмотр имени пользователя AI Bot
  • Включение поддержки зрения (зависит от модели)
  • Настройка разрешенных типов вложений
  • Настройка квот использования для каждой группы
  • Отслеживание затрат на входные/выходные токены
  • Тестирование
  • Сохранение настроек

Добавление подключений LLM

  1. Перейдите в AdminPluginsAI
  2. Перейдите на вкладку LLMs
  3. Добавьте новое подключение и выберите вашу модель
  4. Введите API-ключ (в зависимости от модели у вас могут быть дополнительные поля для ручного ввода) и сохраните
  5. (Необязательно) Протестируйте подключение, чтобы убедиться, что оно работает

Поддерживаемые LLM

:person_tipping_hand: Вы всегда можете добавить пользовательский вариант, если не видите свою модель в списке. Поддерживаемые модели постоянно добавляются. Предварительно настроенные модели являются шаблонами — вы всегда можете добиться того же результата, используя «Ручную настройку».

Anthropic

  • Claude Opus 4.6
  • Claude Sonnet 4.6
  • Claude Haiku 4.5

Google

  • Gemini 3 Pro
  • Gemini 3 Flash

OpenAI

  • GPT-5.4
  • GPT-5 Mini
  • GPT-5 Nano

Open Router

  • DeepSeek V3.2
  • Moonshot Kimi K2.5
  • xAI Grok 4 Fast
  • MiniMax M2.5
  • Z-AI GLM-5
  • … и многие другие

Кроме того, клиенты с размещенным решением могут использовать предварительно настроенную CDCK Hosted Small LLM на странице настроек. Это LLM с открытыми весами, размещенная компанией Discourse, готовая к использованию для обеспечения работы функций AI.

Поля конфигурации

:information_source: Вы увидите только поля, относящиеся к выбранному вами провайдеру LLM. Пожалуйста, перепроверьте любые предварительно заполненные поля у соответствующего провайдера, например Model name.

Основные поля:

  • Display name — дружественное имя, отображаемое в выпадающих списках
  • Model name — идентификатор модели, отправляемый в API (например, claude-sonnet-4-6, gpt-5.2)
  • Provider — сервис, размещающий модель (например, Anthropic, OpenAI, Google, AWS Bedrock, Azure, Open Router и т. д.)
  • URL — URL-адрес конечной точки API (не отображается для AWS Bedrock)
  • API Key — настраивается через систему AI Secrets
  • Tokenizer
  • Max prompt tokens — управляет обрезкой промпта для предотвращения запросов чрезмерного размера
  • Max output tokens
  • Input cost / Output cost — стоимость за миллион токенов, используется для отслеживания использования
  • Cached input cost / Cache write cost — для провайдеров, поддерживающих кэширование промптов
  • Vision enabled — включает понимание изображений (зависит от модели)
  • Allowed attachment types — типы файлов, которые может обрабатывать модель

Специфичные для провайдера поля (отображаются динамически в зависимости от выбранного провайдера):

  • AWS Bedrock: Access Key ID, Role ARN, Region, опции рассуждения/мышления, Prompt caching
  • Anthropic: опции рассуждения, Prompt caching
  • OpenAI: Organization ID, Reasoning effort, Service tier
  • Google: Enable thinking, Thinking level
  • Open Router: Provider order, Provider quantizations

Квоты (доступны после первоначального сохранения):

  • Квоты использования для каждой группы могут быть настроены с указанием максимального количества токенов, максимального числа использований и длительности

Технический FAQ

Что такое токенизатор?

  • Токенизатор преобразует строки в токены, которые модель использует для понимания входных данных.

Какое число мне следует использовать для Max prompt tokens?

  • Хорошее эмпирическое правило — 50% от окна контекста модели, которое представляет собой сумму количества токенов, которые вы отправляете, и количества токенов, которые модель генерирует. Если промпт станет слишком большим, запрос не выполнится. Это число используется для обрезки промпта, чтобы предотвратить такое происшествие.

Ограничения

  • Иногда вы можете не видеть в списке модель, которую хотели бы использовать. Хотя вы можете добавить их вручную, мы будем поддерживать популярные модели по мере их выхода.
11 лайков

Это слишком сложно, я вообще не знаю, как это сделать. Надеюсь, что будут обновлены конкретные руководства по различным ИИ, например, по настройке входа через Google.

1 лайк

Мы значительно улучшили интерфейс за последнюю неделю. Не могли бы вы попробовать снова?

3 лайка

Когда будет поддерживаться Gemini 2.0?

Поддерживается уже довольно давно.

4 лайка

Похоже, у меня возникла проблема: я не могу выбрать LLM, хотя настроенные модели, размещенные на CDCK, уже есть.

Это нормально?

2 лайка

Здесь много чего нужно разобрать: какую именно LLM вы пытаетесь выбрать и для каких целей?

LLM от CDCK доступны только для очень специфических функций. Чтобы узнать, для каких именно, перейдите на страницу /admin/whats-new вашего экземпляра и включите фильтр «Показывать только экспериментальные функции». Вам нужно будет активировать эти функции, чтобы разблокировать LLM от CDCK для конкретных возможностей.

Любая LLM, определённая вами вне рамок LLM от CDCK, доступна для всех функций.

4 лайка

Есть ли также тема, в которой дается общий обзор лучшего соотношения цены и качества? Или, может быть, информация о том, какой LLM можно использовать бесплатно для небольшого сообщества с базовым функционалом? Я готов погрузиться в детали и поэкспериментировать, но у меня немного времени.

Например, меня интересует только обнаружение спама и фильтр нецензурной лексики. Раньше у меня это работало бесплатно, но эти плагины устарели или скоро станут таковыми. Было бы здорово сохранить этот функционал, не платя за LLM.

4 лайка

У нас есть эта тема, которая, возможно, именно то, что вы ищете.

2 лайка

Готово! Действительно, это было довольно просто. Но для неспециалиста настройка всё ещё может показаться немного сложной. Например, название модели автоматически подставилось в настройках, но оказалось неверным. К счастью, я увидел правильное название модели в примере curl для Claude на странице API, и всё заработало :tada:

Ориентировочные расходы на контроль спама составляют около 30 евроцентов в месяц (у меня не очень большой форум). Так что это вполне приемлемо! Я установил лимит в 5 евро в консоли API на всякий случай.

1 лайк

Какое имя вы выбрали для Claude? Какое неверное имя было показано и на какое вы его исправили?

1 лайк

Я использую Claude 3.5. Идентификатор модели по умолчанию — claude-3-5-haiku, но мне пришлось изменить его на claude-3-5-haiku-20241022, иначе возникала ошибка.

1 лайк

Хорошо знать, да, иногда может возникать рассогласование. Автоматически подставляемая информация должна служить ориентиром, и это работает в большинстве случаев, но в определённых ситуациях, таких как ваша (учитывая разнообразие моделей и конфигураций провайдеров), может не сработать.

Я обновил первый пост в этом руководстве.

1 лайк

Эта модель не указана в версии 3.4.2 — доступны ли эти предварительные конфигурации только в версии 3.5, и мне нужно добавлять их вручную?

Редактирование: Также, какой вариант выбрать для «Токенизатора» при использовании моделей Grok 3?

Пресеты — это просто шаблоны; вы можете достичь того же результата, используя «Ручную настройку».

Я обнаружил, что токенизатор Gemini довольно близок к токенизатору Grok, поэтому попробуйте его.

2 лайка

Есть ли способ использовать IBM WatsonX через текущую систему управления конфигурацией или для этого потребуется дополнительная разработка со стороны команды Discourse?

Случайно ли IBM WatsonX предоставляет API, совместимый с OpenAI?

Отличный вопрос. Краткий просмотр документации не дал многого, но сам факт существования этого репозитория указывает на то, что прямая совместимость отсутствует: GitHub - aseelert/watsonx-openai-api: Watsonx Openai compatible API · GitHub

Какие из этих LLM бесплатны для использования в борьбе со спамом?

Редакция: Забыл, я использую Gemini Flash 2.5

Я тоже всегда задаюсь этим вопросом. Похоже, это лучший ответ на него.

Но также в исходном сообщении (OP) темы о настройке спама есть вот что. Мне кажется, это просто немного трудно найти среди всей представленной информации.

1 лайк