Discourse AI - страница настроек большой языковой модели (LLM)

Discourse · 02.Август.2024 21:28:38

Это руководство посвящено странице настроек LLM, которая является частью плагина Discourse AI.

Требуемый уровень пользователя: Администратор

Выделенная страница настроек предназначена для того, чтобы разместить все, что связано с большими языковыми моделями (LLM), используемыми в функциях Discourse AI, в одном месте.

В зависимости от включенной функции Discourse AI может потребоваться LLM. Пожалуйста, проверьте каждую функцию Discourse AI, чтобы узнать, является ли LLM обязательным условием.

Возможности

Добавление новых моделей с предварительно заполненной информацией
Добавление пользовательских моделей, не указанных в списке
Настройка параметров LLM
Разрешение использования конкретной LLM для AI Bot
- Просмотр имени пользователя AI Bot
Включение поддержки зрения (зависит от модели)
Настройка разрешенных типов вложений
Настройка квот использования для каждой группы
Отслеживание затрат на входные/выходные токены
Тестирование
Сохранение настроек

Добавление подключений LLM

Перейдите в Admin → Plugins → AI
Перейдите на вкладку LLMs
Добавьте новое подключение и выберите вашу модель
Введите API-ключ (в зависимости от модели у вас могут быть дополнительные поля для ручного ввода) и сохраните
(Необязательно) Протестируйте подключение, чтобы убедиться, что оно работает

Поддерживаемые LLM

Вы всегда можете добавить пользовательский вариант, если не видите свою модель в списке. Поддерживаемые модели постоянно добавляются. Предварительно настроенные модели являются шаблонами — вы всегда можете добиться того же результата, используя «Ручную настройку».

Anthropic

Claude Opus 4.6
Claude Sonnet 4.6
Claude Haiku 4.5

Google

Gemini 3 Pro
Gemini 3 Flash

OpenAI

GPT-5.4
GPT-5 Mini
GPT-5 Nano

Open Router

DeepSeek V3.2
Moonshot Kimi K2.5
xAI Grok 4 Fast
MiniMax M2.5
Z-AI GLM-5
… и многие другие

Кроме того, клиенты с размещенным решением могут использовать предварительно настроенную CDCK Hosted Small LLM на странице настроек. Это LLM с открытыми весами, размещенная компанией Discourse, готовая к использованию для обеспечения работы функций AI.

Поля конфигурации

Вы увидите только поля, относящиеся к выбранному вами провайдеру LLM. Пожалуйста, перепроверьте любые предварительно заполненные поля у соответствующего провайдера, например Model name.

Основные поля:

Display name — дружественное имя, отображаемое в выпадающих списках
Model name — идентификатор модели, отправляемый в API (например, claude-sonnet-4-6, gpt-5.2)
Provider — сервис, размещающий модель (например, Anthropic, OpenAI, Google, AWS Bedrock, Azure, Open Router и т. д.)
URL — URL-адрес конечной точки API (не отображается для AWS Bedrock)
API Key — настраивается через систему AI Secrets
Tokenizer
Max prompt tokens — управляет обрезкой промпта для предотвращения запросов чрезмерного размера
Max output tokens
Input cost / Output cost — стоимость за миллион токенов, используется для отслеживания использования
Cached input cost / Cache write cost — для провайдеров, поддерживающих кэширование промптов
Vision enabled — включает понимание изображений (зависит от модели)
Allowed attachment types — типы файлов, которые может обрабатывать модель

Специфичные для провайдера поля (отображаются динамически в зависимости от выбранного провайдера):

AWS Bedrock: Access Key ID, Role ARN, Region, опции рассуждения/мышления, Prompt caching
Anthropic: опции рассуждения, Prompt caching
OpenAI: Organization ID, Reasoning effort, Service tier
Google: Enable thinking, Thinking level
Open Router: Provider order, Provider quantizations

Квоты (доступны после первоначального сохранения):

Квоты использования для каждой группы могут быть настроены с указанием максимального количества токенов, максимального числа использований и длительности

Технический FAQ

Что такое токенизатор?

Токенизатор преобразует строки в токены, которые модель использует для понимания входных данных.

Какое число мне следует использовать для Max prompt tokens?

Хорошее эмпирическое правило — 50% от окна контекста модели, которое представляет собой сумму количества токенов, которые вы отправляете, и количества токенов, которые модель генерирует. Если промпт станет слишком большим, запрос не выполнится. Это число используется для обрезки промпта, чтобы предотвратить такое происшествие.

Ограничения

Иногда вы можете не видеть в списке модель, которую хотели бы использовать. Хотя вы можете добавить их вручную, мы будем поддерживать популярные модели по мере их выхода.

qianping_chen · 30.Сентябрь.2024 17:16:20

Это слишком сложно, я вообще не знаю, как это сделать. Надеюсь, что будут обновлены конкретные руководства по различным ИИ, например, по настройке входа через Google.

sam · 01.Октябрь.2024 05:40:38

Мы значительно улучшили интерфейс за последнюю неделю. Не могли бы вы попробовать снова?

hameedacpa · 24.Февраль.2025 17:08:28

Когда будет поддерживаться Gemini 2.0?

sam · 24.Февраль.2025 21:58:17

Поддерживается уже довольно давно.

Joe_F · 11.Март.2025 13:21:50

Похоже, у меня возникла проблема: я не могу выбрать LLM, хотя настроенные модели, размещенные на CDCK, уже есть.

Это нормально?

sam · 12.Март.2025 00:17:15

Здесь много чего нужно разобрать: какую именно LLM вы пытаетесь выбрать и для каких целей?

LLM от CDCK доступны только для очень специфических функций. Чтобы узнать, для каких именно, перейдите на страницу /admin/whats-new вашего экземпляра и включите фильтр «Показывать только экспериментальные функции». Вам нужно будет активировать эти функции, чтобы разблокировать LLM от CDCK для конкретных возможностей.

Любая LLM, определённая вами вне рамок LLM от CDCK, доступна для всех функций.

AquaL1te · 12.Март.2025 09:13:55

Есть ли также тема, в которой дается общий обзор лучшего соотношения цены и качества? Или, может быть, информация о том, какой LLM можно использовать бесплатно для небольшого сообщества с базовым функционалом? Я готов погрузиться в детали и поэкспериментировать, но у меня немного времени.

Например, меня интересует только обнаружение спама и фильтр нецензурной лексики. Раньше у меня это работало бесплатно, но эти плагины устарели или скоро станут таковыми. Было бы здорово сохранить этот функционал, не платя за LLM.

Saif · 12.Март.2025 19:20:39

У нас есть эта тема, которая, возможно, именно то, что вы ищете.

AquaL1te · 25.Март.2025 09:36:43

Готово! Действительно, это было довольно просто. Но для неспециалиста настройка всё ещё может показаться немного сложной. Например, название модели автоматически подставилось в настройках, но оказалось неверным. К счастью, я увидел правильное название модели в примере curl для Claude на странице API, и всё заработало

Ориентировочные расходы на контроль спама составляют около 30 евроцентов в месяц (у меня не очень большой форум). Так что это вполне приемлемо! Я установил лимит в 5 евро в консоли API на всякий случай.

Saif · 25.Март.2025 16:16:56

Какое имя вы выбрали для Claude? Какое неверное имя было показано и на какое вы его исправили?

AquaL1te · 26.Март.2025 09:31:18

Я использую Claude 3.5. Идентификатор модели по умолчанию — claude-3-5-haiku, но мне пришлось изменить его на claude-3-5-haiku-20241022, иначе возникала ошибка.

Saif · 26.Март.2025 15:49:43

Хорошо знать, да, иногда может возникать рассогласование. Автоматически подставляемая информация должна служить ориентиром, и это работает в большинстве случаев, но в определённых ситуациях, таких как ваша (учитывая разнообразие моделей и конфигураций провайдеров), может не сработать.

Я обновил первый пост в этом руководстве.

jrgong · 11.Апрель.2025 11:20:22

Эта модель не указана в версии 3.4.2 — доступны ли эти предварительные конфигурации только в версии 3.5, и мне нужно добавлять их вручную?

Редактирование: Также, какой вариант выбрать для «Токенизатора» при использовании моделей Grok 3?

Falco · 11.Апрель.2025 17:15:01

Пресеты — это просто шаблоны; вы можете достичь того же результата, используя «Ручную настройку».

Я обнаружил, что токенизатор Gemini довольно близок к токенизатору Grok, поэтому попробуйте его.

CraigW · 24.Июль.2025 22:52:31

Есть ли способ использовать IBM WatsonX через текущую систему управления конфигурацией или для этого потребуется дополнительная разработка со стороны команды Discourse?

Falco · 24.Июль.2025 23:15:40

Случайно ли IBM WatsonX предоставляет API, совместимый с OpenAI?

CraigW · 25.Июль.2025 18:22:13

Отличный вопрос. Краткий просмотр документации не дал многого, но сам факт существования этого репозитория указывает на то, что прямая совместимость отсутствует: GitHub - aseelert/watsonx-openai-api: Watsonx Openai compatible API · GitHub

AntiMetaman · 05.Сентябрь.2025 20:03:57

Какие из этих LLM бесплатны для использования в борьбе со спамом?

Редакция: Забыл, я использую Gemini Flash 2.5

pfaffman · 06.Сентябрь.2025 19:51:04

Я тоже всегда задаюсь этим вопросом. Похоже, это лучший ответ на него.

Но также в исходном сообщении (OP) темы о настройке спама есть вот что. Мне кажется, это просто немного трудно найти среди всей представленной информации.

Тема		Ответов	Просм.
Simplified Large Language Model (LLM) configurations for Discourse AI Announcements ai	1	354	09.08.2024
What LLM to use for Discourse AI? Site Management how-to , ai	0	895	23.01.2025
Feature request: improve Discourse AI LLM setup (model discovery) and add AI config import/export Feature ai	0	86	26.01.2026
Configure API Keys for Anthropic Integrations how-to , ai	0	1594	03.10.2023
Can't choose default LLM model Support ai	2	173	16.11.2025