Эта тема посвящена настройке модуля Embeddings плагина Discourse AI. Здесь объясняется, что такое эмбеддинги, как они используются и как их настроить.
Требуемый уровень пользователя: Администратор
Эмбеддинги являются ключевым компонентом плагина Discourse AI, обеспечивая такие функции, как Связанные темы и Поиск с помощью ИИ. Это руководство проведет вас через процесс настройки и использования эмбеддингов в вашем экземпляре Discourse.
Что такое эмбеддинги?
Эмбеддинги — это числовые представления текста, которые улавливают семантический смысл. В Discourse они используются для:
- Генерации связанных тем в нижней части страниц тем
- Включения функциональности семантического поиска
Настройка эмбеддингов
Для хостинговых клиентов
Если вы используете хостинг, эмбеддинги уже настроены. Вам достаточно просто включить функции ИИ, которые от них зависят.
Для самостоятельно размещенных экземпляров
Если вы самостоятельно размещаете свой экземпляр, обратитесь к руководству по самостоятельной установке Discourse AI для получения подробных инструкций по настройке.
Настройка определений эмбеддингов
Модели эмбеддингов теперь настраиваются как определения эмбеддингов в интерфейсе администратора. Перейдите в Администрирование → плагин ИИ → вкладка Эмбеддинги. При добавлении нового определения эмбеддинга вы можете выбрать из предварительно настроенных пресетов или настроить его вручную.
Доступные пресеты включают:
- text-embedding-3-large (OpenAI)
- text-embedding-3-small (OpenAI)
- text-embedding-ada-002 (OpenAI)
- gemini-embedding-001 (Google)
- bge-large-en (Hugging Face)
- bge-m3 (Hugging Face)
- multilingual-e5-large (Hugging Face)
Каждое определение эмбеддинга включает: отображаемое имя, провайдера, URL, API-ключ (или секрет ИИ), токенизатор, размерность, функцию расстояния, максимальную длину последовательности и необязательные промпты для встраивания/поиска.
Настройка эмбеддингов
Перейдите в Администрирование → Плагины → Discourse AI и убедитесь, что включены следующие настройки.
- ai embeddings enabled: Включение или отключение модуля эмбеддингов
- ai embeddings selected model: Выбор определения эмбеддинга, которое будет использоваться для генерации эмбеддингов
Необязательные настройки, которые можно настроить…
- AI embeddings generate for pms: Решение о генерации эмбеддингов для личных сообщений
- AI embeddings semantic related topics enabled: Включение или отключение функции «Связанные темы»
- AI embeddings semantic related topics: Максимальное количество отображаемых связанных тем
- AI embeddings semantic related include closed topics: Включение закрытых тем в результаты связанных тем
- AI embeddings semantic related age penalty: Применение экспоненциального штрафа за возраст к темам в результатах связанных тем (0.0 отключает, более высокие значения сильнее штрафуют старые темы)
- AI embeddings semantic related age time scale: Масштаб времени в днях для расчета штрафа за возраст (по умолчанию: 365)
- AI embeddings semantic search enabled: Включение полного поиска с помощью ИИ
- AI embeddings semantic quick search enabled: Включение опции семантического поиска во всплывающем меню поиска
- AI embeddings semantic search use hyde: Включение HyDE (Hypothetical Document Embedding) для семантического поиска
- AI embeddings semantic search hyde agent: Агент ИИ, используемый для расширения поисковых запросов при включенном HyDE
Провайдеры
Discourse AI поддерживает нескольких провайдеров эмбеддингов:
- OpenAI
- Hugging Face (для моделей с открытым исходным кодом/открытыми весами)
- Cloudflare Workers AI
Для хостинговых клиентов Discourse предоставляет предварительно настроенные (засеянные) определения эмбеддингов, которые работают сразу после установки.
Функции
Связанные темы
При включении в нижней части страниц тем появляется раздел «Связанные темы», содержащий ссылки на семантически похожие обсуждения.
Поиск с помощью ИИ
Эмбеддинги обеспечивают работу опции семантического поиска на интерфейсе полного поиска.
Семантический поиск может опционально использовать HyDE (Hypothetical Document Embedding). При включении через ai embeddings semantic search use hyde поисковый запрос расширяется с помощью агента ИИ, настроенного в ai embeddings semantic search hyde agent. Расширенный запрос затем преобразуется в вектор и используется для поиска похожих тем. Этот метод добавляет некоторую задержку при поиске, но может улучшить результаты.
При выборе агента для HyDE выбирайте быстрые модели, такие как Gemini Flash, Claude Haiku, GPT-4o Mini или новейшие доступные модели.
Генерация эмбеддингов
Эмбеддинги автоматически генерируются для новых сообщений. Для генерации эмбеддингов для существующего контента:
- Discourse автоматически заполнит эмбеддинги для более старых тем с помощью запланированной задачи, которая выполняется каждые 5 минут
- Заполнение обрабатывает темы в порядке недавней активности
Часто задаваемые вопросы
В: Как определяются связанные темы?
О: Связанные темы определяются исключительно на основе эмбеддингов, которые включают заголовок, категорию, теги и содержимое сообщений.
В: Можно ли исключить определенные темы из связанных тем?
О: Да, существует настройка сайта для удаления закрытых тем из результатов.
В: Работают ли эмбеддинги для исторических сообщений?
О: Да, система автоматически заполнит эмбеддинги для всего вашего контента.




