Развертывание OpenSource LLM для DiscourseAI на собственном сервере

Discourse · 08.Январь.2024 20:39:55

Плагин Discourse AI включает множество функций, требующих включения LLM, таких как, например, суммаризация, AI Helper, AI Search и AI Bot. Хотя вы можете использовать сторонний API, например, настроить ключи API для OpenAI или настроить ключи API для Anthropic, мы создали Discourse AI с самого начала так, чтобы не зависеть от этих провайдеров.

Запуск с HuggingFace TGI

HuggingFace предоставляет отличное контейнерное изображение, которое позволит быстро запустить сервер.

Например:

mkdir -p /opt/tgi-cache
docker run --rm --gpus all --shm-size 1g -p 8080:80 \
  -v /opt/tgi-cache:/data \
  ghcr.io/huggingface/text-generation-inference:latest \
  --model-id mistralai/Mistral-7B-Instruct-v0.2

Это позволит запустить локальный экземпляр Mistral 7B Instruct на localhost в порту 8080, который можно протестировать с помощью:

curl http://localhost:8080/ \
    -X POST \
    -H 'Content-Type: application/json' \
    -d '{"inputs":"<s>[INST] What is your favourite condiment? [/INST] Well, I'm quite partial to a good squeeze of fresh lemon juice. It adds just the right amount of zesty flavour to whatever I'm cooking up in the kitchen!</s> [INST] Do you have mayonnaise recipes? [/INST]","parameters":{"max_new_tokens":500, "temperature":0.5,"top_p": 0.9}}'

Запуск с vLLM

Другой вариант для самостоятельного размещения LLM, поддерживаемый Discourse AI, — это vLLM, очень популярный проект, распространяемый под лицензией Apache.

Вот как начать работу с моделью:

mkdir -p /opt/vllm-cache
docker run --gpus all \
  -v /opt/vllm-cache:/root/.cache/huggingface \
  -e "MODEL=mistralai/Mistral-7B-Instruct-v0.2" \
  -p 8080:8000 --ipc=host vllm/vllm-openai:latest

Тестирование можно выполнить с помощью:

curl -X POST http://localhost:8080/v1/completions \
-H "Content-Type: application/json" \
-d '{
"model": "mistralai/Mistral-7B-Instruct-v0.2",
"prompt": "<s> [INST] What was the latest released hero for Dota 2? [/INST] The latest released hero for Dota 2 was", "max_tokens": 200}'

Запуск с Ollama

Ollama — ещё один популярный вариант для запуска моделей с открытым исходным кодом локально. Он упрощает управление моделями и предоставляет API, совместимый с OpenAI.

ollama pull mistral
ollama serve

Это запускает локальный сервер по адресу http://localhost:11434, к которому Discourse AI может подключиться, используя провайдера Ollama.

Доступность для вашего экземпляра Discourse

В большинстве случаев вы будете запускать это на выделенном сервере из-за требований к GPU. В таком случае рекомендуется использовать обратный прокси, завершение TLS и защиту конечной точки, чтобы к ней мог подключаться только ваш экземпляр Discourse.

Настройка Discourse AI

Подключения к LLM теперь настраиваются через административный интерфейс, а не через настройки сайта. Перейдите по адресу /admin/plugins/discourse-ai/ai-llms и добавьте новый LLM:

Нажмите New, чтобы добавить модель.
Выберите Provider — в зависимости от вашего сервера инференса выберите vLLM, Hugging Face или Ollama.
Введите URL вашего конечного пункта инференса (например, http://your-server:8080).
Введите API-ключ, если ваш конечный пункт требует его.
Заполните название модели, токенизатор, максимальное количество токенов запроса и другие детали модели.

После добавления вашего LLM установите его как модель по умолчанию через настройку сайта ai_default_llm_model или назначьте его для конкретных функций через конфигурацию агента в /admin/plugins/discourse-ai/ai-features.

Bathinda · 19.Март.2024 04:44:43

Для тех, кто ищет по этой теме с/для:
#Llava-Api-keys

Isambard · 23.Март.2024 22:48:26

Я тоже использую vLLM. Также рекомендую модель openchat v3.5 0106 — это 7-миллиардная модель с 7 миллиардами параметров, которая показывает отличные результаты.

Я запускаю её в квантованном виде с точностью 4 бита, чтобы она работала быстрее.

oppman · 13.Январь.2025 23:43:35

Я поручаю эту задачу стажёру. Есть ли у кого-нибудь рекомендации по конкретной услуге для регистрации? Это для тестирования. У стажёра уже настроен тест с OpenAI. Он работает нормально. Они заинтересованы в попытке использовать HuggingFace TGI, но, похоже, мне нужно предоставить им выделенный сервер с GPU? Какие минимальные характеристики требуются для теста?

Есть ли ссылки, которые я могу дать стажёру?

Я ещё не изучал этот проект подробно. Я лишь предполагаю, что стажёру понадобятся некоторые ресурсы, и пытаюсь дать разумные рекомендации по услугам для стажёра в ходе исследования.

Eric_Keller · 15.Январь.2025 16:16:40

Привет! При развертывании контейнера vllm с самоподписанным сертификатом на локальном GPU-сервере я не нашел хорошего способа добавить корневой CA в контейнер Discourse, чтобы он мог безопасно обращаться к этому локальному сервису по HTTPS.

Например:

./launcher enter app
curl -L  https://vllm.infra.example.com/v1/models
curl: (60) SSL certificate problem: unable to get local issuer certificate
More details here: https://curl.se/docs/sslcerts.html

curl failed to verify the legitimacy of the server and therefore could not
establish a secure connection to it. To learn more about this situation and
how to fix it, please visit the web page mentioned above.

Есть ли хороший способ добавить корневой сертификат CA (самоподписанный) в контейнер Discourse так, чтобы изменения сохранялись даже после обновления образа контейнера?

Насколько я знаю, добавление этого в app.yml:

run:
  - exec: wget ... && update-ca-certificates

сработает корректно только при сборке/пересборке приложения.

Буду благодарен за любые подсказки.

Falco · 21.Февраль.2025 14:37:56

14 сообщений были перенесены в новую тему: Настройка Discourse AI для работы с Ollama локально

pacharanero · 20.Январь.2026 17:17:35

Есть ли возможность добавлять пользовательские заголовки HTTP в запросы Discourse AI? У нас есть сервер с GPU, который мы используем для различных задач; он предоставляет API, совместимое с OpenAI, но в целях безопасности мы разместили его за шлюзом управления API (API Management), который требует наличия пользовательского заголовка HTTP (например, SubscriptionKey), и мы передаём там наш ключ аутентификации.Обратите внимание, что этот ключ аутентификации используется для прохождения через APIM и отличается от ключа API, который обычно указывается для таких сервисов, как OpenAI API.Было бы отлично, если бы появилась возможность добавлять пользовательские заголовки при настройке каждой LLM на странице admin/plugins/discourse-ai/ai-llms. Возможно, стоит добавить опцию «Custom» в выпадающем списке «Provider» с дополнительными настройками для подобных сценариев использования?

pfaffman · 20.Январь.2026 19:26:40

Краткий ответ: используйте плагин для добавления этого заголовка. Обходным решением может стать локальный прокси-сервер, к которому будет обращаться Discourse; он добавит заголовок и передаст данные обратно в Discourse. Один ненадёжный источник предполагает, что вы можете настроить NGINX на выполнение этой задачи с помощью чего-то вроде:

server {
    listen 80;
    
    location / {
        proxy_pass https://api.example.com;
        proxy_set_header SubscriptionKey xyz;
        proxy_set_header Host $host;
    }
}

Возможно, существует изящный способ добавить это в конфигурацию nginx для Discourse по какому-то секретному пути (который также слушал бы только ваш сервер).

mononym · 06.Июль.2026 16:34:04

Здравствуйте,

Я не могу найти эти настройки:

Есть ли у вас какие-либо предложения по тестированию функции AI-перевода с использованием бэкенда Ollama?

Falco · 06.Июль.2026 16:54:41

Создайте новую LLM по адресу /admin/plugins/discourse-ai/ai-llms/new?llmTemplate=none, выберите OpenAI в качестве провайдера, так как Ollama поддерживает OpenAI compatibility - Ollama.

mononym · 06.Июль.2026 17:04:42

Спасибо! Я тоже заметил, что URL работает только при включённом плагине AI

Есть ли какие-либо предложения, что выбрать/установить для следующих обязательных настроек для нового добавленного провайдера?

Токенизатор

Контекстное окно

Что касается модели, я подумывал, возможно, использовать stablelm2:1.6b или translategemma:4b, но пока не уверен.
В README последней есть описание входного промпта. ~~Мне интересно, какой запрос отправляет функция перевода AI в Ollama.~~ см. /admin/plugins/discourse-ai/ai-agents/-28/edit

Falco · 06.Июль.2026 17:12:01

Выбирайте тот, что максимально близок к модели, которую вы используете. Для Gemma можно взять токенизатор от Gemini.

Здесь вы задаёте максимальный контекст для вашего деплоя.

Пожалуйста, не делайте этого. Эта модель очень-очень-очень-очень-очень старая. Это худший выбор, который вы можете сделать.

Эта модель отстает на одно поколение и имеет очень строгие требования к промптам, которые несовместимы с Discourse. Нам нужен более стандартный LLM для общего использования.

Для таких размеров я рекомендую либо Qwen 3.5, либо Gemma 4.

mononym · 06.Июль.2026 18:12:45

Ещё раз спасибо. Я настроил параметры, загрузил модель, подправил агента и теперь запустил функцию перевода с помощью ИИ. Посмотрим, что из этого выйдет.

Ещё один вопрос. Раньше мы использовали плагин переводчика с щедрым предоставлением экземпляра LibreTranslate. Невозможно ли подключить функцию перевода Discourse AI к этому конечному узлу LibreTranslate? В конце концов, это было бы гораздо проще, чем размещать экземпляр Ollama на сервере без реальных возможностей LLM.

Falco · 06.Июль.2026 18:36:54

Почему бы вам не продолжать использовать его? Мы больше не обновляем его, но он будет продолжать работать как есть.

Перевод в Discourse AI работает с совершенно другим набором ограничений, чем оригинальный плагин Переводчик, поэтому мы создали его с нуля, чтобы учесть этот новый мир, где переводы на основе LLM лучше и дешевле, чем то, что было возможно раньше с помощью ML-переводческих API.

Тема		Ответов	Просм.
How to configure Discourse to use a locally installed LLM? Support ai	7	355	03.06.2025
Discourse AI - Self-Hosted Guide Self-Hosting ai	59	14119	20.05.2024
I want to install Discourse AI on Discourse Self-hosting ai	12	596	19.05.2024
Getting discourse ai to work with ollama locally Support ai	13	703	20.02.2025
How to use the hugging face llama2 chat bot Development ai , ai-bot	2	632	09.03.2024