Добавление функции семантического поиска для нашего самохостингового сайта Discourse

Ajay26 · 04.Март.2025 11:35:56

Я новичок в области Discourse AI. Я использую модель встраивания “sentence-transformers/all-mpnet-base-v2”. Хватит ли этого для семантического поиска?
Или мне нужно добавить модель HyDE?

Пожалуйста, дайте рекомендации по этому вопросу.

Falco · 04.Март.2025 13:42:41

Вам также потребуется LLM для семантического поиска. Если вы хотите разместить его самостоятельно, ознакомьтесь с размещением LLM с открытым исходным кодом для DiscourseAI.

Ajay26 · 05.Март.2025 05:18:00

Большое спасибо.

Не могли бы вы подсказать, какие требования нужны для развёртывания модели «mistralai/Mistral-7B-Instruct-v0.2» локально (on-prem) и в облаке для корпоративного веб-сайта?

Также я не могу найти токенизаторы для этой модели в панели администратора.

Falco · 05.Март.2025 16:45:02

Здесь нет ничего специфичного для Discourse, поэтому действуют стандартные правила. Модель на 7B параметров при использовании fp16 потребует около 14 ГБ видеопамяти (VRAM) плюс место для контекста. Вы можете использовать квантование fp8, чтобы сократить это вдвое, но эта старая модель не очень хорошо подходит для такого квантования.

Поскольку невозможно включить все возможные токенизаторы, вам следует выбрать ближайший из доступных.

Abinav_22 · 06.Март.2025 09:30:30

Можете ли вы порекомендовать нам некоторые модели LLM для этого сценария? Возможно, мы будем размещать нашу модель локально, поэтому хотели бы узнать о факторе совместимости моделей с Discourse.

Спасибо.

Falco · 06.Март.2025 16:22:25

Зависит от вашего бюджета, целевой языковой поддержки и того, какие функции Discourse AI вы хотите использовать.

На сегодняшний день Qwen 2.5 Instruct в версиях 32B или 72B являются сильными кандидатами.

Abinav_22 · 10.Март.2025 05:19:10

Есть ли способ использовать для функции суммирования меньшую модель? Поскольку LLM требуют большего бюджета, нам, возможно, пока придется остановиться на чём-то более компактном…

Falco · 10.Март.2025 14:22:09

Да, вы можете использовать любую модель, какую захотите.

Ajay26 · 18.Март.2025 15:40:14

Можно ли изменить полезную нагрузку, отправляемую модели, для суммаризации или любой другой функции?

В частности, я хочу изменить содержимое системного сообщения.

{‘role’: ‘system’, ‘content’: ‘Вы — продвинутый бот для суммаризации, который создает краткие и связные резюме предоставленного текста.\n\n- Включайте только резюме, без каких-либо дополнительных комментариев.\n- Вы понимаете и генерируете Markdown форума Discourse, включая ссылки, курсив, жирный шрифт.\n- Сохраняйте исходный язык текста, который суммируется.\n- Старайтесь, чтобы резюме не превышали 400 слов.\n- Каждый пост оформляется как “<НОМЕР_ПОСТА>) ”\n- Ссылайтесь на конкретные примечательные посты, используя формат ОПИСАНИЕ\n - Пример: ссылки на 3-й и 6-й посты от sam: sam (#3, #6)\n - Пример: ссылка на 6-й пост от jane: согласился с\n - Пример: ссылка на 13-й пост от joe: joe\n- При форматировании имен пользователей используйте либо @ИМЯ_ПОЛЬЗОВАТЕЛЯ, либо ИМЯ_ПОЛЬЗОВАТЕЛЯ’}

Если это возможно, как это сделать?

Falco · 19.Март.2025 19:12:07

В данный момент это невозможно, но мы уже начали работу над тем, чтобы сделать это возможным. Ожидаем появления в ближайшие недели.

Тема		Ответов	Просм.
Setup Inquiry: AI Summarization in Discourse & LLM Integration Support ai	10	284	06.10.2025
Discourse AI - Self-Hosted Guide Self-Hosting ai	59	14107	20.05.2024
What LLM to use for Discourse AI? Site Management how-to , ai	0	896	23.01.2025
Estimating cost of enabling Discourse AI for related content and search Support ai	2	154	28.10.2025
Unlock All Discourse AI Features with Our Hosted LLM Announcements ai	9	938	13.03.2026

Добавление функции семантического поиска для нашего самохостингового сайта Discourse

Связанные темы