Искусственный интеллект в Discourse и генерация с дополненной выборкой

aas · 22.Ноябрь.2023 21:31:24

Discourse AI выглядит потрясающе, и я очень хочу настроить его на своём собственном экземпляре!

У меня есть один вопрос (или, возможно, предложение по улучшению), касающийся бота-помощника и эмбеддингов: могу ли я выбрать, какие темы будут использоваться для генерации с дополнением через поиск (RAG)? Например, было бы замечательно, если бы можно было настроить плагин так, чтобы эмбеддинги вычислялись только для тем в категориях с официальной документацией. Я опасаюсь, что если бот будет формировать векторную базу данных, используя всё содержимое нашего форума, то результаты будут недостаточно качественными. Также было бы интересно настроить вычисление эмбеддингов только для тем с определёнными тегами или для решённых тем. Мне интересно узнать подробности о рабочем процессе RAG. Есть ли в Discourse AI рабочий процесс RAG? Сможем ли мы контролировать, какие документы добавляются в векторную базу данных? Если у нас уже есть коллекция эмбеддингов, можем ли мы настроить Discourse AI на их использование при вызове помощника или семантическом поиске?

Я видел краткое упоминание об этом здесь, но хотел бы узнать больше деталей!

sam · 22.Ноябрь.2023 22:47:29

Пока ещё нет, но мне очень нравится эта идея по улучшению.

Наша команда поиска сейчас не имеет параметров, когда вы её выбираете:

Так что идея здесь в том, чтобы разрешить указывать дополнительные параметры для различных добавляемых команд. Мне это очень нравится, нужно только продумать интерфейс и структуры данных.

tentacleskilt · 23.Ноябрь.2023 09:27:10

aas:

Discourse AI выглядит потрясающе, и я с огромным нетерпением жду возможности настроить его на своем собственном хостинге!

У меня есть вопрос (возможно, это предложение по улучшению функционала), касающийся помощника-бота и эмбеддингов: могу ли я выбрать, какие темы будут использоваться для генерации с дополнением на основе поиска (RAG)? Например, было бы здорово, если бы я мог настроить плагин так, чтобы он вычислял эмбеддинги только для тем в категориях моей официальной документации. Я опасаюсь, что если бот будет формировать векторную базу данных, используя всё содержимое нашего форума, результаты будут недостаточно качественными. Также было бы интересно настроить вычисление эмбеддингов только для тем с определёнными тегами или помеченных как решённые. Меня интересуют детали эссе о рабочем процессе RAG. Есть ли в Discourse AI рабочий процесс RAG? Будем ли мы иметь возможность контролировать, какие документы добавляются в векторную базу данных? Если у нас уже есть коллекция эмбеддингов, можем ли мы настроить Discourse AI на их использование при вызове помощника или семантическом поиске?

Я видел это кратко упомянутым здесь, но хотел бы узнать больше подробностей!

Что в этом персонаже строится поверх интеграции с Discourse, помимо использования интерфейса Discourse в качестве фронтенда для внешнего LLM? Для большинства наших персонажей мы рассматриваем возможность реализации RAG, чтобы создать что-то, что стандартный LLM «из коробки» не сможет обеспечить.

Насколько мне известно, плагин Discourse AI на данный момент строит векторную базу данных, используя все сообщения на форуме, однако этот подход будет доработан, чтобы пользователи могли указывать, какие документы должны быть включены. Это обеспечит более детальный контроль над данными для обучения и улучшит качество генерируемых ответов.

Кроме того, возможность использования предварительно вычисленных эмбеддингов всё ещё изучается…

sam · 29.Апрель.2024 23:16:30

К сведению: это уже реализовано

Вы можете управлять параметрами поиска при добавлении инструмента поиска. Если вы добавите Contribute > Bug, поиск будет выполняться только по ошибкам.

Тема		Ответов	Просм.
RAG capacities of discourse-ai Support ai	6	479	19.09.2024
API access to the embedding(s) for a post Feature completed	3	553	12.09.2024
Improving quality of search filters in Discourse AI Support ai	14	777	28.06.2024
Discourse AI - AI search Site Management how-to , ai , ai-search	9	3333	02.07.2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai , ai-bot	57	4543	29.04.2026

Искусственный интеллект в Discourse и генерация с дополненной выборкой

Связанные темы