Discourse AI выглядит потрясающе, и я очень хочу настроить его на своём собственном экземпляре!
У меня есть один вопрос (или, возможно, предложение по улучшению), касающийся бота-помощника и эмбеддингов: могу ли я выбрать, какие темы будут использоваться для генерации с дополнением через поиск (RAG)? Например, было бы замечательно, если бы можно было настроить плагин так, чтобы эмбеддинги вычислялись только для тем в категориях с официальной документацией. Я опасаюсь, что если бот будет формировать векторную базу данных, используя всё содержимое нашего форума, то результаты будут недостаточно качественными. Также было бы интересно настроить вычисление эмбеддингов только для тем с определёнными тегами или для решённых тем. Мне интересно узнать подробности о рабочем процессе RAG. Есть ли в Discourse AI рабочий процесс RAG? Сможем ли мы контролировать, какие документы добавляются в векторную базу данных? Если у нас уже есть коллекция эмбеддингов, можем ли мы настроить Discourse AI на их использование при вызове помощника или семантическом поиске?
Я видел краткое упоминание об этом здесь, но хотел бы узнать больше деталей!
Так что идея здесь в том, чтобы разрешить указывать дополнительные параметры для различных добавляемых команд. Мне это очень нравится, нужно только продумать интерфейс и структуры данных.
Насколько мне известно, плагин Discourse AI на данный момент строит векторную базу данных, используя все сообщения на форуме, однако этот подход будет доработан, чтобы пользователи могли указывать, какие документы должны быть включены. Это обеспечит более детальный контроль над данными для обучения и улучшит качество генерируемых ответов.
Кроме того, возможность использования предварительно вычисленных эмбеддингов всё ещё изучается…