Исследование вариантов ранжирования для Discourse AI

tpetrov · 16.Сентябрь.2025 05:54:20

А, теперь понятно, спасибо за объяснение, именно этого мне и не хватало.

Кстати, я знаю, что в более продвинутых системах RAG часто используется повторное ранжирование. Есть ли что-то подобное в том, как Discourse это обрабатывает? Как вы думаете, добавление этапа повторного ранжирования дало бы какой-то положительный эффект?

sam · 16.Сентябрь.2025 06:08:55

Переранжирование находится в стадии разработки.

@Falco / @Roman реализовали базовый переранжировщик в Discourse:

github.com/discourse/discourse

plugins/discourse-ai/config/settings.yml

f9424a549


      
          ai_hugging_face_tei_reranker_endpoint:
            default: ""
          ai_hugging_face_tei_reranker_endpoint_srv:
            default: ""
            hidden: true
          ai_hugging_face_tei_reranker_api_key: ""

Это используется в семантическом поиске и RAG. Однако эта функция довольно скрыта и её сложно настроить.

Я думаю, что в среднесрочной перспективе (о чём мы обсуждали с @awesomerobot) мы перейдём от терминологии LLM к термину «Модели»… и, возможно, немного унифицируем интерфейс, чтобы можно было определять эмбеддинги/переранжировщики и LLM в едином интерфейсе.

На данный момент мы поддерживаем только очень специфичный API переранжировщика от Hugging Face.

Это, безусловно, улучшает качество результатов.

tpetrov · 16.Сентябрь.2025 06:24:17

Отлично!
Значит, сейчас это отключено по умолчанию и не может быть легко настроено на тарифном плане с хостингом (Pro)?

sam · 16.Сентябрь.2025 06:25:03

Не уверен, давай подождём ответа от @Falco.

tpetrov · 02.Октябрь.2025 12:19:15

Привет, @Falco! Есть ли способ включить ранжировщик для тестирования или, может быть, есть какие-то сроки?

Falco · 15.Октябрь.2025 16:16:16

Мы только что развернули крупное улучшение в технологии, лежащей в основе семантического поиска в Discourse: DEV: Re-introduce PG Vector 0.8.0 upgrade by romanrizzi · Pull Request #35233 · discourse/discourse · GitHub.

Попробуйте снова выполнить ваш сценарий — изменения уже применены к вашему сайту. Ожидается, что это улучшит работу RAG без необходимости использования ранжировщика.

Мы по-прежнему планируем сделать ранжировщик общедоступным, но пока ждем, пока будут внесены необходимые изменения в зависимости.

tpetrov · 16.Октябрь.2025 15:59:43

Спасибо, Фалько!

Будет ли это работать только для семантического поиска по темам Discourse, или также для RAG-документов, загруженных в персону? По моему опыту, ИИ работает довольно хорошо с темами форумов (например, на ask.discourse), но не так хорошо с загруженными документами в персону (или я ещё не нашёл наилучшую формулу).

Falco · 16.Октябрь.2025 16:16:40

Это влияет на все случаи использования эмбеддингов в Discourse, включая связанные темы, RAG, поиск, предложения категорий и тегов в редакторе и т. д.

Falco · 30.Октябрь.2025 21:50:12

Привет, @tpetrov, улучшились ли результаты с новой моделью эмбеддингов?

tpetrov · 31.Октябрь.2025 10:33:56

Привет, Фалько! Извини, у меня не было времени на тщательное тестирование, поэтому я не могу точно сказать.

Думаю, нет способа переключаться между ними для сравнения?

Falco · 02.Ноябрь.2025 17:06:22

Сейчас нет. Старые и новые модели были доступны несколько месяцев, но недавно мы отключили старые на нашем хостинге.

Тема		Ответов	Просм.
Discourse AI and retrieval augmented generation Feature ai	3	859	29.04.2024
RAG capacities of discourse-ai Support ai	6	480	19.09.2024
Why is my AI forum helper struggling to answer questions? Support ai , ai-bot	3	456	15.09.2025
Advice on a support bot for a technical support forum (Discourse AI vs Discourse Chatbot) General ai , ai-bot	57	4543	29.04.2026
Improving quality of search filters in Discourse AI Support ai	14	777	28.06.2024

Исследование вариантов ранжирования для Discourse AI

Связанные темы