А, теперь понятно, спасибо за объяснение, именно этого мне и не хватало.
Кстати, я знаю, что в более продвинутых системах RAG часто используется повторное ранжирование. Есть ли что-то подобное в том, как Discourse это обрабатывает? Как вы думаете, добавление этапа повторного ранжирования дало бы какой-то положительный эффект?
@Falco / @Roman реализовали базовый переранжировщик в Discourse:
Это используется в семантическом поиске и RAG. Однако эта функция довольно скрыта и её сложно настроить.
Я думаю, что в среднесрочной перспективе (о чём мы обсуждали с @awesomerobot) мы перейдём от терминологии LLM к термину «Модели»… и, возможно, немного унифицируем интерфейс, чтобы можно было определять эмбеддинги/переранжировщики и LLM в едином интерфейсе.
На данный момент мы поддерживаем только очень специфичный API переранжировщика от Hugging Face.
Попробуйте снова выполнить ваш сценарий — изменения уже применены к вашему сайту. Ожидается, что это улучшит работу RAG без необходимости использования ранжировщика.
Мы по-прежнему планируем сделать ранжировщик общедоступным, но пока ждем, пока будут внесены необходимые изменения в зависимости.
Будет ли это работать только для семантического поиска по темам Discourse, или также для RAG-документов, загруженных в персону? По моему опыту, ИИ работает довольно хорошо с темами форумов (например, на ask.discourse), но не так хорошо с загруженными документами в персону (или я ещё не нашёл наилучшую формулу).