Поддержка поиска с использованием Vanilla Embedding

Было бы здорово иметь простой семантический поиск без необходимости использовать модель HyDE.

У меня есть документ по настройке клиента Perforce, который мы используем для контроля версий. При поиске по запросу «контроль версий» обычный поиск ничего не находит, так как на странице это ключевое слово не упоминается.

При включении полного поиска по странице возникает ошибка 500, которая появляется каждый раз, когда результат работы ИИ пуст:

Однако при использовании конечной точки discourse-ai/embeddings/semantic-search.json?hyde=false&q=Version%20Control я вижу тему о Perforce в списке.

Не уверен, решает ли HyDE отфильтровать её или это связано с ошибкой 500, но было бы неплохо, если бы по умолчанию использовался поиск на основе семантики и ключевых слов.

1 лайк

У нас был режим поиска, похожий на этот, в быстром поиске в заголовке: только асимметричные эмбеддинги плюс этап переупорядочивания, но при тестировании с моделями эмбеддингов 2023 года результаты оказались неудовлетворительными. На этой неделе мы обновили здесь, в Meta, модель эмбеддингов до самого современного уровня, и это выглядит очень многообещающе, поэтому мы обязательно вернёмся к этому вопросу в ближайшее время.

2 лайка

Звучит захватывающе! Не терпится попробовать, когда это станет доступно всем.

1 лайк