Различия в задержке поиска между семантическим поиском на базе ИИ и поиском по ключевым словам

Не могли бы вы уточнить, что вы имеете в виду под задержкой?

Что касается связанных тем, то поскольку все эмбеддинги предварительно рассчитаны, дополнительных затрат времени выполнения нет. Напротив, SQL-запрос для поиска связанных тем выполняется быстрее, чем наш старый запрос на предложение тем, а мы также кэшируем связанные темы для ещё более высокой производительности.

Что касается поиска на основе ИИ, то наш текущий подход HyDE[1] к нему влечёт за собой серьёзные задержки, поэтому он выполняется асинхронно: пользователю сначала показывается стандартный поиск, а затем предлагается дополнить его результатами ИИ, когда они будут готовы. Здесь, в Meta, результаты поиска с использованием ИИ готовы в среднем через 4 секунды после появления обычных результатов поиска.


  1. GPT-4: HyDE означает Hypothetical Document Embeddings (эмбеддинги гипотетических документов) — техника, используемая в семантическом поиске для нахождения документов на основе сходства их содержания. Этот подход позволяет получать более точные и контекстно релевантные результаты поиска, оценивая концептуальное сходство между документами, а не полагаясь исключительно на совпадение ключевых слов. Это техника обучения без учителя, которая сочетает возможности GPT-3 по пониманию языка с контрастными текстовыми энкодерами, улучшая способность ИИ понимать и обрабатывать естественный язык более тонко и эффективно. ↩︎

3 лайка