Возможно ли сделать семантический поиск поиском по умолчанию на сайте? Сколько стоят такие запросы?

kuaza · 20.Август.2023 21:11:51

Семантический поиск работает действительно хорошо и даёт лучшие результаты, чем обычный поиск. Мы можем использовать эту систему поиска на всём сайте, но по умолчанию она не включена. Её нужно выбирать вручную при выполнении поиска.

Возможно ли сделать этот поиск по умолчанию? И есть ли у этого запроса какая-либо стоимость?

denvergeeks · 20.Август.2023 21:51:45

Вы можете ознакомиться с плагином Algolia для Discourse. Я уже успешно настроил его на нескольких своих сайтах:

https://meta.discourse.org/search?q=algolia

Falco · 20.Август.2023 22:23:28

Мы обновляем работу семантического поиска, и его результаты будут отображаться вместе с результатами поиска по умолчанию, что должно полностью удовлетворить ваши потребности. Обновление должно быть выпущено через пару недель.

Falco · 05.Сентябрь.2023 15:58:29

Мы только что выпустили семантический поиск, интегрированный в обычный поиск в Discourse AI. Теперь он использует HyDE для достижения лучших результатов, поэтому дайте знать, как у вас получится. Одно большое изменение: у вас должны быть настроены как модуль эмбеддингов, так и LLM-сервис (либо OpenAI, Anthropic или Llama2).

Вы можете протестировать это здесь, на Meta.

kuaza · 06.Сентябрь.2023 19:09:18

Выглядит отлично. Я с нетерпением жду, когда смогу начать пользоваться этим. Вы все замечательные.

bigfudge · 08.Сентябрь.2023 08:35:29

Поиграв с этим немного, я сделал несколько наблюдений:

Результаты отличаются от обычного поиска. Не всегда лучше, потому что иногда поиск по ключевым словам/релевантности действительно дает наилучший результат, когда вы знаете, какие ключевые слова искать, но…
Он возвращает более широкий набор результатов, и они иногда действительно полезны.
Сейчас это работает у меня очень медленно. Я понимаю, что это в какой-то степени неизбежно, так как перед извлечением есть этап генерации LLM, так что не уверен, что это можно исправить, но стоит иметь это в виду. Кажется, это работает медленнее, чем короткий вызов gpt-3.5…

Несколько замечаний по интерфейсу:

Не всегда очевидно в возвращаемых результатах, какая часть релевантна. В приложении, над которым я работаю, я разбиваю документы на довольно маленькие части перед созданием эмбеддингов (предложения/абзацы), и это означает, что при поиске/извлечении можно раскрасить каждое предложение в соответствии с семантической схожестью. Это было бы немного похоже на выделение ключевых слов из поиска, но выглядело бы как тепловая карта, где семантически похожие части окрашены в «горячие» цвета, а непохожие — в «холодные».
Надоедает необходимость нажимать, чтобы развернуть семантические результаты.
Думали ли вы о способах объединения результатов по ключевым словам и семантических результатов? Было бы возможно выбрать «схожесть» или «релевантность» как порядок сортировки набора результатов? Таким образом, если вы выберете «схожесть», вы могли бы начать с представления результатов на основе ключевых слов и вставлять документы, полученные с помощью HYDE, в список по мере их поступления.
Было бы действительно интересно (по крайней мере, для меня) увидеть гипотетический документ, использованный для сопоставления схожести. Я могу представить, что иногда хочется отредактировать этот документ… и поскольку косинусная схожесть относительно недорогая (по сравнению с вызовом генерации LLM), обновление результатов в интерфейсе при обновлении пользователем своего запроса/гипотетического документа все равно было бы довольно быстрым.

В целом — это действительно круто, спасибо! Будет здорово, когда это будет реализовано так, чтобы чат-бот мог использовать результаты.

Б

Falco · 08.Сентябрь.2023 17:52:26

На этой неделе нам удалось сократить время с 45 секунд до 7 секунд благодаря нескольким хитрым оптимизациям, и мы используем это для заполнения кэша, поэтому повторные запросы выполняются мгновенно.

Ben, пост:6, тема:275953:

Не всегда очевидно в возвращаемых результатах, какая часть релевантна. В приложении, над которым я работаю, я разбиваю документы на довольно мелкие части (предложения/абзацы) перед созданием эмбеддингов, и это означает, что при поиске/извлечении можно раскрасить каждое предложение в зависимости от семантического сходства. Это было бы похоже на выделение ключевых слов из запроса, но выглядело бы как тепловая карта, где семантически похожие части окрашены в «горячие» цвета, а непохожие — в «холодные».

В настоящее время мы создаем один эмбеддинг на тему. Мы планируем перейти на создание эмбеддингов для каждого поста, что в будущем сделает этот поиск еще лучше.

Текущий интерфейс временный и был создан не нашей дизайн-командой. Наша цель состояла в том, чтобы запустить его и дать нашему сообществу возможность протестировать его, чтобы собрать отзывы о функциональных аспектах функции. Надлежащий интерфейс появится в ближайшее время.

Это заставит результаты двигаться, пока вы их просматриваете, что в UX является большим запретом. Наша главная цель — найти способ представить оба типа результатов так, чтобы они были полезны и улучшали процесс поиска, не вызывая раздражения.

Да, именно поэтому мы перенесли оба типа результатов на один экран и объединили их в единое поле ввода, в отличие от того, что было у нас раньше. Дальнейшая интеграция обоих типов зависит от парадигмы интерфейса, которую мы выберем для этого экрана.

На вашем собственном экземпляре вы можете запросить ai_api_audit_logs для получения этой информации. Например, недавний поиск по запросу Discourse app freezing on iOS привел к следующему гипотетическому посту:

Тема: Приложение Discourse зависает на iOS

Всем привет, я уже несколько месяцев использую приложение Discourse на своем iPhone, и в последнее время оно довольно часто зависает. Приложение просто блокируется и перестает отвечать, обычно когда я пытаюсь загрузить новые посты или перемещаться между категориями. Это происходит чаще, когда у меня открыто несколько тем одновременно, и я переключаюсь между ними. Индикаторы загрузки крутятся бесконечно, а нажатие кнопок не дает никакого результата. В конце концов оно перезагружается, но это становится довольно раздражающим. У меня установлена последняя версия iOS 13.3 на iPhone 8 Plus. Кто-нибудь еще сталкивался с этой проблемой в последнее время? Сами форумы загружаются нормально в мобильном браузере, проблема только в специальном приложении. Я пробовал несколько раз принудительно закрывать и снова открывать приложение, но это, кажется, не помогает. Есть ли у других пользователей мобильных устройств Discourse какие-либо предложения по решению этих проблем с зависанием? Я бы не хотел отказываться от использования приложения, если оно продолжит блокироваться. Заранее спасибо за любую помощь или совет!

Поскольку мы внесли несколько изменений в промпт, я невероятно впечатлен результатами.

Это интересное предложение, но довольно сложно объяснить этот процесс обычному пользователю. Тем не менее, мне очень нравится то, что Shopify сделал для своего административного интерфейса: они позволяют переопределять некоторые рекомендации по продуктам, предложенные ИИ. В конечном итоге мы можем сделать то же самое здесь.

Это уже так с двух дней назад. ИИ-бот использует этот метод для получения 1/4 своих внутренних результатов поиска.

system · 08.Октябрь.2023 17:52:27

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.

Тема		Ответов	Просм.
Hiding XX results found using AI - enable toggle by default Feature ai , ai-search	7	264	25.10.2025
Getting a lot of no results for semantic search Support ai , ai-search	20	600	13.03.2025
New Experiment: Enable AI search with one click! Announcements ai , ai-search	2	543	08.12.2024
Discourse AI - AI search Site Management how-to , ai , ai-search	9	3318	02.07.2025
Discourse needs better search Feature search	39	1908	10.07.2025

Возможно ли сделать семантический поиск поиском по умолчанию на сайте? Сколько стоят такие запросы?

Связанные темы