Семантический поиск работает действительно хорошо и даёт лучшие результаты, чем обычный поиск. Мы можем использовать эту систему поиска на всём сайте, но по умолчанию она не включена. Её нужно выбирать вручную при выполнении поиска.
Мы обновляем работу семантического поиска, и его результаты будут отображаться вместе с результатами поиска по умолчанию, что должно полностью удовлетворить ваши потребности. Обновление должно быть выпущено через пару недель.
Мы только что выпустили семантический поиск, интегрированный в обычный поиск в Discourse AI. Теперь он использует HyDE для достижения лучших результатов, поэтому дайте знать, как у вас получится. Одно большое изменение: у вас должны быть настроены как модуль эмбеддингов, так и LLM-сервис (либо OpenAI, Anthropic или Llama2).
Поиграв с этим немного, я сделал несколько наблюдений:
Результаты отличаются от обычного поиска. Не всегда лучше, потому что иногда поиск по ключевым словам/релевантности действительно дает наилучший результат, когда вы знаете, какие ключевые слова искать, но…
Он возвращает более широкий набор результатов, и они иногда действительно полезны.
Сейчас это работает у меня очень медленно. Я понимаю, что это в какой-то степени неизбежно, так как перед извлечением есть этап генерации LLM, так что не уверен, что это можно исправить, но стоит иметь это в виду. Кажется, это работает медленнее, чем короткий вызов gpt-3.5…
Несколько замечаний по интерфейсу:
Не всегда очевидно в возвращаемых результатах, какая часть релевантна. В приложении, над которым я работаю, я разбиваю документы на довольно маленькие части перед созданием эмбеддингов (предложения/абзацы), и это означает, что при поиске/извлечении можно раскрасить каждое предложение в соответствии с семантической схожестью. Это было бы немного похоже на выделение ключевых слов из поиска, но выглядело бы как тепловая карта, где семантически похожие части окрашены в «горячие» цвета, а непохожие — в «холодные».
Надоедает необходимость нажимать, чтобы развернуть семантические результаты.
Думали ли вы о способах объединения результатов по ключевым словам и семантических результатов? Было бы возможно выбрать «схожесть» или «релевантность» как порядок сортировки набора результатов? Таким образом, если вы выберете «схожесть», вы могли бы начать с представления результатов на основе ключевых слов и вставлять документы, полученные с помощью HYDE, в список по мере их поступления.
Было бы действительно интересно (по крайней мере, для меня) увидеть гипотетический документ, использованный для сопоставления схожести. Я могу представить, что иногда хочется отредактировать этот документ… и поскольку косинусная схожесть относительно недорогая (по сравнению с вызовом генерации LLM), обновление результатов в интерфейсе при обновлении пользователем своего запроса/гипотетического документа все равно было бы довольно быстрым.
В целом — это действительно круто, спасибо! Будет здорово, когда это будет реализовано так, чтобы чат-бот мог использовать результаты.
На этой неделе нам удалось сократить время с 45 секунд до 7 секунд благодаря нескольким хитрым оптимизациям, и мы используем это для заполнения кэша, поэтому повторные запросы выполняются мгновенно.
В настоящее время мы создаем один эмбеддинг на тему. Мы планируем перейти на создание эмбеддингов для каждого поста, что в будущем сделает этот поиск еще лучше.
Текущий интерфейс временный и был создан не нашей дизайн-командой. Наша цель состояла в том, чтобы запустить его и дать нашему сообществу возможность протестировать его, чтобы собрать отзывы о функциональных аспектах функции. Надлежащий интерфейс появится в ближайшее время.
Это заставит результаты двигаться, пока вы их просматриваете, что в UX является большим запретом. Наша главная цель — найти способ представить оба типа результатов так, чтобы они были полезны и улучшали процесс поиска, не вызывая раздражения.
Да, именно поэтому мы перенесли оба типа результатов на один экран и объединили их в единое поле ввода, в отличие от того, что было у нас раньше. Дальнейшая интеграция обоих типов зависит от парадигмы интерфейса, которую мы выберем для этого экрана.
На вашем собственном экземпляре вы можете запросить ai_api_audit_logs для получения этой информации. Например, недавний поиск по запросу Discourse app freezing on iOS привел к следующему гипотетическому посту:
Тема: Приложение Discourse зависает на iOS
Всем привет, я уже несколько месяцев использую приложение Discourse на своем iPhone, и в последнее время оно довольно часто зависает. Приложение просто блокируется и перестает отвечать, обычно когда я пытаюсь загрузить новые посты или перемещаться между категориями. Это происходит чаще, когда у меня открыто несколько тем одновременно, и я переключаюсь между ними. Индикаторы загрузки крутятся бесконечно, а нажатие кнопок не дает никакого результата. В конце концов оно перезагружается, но это становится довольно раздражающим. У меня установлена последняя версия iOS 13.3 на iPhone 8 Plus. Кто-нибудь еще сталкивался с этой проблемой в последнее время? Сами форумы загружаются нормально в мобильном браузере, проблема только в специальном приложении. Я пробовал несколько раз принудительно закрывать и снова открывать приложение, но это, кажется, не помогает. Есть ли у других пользователей мобильных устройств Discourse какие-либо предложения по решению этих проблем с зависанием? Я бы не хотел отказываться от использования приложения, если оно продолжит блокироваться. Заранее спасибо за любую помощь или совет!
Поскольку мы внесли несколько изменений в промпт, я невероятно впечатлен результатами.
Это интересное предложение, но довольно сложно объяснить этот процесс обычному пользователю. Тем не менее, мне очень нравится то, что Shopify сделал для своего административного интерфейса: они позволяют переопределять некоторые рекомендации по продуктам, предложенные ИИ. В конечном итоге мы можем сделать то же самое здесь.
Это уже так с двух дней назад. ИИ-бот использует этот метод для получения 1/4 своих внутренних результатов поиска.