Добавить семантический поиск в AI Bot

Я уже немного поработал с ботом, и он уже отлично справляется. Можно ли добавить голосовую функцию для включения семантического поиска? В моих экспериментах это сделало бы бота намного умнее, по крайней мере на нашем сайте. Если сравнивать результаты, которые он находит и на основе которых делает сводки или даёт ответы, они значительно хуже тех, которые он мог бы предоставить при использовании семантического поиска.

Кроме того, возможно ли сделать семантический поиск по умолчанию при использовании команды /? Снова думаю, что большинство наших пользователей предпочли бы такие результаты. У нас много статей базы знаний, которые не всегда содержат ключевые слова, которые люди реально используют в поиске, но которые семантически связаны. Это означает, что обычный поиск часто выдаёт менее качественные посты, где люди неформально обсуждают проблемы, а не даёт канонический ответ на их вопрос.

2 лайка

Можете поделиться примерами запросов или вопросов?

Я тоже считаю, что AI-бот очень полезен для сайтов, но мои идеи по поводу запросов или вопросов могут отличаться от идей других людей, поэтому я ищу другие примеры для возможной демонстрации.

2 лайка

Честно говоря, даже если бы вы использовали текущий семантический поиск как часть рабочего процесса бота, это было бы здорово. Сейчас он работает неплохо, но просто не предоставляет нужный контекст информации, даже когда текущий семантический поиск мог бы его найти.

Было бы отлично иметь контроль над промптами, но я понимаю, что в интерфейсе это сложно реализовать, так как легко что-то сломать из-за неправильного промпта. Мне кажется, введение концепции персонажа для бота, который задаётся как системный промпт, могло бы стать хорошим началом в этом направлении.

1 лайк

Абсолютно согласен, это именно то, чего я хочу. Более того, я хочу, чтобы администраторам форумов была предоставлена возможность создавать кастомные персоны с набором собственных команд.

6 лайков

Я действительно вижу, что настройка промптов может быть для нас полезной. Хотя недавно я немного занимался любительским «инжинирингом промптов» для другого проекта, я считаю, что новичкам потребуется некоторое руководство и множество примеров. Кроме того, интерфейс, вероятно, выиграл бы от наличия набора примеров или предустановленных вариантов, таких как «разговорный/веселый», «нейтральный/точный» и вплоть до «книжный/умный», чтобы показать, как формулировки персонажа могут влиять на ответы.

Я также обнаружил, что оценить влияние изменений в формулировках промпта довольно сложно из-за присущей моделям случайности, а также потому, что эффекты могут варьироваться в зависимости от тематики промпта. Было бы неплохо разработать стандартный набор тестовых пользовательских вводов и использовать их для предварительного просмотра того, как изменения в персонаже или инструкциях повлияют на вывод бота. Думаю, это было бы полезно и для вашей команды… хотя, когда набор тестов станет большим, возникнет проблема его оценки без больших затрат времени.

Еще одно измерение, которое, как мне кажется, пользователи часто захотят настраивать, — это насколько строго LLM придерживается исходных материалов, предоставленных в промпте. По моим тестам, нужно быть очень явным (и повторять это) в инструкциях модели не использовать знания извне контекста и четко давать понять (дополнительными инструкциями), что лучше получить никакой ответ, чем неправильный. Также можно контролировать степень, в которой модель «показывает ход своих мыслей» и ссылается на источники или приводит примеры. Я считаю, что это часто хороший способ избежать галлюцинаций и выдуманных ответов, когда контекст не содержит фактического ответа или релевантных материалов.

И последнее замечание… Я вижу, что вы беспокоитесь о расходах и экономии токенов, что, думаю, имеет смысл для очень крупных сайтов. Однако для небольших или более финансово значимых приложений (например, служба поддержки клиентов) я не считаю это большой проблемой, и со временем эти расходы будут только снижаться. Стоимость дополнительных запросов к отдельным классификаторам для проверки ответа или реализации определенных пользователем «ограничений» определенно того стоит для нас. Например, мы обнаружили, что промпты вроде «содержит ли этот ответ информацию, не найденную в этих источниках», довольно показательны и определенно стоит запускать их перед предоставлением информации пользователям. GPT 3.5 определенно подходит для таких задач, даже если основная работа выполняется на GPT-4.

3 лайка