Руководство по агенту ИИ для исследователя форума

sam · 05.Июнь.2025 05:06:40

Это руководство объясняет, что такое агент «Исследователь форума» в Discourse AI, как он работает и как настроить его для глубокого анализа контента форума.>
Требуемый уровень пользователя: Администратор (для включения и настройки), Все пользователи (для взаимодействия, если предоставлен доступ)

Понимание и использование агента «Исследователь форума»

Плагин Discourse AI включает в себя агента Исследователь форума — мощный инструмент, предназначенный для проведения углубленного исследования контента внутри вашего форума. Этот агент поможет вам выявить важные идеи, подвести итоги обсуждений и проанализировать тенденции в вашем сообществе.

Краткое содержание

В этом документе рассматриваются следующие темы:

Как работает агент «Исследователь форума».
Шаги по настройке Исследователя форума.
Лучшие практики взаимодействия с агентом.
Различия между Исследователем форума и стандартными инструментами помощника форума.
Рекомендации по выбору подходящей большой языковой модели (LLM).
Советы по отладке исследовательских задач.
Текущие ограничения агента.

Как это работает

Агент «Исследователь форума» использует специализированный инструмент Researcher. Этот инструмент разработан для:

Доступа к контенту форума: Он может просматривать различные разделы вашего форума.
Применения расширенных фильтров: Гибкая система фильтров позволяет инструменту точно нацеливаться на релевантную информацию. Вы можете указать контент по:
- Конкретным категориям (например, category:support или categories:support,feedback)
- Тегам (например, tag:bug или tags:bug,regression)
- Пользователям или группам (например, username:sam, usernames:sam,jane, group:moderators, groups:moderators,admins)
- Ключевым словам в постах или заголовках тем (например, keywords:regression,bug, topic_keywords:feature,request)
- Даты постов (например, after:2024-01-01 before:2024-06-30)
- Даты тем (например, topic_after:2024-01-01 topic_before:2024-06-30)
- Конкретным темам по ID (например, topic:123 или topics:123,456)
- Статусу темы (например, status:open, status:closed, status:archived, status:noreplies, status:single_user)
- Типу поста (например, post_type:first, post_type:reply)
- Порядку сортировки (например, order:latest, order:oldest, order:latest_topic, order:oldest_topic, order:likes)
- Ограничению количества результатов в строке (например, max_results:50)
- Назначенным темам (если включен плагин Assign, например, assigned_to:username, assigned_to:user1,user2, assigned_to:*, assigned_to:nobody)
- Фильтры можно комбинировать с помощью логики AND (разделенные пробелом) или логики OR (используя OR между группами фильтров). Например: category:bugs status:open after:2024-05-01 OR tag:critical usernames:sally.
Анализа контента с помощью больших языковых моделей (LLM): После получения отфильтрованного контента он использует LLM для анализа информации, извлечения идей и ответа на ваши конкретные вопросы или достижения исследовательских целей.
Следования структурированному процессу: Для обеспечения эффективности и точности, особенно с учетом потенциальных затрат, Исследователь форума спроектирован следующим образом:
- Понимание: Он будет работать с вами, чтобы прояснить ваши исследовательские цели в начале.
- Планирование: На основе ваших целей он разрабатывает комплексный исследовательский подход с использованием доступных фильтров.
- Тестирование (пробный запуск): Перед выполнением полного анализа агент обычно выполняет «пробный запуск». Это включает в себя расчет количества постов, соответствующих вашим критериям фильтрации, без их немедленной обработки с помощью LLM. Затем агент сообщит вам об этом количестве.
- Уточнение: На основе результатов пробного запуска, если количество постов слишком велико (риск высоких затрат или слишком широких результатов) или слишком мало (возможный упуск ключевой информации), агент может помочь вам настроить фильтры.
- Выполнение: После того как вы подтвердите, что объем работы подходит (после пробного запуска), агент запустит окончательный анализ, отправив контент в LLM.
- Резюмирование: Он представляет результаты, обычно используя форматирование Discourse Markdown, со ссылками на оригинальные посты и темы форума в качестве подтверждающих доказательств.

Такой методичный подход означает, что вы можете попросить исследователя выполнить такие задачи, как:

«Подведите итоги наиболее часто обсуждаемых нерешенных ошибок в категории ‘mobile-app’ за последний квартал и выявите любые предложенные решения или обходные пути, упомянутые в обсуждениях».
«Помогите мне определить основные аргументы за и против темы предложения ‘Новая онбординг-процедура для пользователей’ (ссылка) и перечислите ключевых сторонников каждой стороны».
«Проанализируйте активность группы ‘documentation-team’ за последний год и предоставьте отчет об их ключевых вкладах в статьи how-to, выделив любые учебные пособия, получившие значительную положительную обратную связь».

Настройка Исследователя форума

Исследователь форума отключен по умолчанию, поскольку его использование может повлечь за собой затраты на LLM.

Включение агента: Активируйте его, перейдя в раздел Администрирование → ИИ → Агенты.
Контроль доступа: Настоятельно рекомендуется ограничить доступ к этому агенту для определенных групп для управления затратами на LLM. Вы также можете использовать лимиты ИИ для более точного контроля.

После включения инструмент имеет несколько параметров конфигурации:

LLM: Выберите конкретную LLM для исследования. По умолчанию используется текущая LLM агента. Эта опция позволяет вам балансировать между качеством и стоимостью.
Максимальное количество результатов: Это ограничивает количество постов, обрабатываемых за один запрос, для контроля затрат. По умолчанию значение составляет 1000.
Включить приватные: Это позволяет искать в защищенных категориях, используя права доступа взаимодействующего пользователя.
Максимальное количество токенов на пост: Это обрезает длинные посты для экономии токенов. По умолчанию значение составляет 2000 токенов, минимум — 50.
Максимальное количество токенов на пакет: Это контролирует размер фрагмента данных, отправляемого в LLM. Это полезно для LLM с большими контекстными окнами или для поддержания фокуса. Если установлено значение 8000 или меньше, по умолчанию используется максимальное количество токенов промпта LLM минус буфер в 2000 токенов.

Лучшие практики взаимодействия

Чтобы получить максимум от Исследователя форума, контролируя при этом затраты:

Будьте конкретны в целях: Четко определите, что вы хотите узнать, перед началом работы. Агент работает лучше всего, когда у него есть точные цели.
Подтверждайте объем после пробного запуска: Агент обычно сначала выполняет «пробный запуск» и сообщает вам, сколько постов он нашел на основе вашего запроса. Обратите пристальное внимание на это число. Если оно слишком велико (риск высоких затрат или нерезультативных выводов) или слишком мало (возможный упуск критически важной информации), обсудите с агентом уточнение ваших фильтров перед началом полного анализа.
Итеративно настраивайте фильтры: Если начальный пробный запуск не нацелен на нужную информацию, работайте с агентом над корректировкой критериев фильтрации. Добавьте более конкретные ключевые слова, сузьте диапазоны дат или укажите категории/теги.
Объединяйте запросы: Агент разработан для обработки нескольких связанных целей в рамках одного исследовательского выполнения. Попробуйте сгруппировать связанные вопросы в один комплексный исследовательский запрос к агенту.

Отношение к стандартному помощнику форума и связанным инструментам

Агент Исследователь форума отличается от общего помощника форума, использующего стандартные инструменты, такие как Search и Read.

Стандартные инструменты Search и Read:
- Инструмент Search в первую очередь идентифицирует релевантные темы. Он делает это, сопоставляя ключевые слова с содержимым постов и другими критериями (теги, категории и т. д.). Для каждой найденной темы он возвращает ссылку и краткий фрагмент из соответствующего поста, а не полный текст поста.
- Инструмент Read используется для доступа к полному содержимому конкретной темы (или выбранных постов внутри нее), которую определил Search.
- Эти инструменты работают в тандеме для целевого извлечения: Search находит темы, Read анализирует их содержимое.
Инструмент researcher Исследователя форума:
- Прямой глубокий анализ контента: Инструмент researcher не просто идентифицирует темы; он напрямую обрабатывает и анализирует полный текст потенциально множества постов (до настроенного Максимального количества результатов), которые соответствуют его комплексным критериям фильтрации.
- Расширенная фильтрация и синтез: Он использует более сложный язык фильтрации для создания набора данных постов со всего форума (потенциально охватывающего сотни тем), а затем синтезирует информацию из всего этого набора данных для ответа на сложные вопросы. Это фундаментально отличается от чтения отдельных тем по одной.

По сути, в то время как помощник форума использует Search для точного определения тем (представляя фрагменты) и Read для углубления в одну из них, Исследователь форума проводит широкий анализ по реальному тексту множества постов одновременно, чтобы выявить более глубокие, синтезированные идеи.

Какую LLM мне использовать?

Технология LLM быстро развивается, модели постоянно совершенствуются в плане возможностей и рентабельности. В ходе разработки Исследователя форума такие модели, как Gemini 2.5 Flash, Gemini 2.5 Pro, GPT-4.1 и Claude 4 Sonnet, показали отличные результаты для сложных исследовательских планов.

Лучший выбор зависит от ваших конкретных потребностей:

Высококачественный, нюансированный анализ: Более продвинутые модели могут быть предпочтительнее, хотя они обычно стоят дороже.
Широкие обзоры или задачи с чувствительностью к стоимости: Более быстрые и экономичные модели могут быть очень эффективны.

Вот несколько примеров на конкретный момент времени из внутренних тестов Discourse для очень конкретного, сложного запроса:

Посмотрите на топ-1000 открытых тем в категории feature, отсортированных по количеству лайков (только первый пост) — за все время … составьте для меня исполнительный отчет о:

Топ-20 функций, которые должна разработать CDCK

20 самых простых функций, которые может разработать CDCK

Очевидные дубликаты

Вещи, которые определены очень плохо

не задавайте мне больше вопросов, просто запустите исследование

Гибридный пример: Драйвер — Gemini 2.5 Pro, а LLM Исследователя — Gemini 2.0 Flash
Гибридный пример

Отладка исследований

В Discourse вы можете включить расширенную отладку ИИ, добавив группы в настройку сайта ai_bot_debugging_allowed_groups. При этом вы сможете видеть реальные полезные нагрузки, отправляемые в LLM.

Ограничения

В настоящее время нет возможности отправлять изображения в исследовательскую LLM. Это будет рассмотрено в будущих версиях.

Часто задаваемые вопросы (FAQ)

Доступен ли Исследователь форума во всех тарифных планах Discourse?
Исследователь форума является частью плагина Discourse AI, который доступен для самохостинговых сайтов и в нашем плане хостинга Enterprise.
Может ли Исследователь форума получать доступ к контенту из защищенных категорий?
Да, если в его конфигурации включена опция «Включить приватные», а пользователь, взаимодействующий с агентом, имеет необходимые права доступа к этим категориям.
Как я могу контролировать стоимость использования Исследователя форума?
- Ограничьте доступ для определенных, доверенных групп.
- Используйте настройки «Максимальное количество результатов» и «Максимальное количество токенов на пост» для ограничения обработки.
- Выбирайте экономически эффективные LLM.
- Обращайте пристальное внимание на оценки «пробного запуска» перед выполнением полного исследования.
- Используйте лимиты ИИ.

Дополнительные ресурсы

BrianC · 15.Июнь.2025 01:46:43

Отличная работа и большое спасибо за стабильный прогресс в разработке персонажей Discourse AI — это действительно впечатляет.

Когда включено несколько персонажей, выпадающий список в редакторе может казаться перегруженным и запутанным для пользователей. Мне нужна небольшая помощь:

Правильно ли использовать множество персонажей в выпадающем списке для выбора пользователями?
Может ли базовый персонаж автоматически задействовать специализированные персонажи «под капотом»?
Мне кажется, что управление видимостью через права доступа, чтобы персонажи-помощники оставались скрытыми от обычных пользователей и использовались в автоматизации, приведёт к созданию нескольких постов с ответами. Было бы здорово, если бы их можно было использовать как инструменты.

Любые советы по настройке или примеры руководств по развёртыванию будут очень полезны.

jrgong · 07.Июль.2025 11:14:40

Привет, ребята,

Прежде всего, отличная работа! Мы очень ждали возможности систематизировать все знания на форуме.

Одна небольшая проблема, которую мы обнаружили:

Поскольку наш форум работает на немецком языке, иногда LLM пытаются выполнить поиск с использованием немецких кавычек, которые выглядят так: „как это“, что приводит к пустым результатам поиска.

sam · 07.Июль.2025 11:44:06

Какую LLM вы используете? Возможно, стоит скопировать персонажа и переписать системный промпт на немецком языке с подсказками.

jrgong · 07.Июль.2025 12:03:36

Я уже сделал это, даже добавил дополнительную инструкцию:

- Для уточнения параметров поиска на форуме используйте исключительно кавычки ``"``, а не ``„“``.

Но проблема всё ещё сохраняется. Это происходит с GPT 4.1 и иногда с Gemini 2.5 Pro и Flash.

Кстати, где можно найти больше информации о том, как использовать параметры topic_keywords: и keywords:? Я не смог ничего найти ни на meta, ни на ask.discourse.com. Я хочу попробовать воспроизвести поиск, который пытается выполнить LLM. При использовании этих параметров в поиске на моём форуме результатов нет (мы на версии 3.5.0.beta8-dev).

jrgong · 07.Июль.2025 12:40:27

Только что столкнулся со странным поведением в gemini 2.5 researcher:

LLM отвечает:

Я сейчас соберу информацию из этих и других вкладов, чтобы составить описание штамма. Это займёт немного времени. Я свяжусь с вами снова, как только закончу.

Но на самом деле ответ завершён, не продолжается с этого места, и его нужно вручную перезапустить, чтобы продолжить.

Может ли это быть связано с лимитами запросов?

sam · 09.Июль.2025 22:11:10

Персона исследователя не использует стандартную реализацию поиска в ядре Discourse, а использует собственную реализацию. Она анализируется, после чего мы напрямую вызываем полнотекстовый поиск.

jrgong · 09.Июль.2025 22:12:03

А, понял. Было бы неплохо иметь документацию по реализации пользовательского поиска, чтобы получить более детальный контроль над поведением поиска с помощью промптов.

sam · 09.Июль.2025 22:12:08

Это на 1000% галлюцинация со стороны LLM.

В корпусе обучающих данных это «типичный» ответ, поэтому, если мы не будем осторожны, модель может выдумывать подобные вещи

sam · 09.Июль.2025 22:16:17

Если вы включите отладку и нажмете кнопку (i), будет показан раздел промпта, где мы указываем LLM полный язык исследователя.

jrgong · 10.Июль.2025 10:39:59

Хотя я считаю отличным, что у исследователя есть пользовательские и расширенные параметры поиска, эта ситуация затрудняет ручное воспроизведение поисковых запросов, а также последующую настройку или уточнение системного промпта или отладку поиска, когда он возвращает нулевые результаты, поскольку я не могу использовать те же параметры и значения поиска во фронтенде.

Есть ли способ воспроизвести пользовательский поиск, возможно, через API?

sam · 10.Июль.2025 10:41:43

На данный момент нет, но это отличная идея, по сути это своего рода фильтр

tpetrov · 18.Сентябрь.2025 11:47:53

Отличная статья, Сэм, и действительно впечатляет, что теперь мы можем так легко использовать Discourse AI для создания собственного агента глубокого исследования!
Есть лишь одна вещь, которая меня беспокоит:

Тема		Ответов	Просм.
Support for AI Bot to Configure for a Support the community forum with latest version of Discourse Support ai	19	471	04.12.2025
Chat with forum via the AI Support ai , ai-bot	4	950	15.08.2023
Use AI to request summary and others things from topic Extras	3	258	02.02.2025
Announcing the Forum Researcher :robot: Announcements ai	1	267	06.06.2025
Discourse AI - AI Bot - a glimpse of capabilities General ai , ai-bot	4	1382	22.11.2023