Это руководство объясняет, что такое агент «Исследователь форума» в Discourse AI, как он работает и как настроить его для глубокого анализа контента форума.>
Требуемый уровень пользователя: Администратор (для включения и настройки), Все пользователи (для взаимодействия, если предоставлен доступ)
Понимание и использование агента «Исследователь форума»
Плагин Discourse AI включает в себя агента Исследователь форума — мощный инструмент, предназначенный для проведения углубленного исследования контента внутри вашего форума. Этот агент поможет вам выявить важные идеи, подвести итоги обсуждений и проанализировать тенденции в вашем сообществе.
Краткое содержание
В этом документе рассматриваются следующие темы:
- Как работает агент «Исследователь форума».
- Шаги по настройке Исследователя форума.
- Лучшие практики взаимодействия с агентом.
- Различия между Исследователем форума и стандартными инструментами помощника форума.
- Рекомендации по выбору подходящей большой языковой модели (LLM).
- Советы по отладке исследовательских задач.
- Текущие ограничения агента.
Как это работает
Агент «Исследователь форума» использует специализированный инструмент Researcher. Этот инструмент разработан для:
- Доступа к контенту форума: Он может просматривать различные разделы вашего форума.
- Применения расширенных фильтров: Гибкая система фильтров позволяет инструменту точно нацеливаться на релевантную информацию. Вы можете указать контент по:
- Конкретным категориям (например,
category:supportилиcategories:support,feedback) - Тегам (например,
tag:bugилиtags:bug,regression) - Пользователям или группам (например,
username:sam,usernames:sam,jane,group:moderators,groups:moderators,admins) - Ключевым словам в постах или заголовках тем (например,
keywords:regression,bug,topic_keywords:feature,request) - Даты постов (например,
after:2024-01-01 before:2024-06-30) - Даты тем (например,
topic_after:2024-01-01 topic_before:2024-06-30) - Конкретным темам по ID (например,
topic:123илиtopics:123,456) - Статусу темы (например,
status:open,status:closed,status:archived,status:noreplies,status:single_user) - Типу поста (например,
post_type:first,post_type:reply) - Порядку сортировки (например,
order:latest,order:oldest,order:latest_topic,order:oldest_topic,order:likes) - Ограничению количества результатов в строке (например,
max_results:50) - Назначенным темам (если включен плагин Assign, например,
assigned_to:username,assigned_to:user1,user2,assigned_to:*,assigned_to:nobody) - Фильтры можно комбинировать с помощью логики AND (разделенные пробелом) или логики OR (используя
ORмежду группами фильтров). Например:category:bugs status:open after:2024-05-01 OR tag:critical usernames:sally.
- Конкретным категориям (например,
- Анализа контента с помощью больших языковых моделей (LLM): После получения отфильтрованного контента он использует LLM для анализа информации, извлечения идей и ответа на ваши конкретные вопросы или достижения исследовательских целей.
- Следования структурированному процессу: Для обеспечения эффективности и точности, особенно с учетом потенциальных затрат, Исследователь форума спроектирован следующим образом:
- Понимание: Он будет работать с вами, чтобы прояснить ваши исследовательские цели в начале.
- Планирование: На основе ваших целей он разрабатывает комплексный исследовательский подход с использованием доступных фильтров.
- Тестирование (пробный запуск): Перед выполнением полного анализа агент обычно выполняет «пробный запуск». Это включает в себя расчет количества постов, соответствующих вашим критериям фильтрации, без их немедленной обработки с помощью LLM. Затем агент сообщит вам об этом количестве.
- Уточнение: На основе результатов пробного запуска, если количество постов слишком велико (риск высоких затрат или слишком широких результатов) или слишком мало (возможный упуск ключевой информации), агент может помочь вам настроить фильтры.
- Выполнение: После того как вы подтвердите, что объем работы подходит (после пробного запуска), агент запустит окончательный анализ, отправив контент в LLM.
- Резюмирование: Он представляет результаты, обычно используя форматирование Discourse Markdown, со ссылками на оригинальные посты и темы форума в качестве подтверждающих доказательств.
Такой методичный подход означает, что вы можете попросить исследователя выполнить такие задачи, как:
- «Подведите итоги наиболее часто обсуждаемых нерешенных ошибок в категории ‘mobile-app’ за последний квартал и выявите любые предложенные решения или обходные пути, упомянутые в обсуждениях».
- «Помогите мне определить основные аргументы за и против темы предложения ‘Новая онбординг-процедура для пользователей’ (ссылка) и перечислите ключевых сторонников каждой стороны».
- «Проанализируйте активность группы ‘documentation-team’ за последний год и предоставьте отчет об их ключевых вкладах в статьи how-to, выделив любые учебные пособия, получившие значительную положительную обратную связь».
Настройка Исследователя форума
Исследователь форума отключен по умолчанию, поскольку его использование может повлечь за собой затраты на LLM.
- Включение агента: Активируйте его, перейдя в раздел Администрирование → ИИ → Агенты.
- Контроль доступа: Настоятельно рекомендуется ограничить доступ к этому агенту для определенных групп для управления затратами на LLM. Вы также можете использовать лимиты ИИ для более точного контроля.
После включения инструмент имеет несколько параметров конфигурации:
- LLM: Выберите конкретную LLM для исследования. По умолчанию используется текущая LLM агента. Эта опция позволяет вам балансировать между качеством и стоимостью.
- Максимальное количество результатов: Это ограничивает количество постов, обрабатываемых за один запрос, для контроля затрат. По умолчанию значение составляет 1000.
- Включить приватные: Это позволяет искать в защищенных категориях, используя права доступа взаимодействующего пользователя.
- Максимальное количество токенов на пост: Это обрезает длинные посты для экономии токенов. По умолчанию значение составляет 2000 токенов, минимум — 50.
- Максимальное количество токенов на пакет: Это контролирует размер фрагмента данных, отправляемого в LLM. Это полезно для LLM с большими контекстными окнами или для поддержания фокуса. Если установлено значение 8000 или меньше, по умолчанию используется максимальное количество токенов промпта LLM минус буфер в 2000 токенов.
Лучшие практики взаимодействия
Чтобы получить максимум от Исследователя форума, контролируя при этом затраты:
- Будьте конкретны в целях: Четко определите, что вы хотите узнать, перед началом работы. Агент работает лучше всего, когда у него есть точные цели.
- Подтверждайте объем после пробного запуска: Агент обычно сначала выполняет «пробный запуск» и сообщает вам, сколько постов он нашел на основе вашего запроса. Обратите пристальное внимание на это число. Если оно слишком велико (риск высоких затрат или нерезультативных выводов) или слишком мало (возможный упуск критически важной информации), обсудите с агентом уточнение ваших фильтров перед началом полного анализа.
- Итеративно настраивайте фильтры: Если начальный пробный запуск не нацелен на нужную информацию, работайте с агентом над корректировкой критериев фильтрации. Добавьте более конкретные ключевые слова, сузьте диапазоны дат или укажите категории/теги.
- Объединяйте запросы: Агент разработан для обработки нескольких связанных целей в рамках одного исследовательского выполнения. Попробуйте сгруппировать связанные вопросы в один комплексный исследовательский запрос к агенту.
Отношение к стандартному помощнику форума и связанным инструментам
Агент Исследователь форума отличается от общего помощника форума, использующего стандартные инструменты, такие как Search и Read.
-
Стандартные инструменты
SearchиRead:- Инструмент
Searchв первую очередь идентифицирует релевантные темы. Он делает это, сопоставляя ключевые слова с содержимым постов и другими критериями (теги, категории и т. д.). Для каждой найденной темы он возвращает ссылку и краткий фрагмент из соответствующего поста, а не полный текст поста. - Инструмент
Readиспользуется для доступа к полному содержимому конкретной темы (или выбранных постов внутри нее), которую определилSearch. - Эти инструменты работают в тандеме для целевого извлечения:
Searchнаходит темы,Readанализирует их содержимое.
- Инструмент
-
Инструмент
researcherИсследователя форума:- Прямой глубокий анализ контента: Инструмент
researcherне просто идентифицирует темы; он напрямую обрабатывает и анализирует полный текст потенциально множества постов (до настроенногоМаксимального количества результатов), которые соответствуют его комплексным критериям фильтрации. - Расширенная фильтрация и синтез: Он использует более сложный язык фильтрации для создания набора данных постов со всего форума (потенциально охватывающего сотни тем), а затем синтезирует информацию из всего этого набора данных для ответа на сложные вопросы. Это фундаментально отличается от чтения отдельных тем по одной.
- Прямой глубокий анализ контента: Инструмент
По сути, в то время как помощник форума использует Search для точного определения тем (представляя фрагменты) и Read для углубления в одну из них, Исследователь форума проводит широкий анализ по реальному тексту множества постов одновременно, чтобы выявить более глубокие, синтезированные идеи.
Какую LLM мне использовать?
Технология LLM быстро развивается, модели постоянно совершенствуются в плане возможностей и рентабельности. В ходе разработки Исследователя форума такие модели, как Gemini 2.5 Flash, Gemini 2.5 Pro, GPT-4.1 и Claude 4 Sonnet, показали отличные результаты для сложных исследовательских планов.
Лучший выбор зависит от ваших конкретных потребностей:
- Высококачественный, нюансированный анализ: Более продвинутые модели могут быть предпочтительнее, хотя они обычно стоят дороже.
- Широкие обзоры или задачи с чувствительностью к стоимости: Более быстрые и экономичные модели могут быть очень эффективны.
Вот несколько примеров на конкретный момент времени из внутренних тестов Discourse для очень конкретного, сложного запроса:
Посмотрите на топ-1000 открытых тем в категории feature, отсортированных по количеству лайков (только первый пост) — за все время … составьте для меня исполнительный отчет о:
- Топ-20 функций, которые должна разработать CDCK
- 20 самых простых функций, которые может разработать CDCK
- Очевидные дубликаты
- Вещи, которые определены очень плохо
не задавайте мне больше вопросов, просто запустите исследование
- Пример Gemini 2.0 Flash
- Пример Gemini 2.5 Flash (с мышлением)
- Пример GPT-4.1
- Пример Claude 4 Sonnet
- Пример Gemini 2.5 Pro
Гибридный пример: Драйвер — Gemini 2.5 Pro, а LLM Исследователя — Gemini 2.0 Flash
Гибридный пример
Отладка исследований
В Discourse вы можете включить расширенную отладку ИИ, добавив группы в настройку сайта ai_bot_debugging_allowed_groups. При этом вы сможете видеть реальные полезные нагрузки, отправляемые в LLM.
Ограничения
В настоящее время нет возможности отправлять изображения в исследовательскую LLM. Это будет рассмотрено в будущих версиях.
Часто задаваемые вопросы (FAQ)
-
Доступен ли Исследователь форума во всех тарифных планах Discourse?
Исследователь форума является частью плагина Discourse AI, который доступен для самохостинговых сайтов и в нашем плане хостинга Enterprise. -
Может ли Исследователь форума получать доступ к контенту из защищенных категорий?
Да, если в его конфигурации включена опция «Включить приватные», а пользователь, взаимодействующий с агентом, имеет необходимые права доступа к этим категориям. -
Как я могу контролировать стоимость использования Исследователя форума?
- Ограничьте доступ для определенных, доверенных групп.
- Используйте настройки «Максимальное количество результатов» и «Максимальное количество токенов на пост» для ограничения обработки.
- Выбирайте экономически эффективные LLM.
- Обращайте пристальное внимание на оценки «пробного запуска» перед выполнением полного исследования.
- Используйте лимиты ИИ.



