Guia do Agente AI Pesquisador de Fórum

:bookmark: Este guia explica o agente Forum Researcher no Discourse AI, como ele funciona e como configurá-lo para análise aprofundada de conteúdo do fórum.

:person_raising_hand: Nível de usuário necessário: Administrador (para ativar e configurar), Todos os usuários (para interagir, se tiver acesso concedido)

Entendendo e usando o agente Forum Researcher

O plugin Discourse AI inclui o agente Forum Researcher, uma ferramenta poderosa projetada para realizar pesquisas aprofundadas sobre o conteúdo do seu fórum. Este agente pode ajudá-lo a descobrir insights, resumir discussões e analisar tendências em toda a sua comunidade.

Resumo

Este documento abordará:

  • Como o agente Forum Researcher funciona.
  • Passos para configurar o Forum Researcher.
  • Melhores práticas para interagir com o agente.
  • A distinção entre o Forum Researcher e as ferramentas padrão de ajuda do fórum.
  • Orientação sobre a seleção de um Modelo de Linguagem Grande (LLM) apropriado.
  • Dicas de depuração para tarefas de pesquisa.
  • Limitações atuais do agente.

Como funciona

O agente Forum Researcher utiliza uma ferramenta dedicada chamada Researcher. Esta ferramenta foi projetada para:

  1. Acessar conteúdo do fórum: Ela pode ler várias seções do seu fórum.
  2. Aplicar filtros avançados: Um sistema de filtros flexível permite que a ferramenta direcione informações relevantes com precisão. Você pode especificar conteúdo por:
    • Categorias específicas (por exemplo, category:suporte ou categories:suporte,feedback)
    • Tags (por exemplo, tag:bug ou tags:bug,regressão)
    • Usuários ou grupos (por exemplo, username:sam, usernames:sam,jane, group:moderadores, groups:moderadores,administradores)
    • Palavras-chave em posts ou títulos de tópicos (por exemplo, keywords:regressão,bug, topic_keywords:recurso,solicitação)
    • Intervalos de datas para posts (por exemplo, after:2024-01-01 before:2024-06-30)
    • Intervalos de datas para tópicos (por exemplo, topic_after:2024-01-01 topic_before:2024-06-30)
    • Tópicos específicos por ID (por exemplo, topic:123 ou topics:123,456)
    • Status do tópico (por exemplo, status:aberto, status:fechado, status:arquivado, status:sem_respostas, status:usuario_unico)
    • Tipo de post (por exemplo, post_type:primeiro, post_type:resposta)
    • Ordem de classificação (por exemplo, order:mais_recente, order:mais_antigo, order:mais_recente_topico, order:mais_antigo_topico, order:curtidas)
    • Limite de resultados inline (por exemplo, max_results:50)
    • Tópicos atribuídos (se o plugin de Atribuição estiver ativado, por exemplo, assigned_to:usuario, assigned_to:usuario1,usuario2, assigned_to:*, assigned_to:ninguem)
    • Filtros podem ser combinados usando lógica AND (separados por espaço) ou lógica OR (usando OR entre grupos de filtros). Por exemplo: category:bugs status:aberto after:2024-05-01 OR tag:critico usernames:sally.
  3. Analisar conteúdo com Modelos de Linguagem Grande (LLMs): Após recuperar o conteúdo filtrado, ele usa um LLM para analisar as informações, extrair insights e responder às suas perguntas específicas ou atingir seus objetivos de pesquisa.
  4. Seguir um processo estruturado: Para garantir eficiência e precisão, especialmente considerando custos potenciais, o Forum Researcher foi projetado para:
    • Entender: Ele trabalhará com você para esclarecer seus objetivos de pesquisa no início.
    • Planejar: Com base em seus objetivos, ele projeta uma abordagem de pesquisa abrangente usando os filtros disponíveis.
    • Testar (Simulação): Antes de executar a análise completa, o agente geralmente realiza uma “simulação” (dry run). Isso envolve calcular quantos posts correspondem aos seus critérios de filtro sem processá-los imediatamente com o LLM. O agente então informará essa contagem.
    • Refinar: Com base nos resultados da simulação, se o número de posts for muito grande (arriscando altos custos ou resultados excessivamente amplos) ou muito pequeno (potencialmente perdendo informações-chave), o agente pode ajudá-lo a ajustar os filtros.
    • Executar: Uma vez que você confirme que o escopo é apropriado (após a simulação), o agente executa a análise final, enviando o conteúdo para o LLM.
    • Resumir: Ele apresenta as descobertas, geralmente usando Markdown do Discourse, com links de volta para os posts e tópicos originais do fórum como evidência de apoio.

Essa abordagem metódica significa que você pode pedir ao pesquisador para realizar tarefas como:

  • “Resuma os bugs não resolvidos mais discutidos na categoria ‘mobile-app’ do último trimestre e identifique quaisquer soluções ou alternativas propostas mencionadas nas discussões.”
  • “Ajude-me a identificar os principais argumentos a favor e contra o tópico da proposta ‘Novo Onboarding de Usuários’ (link) e liste os principais defensores de cada lado.”
  • “Revise a atividade do grupo ‘documentation-team’ no último ano e forneça um relatório sobre suas principais contribuições para artigos #como-fazer, destacando quaisquer tutoriais que receberam feedback positivo significativo.”

Configurando o Forum Researcher

O Forum Researcher está desativado por padrão porque seu uso pode incorrer em custos de LLM.

  1. Ativar Agente: Ative-o navegando para Admin → AI → Agents.
  2. Controlar Acesso: É altamente recomendado limitar este agente a grupos específicos para gerenciar custos de LLM. Você também pode usar quotas de IA para controle mais fino.

Uma vez ativado, a ferramenta possui várias opções de configuração:

  • LLM: Selecione um LLM específico para pesquisa. Isso padrão para o LLM atual do agente. Esta opção permite que você equilibre qualidade e custo.
  • Número máximo de resultados: Isso limita o número de posts processados por consulta para controlar custos. O padrão é 1000.
  • Incluir privados: Isso permite pesquisar em categorias seguras, usando as permissões do usuário que interage.
  • Tokens máximos por post: Isso truncar posts longos para economizar custos de tokens. O padrão é 2000 tokens, com um mínimo de 50.
  • Tokens máximos por lote: Isso controla o tamanho do bloco de dados enviado ao LLM. É útil para LLMs com janelas de contexto grandes ou para manter o foco. Se definido para 8000 ou menos, o padrão é o máximo de tokens de prompt do LLM menos um buffer de 2000 tokens.

Melhores práticas para interação

Para obter o máximo do Forum Researcher enquanto gerencia custos:

  • Seja específico com objetivos: Defina claramente o que você quer descobrir antes de começar. O agente funciona melhor quando tem objetivos precisos.
  • Confirme o escopo após a simulação: O agente geralmente realiza uma ‘simulação’ primeiro e informa quantos posts ele encontrou com base em sua solicitação. Preste muita atenção a esse número. Se for muito alto (arriscando altos custos ou resultados sem foco) ou muito baixo (potencialmente perdendo informações cruciais), discuta o refinamento de seus filtros com o agente antes de comprometer-se com a análise completa.
  • Itere nos filtros: Se a simulação inicial não estiver direcionando as informações corretas, trabalhe com o agente para ajustar os critérios de filtro. Adicione palavras-chave mais específicas, estreite intervalos de datas ou especifique categorias/tags.
  • Consolide consultas: O agente foi projetado para lidar com múltiplos objetivos relacionados em uma única execução de pesquisa. Tente agrupar perguntas relacionadas em uma única solicitação de pesquisa abrangente ao agente.

Relação com o helper padrão do fórum e ferramentas relacionadas

O agente Forum Researcher é distinto de um Forum Helper geral que usa ferramentas padrão como Search e Read.

  • Ferramentas Search e Read Padrão:

    • A ferramenta Search identifica principalmente tópicos relevantes. Ela faz isso correspondendo palavras-chave ao conteúdo do post e outros critérios (tags, categorias, etc.). Para cada tópico correspondente, ela retorna um link e um breve trecho de um post relevante, não o conteúdo completo do post.
    • A ferramenta Read é usada para acessar o conteúdo completo de um tópico específico (ou posts selecionados dentro dele) que Search identificou.
    • Essas ferramentas funcionam em conjunto para recuperação direcionada: Search encontra tópicos, Read resume seu conteúdo.
  • Ferramenta researcher do Forum Researcher:

    • Análise de conteúdo direta e profunda: A ferramenta researcher não apenas identifica tópicos; ela processa e analisa diretamente o conteúdo completo de potencialmente muitos posts (até seu Número máximo de resultados configurado) que correspondem aos seus critérios de filtro abrangentes.
    • Filtragem e síntese avançadas: Ela usa uma linguagem de filtragem mais complexa para construir um conjunto de dados de posts de todo o fórum (potencialmente abrangendo centenas de tópicos) e, em seguida, sintetiza informações de todo esse conjunto de dados para responder a perguntas complexas. Isso é fundamentalmente diferente de ler tópicos individuais um por um.

Em essência, enquanto um Forum Helper usa Search para localizar tópicos (apresentando trechos) e Read para mergulhar em um, o Forum Researcher realiza uma análise ampla sobre o texto real de muitos posts simultaneamente para descobrir insights mais profundos e sintetizados.

Qual LLM devo usar?

A tecnologia LLM está evoluindo rapidamente, com modelos melhorando continuamente em capacidade e relação custo-benefício. Durante o desenvolvimento do Forum Researcher, modelos como Gemini 2.5 Flash, Gemini 2.5 Pro, GPT-4.1 e Claude 4 Sonnet forneceram excelentes resultados para planos de pesquisa complexos.

A melhor escolha depende de suas necessidades específicas:

  • Análise de alta qualidade e matizada: Modelos mais avançados podem ser preferíveis, embora geralmente venham com custos mais altos.
  • Visões gerais amplas ou tarefas sensíveis a custos: Modelos mais rápidos e econômicos podem ser muito eficazes.

Aqui estão alguns exemplos pontuais de testes internos no Discourse para uma consulta muito específica e complexa:

Olhe os 1000 tópicos abertos principais na categoria de recursos - ordenados por curtidas (apenas o primeiro post) - de todos os tempos … faça um relatório executivo dos:

  • Top 20 recursos que a CDCK deve construir
  • Top 20 recursos mais fáceis que a CDCK poderia construir
  • Duplicatas óbvias
  • Coisas que estão muito mal definidas

não me faça mais perguntas, apenas execute a pesquisa

  1. Exemplo Gemini 2.0 Flash
  2. Exemplo Gemini 2.5 Flash (com raciocínio)
  3. Exemplo GPT-4.1
  4. Exemplo Claude 4 Sonnet
  5. Exemplo Gemini 2.5 Pro

Exemplo híbrido: Driver é Gemini 2.5 Pro e LLM Researcher é Gemini 2.0 Flash
Exemplo híbrido

Depuração de pesquisa

No Discourse, você pode ativar a depuração avançada de IA adicionando grupos à configuração do site ai_bot_debugging_allowed_groups. Com isso em vigor, você poderá ver as cargas úteis reais enviadas ao LLM.

Limitações

Atualmente, não há opção para enviar imagens ao LLM de pesquisa. Isso será considerado em versões futuras.

Perguntas frequentes (FAQs)

  • O Forum Researcher está disponível em todos os planos do Discourse?
    O Forum Researcher faz parte do plugin Discourse AI, que está disponível para sites auto-hospedados e em nosso plano de hospedagem Enterprise.

  • O Forum Researcher pode acessar conteúdo de categorias seguras?
    Sim, se a opção “Incluir privados” estiver ativada em sua configuração e o usuário que interage com o agente tiver as permissões necessárias para acessar essas categorias.

  • Como posso controlar o custo de usar o Forum Researcher?

    • Limite o acesso a grupos específicos e confiáveis.
    • Use as configurações “Número máximo de resultados” e “Tokens máximos por post” para limitar o processamento.
    • Escolha LLMs com bom custo-benefício.
    • Preste muita atenção às estimativas da “simulação” antes de executar a pesquisa completa.
    • Utilize cotas de IA.

Recursos adicionais

18 curtidas

@sam Ótimo trabalho e muito obrigado pelo progresso constante nas personas de IA do Discourse — trabalho verdadeiramente impressionante.

Quando várias personas estão habilitadas, o menu suspenso do compositor pode parecer lotado e confuso para os usuários. Estou procurando orientação sobre a melhor forma de:

  • O uso correto é ter várias personas no menu suspenso para os usuários selecionarem?

  • É possível que uma persona padrão acesse personas especializadas nos bastidores?

  • Acho que controlar a visibilidade por meio de permissões, para que as personas de ajuda permaneçam ocultas da visualização dos usuários regulares e sejam usadas com uma automação, resultará em várias postagens de resposta. Seria ótimo se elas pudessem ser usadas como ferramentas.

Quaisquer dicas de configuração ou exemplos de diretrizes de implantação seriam úteis.

2 curtidas

Olá pessoal,

Primeiramente, um trabalho fantástico! Isto é algo que estávamos realmente esperando, poder curar todo o conhecimento do fórum.

Um pequeno problema que encontramos:

  • Como nosso fórum está em alemão, parece que o LLM tentou fazer uma busca com as aspas alemãs que parecem „assim“, o que resulta em resultados de busca vazios. Nota: Traduzimos o prompt do sistema padrão do Pesquisador para o alemão.
1 curtida

Qual LLM você está usando? Pode valer a pena copiar a persona e refazer o prompt do sistema em alemão com dicas

Eu já fiz isso, inclusive dei uma instrução extra:

- Para parâmetros de pesquisa refinados no fórum, use exclusivamente as aspas ``"`` e não ``„“``.

Mas o problema ainda persiste. Aconteceu com gpt 4.1 e ocasionalmente com gemini 2.5 pro e flash.

A propósito, onde posso encontrar mais informações sobre como usar os parâmetros topic_keywords: e keywords:? Não encontrei nada no meta nem no ask.discourse.com. Quero tentar replicar a pesquisa que o LLM está tentando realizar. Não obtenho resultados de pesquisa quando os uso na pesquisa do meu fórum (estamos na versão 3.5.0.beta8-dev).

Acabei de encontrar um comportamento estranho com o pesquisador gemini 2.5:

O LLM responde:

Compilarei agora as informações destas e de outras contribuições para elaborar a descrição da cepa. Isso levará um momento. Entrarei em contato novamente assim que concluir.

Mas a resposta na verdade está finalizada e não continua a partir daqui, tendo que ser reativada manualmente para prosseguir

A persona do pesquisador não usa a implementação de pesquisa principal do Discourse, ela usa uma implementação personalizada, isso é analisado e então chamamos a pesquisa de texto completo diretamente.

Ah, entendi. Seria bom ainda ter alguma documentação sobre isso para ter um controle mais granular sobre o comportamento da busca via prompts.

1 curtida

Isso é 1000% uma alucinação de um LLM.

No corpus de dados de treinamento, esta é uma resposta “comum”, então, se não formos cuidadosos, ele pode inventar esse tipo de coisa :frowning:

2 curtidas

Nova atualização para Minecraft adiciona templos subaquáticos

Embora eu ache ótimo que a persona de pesquisador receba parâmetros de busca personalizados e avançados, esta circunstância torna difícil reproduzir manualmente as consultas de busca e, em seguida, personalizar ou refinar o prompt do sistema ou depurar a busca quando ela retorna zero resultados, já que não consigo usar os mesmos parâmetros e valores de busca no front-end. Existe alguma maneira de reproduzir a busca personalizada, talvez via API?

1 curtida

No momento não, mas é uma ótima ideia, essencialmente isto é um tipo de filtro

2 curtidas

Ótima redação, Sam, e é realmente impressionante que agora possamos usar o Discourse AI para construir algo como nosso próprio agente de Pesquisa Profunda com tanta facilidade!
Há apenas uma coisa que me preocupa:
image :open_mouth:

3 curtidas