Olá pessoal,
Gostaria de propor um filtro assistido por IA para respostas de baixo sinal/sem sentido (“respostas de água”, comentários genéricos de spam) dentro dos tópicos.
O problema
Em muitas comunidades de língua inglesa, os tópicos costumam ser inundados com respostas curtas e de baixo esforço, como:
- “Obrigado / legal / bom post”
- “Eu concordo”
- “Seguindo”
- “Up”
- elogios genéricos sem novas informações
Essas respostas adicionam ruído, aumentam a necessidade de rolar a tela e reduzem a experiência de leitura para todos — especialmente em threads longas.
Moderadores podem combater isso com regras e ações manuais, mas isso não escala bem. E a filtragem puramente baseada em regex tende a ter altas falsas positivas.
O que eu construí / protótipo atual
Atualmente, estou experimentando uma abordagem semelhante a um plugin:
- Pré-filtro Regex para capturar as respostas mais óbvias, curtas/evasivas
- Em seguida, passar os candidatos restantes para um LLM para classificação
- A interface do usuário deve ser transparente: mostrar quantas respostas foram ocultadas
- As respostas ocultadas devem ser visíveis sob demanda (“Mostrar respostas ocultadas”)
- (Opcional) Para conteúdo oculto, executar outra etapa do LLM para extrair 2–3 frases representativas das respostas ocultadas, para que os leitores possam ver rapidamente “o que foi ocultado” sem expandir tudo.
Mesmo apenas com regex, a experiência de leitura melhora muito (menos rolagem), mas a taxa de falsos positivos é muito alta — então acredito que o julgamento baseado em LLM é necessário.
Comportamento do produto proposto (voltado para o usuário)
Dentro de cada tópico, os leitores veriam algo como:
- “12 respostas ocultadas (Filtro de baixo sinal: Médio)”
- Botões: Mostrar respostas ocultadas / Alterar nível do filtro
E fornecer vários níveis, por exemplo:
- Desligado: mostrar tudo
- Baixo: ocultar lixo óbvio (precisão muito alta)
- Médio: ocultar respostas comuns de baixo sinal
- Alto: filtragem agressiva (o usuário opta por ativar)
Importante:
- Esta deve ser uma preferência por usuário (e talvez também configurável por categoria/padrão do site).
- O sistema deve permanecer transparente e reversível: nada é “excluído”, apenas ocultado por padrão.
Por que isso se encaixa no Discourse (especialmente agora)
O Discourse já possui vários recursos relacionados a IA e o ecossistema Discourse AI está crescendo. Eu acho que um “limpador” de respostas dentro do tópico é um dos usos mais práticos e de alto impacto dos LLMs para a experiência do usuário da comunidade.
Não é exatamente “detecção de spam” (que geralmente é em nível de conta). Isso é mais sobre qualidade de leitura em nível de tópico.
Perguntas para mantenedores / comunidade
- O Discourse já tem planos para um filtro de qualidade de resposta / baixo sinal?
- Faria sentido construir isso como uma extensão para o Discourse AI, ou como um plugin separado?
- Qual é a melhor maneira de implementar a interface/experiência do usuário para que seja transparente e não confunda os usuários?
- Alguma preocupação sobre política de moderação, níveis de confiança ou casos extremos (por exemplo, respostas curtas, mas valiosas, como “Resolvido”, “+1 com um link”, etc.)?
Se essa direção fizer sentido, ficarei feliz em compartilhar mais detalhes (regras de regex, mock da UI, ideias de prompt) e potencialmente trabalhar em um PR/plugin.
Obrigado!