Discourse está pronto para agentes: veja como

Discourse · Maio 22, 2026, 3:12am

O público dos fóruns está mudando. Alguns dos seus leitores não são mais leitores de verdade — não no sentido tradicional. Eles são agentes que leem em nome de alguém, resumindo seu conteúdo em uma resposta para uma pessoa que talvez nunca clique no link ou se torne um membro de fato. Seja você um administrador de uma comunidade de suporte a desenvolvedores, um fórum de clientes ou um clube de fãs, seu conhecimento está sendo extraído para respostas de IA neste exato momento.

Este é um tópico de discussão complementar para a entrada original em https://blog.discourse.org/2026/05/discourse-is-agent-ready-heres-how/

eisammy · Maio 22, 2026, 1:20pm

Pergunta genuína: por que eu deveria deixar que os crawlers de IA inundem meu servidor? Claro que o artigo deixa claro que a escolha sempre será minha, mas, partindo da perspectiva comercial da coisa e usando o Reddit como exemplo de como eles lidam com scraping de IA, quais seriam os benefícios aqui?

Recentemente vi que o Google vai criar páginas personalizadas de acordo com o histórico de seus usuários, ou seja, menos cliques para os webmasters e mais dinheiro para a Alphabet. Então, de novo, qual é o ponto aqui?

Atualmente, eu permito que buscadores e indexadores de cache, como o Wayback Machine, leiam e façam o cache do meu conteúdo, embora eu não consiga visualizar nada senão o fornecimento do conteúdo dos meus usuários para que a Alphabet e companhia monetizem em cima sem que minha comunidade se beneficie de nada, fora que há questões legais como no meu país é o LGDP ou na Europa o GDPR.

Lilly · Maio 22, 2026, 1:22pm

Isso parece ter sido escrito por uma IA para fóruns diferentes do Discourse:

Isso é confuso. Foi revisado por um membro humano da equipe?

Canapin · Maio 22, 2026, 1:37pm

Obrigado pela leitura interessante!

Sem dúvida, uma das melhores funcionalidades do Discourse.
Eu me encolho toda vez que procuro por uma URL que retorne dados em qualquer outro site e descubro que não há nenhuma.

Seria ótimo se você pudesse sempre incluir links para suas fontes em afirmações como essa. Isso ajudaria os leitores a verificar os dados

awesomerobot · Maio 22, 2026, 1:52pm

Isso depende do propósito do seu fórum. Se for, por exemplo, um fórum de marca ou de suporte, seu objetivo pode ser simplesmente fornecer uma resposta às pessoas o mais rápido possível. Se o conteúdo for incorporado ao treinamento de IA, isso pode ser benéfico. Esperemos que, se for realmente um problema não resolvido, as pessoas ainda encontrem seu site para perguntar sobre isso, mas isso ainda é desafiador se elas recorrerem primeiro à IA.

Em um contexto mais social, os raspadores de IA são quase inteiramente inúteis, pois você deseja que as pessoas da sua comunidade interajam entre si. Esse pode ser um bom caso para tentar bloqueá-los completamente.

Orioni · Maio 22, 2026, 2:34pm

Do meu próprio ponto de vista profissional, trabalhando com IA e SEO, o impacto e a importância do llms.txt ainda não foram comprovados. Recentemente, o Google declarou que não está usando nem dando suporte a ele. Isso não significa que outros agentes também não o farão. Mas é uma nuance que achei importante compartilhar.

darkpixlz · Maio 22, 2026, 6:27pm

Eu simplesmente não permito. É minha opinião pessoal, mas os LLMs sempre foram proibidos de acessar meus sites e sempre serão. Não gosto de doar meu trabalho árduo, seja texto ou código, para raspadores, especialmente os da OpenAI ou Anthropic.

A maioria dos meus domínios possui arquivos como estes:
https://pyxfluff.dev/robots.txt
https://pyxfluff.dev/llms.txt

Obviamente, tudo isso é apenas uma preferência pessoal, mas toda essa febre de IA acabaria assim que as pessoas parassem de permitir que essas empresas roubem o conteúdo de seus sites. Talvez a última atualização do Google, contra a qual tantas pessoas se opõem, faça os donos de sites perceberem que, agora, não terão mais nenhum acesso ao seu site.

awesomerobot · Maio 22, 2026, 6:42pm

Infelizmente, não há uma maneira infalível de bloquear os raspadores de LLM se o conteúdo do seu site for publicamente acessível. Muitos deles ignoram o robots.txt e até tentam se passar por visitantes humanos (usando diferentes user agents e endereços IP) para contornar os bloqueios. Espera-se que algum tipo de regulamentação legal possa estabelecer limites para a situação, pois parece que muitas pessoas gostariam de ter a escolha de saber se seu conteúdo é usado dessa forma ou não!

ted · Maio 24, 2026, 12:21pm

Considerando que a regulamentação legal existente, como licenças e direitos autorais, tem sido totalmente ignorada, eu não manteria minhas esperanças altas. Mesmo que uma empresa como o Google seja processada em uma ação coletiva e multada em dezenas de bilhões, ainda seria apenas uma gota no oceano em comparação aos centenas de bilhões que investiram em LLMs. A dinâmica da lei de potência de “o vencedor leva a maior parte” torna o crime extremamente lucrativo para essas empresas.

Eviepayne · Maio 24, 2026, 10:08pm

Acho que tornar o Anubis um captcha suportado deve vir com esta atualização.

Tópico		Respostas	Visualizações
How to prevent community content from being used to train LLMs like ChatGPT? Community Building	69	4840	16 de Julho de 2023
AI Citations - Does Discourse allow AI bot crawling? Support	10	253	12 de Agosto de 2025
SEO for AI: How Community Content Wins in New Search Blog	6	632	8 de Setembro de 2025
How do you use Discourse AI? Tell us and make it even better! Feature feedback , ai	20	2643	2 de Março de 2025
I populated my (mostly-dead) Discourse forum with bots! General show-and-tell	15	510	3 de Maio de 2026

Discourse está pronto para agentes: veja como

Tópicos relacionados