Dicas para Prevenir Spam

:bookmark: Esta documentação fornece um guia abrangente sobre como prevenir spam em fóruns Discourse, incluindo informações sobre várias configurações e ferramentas projetadas para ajudar a manter um ambiente comunitário livre de spam.

:person_raising_hand: Nível de usuário necessário: Administrador

Na maioria dos fóruns, o spam é raro. No entanto, se você estiver enfrentando problemas com spam no seu site, o Discourse oferece inúmeras ferramentas para ajudar a prevenir automaticamente o spam.

O guia a seguir oferece algumas recomendações sobre como você pode ajudar a prevenir spam, mantendo ao mesmo tempo um ambiente positivo e acolhedor para sua comunidade.

Detecção de Spam com Discourse AI

A Detecção de Spam com IA é uma das melhores funcionalidades do Discourse para detecção automatizada de spam. Diferente de outras ferramentas, ela pode bloquear automaticamente usuários e publicações com base em regras pré-configuradas. A Detecção de Spam com IA está disponível para todos os usuários no hospedagem Discourse e em sites auto-hospedados com um LLM configurado.

Os benefícios da Detecção de Spam com IA incluem:

  • Automação: Nenhuma intervenção manual é necessária para bloquear spam óbvio.
  • Personalização: Você pode adaptá-la às necessidades exclusivas da sua comunidade.
  • Escalabilidade: Funciona bem mesmo quando as comunidades estão sob ataques pesados de spam.
  • Ampla compatibilidade: LLMs gratuitos (na hospedagem Discourse) e de baixo custo, como GPT-4, Claude 3.5 e Gemini Flash, podem lidar com a detecção de spam de forma eficaz.

Configurando a detecção de spam com IA

:megaphone: Isso agora está ativado por padrão para clientes Starter e Standard

Basta ativá-lo nas Configurações de Admin → plugins → IA → Tratamento de Spam (detalhes aqui).

Por padrão, ele usa um prompt que o Discourse adaptou para nossos sites, mas você pode adicionar instruções personalizadas específicas do seu site.

Exemplo de prompt personalizado

:information_source: Com o Discourse AI, você também pode usar o bot criativo de IA para gerar prompts personalizados específicos às necessidades do seu site.

Níveis de Confiança Padrão

O nível de confiança padrão para novos usuários no seu site pode ser ajustado na página .../admin/site_settings/category/trust. No entanto, recomendamos manter o nível de confiança padrão definido como 0.

Se você modificou o valor dessa configuração, recomendamos fortemente alterá-lo de volta para 0: novo usuário, pois alterar essa configuração pode colocar seu site em sério risco de spam, devido à forma como os níveis de confiança interagem com as configurações relacionadas ao spam do Discourse.

Configurações de Site Relacionadas ao Spam

:warning: A menos que você esteja enfrentando especificamente problemas com spam, recomendamos manter as seguintes configurações em seus valores padrão.

O Discourse possui várias configurações de site relacionadas ao spam que você pode acessar na página .../admin/config/spam do seu site.

Essas configurações podem ser ajustadas para aumentar ou diminuir a sensibilidade da detecção de spam e a rigidez das consequências associadas à publicação de spam.

A seguir, algumas das configurações relacionadas ao spam mais comumente ajustadas que têm um impacto notável na forma como o spam é tratado em um site.

Os valores padrão para todas as configurações são mostrados abaixo.

Ocultando Publicações

As configurações sensibilidade para ocultar publicação e minutos de resfriamento após ocultar publicações controlam a probabilidade de uma publicação sinalizada ser ocultada automaticamente pelo Discourse e quanto tempo um usuário deve esperar antes de poder editar uma publicação sinalizada e oculta.

Silenciando Novos Usuários

O Discourse possui uma configuração de site número de usuários para silenciar novo usuário, que silenciará automaticamente um novo usuário se suas publicações forem sinalizadas como spam por um determinado número de usuários únicos.

Por padrão, isso está definido como 3, então você pode considerar reduzir esse valor se estiver consistentemente tendo problemas com spam vindo do mesmo usuário(s).

Limitando Links

O Discourse limita o número de publicações que um novo usuário pode fazer que contenham links para um domínio externo com a configuração newuser spam host threshold. Se os novos usuários no seu site estiverem frequentemente enviando spam com links para o mesmo domínio, você pode considerar reduzir o valor dessa configuração.

Limitando Endereços IP

O Discourse limita o número de novas contas que um usuário pode criar a partir de qualquer endereço IP dado. Se você estiver encontrando que usuários problemáticos no seu site estão criando contas repetidamente para fazer spam no seu site, você pode considerar reduzir esse valor do padrão.

Também há uma caixa de seleção flag sockpuppets que você pode ativar para impedir que usuários criem múltiplas contas e depois comentem no mesmo tópico:

Além disso, você pode consultar manualmente os endereços IP de usuários problemáticos em sua página de admin nos campos Último Endereço IP e Endereço IP de Registro e excluir outras contas associadas ao mesmo endereço IP.

Ou considere bloquear os endereços IP que os spammers estão usando na página “Logs → IPs Filtrados” (.../admin/logs/screened_ip_addresses):

Ajustando Requisitos de Sinalização

Por padrão, um tópico precisa ser sinalizado por 5 usuários únicos antes que o Discourse suspenda automaticamente a publicação nesse tópico.

Você pode ajustar a configuração de site número de sinalizadores para fechar tópico para aumentar ou diminuir o número de sinalizadores necessários para suspender a publicação em um tópico e ajustar a configuração sensibilidade de fechamento automático de tópico para alterar a probabilidade de o tópico em questão ser fechado automaticamente.

Palavras Monitoradas

Palavras Monitoradas são outra excelente funcionalidade para ajudar a bloquear ou limitar publicações que contenham palavras, frases ou links de URL que spammers possam estar usando repetidamente.

Considere adicionar algumas palavras “Bloqueadas” ou “Silenciadas” ao seu site se você estiver percebendo que spammers estão frequentemente usando os mesmos tipos de texto em suas publicações.

Para um uso mais avançado de Palavras Monitoradas, você também pode considerar Usando Regex com Palavras Monitoradas.

Aumentar Requisitos de Nível de Confiança

Se você estiver percebendo que o spam está vindo principalmente de usuários TL0, você também pode querer ajustar algumas configurações de nível de confiança para tornar mais difícil alcançar o TL1:

Plugin hCaptcha

O plugin Discourse hCaptcha visa aprimorar a segurança e a proteção contra bots integrando o hCaptcha ao formulário local de cadastro.

:sparkles: Em todos os sites hospedados no Discourse, este plugin está automaticamente incluído.

Passos Adicionais

Entender por que os usuários estão fazendo spam no seu site é importante. Eles estão entediados, mal-intencionados ou tentando se promover?

Sugestões para lidar com o usuário difícil, juntamente com uma variedade de outros tópicos de moderação, podem ser encontrados no guia de moderação do Discourse, então você pode querer ler este guia para obter algumas ideias adicionais sobre como moderar seu site.

Além do acima exposto, aumentar sua equipe de moderação por um curto período, para que você tenha cobertura total, é outra boa abordagem para combater o spam. A chave é desgastar os usuários problemáticos até que eles se cansem e sigam em frente.

Se você estiver continuamente tendo problemas com spam após seguir este guia, também pode considerar colocar todas ou algumas publicações de novos usuários na fila de revisão com as configurações aprovar contagem de publicações, aprovar a menos que grupos permitidos ou aprovar novos tópicos a menos que grupos permitidos:

A configuração aprovar a menos que grupos permitidos exige que publicações criadas por usuários que não estão nos grupos especificados sejam aprovadas. Publicações criadas por administradores e moderadores são sempre aprovadas.

A configuração aprovar novos tópicos a menos que grupos permitidos exige que novos tópicos criados por usuários que não estão nos grupos especificados sejam aprovados. Tópicos criados por administradores e moderadores são sempre aprovados.

No entanto, é importante garantir que você tenha moderadores suficientes à mão para lidar com isso, pois isso pode potencialmente dificultar que novos usuários comecem a interagir com o site se as publicações não forem aprovadas.

18 curtidas

Não posso falar por todos os fóruns, mas em um fórum em que eu era TL3, havia pelo menos um post de spam ainda ativo quando fiz login pela primeira vez no dia nas minhas categorias observadas. E no fórum em que sou moderador atualmente, recebemos em média 2 posts de spam por dia. Portanto, acho que é algo relativamente comum em muitos fóruns, com base nisso.

5 curtidas

Uma expressão regular muito útil é \\d{3}-\\d{4}|[\\w+\\-.]+@[a-z\\d\\-]+(\\.[a-z\\d\\-]+)*\\.[a-z]+ que bloqueia endereços de e-mail e números de telefone. Não se esqueça de ativar as configurações - postagem - “expressões regulares de palavras monitoradas”.

7 curtidas

Olá :wave:

Tenho aproveitado muito estas dicas no meu fórum, então… obrigado! :heart:

Existe alguma configuração que possa ser ativada para que apenas novos usuários que se cadastram a partir de um domínio gmail.com, por exemplo, sejam enviados para a fila de revisão?

Atualmente, todos os novos usuários são enviados para a fila para revisão, mas descobri que a maioria dos usuários de spam são aqueles criados com um e-mail do Gmail. Enviar apenas esses para a fila de revisão reduziria a carga e o tempo de revisão, pelo menos para mim :sweat_smile:

1 curtida

@SaraDev Você sabe se isso é possível? Eu também adoraria saber, pois seria muito útil bloquear não apenas IPs, mas domínios específicos!

1 curtida

Não há um recurso principal do Discourse para enviar postagens apenas de usuários de um domínio específico (por exemplo, gmail.com) para a fila de revisão.

O recurso mais próximo relacionado é a configuração do site domínios de e-mail para aprovação automática, que permite que certos domínios de e-mail ignorem o processo manual de aprovação de usuários, aprovando automaticamente os usuários desses domínios.

Também existem configurações para domínios de e-mail bloqueados e domínios de e-mail permitidos que fornecem uma maneira de restringir ou controlar quem pode se registrar em seu site com base em seus domínios de e-mail:

No entanto, todas essas configurações exigiriam que a configuração deve aprovar usuários estivesse habilitada e afetariam apenas os usuários que estão se registrando inicialmente em um site, e não a interação entre a criação de postagens e a fila de revisão.

Como uma solução alternativa, você poderia usar Grupos para realizar uma funcionalidade semelhante. Por exemplo, você poderia criar um grupo personalizado e adicionar automaticamente usuários que se registram com um endereço de e-mail específico ao grupo, e então adicionar este grupo à configuração aprovar a menos que grupos permitidos e aprovar novos tópicos a menos que grupos permitidos.

Com esse tipo de configuração, você poderia efetivamente contornar a fila de revisão para usuários com um domínio específico, enquanto ainda envia outras postagens para a fila de revisão, se desejar.

2 curtidas

Olá, eu estava me perguntando se é possível forçar um captcha na criação de tópicos e/ou posts?

Não sei, mas o que ajuda se um bot puder contornar o captcha ao fazer login? Então ele pode fazer o mesmo ao publicar.

Verdade, mas parece haver suporte a captcha para registro, então eu estava me perguntando se o mesmo existe para a criação de tópicos/posts.

Temos visto vários clientes serem atingidos por grandes ataques de spam ultimamente, e o que todos eles tinham em comum é que abriram uma ou mais categorias para todos - criar, contornando todas as restrições de nível de confiança.

Para administradores experientes do Discourse, é óbvio que esta é uma má ideia, mas para pessoas menos experientes não é. Portanto, pode ser uma boa ideia afirmar o (para nós) óbvio e adicionar isso à postagem inicial do tópico.

7 curtidas

Ultimamente, temos lidado com spammers que usam registro automático e, em seguida, tentam criar novos tópicos com conteúdo gerado por IA que se parece com solicitações genuínas de conselhos, mas inclui links de afiliados da Amazon. Eles geralmente mascaram esses links com vários mecanismos de encurtamento de URL. Eles são capazes de responder a réplicas e até mesmo conversar em PM de forma engraçada. Alguém já passou por isso? Eu me pergunto se, como essas tentativas parecem ser totalmente automatizadas, haveria muitos outros fóruns do Discourse visados. Você tem algum conselho sobre uma estratégia para cortá-los?

1 curtida

Olá @Overgrow,

Algumas ideias que você pode tentar aqui para evitar isso:

  • Use Discourse AI - Triagem de IA para Configurar detecção de spam em sua comunidade para detectar esse tipo de conteúdo
  • Adicione encurtadores de URL e padrões de links de afiliados da Amazon à sua lista de palavras monitoradas bloqueadas
  • Reduza o limiar de spam de novos usuários por host e aumente os requisitos para TL1
  • Reduza máximo de novas contas por IP de registro e ative marcar contas falsas
  • Use o plugin Discourse hCaptcha para ajudar a prevenir registros automatizados de spam/IA em seu site.
  • Considere colocar todo o conteúdo de novos usuários na fila de revisão até que o ataque diminua, ajustando:
    • contagem de postagens aprovadas
    • aprovar a menos que nível de confiança
    • aprovar novos tópicos a menos que nível de confiança

A abordagem aqui será semelhante à prevenção de spam em geral, com mais foco especificamente em URLs encurtados e conteúdo gerado por IA.

Para o seu caso aqui, você pode tentar usar um prompt de IA especificamente para detectar conteúdo de IA como o seguinte:

Você é um sistema de detecção de spam. Analise o seguinte conteúdo e contexto.

Notas:
- As respostas devem permanecer relevantes ao tópico da discussão.
- Marque como SPAM se o conteúdo for irrelevante, promocional ou automatizado.
- Considere postagens de novos usuários com links como SPAM potencial, a menos que explicitamente relevantes ao tópico.

Procure por conteúdo que pareça autêntico, mas tenha padrões não naturais.
Procure por textos com frases peculiares, formalidade excessiva misturada com
linguagem casual, ou conselhos genéricos que não se encaixam bem no contexto.
Marque o conteúdo que contém links de afiliados ocultos, especialmente quando a postagem
parece projetada para levar naturalmente a recomendações de produtos.

Preste atenção especial a estas bandeiras vermelhas:
1. Conteúdo que se apresenta como solicitações genuínas de conselhos, mas contém elementos promocionais
2. Postagens que introduzem um problema e, em seguida, sugerem produtos específicos como soluções
3. A presença de encurtadores de URL (bit.ly, tinyurl, t.co, goo.gl, etc.) que podem disfarçar links de afiliados
4. Links ou referências de produtos da Amazon, especialmente com parâmetros de afiliados (tag=, ref=, affiliate=)
5. Conteúdo que parece pedir recomendações, mas sutilmente direciona para produtos específicos
6. Texto de qualidade artificial - linguagem excessivamente formal misturada com expressões casuais ou estrutura estranha
7. Novas contas postando conteúdo com qualquer um dos padrões acima

Responda apenas com "SPAM" ou "NÃO SPAM".
3 curtidas

Tenho tido muitos problemas com contas de bots ultimamente. Tive que desativar o registro de novos usuários pela segunda vez. Ontem tive que excluir cerca de 50 contas de bots com aproximadamente 30 posts de spam. Já ativei o hcaptcha com um quebra-cabeça difícil, mas isso não os impediu. Estava na versão 3.5.0, mas acabei de atualizar para a 3.6.0 logo após o ataque. Já não permitimos links no nível de confiança 0 e exigimos 30 posts antes de permitir links, mas esses posts são apenas paredes de texto sobre agentes de viagens e outras bobagens aleatórias. Também tive contas e posts de IA que se referem ao conteúdo real do fórum, mas não fazem muito sentido. Estes são um tanto divertidos para a nossa base de usuários, mas, de qualquer forma, eu não queria ativar a IA no fórum, mas sinto que esgotei todas as outras opções. No entanto, recebo esta mensagem:

Mas não vejo onde adicionar essa configuração?

Acima de tudo, embora a IA possa ajudar com o spam, não acho que habilitá-la ajudará na criação das contas de bot em primeiro lugar, ou estou enganado?

1 curtida

Se approve post count for definido como 1. Então, modificar estes ainda é necessário?

Eu honestamente não sei a resposta para essa pergunta.

Sim, se approve_post_count for definido como 1, você ainda deve revisar essas outras configurações.

Como essas configurações interagem:

approve_post_count (definido como 1):

  • Afeta usuários com nível de confiança 0 e 1
  • Requer que a primeira postagem deles seja aprovada
  • Após 1 postagem aprovada, eles podem postar livremente (assumindo que ainda estão no TL0 ou TL1)

approve_unless_allowed_groups (anteriormente approve_unless_trust_level):

  • Afeta todos que não estão nos grupos especificados

  • Requer a aprovação de todas as postagens (não apenas a primeira)

  • approve_new_topics_unless_allowed_groups (anteriormente approve_new_topics_unless_trust_level):

  • Afeta todos que não estão nos grupos especificados

  • Requer aprovação apenas para novos tópicos (não respostas)

A diferença fundamental:

  • approve_post_count é temporário - depois que os usuários atingem o limite de contagem, eles podem postar livremente
  • As configurações “unless allowed groups” (a menos que os grupos permitidos) são contínuas - elas se aplicam a TODAS as postagens/tópicos de usuários que não estão nos grupos especificados, independentemente de quantas postagens eles fizeram

Você também pode combinar configurações para um melhor controle de postagem em seu site, por exemplo:

  • Use approve_post_count: 1 para revisar postagens iniciais de novos usuários (TL0/TL1)
  • Use as configurações approve_unless_allowed_groups para moderação contínua de todos, exceto grupos específicos (por exemplo, membros TL2+)

Isso cria uma abordagem onde novos usuários são moderados inicialmente, e você também pode controlar quem tem liberdade contínua para postar sem aprovação.