Devemos dizer ao scanner de spam de IA para sinalizar postagens com números de telefone por padrão?

awesomerobot · Setembro 15, 2025, 2:40pm

Parece que uma variedade bastante comum de spam são postagens de suporte ao cliente não relacionadas, provavelmente tentando obter informações falsas para aparecer em resultados de IA ou de pesquisa? Frequentemente contêm números de telefone… devemos mencionar números de telefone em nosso prompt de spam de IA? Provavelmente incomum para as pessoas postarem isso em casos de uso normais?

Prompt padrão existente

Você é um sistema de detecção de spam. Analise o seguinte conteúdo e contexto da postagem.

Considere o tipo de postagem cuidadosamente:
- Para postagens de RESPOSTA: Verifique se a resposta é relevante e atual para o tópico
- Para postagens de NOVO TÓPICO: Verifique se é um tópico legítimo ou promoção de spam

Uma postagem é spam se corresponder a qualquer um destes critérios:
- Contém conteúdo comercial não solicitado ou promoções
- Possui links externos suspeitos ou não relacionados
- Apresenta padrões de postagem automatizada/bot
- Contém conteúdo ou anúncios irrelevantes
- Para respostas: Completamente não relacionado ao tópico da discussão
- Usa palavras-chave excessivas ou padrões de texto repetitivos
- Apresenta formatação ou uso de caracteres suspeitos

Seja especialmente rigoroso com:
- Respostas que ignoram a conversa anterior
- Postagens contendo múltiplos links externos não relacionados
- Respostas genéricas que poderiam ser postadas em qualquer lugar

Seja justo com:
- Novos usuários fazendo contribuições legítimas pela primeira vez
- Falantes não nativos fazendo esforços genuínos para participar
- Menções de produtos relevantes ao tópico em contextos apropriados

Informações Específicas do Site:
- Nome do site: {site_title}
- URL do site: {site_url}
- Descrição do site: {site_description}
- 10 principais categorias do site: {top_categories}

Formate sua resposta como um objeto JSON com uma única chave chamada "spam", que é um booleano que indica se uma postagem é spam ou legítima.
Sua saída deve estar no seguinte formato:

{"spam": xx}

Onde xx é verdadeiro se a postagem for spam, ou falso se for legítima.
responda apenas com JSON válido

pfaffman · Setembro 15, 2025, 3:53pm

E eu acho que muitas vezes esses números de telefone incluem várias ofuscações de números de telefone para contornar testes de números de telefone com regex (eu realmente não sei, tipo, uh, unicode ou alguma outra bobagem?). Existe alguma maneira de fazer a IA procurar especificamente por eles?

awesomerobot · Setembro 15, 2025, 4:06pm

Podemos fazer alguns testes com base no spam que recebemos, mas suspeito que instruí-la a procurar por números de telefone e especificar que ela deve prestar atenção a possíveis tentativas de ofuscação de unicode pode ser suficiente para capturar a maior parte?

Eu acho que seria melhor em capturar tentativas de esconder números do que o regex, apenas porque é mais flexível.

pfaffman · Setembro 15, 2025, 4:42pm

Vindo de alguém que sabe pouco sobre IA e não muito sobre unicode (em relação ao grupo que espero que esteja prestando atenção a isso), isso parece ótimo!

Eu pensaria assim. Dado que a IA pode identificar Unicode de forma confiável, não há razão para um número de telefone conter Unicode, então deve ser bem fácil. Nos tempos da classificação bayesiana simples, um número de telefone Unicode seria um ótimo indicador de Spam. Um monte deles também tinha algum símbolo TM unicode estranho e alguns outros.

E se ele pudesse procurar de forma confiável por coisas como “suporte ao cliente” em uma empresa que não está conectada ao fórum, isso também seria uma fruta fácil de colher.

sam · Setembro 15, 2025, 11:23pm

Muito disso depende de “precisamos de avaliações”:

Temos:

O que precisamos fazer aqui é:

Adicionar um monte de posts de spam/ham ao conjunto de avaliação (diga 20-30 de cada)
Executar a avaliação
Corrigir o prompt
Executar a avaliação novamente

Caso contrário, tendemos a estar tateando no escuro. cc @Falco

Tópico		Respostas	Visualizações
Discourse AI - Spam detection Site Management moderation , how-to , ai , spam	30	4709	10 de Março de 2026
Are you experiencing AI based spam? Community Building ai	22	2309	19 de Janeiro de 2025
Setting up spam detection in your community Site Management moderation , automation , how-to , ai	10	2111	30 de Janeiro de 2025
Discourse AI to make spam filter smarter? Feature completed , ai	1	496	18 de Maio de 2024
Diagnosing spam attack of 100 topics Feature	34	3120	29 de Maio de 2017

Devemos dizer ao scanner de spam de IA para sinalizar postagens com números de telefone por padrão?

Tópicos relacionados