Devemos dizer ao scanner de spam de IA para sinalizar postagens com números de telefone por padrão?

,

Parece que uma variedade bastante comum de spam são postagens de suporte ao cliente não relacionadas, provavelmente tentando obter informações falsas para aparecer em resultados de IA ou de pesquisa? Frequentemente contêm números de telefone… devemos mencionar números de telefone em nosso prompt de spam de IA? Provavelmente incomum para as pessoas postarem isso em casos de uso normais?

Prompt padrão existente
Você é um sistema de detecção de spam. Analise o seguinte conteúdo e contexto da postagem.

Considere o tipo de postagem cuidadosamente:
- Para postagens de RESPOSTA: Verifique se a resposta é relevante e atual para o tópico
- Para postagens de NOVO TÓPICO: Verifique se é um tópico legítimo ou promoção de spam

Uma postagem é spam se corresponder a qualquer um destes critérios:
- Contém conteúdo comercial não solicitado ou promoções
- Possui links externos suspeitos ou não relacionados
- Apresenta padrões de postagem automatizada/bot
- Contém conteúdo ou anúncios irrelevantes
- Para respostas: Completamente não relacionado ao tópico da discussão
- Usa palavras-chave excessivas ou padrões de texto repetitivos
- Apresenta formatação ou uso de caracteres suspeitos

Seja especialmente rigoroso com:
- Respostas que ignoram a conversa anterior
- Postagens contendo múltiplos links externos não relacionados
- Respostas genéricas que poderiam ser postadas em qualquer lugar

Seja justo com:
- Novos usuários fazendo contribuições legítimas pela primeira vez
- Falantes não nativos fazendo esforços genuínos para participar
- Menções de produtos relevantes ao tópico em contextos apropriados

Informações Específicas do Site:
- Nome do site: {site_title}
- URL do site: {site_url}
- Descrição do site: {site_description}
- 10 principais categorias do site: {top_categories}

Formate sua resposta como um objeto JSON com uma única chave chamada "spam", que é um booleano que indica se uma postagem é spam ou legítima.
Sua saída deve estar no seguinte formato:

{"spam": xx}

Onde xx é verdadeiro se a postagem for spam, ou falso se for legítima.
responda apenas com JSON válido
7 curtidas

E eu acho que muitas vezes esses números de telefone incluem várias ofuscações de números de telefone para contornar testes de números de telefone com regex (eu realmente não sei, tipo, uh, unicode ou alguma outra bobagem?). Existe alguma maneira de fazer a IA procurar especificamente por eles?

2 curtidas

Podemos fazer alguns testes com base no spam que recebemos, mas suspeito que instruí-la a procurar por números de telefone e especificar que ela deve prestar atenção a possíveis tentativas de ofuscação de unicode pode ser suficiente para capturar a maior parte?

Eu acho que seria melhor em capturar tentativas de esconder números do que o regex, apenas porque é mais flexível.

1 curtida

Vindo de alguém que sabe pouco sobre IA e não muito sobre unicode (em relação ao grupo que espero que esteja prestando atenção a isso), isso parece ótimo! :rofl:

Eu pensaria assim. Dado que a IA pode identificar Unicode de forma confiável, não há razão para um número de telefone conter Unicode, então deve ser bem fácil. Nos tempos da classificação bayesiana simples, um número de telefone Unicode seria um ótimo indicador de Spam. Um monte deles também tinha algum símbolo TM unicode estranho e alguns outros.

E se ele pudesse procurar de forma confiável por coisas como “suporte ao cliente” em uma empresa que não está conectada ao fórum, isso também seria uma fruta fácil de colher.

2 curtidas

Muito disso depende de “precisamos de avaliações”:

Temos:

O que precisamos fazer aqui é:

  1. Adicionar um monte de posts de spam/ham ao conjunto de avaliação (diga 20-30 de cada)
  2. Executar a avaliação
  3. Corrigir o prompt
  4. Executar a avaliação novamente

Caso contrário, tendemos a estar tateando no escuro. cc @Falco

3 curtidas