A automação de triagem por IA escaneia DMs entre usuários comuns?

Olá,

Configurei a automação “Triagem de posts usando IA” para moderação de conteúdo na minha plataforma (madeira.community — um diretório empresarial multilíngue para a ilha da Madeira).

A automação funciona perfeitamente para posts públicos. No entanto, ativei a opção “Incluir mensagens pessoais” e constatei que as mensagens diretas (DMs) entre usuários comuns não estão sendo analisadas de forma alguma.

Minha preocupação é real: agentes mal-intencionados podem usar mensagens privadas para realizar atividades ilegais — tráfico de drogas, compartilhamento de dados financeiros roubados, aliciamento — contornando completamente a moderação por IA que funciona bem no conteúdo público.

Minhas perguntas:

  1. A opção “Incluir mensagens pessoais” realmente suporta a análise de DMs entre dois usuários comuns (não membros da equipe)?

  2. Se não — isso é por design ou uma limitação conhecida?

  3. Existe alguma forma suportada de aplicar a triagem por IA a mensagens privadas entre usuários comuns?

Encontrei uma referência a um commit “Skip PM scanning in LLM triage by default” (Pular a análise de mensagens privadas na triagem por LLM por padrão), o que sugere que isso pode ser intencional. Mas a opção na interface existe — então estou confuso sobre o que ela realmente faz.

Obrigado

Sim, suporta. Se você ativar essa opção, a verificação de MPs deve funcionar.

Como você determinou isso?

“Testei enviando uma mensagem privada entre dois usuários comuns (testUser para darinauser, ambos não são da equipe) com conteúdo claramente ilegal: ‘cocaína. armas. granadas’ e ‘pornografia. sujeira. depravação. violência’. As mensagens foram entregues e não foram sinalizadas. A fila de revisão permaneceu vazia. O mesmo conteúdo em postagens públicas foi sinalizado imediatamente.”

Posso confirmar que eles não foram processados; os IDs de tópico dessas mensagens privadas (210, 211, 212 e 214) e os IDs de postagem não estão na tabela ai_api_audit_logs.

Acho que “Tipo de Tópico” “Todos os tópicos” significa todos os tópicos que não são mensagens privadas.
Você poderia tentar deixar esse campo vazio?

"Isso funcionou! Obrigado, Richard. Deixar o Tipo de Tópico vazio resolveu — as mensagens diretas entre usuários comuns agora estão sendo verificadas.
Agora estou planejando configurar duas automações separadas:

Uma para postagens públicas com um prompt de moderação rigoroso
Uma para mensagens privadas com um prompt mais leve — sinalizando apenas as violações mais graves (CSAM, tráfico de drogas, armas)

Dessa forma, o conteúdo público recebe moderação completa, enquanto as conversas privadas têm limites mais adequados."

O tópico pode ser fechado. OBRIGADO!

Hmm, “todos os tópicos” parece um pouco pouco claro neste contexto… talvez devêssemos atualizar para esclarecer

  • todos os tópicos tópicos (todas as categorias)
  • Tópicos Públicos (excluir todas as categorias seguras) tópicos (apenas categorias públicas)
  • mensagens pessoais apenas

A parte “Todos os tópicos” me fez pensar que todo o conteúdo seria revisado.
Eu nem considerei que deixar o campo em branco resultaria na revisão de todo o conteúdo.

Acho que ter um único menu suspenso é bastante limitado, e três opções separadas seriam melhores e, definitivamente, mais claras para o usuário.

  • tópicos públicos sim/não
  • tópicos não públicos sim/não
  • mensagens privadas sim/não

Existem 8 situações possíveis, e o menu suspenso cobre apenas quatro delas.

Talvez sim?

  • Todos (tópicos + mensagens privadas)

  • Apenas tópicos públicos

  • Apenas tópicos não públicos

  • Tópicos não públicos + mensagens privadas

  • Apenas mensagens privadas

Isso não abrange “tópicos regulares (tanto públicos quanto não públicos), mas sem mensagens privadas”, o que seria uma escolha bastante lógica.

E, embora seja uma escolha menos provável, “tópicos públicos e mensagens privadas”.