Melhores práticas para antispam de IA mais triagem de posts de IA operando juntas?

Tenho tido um sucesso fantástico com a detecção de spam do Discourse AI—apesar da minha apreensão inicial, tem sido extremamente eficaz em manter minha instância do Discourse auto-hospedada livre de spam.

Como a instância do Discourse que administro está conectada a um site de previsão do tempo, há discussões mais do que ocasionais sobre tópicos politizados como mudanças climáticas, as políticas da administração atual em relação à NOAA e NASA, e outros itens semelhantes. Como temos uma equipe de moderação muito pequena que não pode estar presente o tempo todo, configurei uma Automação que usa uma persona e um prompt de “triagem de postagens” para verificar todas as postagens novas e editadas em busca de itens de “guerra cultural” e sinalizá-las para atenção. (Configurei a automação de triagem para apenas sinalizar, não ocultar—a ideia é que os olhos humanos vejam tópicos controversos mais rapidamente para garantir que a conversa permaneça civilizada.)

Tudo isso está funcionando muito bem. No entanto, às vezes, a IA antispam e a IA de triagem sinalizam a mesma postagem. Ajustei um pouco meu prompt de triagem para tentar contornar isso, mas estou receoso de comprometer a eficácia da triagem mexendo demais no prompt.

Outras pessoas estão lidando com o problema de postagens serem sinalizadas duas vezes tanto pela antispam quanto por uma automação de triagem do fórum? Qual é a solução correta aqui? Não devo usar uma automação de triagem com antispam, ou estou perdendo alguma configuração para que a automação não sinalize postagens com sinalizações já definidas, ou algo assim?

Quero enfatizar novamente que tudo está funcionando muito bem, e ambos os sistemas são muito eficazes! Só quero ver se há uma maneira de evitar que as coisas sejam sinalizadas duas vezes e que as duas tarefas diferentes de IA não interfiram uma na outra. Aconselhamento apreciado!

Se a sinalização dupla estiver causando um problema, então parece um bug em um ou ambos os módulos. Eles provavelmente não deveriam avaliar posts que já estão sinalizados (e então talvez verificar novamente antes de tentar definir uma sinalização).

hmm, certamente parece uma coisa de “sequenciamento”, eu me pergunto se você simplesmente muda para uma única persona que lida com spam e triagem? ou uma triagem para tl0-1 para spam+triagem e outra para tl2 que faz apenas triagem?

2 curtidas

Sim, boas observações — embora pareça que isso significaria desabilitar o recurso antispam integrado e confiar na automação em vez disso, a menos que eu esteja perdendo alguma coisa (muito possível!).

Deixe-me pensar sobre isso. Isso pode, de fato, ser a melhor maneira de fazer as coisas.

2 curtidas

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.