Este tópico cobre a configuração do recurso de Toxicidade do plugin Discourse AI.
Nível de usuário necessário: Administrador
Os módulos de Toxicidade podem classificar automaticamente o nível de toxicidade de cada nova postagem e mensagem de chat em sua instância do Discourse. Você também pode habilitar a marcação automática de conteúdo que ultrapassa um limite.
As classificações são armazenadas no banco de dados, portanto, você pode habilitar o plugin e usar o Data Explorer para relatórios da classificação que ocorre para novo conteúdo no Discourse imediatamente. Em breve, enviaremos algumas consultas padrão do Data Explorer com o plugin para facilitar isso.
Configurações
ai_toxicity_enabled: Habilita ou desabilita o módulo
ai_toxicity_inference_service_api_endpoint: URL onde a API está em execução para o módulo de toxicidade. Se você estiver usando a hospedagem CDCK, isso é tratado automaticamente para você. Se você estiver auto-hospedando, consulte o guia de auto-hospedagem.
ai_toxicity_inference_service_api_key: Chave de API para a API de toxicidade configurada acima. Se você estiver usando a hospedagem CDCK, isso é tratado automaticamente para você. Se você estiver auto-hospedando, consulte o guia de auto-hospedagem.
ai_toxicity_inference_service_api_model: ai_toxicity_inference_service_api_model: Oferecemos três modelos diferentes:
original,unbiasedemultilingual.unbiasedé recomendado sobreoriginalporque tentará não transmitir vieses introduzidos pelo material de treinamento para a classificação. Para comunidades multilíngues, o último modelo suporta italiano, francês, russo, português, espanhol e turco.ai_toxicity_flag_automatically: Marca automaticamente postagens/mensagens de chat quando a classificação para uma categoria específica ultrapassa o limite configurado. As categorias disponíveis são
toxicity,severe_toxicity,obscene,identity_attack,insult,threatesexual_explicit. Existe uma configuraçãoai_toxicity_flag_threshold_${category}para cada uma.ai_toxicity_groups_bypass: Usuários nesses grupos não terão suas postagens classificadas pelo módulo de toxicidade. Por padrão, inclui usuários da equipe.
Recursos adicionais
10 curtidas