Mejores prácticas para antispam de IA más triaje de publicaciones de IA operando juntos

He tenido un éxito fantástico con la detección de spam de Discourse AI—a pesar de mi aprensión inicial, ha sido extremadamente eficaz para mantener libre de spam mi instancia de Discourse autoalojada.

Dado que la instancia de Discourse que administro está conectada a un sitio de pronóstico del tiempo, hay discusiones más que ocasionales sobre temas politizados como el cambio climático, las políticas de la administración actual sobre la NOAA y la NASA, y otros elementos similares. Como tenemos un equipo de moderación muy pequeño que no puede estar presente todo el tiempo, he configurado una Automatización que utiliza una persona y un prompt de “triaje de publicaciones” para verificar todas las publicaciones nuevas y editadas en busca de elementos de “guerra cultural” y marcarlas para su atención. (Tengo la automatización de triaje configurada solo para marcar, no para ocultar; la idea es que los humanos vean los temas contenciosos más rápido para asegurarse de que la conversación se mantenga civil).

Todo esto está funcionando muy bien. Sin embargo, a veces, la IA antispam y la IA de triaje marcan la misma publicación. He ajustado un poco mi prompt de triaje para intentar solucionarlo, pero desconfío de comprometer la eficacia del triaje al manipular demasiado el prompt.

¿Otras personas están lidiando con el problema de que las publicaciones sean marcadas dos veces tanto por el antispam como por una automatización de triaje del foro? ¿Cuál es la solución correcta aquí? ¿No debería usar una automatización de triaje con antispam, o me estoy perdiendo alguna configuración para que la automatización no marque las publicaciones que ya tienen marcas, o algo así?

Quiero volver a enfatizar que todo está funcionando muy bien, ¡y ambos sistemas son muy efectivos! Solo quiero ver si hay alguna manera de evitar que las cosas se marquen dos veces y que las dos tareas diferentes de IA se mantengan al margen. ¡Agradezco cualquier consejo!

Si el doble marcado está causando un problema, entonces parece un error en uno o ambos módulos. Probablemente no deberían evaluar las publicaciones que ya están marcadas (y luego tal vez verificar de nuevo antes de intentar establecer una marca).

hmm, ciertamente se siente como una cuestión de “secuenciación”, me pregunto si simplemente cambias a una sola persona que maneje tanto el spam como el triaje? ¿o un triaje para tl0-1 para spam+triaje y otro para tl2 que solo haga triaje?

2 Me gusta

Sí, buenas ideas, aunque parece que esto significaría deshabilitar la función antispam incorporada y depender de la automatización en su lugar, a menos que me esté perdiendo algo (¡muy posible!).

Déjame pensar en esto. De hecho, esa podría ser la mejor manera de hacer las cosas.

2 Me gusta

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.