He habilitado el manejo de spam de Discourse AI en nuestro foro. He configurado Claude Sonnet 4 con una clave API y he seleccionado la persona del detector de spam.
Hice una publicación de prueba que es claramente spam. Nada sutil al respecto.
No fue bloqueada y se publicó de inmediato.
Cuando le di la URL de la publicación al bot de spam usando la función de prueba, el resultado dice “No es spam”, pero en el registro de escaneo dice: SPAM - Este es un anuncio promocional claro…
Mi expectativa sería que el resultado fuera SPAM, coincidiendo con la declaración de SPAM del registro de escaneo. Y que esto pondría en cola la publicación para su revisión por parte de administradores y moderadores, por ejemplo.
¿Alguien podría compartir lo que me estoy perdiendo? No soy un experto, ¡así que estoy abierto a cualquier orientación!
Esto solucionará tanto que la prueba como la publicación no se marquen:
El prompt del sistema del Persona detector de spam estaba confundiendo a los modelos Claude. El cambio hace que las instrucciones del formato de respuesta esperado sean más explícitas.
¡Ah, fantástico! La función de prueba está funcionando como se esperaba.
Me pregunto si podrías ayudarme a entender por qué la función de Spam de IA todavía no está bloqueando una publicación de spam para que no se publique de inmediato. Envié la publicación a la prueba de Spam de IA y la está marcando como spam, pero se publicó.
¿Quizás me falta alguna pieza de conexión? ¡Muchas gracias por tu ayuda con esto!