El bot de spam de IA dice que no es spam, pero el registro de escaneo dice que es spam

He habilitado el manejo de spam de Discourse AI en nuestro foro. He configurado Claude Sonnet 4 con una clave API y he seleccionado la persona del detector de spam.

Hice una publicación de prueba que es claramente spam. Nada sutil al respecto.

No fue bloqueada y se publicó de inmediato.

Cuando le di la URL de la publicación al bot de spam usando la función de prueba, el resultado dice “No es spam”, pero en el registro de escaneo dice: SPAM - Este es un anuncio promocional claro…

Mi expectativa sería que el resultado fuera SPAM, coincidiendo con la declaración de SPAM del registro de escaneo. Y que esto pondría en cola la publicación para su revisión por parte de administradores y moderadores, por ejemplo.

¿Alguien podría compartir lo que me estoy perdiendo? No soy un experto, ¡así que estoy abierto a cualquier orientación!

¡Gracias!

¿Cuál es el nivel de confianza del usuario que publicó? El spam de IA omitirá las publicaciones de usuarios TL2+.

4 Me gusta

¡Gracias por tu respuesta!

El usuario que utilicé para publicar es Usuario nuevo de nivel de confianza

¿Alguna idea de por qué pasó la publicación?

¡Agradezco tu ayuda!

Esto solucionará tanto que la prueba como la publicación no se marquen:

El prompt del sistema del Persona detector de spam estaba confundiendo a los modelos Claude. El cambio hace que las instrucciones del formato de respuesta esperado sean más explícitas.

4 Me gusta

¡Ah, fantástico! La función de prueba está funcionando como se esperaba.

Me pregunto si podrías ayudarme a entender por qué la función de Spam de IA todavía no está bloqueando una publicación de spam para que no se publique de inmediato. Envié la publicación a la prueba de Spam de IA y la está marcando como spam, pero se publicó.

¿Quizás me falta alguna pieza de conexión? ¡Muchas gracias por tu ayuda con esto!

1 me gusta

¿Eres un administrador o un TL de nivel superior? Si es así, quizás deberías intentar usar un usuario de prueba de TL bajo.

1 me gusta

Omitimos una publicación cuando:

  • El nivel de confianza del autor es superior a TL1.
  • La publicación pertenece a un tema de mensaje privado.
  • El autor es un bot.
  • El autor es personal (moderador/administrador).
  • El autor ya ha realizado más de 3 publicaciones en temas normales (no privados).
  • La publicación ya ha sido escaneada 3 o más veces.

Si la prueba está funcionando, estoy seguro de que debe ser por una de las razones anteriores.

1 me gusta

¡Ahhh, sí! ¡Gracias por sus respuestas pacientes y útiles!

Publiqué con mi usuario administrador en lugar de mi usuario de nivel de confianza 0. :woman_facepalming:

¡Está funcionando! Me encanta la forma en que el usuario discourse_ai_spam aparece como el usuario que marcó y despublicó la publicación.

¡Gracias de nuevo por su ayuda rápida y generosa con esto!

3 Me gusta