Y este es un ejemplo de los mismos spammers siendo atrapados aquí: https://meta.discourse.org/t/full-list-of-quickbooks-desktop-support-contact-numbers-a-complete-call-center-in-the-usa/380776 (ya está oculto).
Estos tipos definitivamente están trabajando duro.
Gran trabajo en esta función. Así es exactamente como me gusta ver el uso de la IA.
Pregunta rápida: cuando un nuevo usuario TL0 envía una respuesta o un tema, ¿hay un retraso mientras se escanea el contenido?
Veo un pequeño retraso en el probador integrado (captura de pantalla a continuación), pero cuando publico desde una cuenta de prueba, no hay una pausa similar. ¿El escaneo en vivo es asíncrono después de la publicación, y la publicación se oculta solo si infringe una regla? (contexto: estoy usando la API de OpenAI ChatGPT 5).
Por lo que vale, IA > Spam y Estadísticas se incrementan según lo esperado con la cuenta de prueba, por lo que la publicación SÍ se está escaneando; simplemente no introduce el mismo retraso que el botón Test.
Ok, esto funciona bastante bien, pero ¿qué sucede cuando marca docenas de temas/usuarios? No veo una forma de prohibir/eliminar en masa a estos usuarios/publicaciones.
Gracias por el hilo detallado. Tenemos habilitada la detección de spam de Discourse AI en nuestra instancia, y una de las cosas que estamos viendo es la acción de silenciar automáticamente por defecto cuando se marca la primera publicación realizada por una cuenta.
Entiendo que esto es para silenciar a los spammers de un solo disparo; sin embargo, esto está causando problemas en los que aprobar/aceptar una marca significa que el usuario permanecerá silenciado en casos en los que queremos aprobar la marca pero no silenciar al usuario. Sería bueno tener:
un botón de “aceptar y mantener silenciado”, y
un botón separado de “aceptar y levantar el silencio”.
Aquí está el conjunto de instrucciones personalizadas que estoy utilizando para la detección de spam. Es más detallado que la versión estándar, por lo que utilizará más tokens. ¿Qué están utilizando otros para los conjuntos de instrucciones personalizadas para la detección de spam?
Conjunto de Instrucciones Conciso para Detección de Spam
Usted es un sistema de detección de spam que revisa publicaciones de foros.
Su tarea es determinar si una publicación tiene como objetivo principal promocionar, engañar, manipular clasificaciones de búsqueda, distribuir enlaces maliciosos o interrumpir la discusión, en lugar de participar genuinamente en la comunidad.
Evalúe:
Contenido de la publicación
Tipo de publicación (RESPUESTA o NUEVO TEMA)
Contexto del hilo (para respuestas)
Información del sitio
Clasifique como spam si la publicación:
Promociona productos, servicios o sitios externos sin participación significativa
Contiene enlaces sospechosos, no relacionados o múltiples enlaces promocionales
Utiliza relleno de palabras clave estilo SEO o patrones repetitivos
Parece automatizada, basada en plantillas o generada por bots
Es irrelevante para el tema del foro
Para publicaciones de RESPUESTA: ignora el hilo e inyecta contenido no relacionado
Los indicadores fuertes de spam incluyen:
Enlaces de afiliados/referidos
Lenguaje de “Comprar ahora”, descuentos u ofertas
Información de contacto no relacionada con la discusión
Elogio genérico + enlace
Estructura de copiar y pegar
Texto sin sentido o generado por IA
NO clasifique como spam solo porque:
El usuario es nuevo
El inglés es imperfecto
La publicación es corta
El tono es entusiasta
Se menciona un producto o proveedor relevante en contexto
Las señales legítimas incluyen:
Referencias específicas al hilo
Discusión técnica relevante para el tema
Preguntas genuinas
Experiencia personal relacionada con el tema del foro
Regla de Decisión
Si la intención principal parece promocional, maliciosa o disruptiva → spam = verdadero.
Si la publicación participa significativamente en la discusión → spam = falso.
Cuando haya incertidumbre pero haya varias señales de alerta, priorice la seguridad de la comunidad.
Formato de Salida
Devuelva solo JSON válido:
{“spam”: true o false, “reason”: “Explicación breve (1–2 frases).”}
Debería haber un informe en la página Admin->Plugin->AI->SPAM que muestre los detalles del cuadro de resumen. El cuadro de resumen muestra el número de publicaciones escaneadas, el spam detectado y los falsos positivos y negativos.
¿Existe el informe detallado en algún lugar que no he encontrado?
¿Existe una consulta de Data Explorer que proporcione el detalle de nivel inferior?