Esta guía explica cómo configurar y utilizar la función de detección de spam de Discourse AI, incluido el proceso de configuración, los criterios de escaneo, la lógica de clasificación, las personalizaciones y los contrastes con la clasificación (triage) por IA.
Nivel de usuario requerido: Administrador
Esto está activado por defecto para los clientes Starter y Pro, así como para nuestros clientes heredados Basic, Open Source, Creator y Business.
Discourse AI proporciona una función eficiente de detección de spam que identifica y marca las publicaciones de spam con una configuración mínima. Si bien está diseñada para ser sencilla, complementa el sistema de clasificación (triage) por IA más versátil, que admite flujos de trabajo más amplios y casos de uso mayores.
Resumen
En esta guía aprenderá:
- Cómo funciona la detección de spam por IA y qué contenido se escanea
- La lógica de clasificación y el contexto utilizado por la IA
- Pasos para configurar la detección de spam a través de
/admin/plugins/discourse-ai/ai-spam - Pautas para la selección del Modelo de Lenguaje Grande (LLM)
- Diferencias clave entre la detección de spam y la clasificación (triage) por IA
- Cómo gestionar las publicaciones marcadas y las omitidas
Cómo funciona la detección de spam por IA
¿Qué contenido se escanea?
La detección de spam por IA evalúa las publicaciones según estos criterios:
-
Nivel de confianza del usuario:
- Escanea las publicaciones de usuarios con un nivel de confianza igual o inferior al máximo configurado (controlado por la configuración del sitio
ai_spam_detection_max_trust_level, predeterminado: nivel de confianza 1). - Excluye las publicaciones de niveles de confianza más altos.
- Siempre excluye las publicaciones de usuarios del personal y bots independientemente de su nivel de confianza.
- Escanea las publicaciones de usuarios con un nivel de confianza igual o inferior al máximo configurado (controlado por la configuración del sitio
-
Tipo de publicación:
- Publicaciones públicas (excluyendo mensajes privados).
- Se incluyen tanto las publicaciones de respuesta como las publicaciones del primer tema, según umbrales adicionales.
-
Ediciones de publicación:
- Escanea publicaciones con ediciones significativas (por ejemplo, cambios que superan los 10 caracteres).
- Aplica un retraso de 10 minutos entre escaneos de la misma publicación.
- Limita los nuevos escaneos a un máximo de 3 escaneos por publicación.
- Solo vuelve a escanear las publicaciones editadas en las últimas 24 horas.
-
Frecuencia de publicación:
- Escanea las publicaciones de usuarios con no más del recuento de publicaciones configurado como umbral (controlado por la configuración del sitio
ai_spam_detection_max_post_count, predeterminado: 3 publicaciones) en temas públicos. - Excluye las publicaciones de usuarios que superan este umbral.
- Escanea las publicaciones de usuarios con no más del recuento de publicaciones configurado como umbral (controlado por la configuración del sitio
-
Cola de revisión:
- Las publicaciones que ya fueron aprobadas desde la cola de revisión no se escanean.
El proceso de clasificación
Las publicaciones que cumplen los criterios se envían a un agente de IA para su análisis. El agente evalúa si la publicación es spam o no es spam y proporciona un motivo para su clasificación, utilizando una salida JSON estructurada. La evaluación se basa en:
- Contexto: Incluye el contenido de la publicación, el título del tema, la categoría, los datos de la cuenta del usuario (por ejemplo, nombre de usuario, correo electrónico, antigüedad de la cuenta, total de publicaciones y nivel de confianza) e información de geolocalización basada en IP.
- Análisis de imágenes: Se incluyen hasta 3 subidas de imágenes adjuntas a una publicación para su análisis.
- Contexto de respuesta: Para las publicaciones de respuesta, se incluye el contenido de la publicación principal (hasta 500 caracteres).
- Información del sitio: Se proporcionan al sistema de IA el nombre del sitio, la URL, la descripción y las 10 categorías principales.
- Instrucciones personalizadas: Reglas definidas por el administrador para reforzar o adaptar los criterios de escaneo.
- Detección automatizada:
- Marca contenido irrelevante o promocional (por ejemplo, anuncios o material comercial).
- Identifica comportamientos automatizados o similares a bots.
- Evalúa la relevancia del contenido para la discusión.
Prompt predeterminado y contexto
La IA utiliza un prompt del sistema predeterminado para guiar la detección de spam. El prompt del agente de detección de spam incorporado cubre:
Eres un sistema de detección de spam. Analiza el siguiente contenido de la publicación y su contexto.
Considera cuidadosamente el tipo de publicación:
- Para publicaciones de RESPUESTA: Verifica si la respuesta es relevante y está en el tema del hilo
- Para publicaciones de NUEVO TEMA: Verifica si es una promoción de tema legítimo o spam
Una publicación es spam si coincide con alguno de estos criterios:
- Contiene contenido comercial no solicitado o promociones
- Tiene enlaces externos sospechosos o no relacionados
- Muestra patrones de publicación automatizada/bot
- Contiene contenido irrelevante o publicidad
- Para respuestas: Completamente irrelevante para el hilo de discusión
- Utiliza palabras clave excesivas o patrones de texto repetitivos
- Muestra un formato o uso de caracteres sospechosos
Sé especialmente estricto con:
- Respuestas que ignoran la conversación anterior
- Publicaciones que contienen múltiples enlaces externos no relacionados
- Respuestas genéricas que podrían publicarse en cualquier lugar
Sé justo con:
- Usuarios nuevos que realizan contribuciones legítimas iniciales
- Hablantes no nativos que hacen esfuerzos genuinos por participar
- Menciones de productos relevantes para el tema en contextos apropiados
El escáner también compila un paquete de contexto, que incluye:
- Tipo de publicación (NUEVO TEMA o RESPUESTA) con metadatos de categoría y tema.
- Para respuestas: el contenido de la publicación principal y el autor del tema.
- Datos del autor (nombre de usuario, correo electrónico, antigüedad de la cuenta, total de publicaciones, nivel de confianza y ubicación basada en IP).
- Texto de la publicación truncado a 5000 caracteres para su procesamiento.
- Hasta 3 subidas de imágenes adjuntas a la publicación.
Configurar la detección de spam por IA
Guía de configuración
-
Acceder a la configuración:
Navegue a/admin/plugins/discourse-ai/ai-spam. -
Seleccionar un LLM:
Si su sitio está alojado por Discourse
Puede seleccionar nuestro LLM pequeño alojado por CDCK de la lista de LLM.
- Elija un modelo de lenguaje adecuado para las necesidades de su foro. Consulte la página de configuración del Modelo de Lenguaje Grande (LLM) de Discourse para configurar los LLM.
- Acceda a
/admin/plugins/discourse-ai/ai-llmspara las configuraciones de LLM.
- Activar la detección de spam:
Active la función de detección de spam conmutándola.
Nota: Un LLM conectado es obligatorio.
-
Añadir instrucciones personalizadas:
- Defina reglas específicas para su foro (por ejemplo, monitoreo más estricto de enlaces externos).
- Guarde cualquier cambio para aplicarlos.
-
Ajustar los umbrales de escaneo (opcional):
ai_spam_detection_max_trust_level: Establezca el nivel de confianza máximo de los usuarios cuyas publicaciones se escanean (predeterminado: 1). Se puede configurar de 0 a 4.ai_spam_detection_max_post_count: Establezca el número máximo de publicaciones que puede tener un usuario y aun así ser escaneado (predeterminado: 3). Se puede configurar de 1 a 100.
Diferencias con la clasificación (triage) por IA
Mientras que la detección de spam está diseñada específicamente para identificar spam, la clasificación (triage) por IA admite tareas de gestión de publicaciones más amplias.
| Característica | Detección de spam por IA | Clasificación (Triage) por IA |
|---|---|---|
| Complejidad | Configuración simplificada y opinada | Altamente personalizable y flexible |
| Caso de uso principal | Detección de spam con sobrecarga mínima | Flujos de trabajo avanzados para categorización, etiquetado, respuestas, detección de spam, detección de nsfw |
| Acciones | Marca el spam, oculta publicaciones, silencia usuarios | Etiqueta, categoriza, oculta publicaciones, añade respuestas, marca publicaciones, silencia usuarios |
| Recomendación | Configuración sencilla y eficaz para la mayoría de las situaciones | Usar para flujos de trabajo ricos y altamente personalizables |
Para más detalles, consulte Discourse AI - Clasificación (Triage) por IA.
Recomendaciones de selección de LLM
El rendimiento de la detección de spam depende del LLM elegido.
La mayoría de los LLM de bajo costo funcionan eficazmente, como:
- GPT-4o-mini
- Claude 3.5 Haiku
- Gemini 2.0 Flash
Experimente con diferentes modelos para encontrar el mejor ajuste. Configure sus modelos a través de /admin/plugins/discourse-ai/ai-llms.
Probar el comportamiento del escáner de spam
Puede probar las reglas de detección de spam directamente desde la página de configuración.
- Pegue una URL o ID de publicación en el campo de prueba.
- Revise el resultado de la clasificación y el razonamiento de la IA para su decisión.
- Los cambios no guardados se aplican durante la prueba, lo que permite la experimentación sin riesgo.
Gestión de publicaciones marcadas y omitidas
Manejo de publicaciones marcadas
Cuando se detecta una publicación como spam, el sistema:
- Marca la publicación como spam y la añade a la cola de revisión.
- Silencia al usuario que publica.
- Oculta la publicación de la vista pública.
- Hace que el tema sea invisible si la publicación de spam fue la primera publicación del tema.
Las publicaciones marcadas aparecen en la cola de moderación. Los administradores pueden:
- Aprobar publicaciones legítimas clasificadas erróneamente como spam.
- Rechazar temas de spam para mantener la precisión del sistema.
Importante: Rechace las marcas de spam para las publicaciones clasificadas incorrectamente. Los usuarios permanecen silenciados hasta que se resuelve la marca.
Manejo del spam omitido
El spam omitido se refiere a publicaciones que evitan la detección pero son marcadas por la comunidad. Los moderadores pueden gestionarlas según sea necesario.
Mejores prácticas
- Supervise regularmente el spam marcado y el omitido para refinar la precisión del sistema. Las métricas clicables simplifican este proceso.
- Utilice casos de prueba para evaluar las instrucciones personalizadas frente a casos extremos.
- Revise y ajuste la configuración de LLM cuando sea necesario.
- Utilice las configuraciones del sitio
ai_spam_detection_max_trust_levelyai_spam_detection_max_post_countpara ajustar qué usuarios son escaneados según las necesidades de su comunidad.
Recursos adicionales
Configurar la detección de spam por IA de manera efectiva reduce los esfuerzos de moderación manual, asegurando una comunidad limpia y libre de spam.

