¿Deberíamos indicar al escáner de spam de IA que marque las publicaciones que contienen números de teléfono por defecto?

awesomerobot · 15 Septiembre, 2025 14:40

Parece que una variedad bastante común de spam son las publicaciones de soporte al cliente no relacionadas, ¿probablemente intentando que aparezca información falsa en los resultados de IA o de búsqueda? Estas a menudo contienen números de teléfono… ¿deberíamos mencionar los números de teléfono en nuestro prompt de spam de IA? Probablemente sea poco común que la gente publique esto en casos de uso normales.

Prompt predeterminado existente

Eres un sistema de detección de spam. Analiza el siguiente contenido y contexto de la publicación.

Considera cuidadosamente el tipo de publicación:
- Para publicaciones de RESPUESTA: Comprueba si la respuesta es relevante y temática para el hilo.
- Para publicaciones de NUEVO TEMA: Comprueba si es un tema legítimo o una promoción de spam.

Una publicación es spam si coincide con alguno de estos criterios:
- Contiene contenido comercial no solicitado o promociones.
- Tiene enlaces externos sospechosos o no relacionados.
- Muestra patrones de publicación automatizada/bot.
- Contiene contenido o publicidad irrelevante.
- Para respuestas: Completamente no relacionado con el hilo de discusión.
- Utiliza palabras clave excesivas o patrones de texto repetitivos.
- Muestra formato o uso de caracteres sospechosos.

Sé especialmente estricto con:
- Respuestas que ignoran la conversación anterior.
- Publicaciones que contienen múltiples enlaces externos no relacionados.
- Respuestas genéricas que podrían publicarse en cualquier lugar.

Sé justo con:
- Usuarios nuevos que realizan contribuciones iniciales legítimas.
- Hablantes no nativos que hacen esfuerzos genuinos para participar.
- Menciones de productos relevantes para el tema en contextos apropiados.

Información específica del sitio:
- Nombre del sitio: {site_title}
- URL del sitio: {site_url}
- Descripción del sitio: {site_description}
- 10 categorías principales del sitio: {top_categories}

Formatea tu respuesta como un objeto JSON con una sola clave llamada "spam", que es un booleano que indica si una publicación es spam o legítima.
Tu salida debe tener el siguiente formato:

{"spam": xx}

Donde xx es verdadero si la publicación es spam, o falso si es legítima.
responde solo con JSON válido.

pfaffman · 15 Septiembre, 2025 15:53

Y creo que a menudo esos números de teléfono incluyen varias ofuscaciones de números de teléfono para evitar las pruebas de números de teléfono con expresiones regulares (no lo sé realmente, como, eh, unicode o alguna otra tontería?). ¿Hay alguna manera de hacer que la IA busque específicamente esos?

awesomerobot · 15 Septiembre, 2025 16:06

Podemos hacer algunas pruebas basándonos en el spam que hemos recibido, pero sospecho que pedirle que busque números de teléfono y especificar que preste atención a posibles intentos de ofuscación de unicode será suficiente para capturar la mayor parte.

Supongo que sería mejor para detectar intentos de ocultar números que las expresiones regulares, simplemente porque es más flexible.

pfaffman · 15 Septiembre, 2025 16:42

¡Viniendo de alguien que sabe poco sobre IA y no mucho sobre unicode (en relación con el grupo que espero que esté prestando atención a esto), eso suena genial!

Yo pensaría eso. Dado que la IA puede identificar Unicode de manera confiable, no hay ninguna razón para que un número de teléfono contenga Unicode, por lo que debería ser bastante fácil. En los días de la simple clasificación bayesiana, un número de teléfono Unicode sería un muy buen indicador de spam. Un montón de ellos también tenían algún símbolo TM de unicode extraño y un par de otros.

Y si pudiera buscar de manera confiable cosas como “soporte al cliente” en una empresa que no está conectada al foro, eso también sería algo fácil de conseguir.

sam · 15 Septiembre, 2025 23:23

Gran parte de esto depende de “necesitamos evaluaciones”:

Tenemos:

Lo que necesitamos hacer aquí es:

Añadir un gran conjunto de publicaciones de spam/ham al conjunto de evaluación (digamos 20-30 de cada una)
Ejecutar la evaluación
Corregir el prompt
Ejecutar la evaluación de nuevo

De lo contrario, tendemos a estar a tientas en la oscuridad. cc @Falco

Tema		Respuestas	Vistas
Discourse AI - Spam detection Site Management moderation , spam , how-to , ai	24	3128	3 Febrero 2026
Are you experiencing AI based spam? Community ai	23	1904	19 Enero 2025
Setting up spam detection in your community Site Management ai , how-to , moderation , automation	11	1834	30 Enero 2025
Discourse AI to make spam filter smarter? Feature completed , ai	2	442	22 Mayo 2024
Setting up NSFW detection in your community Site Management moderation , automation , how-to , ai	1	887	1 Enero 2026

¿Deberíamos indicar al escáner de spam de IA que marque las publicaciones que contienen números de teléfono por defecto?

Temas relacionados