Solicitud de característica: filtro de "respuesta sin sentido" con IA y niveles seleccionables por el usuario

Hola a todos,

Me gustaría proponer un filtro asistido por IA para respuestas de baja señal/sin sentido (“respuestas de agua”, comentarios genéricos de spam) dentro de los temas.

El problema

En muchas comunidades de habla inglesa, los temas a menudo se inundan con respuestas cortas y de poco esfuerzo como:

  • “Gracias / bien / buen post”
  • “Estoy de acuerdo”
  • “Siguiendo”
  • “Arriba”
  • cumplidos genéricos sin nueva información

Estas respuestas añaden ruido, aumentan el desplazamiento y reducen la experiencia de lectura para todos, especialmente en hilos largos.

Los moderadores pueden combatir esto con reglas y acciones manuales, pero no escala bien. Y el filtrado puramente basado en regex tiende a tener altos falsos positivos.

Lo que he construido / prototipo actual

Actualmente estoy experimentando con un enfoque similar a un complemento (plugin):

  1. Prefiltro de Regex para detectar las respuestas cortas/evasivas más obvias
  2. Luego pasar los candidatos restantes a un LLM para clasificación
  3. La interfaz de usuario debe ser transparente: mostrar cuántas respuestas se ocultaron
  4. Las respuestas ocultas deben ser visibles bajo demanda (“Mostrar respuestas ocultas”)
  5. (Opcional) Para el contenido oculto, ejecutar otro paso de LLM para extraer 2-3 oraciones representativas de las respuestas ocultas, para que los lectores puedan ver rápidamente “lo que se ocultó” sin expandir todo.

Incluso solo con regex, la experiencia de lectura mejora mucho (menos desplazamiento), pero la tasa de falsos positivos es demasiado alta, por lo que creo que el juicio basado en LLM es necesario.

Comportamiento del producto propuesto (orientado al usuario)

Dentro de cada tema, los lectores verían algo como:

  • 12 respuestas ocultas (Filtro de baja señal: Medio)”
  • Botones: Mostrar respuestas ocultas / Cambiar nivel de filtro

Y proporcionar varios niveles, por ejemplo:

  • Desactivado: mostrar todo
  • Bajo: ocultar basura obvia (precisión muy alta)
  • Medio: ocultar respuestas comunes de baja señal
  • Alto: filtrado agresivo (el usuario acepta)

Importante:

  • Esta debe ser una preferencia por usuario (y quizás también configurable por categoría/predeterminado del sitio).
  • El sistema debe seguir siendo transparente y reversible: nada se “elimina”, solo se oculta por defecto.

Por qué esto encaja con Discourse (especialmente ahora)

Discourse ya tiene varias características relacionadas con la IA y el ecosistema de IA de Discourse está creciendo. Creo que un “limpiador” de respuestas dentro del tema es uno de los usos más prácticos y de mayor impacto de los LLM para la experiencia de usuario de la comunidad.

No es exactamente una “detección de spam” (que suele ser a nivel de cuenta). Esto es más sobre la calidad de lectura a nivel de tema.

Preguntas para los mantenedores / comunidad

  1. ¿Tiene Discourse ya planes para un filtro de calidad de respuesta / baja señal?
  2. ¿Tendría sentido construir esto como una extensión de Discourse AI, o como un complemento separado?
  3. ¿Cuál es la mejor manera de implementar la interfaz de usuario/experiencia para que sea transparente y no confunda a los usuarios?
  4. ¿Alguna preocupación sobre la política de moderación, los niveles de confianza o los casos límite (por ejemplo, respuestas cortas pero valiosas como “Resuelto”, “+1 con un enlace”, etc.)?

Si esta dirección tiene sentido, estaré encantado de compartir más detalles (reglas de regex, maqueta de UI, ideas de prompt) y potencialmente trabajar en un PR/complemento.

¡Gracias!


2 Me gusta