Soy experto en aprendizaje automático, pero no en Discourse. Aunque no soy un experto, he utilizado Discourse mucho y me encanta.
Una herramienta que creo que sería muy potente sería un script para ejecutar (que interactúe con la API) que pudiera:
-
Analizar el uso de etiquetas y etiquetar automáticamente los temas basándose en los datos. Por ejemplo, si una etiqueta en uso es “receta” y algunos temas están etiquetados como “receta”, un algoritmo de aprendizaje automático podría identificar publicaciones adicionales que deberían etiquetarse como “receta”.
-
Analizar los temas para proponer nuevas etiquetas y etiquetar automáticamente los temas relevantes.
Creo que la implementación adecuada de esto estaría en Python y fuera de la implementación real de Discourse. Con un buen diseño de software, el procesamiento del lenguaje natural (NLP) y el aprendizaje automático (ML) estarían segregados del código que interactúa con Discourse. Al interactuar con Discourse a través de la API, esto permitiría desarrollar código de ML arbitrario y crear un paquete de Python de código abierto con contribuciones de la comunidad de ML, esencialmente de forma independiente a la distribución de Discourse. Una interfaz sólida también podría permitir aplicar ML a la gestión de foros de Discourse de otras maneras.
Por lo tanto, estoy interesado en desarrollar un primer intento de ML/NLP para implementar un etiquetador automático y convertirlo en una biblioteca de código abierto.
¿Hay algún desarrollador de Discourse familiarizado con la API que esté interesado en ayudar con el componente de comunicación de Discourse de este proyecto/biblioteca? Este es un componente crítico del equipo que falta. Necesitamos a alguien que pueda hacer esto antes de poder empezar.
¿Hay otros académicos/expertos que deseen participar en el desarrollo de ML/NLP?