Je suis expert en apprentissage automatique, mais pas en Discourse. Je l’utilise beaucoup cependant, et je le trouve vraiment agréable.
Un outil qui, selon moi, serait très puissant serait un script à exécuter (en interagissant avec l’API) capable de :
-
Analyser l’utilisation des balises et auto-étiqueter les sujets en fonction des données. Par exemple, si une balise utilisée est « recette » et que certains sujets sont étiquetés « recette », un algorithme d’apprentissage automatique pourrait identifier d’autres publications qui devraient être étiquetées « recette ».
-
Examiner les sujets pour proposer de nouvelles balises et auto-étiqueter les sujets pertinents.
Je pense que la bonne implémentation de cela serait en Python, en dehors de l’implémentation réelle de Discourse. Avec une bonne conception logicielle, le TAL et l’IA seraient séparés du code interagissant avec Discourse. En interagissant avec Discourse via l’API, cela permettrait de développer du code d’IA arbitraire et de créer un package Python open source avec des contributions de la communauté de l’IA, essentiellement indépendamment de la distribution de Discourse. Une interface solide pourrait également permettre d’appliquer l’IA à la gestion des forums Discourse de manière plus large.
Ainsi, je suis intéressé par le développement d’une première version du TAL/IA pour implémenter un auto-étiqueteur, et rendre cela une bibliothèque open source.
Y a-t-il des développeurs de Discourse familiers avec l’API qui seraient intéressés à aider pour la composante de communication avec Discourse de ce projet/bibliothèque ? C’est une composante critique de l’équipe qui manque. Nous avons besoin de quelqu’un capable de le faire avant de pouvoir commencer.
Y a-t-il d’autres universitaires/experts qui souhaiteraient participer au développement du TAL/IA ?