Bonjour,
Nouveau parmi vous, désolé si je m’attarde sur un sujet déjà épuisé.
Je suis d’accord avec @sam pour dire qu’il y a un piège, mais d’un autre côté, la technologie de modélisation thématique est désormais assez mature et des outils prêts à l’emploi très performants existent. Un projet récent que j’ai mené a analysé environ 5 millions de titres et résumés de brevets ; analyser l’ordre de grandeur de milliers de sujets sur mon tout nouveau site Discourse site serait un jeu d’enfant. De plus, ma communauté pourrait avoir l’énergie nécessaire pour rendre cela possible.
De la part des experts : j’aimerais avoir votre avis sur le fait de savoir si je devrais envisager de concevoir un plugin, ou si je devrais plutôt me pencher sur le code source de Discourse (que j’ai téléchargé depuis GitHub).
J’ai trouvé cela concernant l’extraction de sujets Discourse avec Python, mais je n’ai pas encore réussi à le faire fonctionner. Quelque chose de similaire devrait me permettre de récupérer les données hors ligne, de construire le modèle, puis de le charger pour des requêtes ultérieures.
La plupart des bons outils sont en Python, à titre d’information…