Discourse prend-il en charge l'exportation des conversations sous forme d'un ensemble de données organisé en masse ?

Discourse permet-il d’exporter des conversations sous forme d’un ensemble organisé de données réutilisables hors ligne ? Cas d’usage dans Slack :

  1. Parfois, j’extrais certaines données de l’historique pour préparer des documents destinés aux nouveaux arrivants.
  2. La même approche pour extraire des données utiles de plusieurs discussions afin d’organiser la documentation externe du produit.
  3. Tenter d’analyser un grand nombre de sujets/conversations mal triés à l’aide de Python pour obtenir des données structurées avec des mots mis en évidence — étapes pour définir des liens entre différentes conversations (une sorte d’analyse de données)

J’espère avoir été clair :grinning:

1 « J'aime »

Hmm, as-tu utilisé TensorFlow ? :wink: Tu devrais peut-être éviter beaucoup de données non structurées dès le départ. Je rencontre le même problème ici. Mais j’essaie de régler cela à la source. J’ai un enfer de discussions Slack ici ; je vais m’en sortir en demandant aux gens de structurer les données…

Je ne suis pas sûr que l’IA soit la solution adaptée à mon cas. Je collecte des données provenant de diverses sources, et l’objectif principal est d’identifier les éléments vraiment importants (mots, URL, preuves, etc.) et de créer des données structurées capables de répondre aux questions suivantes :

  1. Quel était l’ordre correct dans le processus d’adoption d’une solution spécifique liée à une tâche donnée, afin de reconstituer le tableau réel des événements.
  2. L’algorithme doit détecter les mentions importantes au sein d’un grand nombre de conversations de faible qualité (en particulier les e-mails comportant de multiples niveaux de pièces jointes et les publications web non fiables).
  3. Définir des liens pertinents entre différentes actions, selon une approche approximative telle que : actualités → blog → humeur et besoins du public → décision via chat/e-mail → stratégie adoptée → actions réelles → hypothèses validées → personnes concernées → explication des résultats.

J’utilise donc un modèle Python à cet effet :

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

Je souhaiterais probablement obtenir une structure de données similaire exportée depuis Discourse (via l’API peut-être). Initialement, j’ai posé une question concernant Discourse for Teams, car j’ai trouvé de nombreuses similitudes avec Slack, et notre équipe n’est pas satisfaite de Slack. La fonctionnalité payante de l’historique est presque inutile.

1 « J'aime »

À cet égard, tout ce que vous pouvez faire avec Discourse, vous pouvez aussi le faire avec Discourse pour les équipes. C’est pourquoi j’ai déplacé votre message dans un nouveau sujet. Peut-être que d’autres personnes ont des suggestions pour vous.

Êtes-vous familier avec JSON ? Vous pouvez ajouter .json à presque n’importe quelle URL dans Discourse pour voir la page dans un format plus portable. Peut-être que cela vous aidera ?

Par exemple, ce sujet :

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

5 « J'aime »

Waouh, cela a l’air super, merci beaucoup, Tobias ! Je pense que cela me suffit :+1:

2 « J'aime »