Discourse prend-il en charge l'exportation des conversations sous forme d'un ensemble de données organisé en masse ?

Ivan_Rapekas · Février 20, 2021, 6:17

Discourse permet-il d’exporter des conversations sous forme d’un ensemble organisé de données réutilisables hors ligne ? Cas d’usage dans Slack :

Parfois, j’extrais certaines données de l’historique pour préparer des documents destinés aux nouveaux arrivants.
La même approche pour extraire des données utiles de plusieurs discussions afin d’organiser la documentation externe du produit.
Tenter d’analyser un grand nombre de sujets/conversations mal triés à l’aide de Python pour obtenir des données structurées avec des mots mis en évidence — étapes pour définir des liens entre différentes conversations (une sorte d’analyse de données)

J’espère avoir été clair

Holger_Winkelmann · Février 20, 2021, 8:59

Hmm, as-tu utilisé TensorFlow ? Tu devrais peut-être éviter beaucoup de données non structurées dès le départ. Je rencontre le même problème ici. Mais j’essaie de régler cela à la source. J’ai un enfer de discussions Slack ici ; je vais m’en sortir en demandant aux gens de structurer les données…

Ivan_Rapekas · Février 20, 2021, 10:08

Je ne suis pas sûr que l’IA soit la solution adaptée à mon cas. Je collecte des données provenant de diverses sources, et l’objectif principal est d’identifier les éléments vraiment importants (mots, URL, preuves, etc.) et de créer des données structurées capables de répondre aux questions suivantes :

Quel était l’ordre correct dans le processus d’adoption d’une solution spécifique liée à une tâche donnée, afin de reconstituer le tableau réel des événements.
L’algorithme doit détecter les mentions importantes au sein d’un grand nombre de conversations de faible qualité (en particulier les e-mails comportant de multiples niveaux de pièces jointes et les publications web non fiables).
Définir des liens pertinents entre différentes actions, selon une approche approximative telle que : actualités → blog → humeur et besoins du public → décision via chat/e-mail → stratégie adoptée → actions réelles → hypothèses validées → personnes concernées → explication des résultats.

J’utilise donc un modèle Python à cet effet :

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

Je souhaiterais probablement obtenir une structure de données similaire exportée depuis Discourse (via l’API peut-être). Initialement, j’ai posé une question concernant Discourse for Teams, car j’ai trouvé de nombreuses similitudes avec Slack, et notre équipe n’est pas satisfaite de Slack. La fonctionnalité payante de l’historique est presque inutile.

tobiaseigen · Février 20, 2021, 10:42

À cet égard, tout ce que vous pouvez faire avec Discourse, vous pouvez aussi le faire avec Discourse pour les équipes. C’est pourquoi j’ai déplacé votre message dans un nouveau sujet. Peut-être que d’autres personnes ont des suggestions pour vous.

Êtes-vous familier avec JSON ? Vous pouvez ajouter .json à presque n’importe quelle URL dans Discourse pour voir la page dans un format plus portable. Peut-être que cela vous aidera ?

Par exemple, ce sujet :

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

Ivan_Rapekas · Février 21, 2021, 4:17

Waouh, cela a l’air super, merci beaucoup, Tobias ! Je pense que cela me suffit

Sujet		Réponses	Vues
Dump all conversations in a file and structured data Support	7	1806	Septembre 15, 2021
Saving a Conversation Support	9	1031	Novembre 3, 2021
Public data dumps Feature	7	2163	Mars 31, 2023
Exporting all Forum Posts for Manual Upload into External LLMs? Support ai	1	279	Janvier 27, 2025
ChatGPT Integration tools for Discourse Support	6	2067	Février 27, 2023

Discourse prend-il en charge l'exportation des conversations sous forme d'un ensemble de données organisé en masse ?

Sujets connexes