Discourse supporta l'esportazione delle conversazioni come blocco organizzato di dati?

Ivan_Rapekas · 20 Febbraio 2021, 6:17pm

Discourse supporta l’esportazione delle conversazioni come un insieme organizzato di dati che può essere riutilizzato offline? Casi d’uso in Slack:

A volte estraggo alcuni dati dalla cronologia per preparare documenti per i nuovi arrivati.
Lo stesso approccio per estrarre dati utili da diverse discussioni e organizzare la documentazione esterna del prodotto.
Tentativo di analizzare molte conversazioni/argomenti mal ordinati utilizzando Python per ottenere dati strutturati con parole evidenziate: passaggi per definire i collegamenti tra diverse conversazioni (una sorta di analisi dei dati)

Spero di essere stato chiaro

Holger_Winkelmann · 20 Febbraio 2021, 8:59pm

Hmm, hai mai usato TensorFlow? Forse dovresti evitare di avere molti dati non strutturati fin dall’inizio. Ho lo stesso problema qui. Ma cerco di sistemarlo in qualche modo alla fonte. Ho un inferno di chat su Slack qui, ma lo risolverò facendo in modo che le persone strutturino i dati…

Ivan_Rapekas · 20 Febbraio 2021, 10:08pm

Non sono sicuro che l’IA sia la soluzione giusta per il mio caso. Raccoglio dati da diverse fonti e l’obiettivo principale è identificare i punti salienti davvero importanti (parole, URL, prove, ecc.) e creare una struttura dati strutturata in grado di rispondere a queste domande:

Qual era l’ordine corretto nel processo di accettazione di una determinata soluzione relativa a un certo compito, al fine di ricostruire la reale sequenza degli eventi.
L’algoritmo dovrebbe rilevare menzioni importanti in una grande quantità di conversazioni di scarsa qualità (in particolare e-mail con molti livelli di allegati e pubblicazioni web non affidabili).
Definire collegamenti di valore tra diverse azioni, approssimativamente in questo modo: notizie → blog → umore e bisogni del pubblico → decisione via chat/e-mail → strategia adottata → azioni reali → assunzioni approvate → persone coinvolte → spiegazione del risultato.

Quindi uso un modello Python a questo scopo:

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

Probabilmente mi piacerebbe avere una struttura dati simile esportata da Discourse (forse tramite API). Inizialmente ho posto la domanda relativa a Discourse for Teams, perché ho trovato molte funzionalità simili a quelle di Slack e il nostro team non è soddisfatto di Slack. La funzione a pagamento per la cronologia è quasi inutile.

tobiaseigen · 20 Febbraio 2021, 10:42pm

A questo proposito, tutto ciò che puoi fare con Discourse, puoi farlo anche con Discourse per Teams. Per questo motivo ho spostato il tuo post in un nuovo argomento dedicato. Forse altri potranno darti dei suggerimenti.

Conosci il formato JSON? Puoi aggiungere .json a quasi qualsiasi URL in Discourse per visualizzare la pagina in un formato più portatile. Forse può esserti utile?

Ad esempio, questo argomento:

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

Ivan_Rapekas · 21 Febbraio 2021, 4:17pm

Wow, sembra fantastico, grazie mille, Tobias! Penso che sia sufficiente per me

Argomento		Risposte	Visualizzazioni
Dump all conversations in a file and structured data Support	7	1806	Settembre 15, 2021
Saving a Conversation Support	9	1031	Novembre 3, 2021
Public data dumps Feature	7	2163	Marzo 31, 2023
Exporting all Forum Posts for Manual Upload into External LLMs? Support ai	1	278	Gennaio 27, 2025
ChatGPT Integration tools for Discourse Support	6	2067	Febbraio 27, 2023

Discourse supporta l'esportazione delle conversazioni come blocco organizzato di dati?

Argomenti correlati