Discourse supporta l'esportazione delle conversazioni come blocco organizzato di dati?

Discourse supporta l’esportazione delle conversazioni come un insieme organizzato di dati che può essere riutilizzato offline? Casi d’uso in Slack:

  1. A volte estraggo alcuni dati dalla cronologia per preparare documenti per i nuovi arrivati.
  2. Lo stesso approccio per estrarre dati utili da diverse discussioni e organizzare la documentazione esterna del prodotto.
  3. Tentativo di analizzare molte conversazioni/argomenti mal ordinati utilizzando Python per ottenere dati strutturati con parole evidenziate: passaggi per definire i collegamenti tra diverse conversazioni (una sorta di analisi dei dati)

Spero di essere stato chiaro :grinning:

1 Mi Piace

Hmm, hai mai usato TensorFlow? :wink: Forse dovresti evitare di avere molti dati non strutturati fin dall’inizio. Ho lo stesso problema qui. Ma cerco di sistemarlo in qualche modo alla fonte. Ho un inferno di chat su Slack qui, ma lo risolverò facendo in modo che le persone strutturino i dati…

Non sono sicuro che l’IA sia la soluzione giusta per il mio caso. Raccoglio dati da diverse fonti e l’obiettivo principale è identificare i punti salienti davvero importanti (parole, URL, prove, ecc.) e creare una struttura dati strutturata in grado di rispondere a queste domande:

  1. Qual era l’ordine corretto nel processo di accettazione di una determinata soluzione relativa a un certo compito, al fine di ricostruire la reale sequenza degli eventi.
  2. L’algoritmo dovrebbe rilevare menzioni importanti in una grande quantità di conversazioni di scarsa qualità (in particolare e-mail con molti livelli di allegati e pubblicazioni web non affidabili).
  3. Definire collegamenti di valore tra diverse azioni, approssimativamente in questo modo: notizie → blog → umore e bisogni del pubblico → decisione via chat/e-mail → strategia adottata → azioni reali → assunzioni approvate → persone coinvolte → spiegazione del risultato.

Quindi uso un modello Python a questo scopo:

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

Probabilmente mi piacerebbe avere una struttura dati simile esportata da Discourse (forse tramite API). Inizialmente ho posto la domanda relativa a Discourse for Teams, perché ho trovato molte funzionalità simili a quelle di Slack e il nostro team non è soddisfatto di Slack. La funzione a pagamento per la cronologia è quasi inutile.

1 Mi Piace

A questo proposito, tutto ciò che puoi fare con Discourse, puoi farlo anche con Discourse per Teams. Per questo motivo ho spostato il tuo post in un nuovo argomento dedicato. Forse altri potranno darti dei suggerimenti.

Conosci il formato JSON? Puoi aggiungere .json a quasi qualsiasi URL in Discourse per visualizzare la pagina in un formato più portatile. Forse può esserti utile?

Ad esempio, questo argomento:

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

5 Mi Piace

Wow, sembra fantastico, grazie mille, Tobias! Penso che sia sufficiente per me :+1:

2 Mi Piace