Discourseは会話を整理されたバルクデータとしてエクスポートできますか？

Ivan_Rapekas · 2021 年 2 月 20 日午後 6:17

Discourseでは、会話のデータを整理された一括形式でエクスポートし、オフラインで再利用できる機能はありますか？Slackでの使用例は以下の通りです：

履歴からデータを抽出して、新規メンバー向けのドキュメントを作成する際。
複数の議論から有用なデータを抽出し、社外の製品ドキュメントを整理する際。
多くの整理されていないトピックや会話をPythonで解析し、構造化されたデータ（強調された単語を含む）を取得して、異なる会話間のリンクを定義するデータ分析を行う際。

私の意図は伝わりましたでしょうか

Holger_Winkelmann · 2021 年 2 月 20 日午後 8:59

えーと、TensorFlowを使ったことはありますか？最初から多くの非構造化データを避けるべきかもしれません。私もここで同じ問題に直面しています。でも、ソース側で何とか整理しようとしています。ここではSlackのチャット地獄がありますが、人々にデータを構造化してもらうことでそれを回避しようとしています。

Ivan_Rapekas · 2021 年 2 月 20 日午後 10:08

AI が私のケースに適しているか確信が持てません。私はさまざまなソースからデータを収集しており、主な目的は、本当に重要なハイライト（単語、URL、証拠など）を見つけて、以下の質問に答えられる構造化データを作成することです。

特定のタスクに関連する解決策を受け入れる過程における適切な順序は何か。出来事の実際の状況を再構築するため。
アルゴリズムは、多くのレベルの添付ファイルや信頼性の低いウェブ出版物を含む、質の低い会話（特にメール）の中から重要な言及を検出する必要があります。
異なるアクション間の価値あるリンクを定義します。おおよそ次のような流れです：ニュース → ブログ → 世論のムードとニーズ → チャット/メールでの意思決定 → 使用された戦略 → 実際の行動 → 承認された仮定 → 関連する人物 → 結果の説明

そのため、これのためにいくつかの Python テンプレートを使用しています：

PRODUCT_RELATIVE_SOURCES = {
    "websites": {
        "company1": [
            "blog",
            "vacancies",
            "news",
            "tags"
        ]
    },
    "social-networks": {
        "network1": [
            "feed",
            "story",
            "public",
            "direct",
            "tags"
        ]
    },
    "messengers": {
        "messenger1": [
            "chat1",
            "room1",
            "bot1",
            "direct",
            "tags"
        ]
    },
    "mailboxes": {
        "box1": [
            "subject",
            "body",
            "sender",
            "cc",
            "meta"
        ]
    }
}

EXCLUDE_SOURCES = {
    "main",
    "libs",
    "opt"
}

おそらく、Discourse から同様のデータ構造をエクスポートしたいと考えています（おそらく API を通じて）。当初は、Slack と非常に類似している点から、Discourse for Teams に関する質問をしました。私たちのチームは Slack に満足していないためです。有料の履歴機能はほぼ役に立ちません。

tobiaseigen · 2021 年 2 月 20 日午後 10:42

この点について、Discourseでできることはすべて、Discourse for Teamsでも可能です。そのため、あなたの投稿を新しいトピックとして独立させました。他の人からもアドバイスがあるかもしれません。

JSONに慣れていますか？Discourse内のほぼすべてのURLに.jsonを追加すると、ページをより移植しやすい形式で表示できます。それが役立つかもしれません。

例えば、このトピック：

https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json

Ivan_Rapekas · 2021 年 2 月 21 日午後 4:17

わあ、すごく素敵ですね！ありがとうございます、トビアス！これで私には十分です👍

トピック		返信	表示
Dump all conversations in a file and structured data Support	7	1806	2021 年 9 月 15 日
Saving a Conversation Support	9	1031	2021 年 11 月 3 日
Public data dumps Feature	7	2163	2023 年 3 月 31 日
Exporting all Forum Posts for Manual Upload into External LLMs? Support ai	1	279	2025 年 1 月 27 日
ChatGPT Integration tools for Discourse Support	6	2067	2023 年 2 月 27 日

Discourseは会話を整理されたバルクデータとしてエクスポートできますか？

関連トピック