Discourseでは、会話のデータを整理された一括形式でエクスポートし、オフラインで再利用できる機能はありますか?Slackでの使用例は以下の通りです:
- 履歴からデータを抽出して、新規メンバー向けのドキュメントを作成する際。
- 複数の議論から有用なデータを抽出し、社外の製品ドキュメントを整理する際。
- 多くの整理されていないトピックや会話をPythonで解析し、構造化されたデータ(強調された単語を含む)を取得して、異なる会話間のリンクを定義するデータ分析を行う際。
私の意図は伝わりましたでしょうか 
「いいね!」 1
えーと、TensorFlowを使ったことはありますか?
最初から多くの非構造化データを避けるべきかもしれません。私もここで同じ問題に直面しています。でも、ソース側で何とか整理しようとしています。ここではSlackのチャット地獄がありますが、人々にデータを構造化してもらうことでそれを回避しようとしています。
AI が私のケースに適しているか確信が持てません。私はさまざまなソースからデータを収集しており、主な目的は、本当に重要なハイライト(単語、URL、証拠など)を見つけて、以下の質問に答えられる構造化データを作成することです。
- 特定のタスクに関連する解決策を受け入れる過程における適切な順序は何か。出来事の実際の状況を再構築するため。
- アルゴリズムは、多くのレベルの添付ファイルや信頼性の低いウェブ出版物を含む、質の低い会話(特にメール)の中から重要な言及を検出する必要があります。
- 異なるアクション間の価値あるリンクを定義します。おおよそ次のような流れです:ニュース → ブログ → 世論のムードとニーズ → チャット/メールでの意思決定 → 使用された戦略 → 実際の行動 → 承認された仮定 → 関連する人物 → 結果の説明
そのため、これのためにいくつかの Python テンプレートを使用しています:
PRODUCT_RELATIVE_SOURCES = {
"websites": {
"company1": [
"blog",
"vacancies",
"news",
"tags"
]
},
"social-networks": {
"network1": [
"feed",
"story",
"public",
"direct",
"tags"
]
},
"messengers": {
"messenger1": [
"chat1",
"room1",
"bot1",
"direct",
"tags"
]
},
"mailboxes": {
"box1": [
"subject",
"body",
"sender",
"cc",
"meta"
]
}
}
EXCLUDE_SOURCES = {
"main",
"libs",
"opt"
}
おそらく、Discourse から同様のデータ構造をエクスポートしたいと考えています(おそらく API を通じて)。当初は、Slack と非常に類似している点から、Discourse for Teams に関する質問をしました。私たちのチームは Slack に満足していないためです。有料の履歴機能はほぼ役に立ちません。
「いいね!」 1
この点について、Discourseでできることはすべて、Discourse for Teamsでも可能です。そのため、あなたの投稿を新しいトピックとして独立させました。他の人からもアドバイスがあるかもしれません。
JSONに慣れていますか?Discourse内のほぼすべてのURLに.jsonを追加すると、ページをより移植しやすい形式で表示できます。それが役立つかもしれません。
例えば、このトピック:
https://meta.discourse.org/t/does-discourse-support-export-conversations-as-an-organized-bulk-of-data/180537.json
「いいね!」 5
わあ、すごく素敵ですね!ありがとうございます、トビアス!これで私には十分です👍
「いいね!」 2