他のフォーラムからの非常に大きなJSONエクスポートの一部を解析/インポートする

プロジェクトの存続期間中、アーカイブまたはアクセス可能にする必要がある多くのディスカッション(残念ながらすべてではなく、数千のうち約500)があるフォーラムを移行したばかりです。移行元はcpmmonwealth.imで、かなり類似したプラットフォームです。

APIから完全な履歴をエクスポートしました。3つの比較的大きな(3〜16MB)JSONファイル(コミュニティ、トピック、スレッド、コメント、リアクション)です。(そのうち2つは不要な、小さいものです…)

元のスレッド > コメント > コメントなどの形式でインポートされる必要すらありません。各スレッドとコメントを単一のトランスクリプトスタイルのメッセージに結合するだけでも構いません。それらを「アーカイブ」トピックに「新しいスレッド」として追加し、すぐにロックする予定です。

基本的に、どこから始めればよいかわかりません。「jq」のレベルはいくつか理解できますし、JSONの1つをWebアプリケーションにロードしましたが、PCがほとんど使用不能になりました。

ここのサポートチームの1人が、JSONをSQLデータベースなどにダンプするスクリプトについて言及していましたか?これらのほとんどにはあまり詳しくありませんが、おそらく習得できるでしょう。始めるための指示が必要です。

例については、discourse/script/import_scripts/drupal_json.rb at main · discourse/discourse · GitHub を参照してください。また、JSON を処理する他のスクリプトもそこで確認してください。

「いいね!」 3

Discourse API が処理できる形式に翻訳する必要があります。

JSONスクリプトはJSONを取得し、それをSQLデータベースに格納して読み取るだけです。

「いいね!」 1

ええ、私はこれらのことについてほとんど何も知りませんし、SQLについてはさらに知りません。だから、私はそこに行くことにしました。とにかく楽しかったです。

「いいね!」 1