Merge two Discourse sites into one

If you have two Discourse sites that you wish were one, this guide is for you.

There’s a tool called discourse_merger that can take one Discourse site and merge it into another.

Prereqs

This is not an easy task, and should be treated like any other migration to Discourse. You will not be running discourse_merger on a live production site. You will perform the merge in another environment where you can review the output before moving the result to production.

Copy vs Merge

Almost everything will be copied from one site to the other, but Categories and Users can be merged, which will avoid duplication.

  • Users will be merged if a user on both sites has the same email address.
  • Categories will be merged if they have the same name.

If you want to do any reorganization of your data, do it before merging.

Choose the destination site

Choose which site will be the destination for the data. This is the one that will retain all its styling and settings. The other site will have its users, categories, topics, posts, uploads, etc. copied/merged into the destination site.

How to do it

Take backups of both sites including files and copy them to the environment where you’ll perform the merge. It’s possible that they’re from different versions of Discourse, so we need them to be at the same version. I would choose to use the most recent version of Discourse while performing the merge.

Restore the destination site to the merger environment. If doing this from the command line:

bundle exec ruby script/discourse restore destination-2018-08-02-134227-v2018xxx.tar.gz

Next we’ll extract the other site.

cd /path/to/data
tar xvzf other-2018-08-02-134227-v2018xxx.tar.gz

The output will include the database dump and the upload files.

Create a database with the data:

psql
CREATE DATABASE "copyme" ENCODING = 'utf8';
\q
gunzip < /path/to/data/other-2018-08-02-134227-v2018xxx.tar.gz | psql -d copyme

If you’re running the import in an official Docker container (recommended), you will need to reset the postgres password to provide it to the script, otherwise you may encounter an error that the postgres user cannot access the database.

To change the password:

sudo -u postgres psql
\password postgres
(enter the new password)
\q

Now it’s time to run the script. Some env variables you’ll set:

DB_NAME: name of database being merged into the destination site.
DB_HOST: (optional) hostname of database being merged. leave blank if it’s local.
DB_PASS: password for the postgres user to access the database
UPLOADS_PATH: absolute path (site being merged) of the directory containing “original” and “optimized” dirs. e.g. /path/to/data/uploads/default
SOURCE_BASE_URL: base url of the site being merged. e.g. https://meta.discourse.org
SOURCE_CDN: (optional) base url of the CDN of the site being merged.

You may need to run a bundle install prior to running the import script to avoid errors. To do so:

su discourse -c 'bundle config set --local with generic_import && bundle install'

On the first run, you might need to install some extra dependencies for the gems required in import.

Once the bundle is complete, run the import.

su discourse -c 'DB_NAME=copyme DB_PASS=password SOURCE_BASE_URL=http://copy.othersite.com UPLOADS_PATH=/shared/import/data/uploads/default bundle exec ruby script/bulk_import/discourse_merger.rb'

When it’s done, review the output in a web browser.

You can use the remap tool to update links from the old forum.

bundle exec ruby script/discourse remap 'copy.othersite.com' 'hot.newsite.com'

Also rebake all posts with uploads:

rake posts:rebake_match["upload:"]

If everything looks good, take a backup of the result and restore it to your production server.

bundle exec ruby script/discourse backup

Last edited by @italo 2024-11-27T00:52:10Z

Last checked by @JammyDodger 2024-05-26T21:20:00Z

Check documentPerform check on document:
「いいね!」 45

動作しているようですが、バックアップを実行すると以下のようなエラーが発生します。

pg_dump: error: query failed: ERROR:  permission denied for table migration_mappings

これは非常に奇妙です。

編集:以下で解決しました。

ALTER USER discourse WITH SUPERUSER;
「いいね!」 1

最近これを使った人はいますか?どうでしたか?

また、ユーザーをそれぞれのフォーラムごとに自動的にグループに入れることは可能ですか?(彼らが来たフォーラムのトピックを表示する権限を簡単に付与できるようにするため。)

少し大変でした。いくつかコメントアウトする必要があったと思います。マージ画像にも問題がありました。

新しいサイトのユーザーをすべて何らかのグループに追加しておけば、マージ時にそのグループに属するようにできると思います。マージ後やマージの一部として行うよりも、こちらの方が簡単でしょう。

「いいね!」 2

前回これを実行したとき、マージされたサイトからのアップロードがすべて欠落していました。tar tf backupfile.tar.gz からアップロードのリストを取得し、allfiles.txtx に入れてアップロードディレクトリにコピーしました。このスクリプト(おそらく変更なしでは動作しません)は、それらのファイルのそれぞれに対してアップロードを作成したため、投稿を再ベイクすることで、欠落した画像がすべて(またはほとんど)修正されました。

def process_uploads
  begin
    # ファイル名のリストを読み込む
    filenames = File.readlines('/shared/uploads/allfiles.txt').map(&:strip)
    count = 0

    filenames.each do |filename|
      # ファイル名に /shared を前置する
      filename.gsub!(/\.\//,"")
      full_path = File.join('/shared/uploads/default/original/', filename)

      begin
        # パスが存在し、通常のファイル(ディレクトリではない)であることを確認する
        count += 1
        
        if File.exist?(full_path) && File.file?(full_path)
          # ファイルを開く
          File.open(full_path, 'r') do |tempfile|
            # 指定されたパラメータを使用してアップロードを作成する
            u = UploadCreator.new(tempfile, 'imported', {}).create_for(-1)
            puts "#{count} -- #{u.id}: #{u.url}"
          end
        else
          puts "警告: パスが見つからないか、通常のファイルではありません: #{full_path}"
        end
      rescue => e
        puts "ファイル #{full_path} の処理中にエラーが発生しました: #{e.message}"
        # 現在のファイルが失敗しても、次のファイルに進む
        next
      end
    end
  rescue Errno::ENOENT
    puts "エラー: files.txt が見つかりませんでした"
  rescue => e
    puts "files.txt の読み取り中にエラーが発生しました: #{e.message}"
  end
end

# 処理を実行する
process_uploads;

次のように、悪い投稿を取得しました。

 bad=Post.where("cooked like '%/images/transparent.png%'")

そして、再ベイクが必要であることをマークするためにこれを使用しました。

bad.update_all(baked_version: nil)

私は性急だったので、これを使用しました。

rake posts:rebake_uncooked_posts

それらを再ベイクするために。

「いいね!」 2

マージしたいディスコースフォーラムを XenForo に変換する方が簡単な場合があります(インポーターは通常優れているため)。その後、マージしたい他のフォーラム(vBulletin から XenForo に変換される)とマージし、最後に新しいマージされた XenForo フォーラムをディスコースにインポートします。