Миграция через загрузку снапшота

schwa · 14.Январь.2022 21:58:22

После успешной борьбы со скриптом миграции vBulletin и наблюдения за тем, как процесс миграции уже идет 36 часов, при этом осталось перенести несколько миллионов сообщений…

Если нет существующего контента Discourse или связей данных, которые нужно сохранить, есть ли какие-либо причины, по которым существующий форум, не являющийся Discourse, нельзя было бы мигрировать, сгенерировав резервную копию SQL-снимка Discourse напрямую из данных исходной базы данных?

Нам пришлось бы написать скрипт почти с нуля, но он был бы высокоуровнево похож на существующие скрипты миграции. Скрипт извлекал бы данные из исходной базы данных, преобразовывал их по мере необходимости* и создавал плоские дампы данных для каждой целевой таблицы Discourse, которые можно было бы использовать для сборки эквивалента резервной копии Discourse. По сути, вывод скрипта внедрялся бы в резервную копию пустого экземпляра Discourse.

Вышеупомянутое скрывает огромный объем работы, но есть ли какие-либо серьезные препятствия, которые я упускаю? Поскольку мы можем использовать все существующие идентификаторы данных из источника (id темы, id потока и т. д.), я не думаю, что этап преобразования требует хранения значительного объема состояния, но, возможно, я ошибаюсь в этом. Похоже, что основная работа логики миграции будет заключаться в вызовах базы данных к исходной базе данных.

pfaffman · 14.Январь.2022 23:26:41

По сути, именно это делает скрипт массового импорта. Насколько я знаю, для vBulletin такой скрипт существует. Вам придется начинать с нуля, и мне пока не удалось успешно его запустить, но если у вас есть другой сервер, попробуйте запустить его там, пока текущий импорт продолжается.

codinghorror · 14.Январь.2022 23:53:52

@zogstrip и @gerhard, где сейчас находится код импортера больших объемов данных на GitHub?

pfaffman · 15.Январь.2022 02:08:44

Это находится в директории скрипта импорта.

github.com/discourse/discourse

script/bulk_import/vbulletin.rb

main

# frozen_string_literal: true

require_relative "base"
require "mysql2"
require "htmlentities"
require "parallel"

class BulkImport::VBulletin < BulkImport::Base
  TABLE_PREFIX = ENV["TABLE_PREFIX"] || "vb_"
  SUSPENDED_TILL = Date.new(3000, 1, 1)
  ATTACHMENT_DIR = ENV["ATTACHMENT_DIR"] || "/shared/import/data/attachments"
  AVATAR_DIR = ENV["AVATAR_DIR"] || "/shared/import/data/customavatars"

  def initialize
    super

    host = ENV["DB_HOST"] || "localhost"
    username = ENV["DB_USERNAME"] || "root"
    password = ENV["DB_PASSWORD"]
    database = ENV["DB_NAME"] || "vbulletin"

This file has been truncated. show original

Тема		Ответов	Просм.
Migrate from another forum to Discourse Migrating to Discourse how-to	0	27451	17.06.2014
Migrating vBulletin onto existing and live Discourse instance Support	8	2405	09.04.2019
Migrating legacy data from other applications Migration	5	1430	03.03.2018
Importing from a legacy forum Migration	2	1766	11.05.2015
My phpBB Migration Journey (postgresql) Migration phpbb	23	2055	30.03.2023

Миграция через загрузку снапшота

Связанные темы