Migration per Snapshot-Upload

schwa · 14. Januar 2022 um 21:58

Nachdem wir erfolgreich mit dem vbulletin-Migrationsskript gekämpft haben und die Migration nun seit 36 Stunden läuft, wobei noch ein paar Millionen Beiträge übrig sind…

Wenn keine bestehenden Discourse-Inhalte oder Datenbeziehungen erhalten bleiben müssen, gibt es dann einen Grund, warum ein bestehendes Nicht-Discourse-Forum nicht migriert werden könnte, indem direkt aus den Quelldatenbankdaten ein Discourse-Backup-SQL-Snapshot generiert wird?

Wir müssten das Skript mehr oder weniger von Grund auf neu schreiben, aber es wäre auf hoher Ebene ähnlich wie die bestehenden Migrationsskripte. Das Skript würde die Daten aus der Quelldatenbank abrufen, sie nach Bedarf aufbereiten* und flache Datendumps für jede Ziel-Discourse-Tabelle generieren, die verwendet werden könnten, um das Äquivalent eines Discourse-Backup-Snapshots zusammenzustellen. Mehr oder weniger würde die Skriptausgabe in den Backup-Snapshot einer leeren Discourse-Instanz eingespeist werden.

Das * oben verbirgt eine Menge Arbeit, aber gibt es größere Hürden, die ich übersehe? Da wir alle vorhandenen Quellendatenbezeichner (Themen-ID, Thread-ID usw.) wiederverwenden können, glaube ich nicht, dass der Aufbereitungsschritt eine signifikante Menge an Zustand erfordert, aber vielleicht liege ich da falsch. Es scheint, dass die Hauptarbeit der Migrationslogik in den Datenbankaufrufen an die Quelldatenbank liegen würde.

pfaffman · 14. Januar 2022 um 23:26

Das ist so ziemlich das, was das Bulk-Import-Skript tut. Ich glaube, es gibt eines für vBulletin. Sie werden ganz von vorne anfangen und ich war bisher nicht erfolgreich darin, es auszuführen, aber wenn Sie eine andere Maschine haben, können Sie es dort versuchen, während der aktuelle Import fortgesetzt wird.

codinghorror · 14. Januar 2022 um 23:53

Wo befindet sich der Massenimport-Code heutzutage auf GitHub, @zogstrip und @gerhard?

pfaffman · 15. Januar 2022 um 02:08

Es befindet sich im Verzeichnis des Importskripts.

github.com/discourse/discourse

script/bulk_import/vbulletin.rb

main

# frozen_string_literal: true

require_relative "base"
require "mysql2"
require "htmlentities"
require "parallel"

class BulkImport::VBulletin < BulkImport::Base
  TABLE_PREFIX = ENV["TABLE_PREFIX"] || "vb_"
  SUSPENDED_TILL = Date.new(3000, 1, 1)
  ATTACHMENT_DIR = ENV["ATTACHMENT_DIR"] || "/shared/import/data/attachments"
  AVATAR_DIR = ENV["AVATAR_DIR"] || "/shared/import/data/customavatars"

  def initialize
    super

    host = ENV["DB_HOST"] || "localhost"
    username = ENV["DB_USERNAME"] || "root"
    password = ENV["DB_PASSWORD"]
    database = ENV["DB_NAME"] || "vbulletin"

This file has been truncated. show original

Thema		Antworten	Aufrufe
Migrate from another forum to Discourse Migrating to Discourse how-to	0	27461	17. Juni 2014
Migrating vBulletin onto existing and live Discourse instance Support	8	2413	9. April 2019
Migrating legacy data from other applications Migration	5	1431	3. März 2018
Importing from a legacy forum Migration	2	1766	11. Mai 2015
My phpBB Migration Journey (postgresql) Migration phpbb	23	2060	30. März 2023

Migration per Snapshot-Upload

Verwandte Themen