ジェイさん、ありがとうございます!励みにします。
うーん、それは考えたくありません。
SQLクエリで正しい道を示してもらってから、おそらく15〜20時間以上かかったでしょう。
もし何か考えがあれば、この件についてあなたの意見を聞かせてください。
非常に強力なVPSで、本番データを使用して完全な試行を実行するには約70時間かかりました。投稿やプライベートメッセージのインポートがまだ完了していなくても、できるだけ早くユーザーに再度操作してもらいたいと考えています。または、私が大幅に修正し、追加のgsub正規表現置換を行ったpreprocess_posts関数を無効にするという別のアイデアもありました。また、元の投稿がTextileマークアップか純粋なHTMLかに応じて、2つのコマンドのいずれかでPandocですべての投稿とプライベートメッセージを処理します。preprocess_postsルーチン全体を無効にすると、インポート時間はほぼ半分に短縮される可能性があり、その後、すべての生のデータがインポートされた後に、そのフォーマット処理をすべてpostprocess_postsセクションに追加できます。しかし、欠点は、後で各投稿のソースフォーマット(TextileまたはHTML)を示す元のデータベース列に簡単にアクセスできなくなることです。これはPandoc操作の条件です。または、各投稿にtextileまたはhtmlというラベルを付けたカスタムフィールドを追加し、後でポスト処理中にそれを取得することはできますか?どうでしょう、独り言です。