古い投稿からリモート画像をダウンロードできますか?

こんにちは。

以前、phpBB フォーラムをインポートしました。
インポート時にリモート画像のダウンロードオプションを設定していなかったと思います。古い投稿には外部リンクが埋め込まれた画像が含まれています。

古い投稿のすべての画像をダウンロードしたいと考えています。
これを行うためのコマンドはありますか?約 15 万件の投稿を解析する必要があります。

何かアドバイスはありますか @vinothkannans さん、@gerhard さん?

  • リモート画像をローカルにダウンロード」サイト設定を有効にします。
  • リモート画像の最大日数」サイト設定の値を 3650(10 年分)に設定します。
  • 古い投稿の再焼き付け数」サイト設定の値を「300」に増やします。300 以上にする場合は、グローバルレートリミッター設定「max_old_rebakes_per_15_minutes」も調整する必要があります。
  • Rails コンソールで古い投稿の「baked_version」を「NULL」に設定します。
    ./launcher enter app
    rails c
    > Post.update_all(baked_version: nil)   # または Post.created_since(N.days.ago).update_all(baked_version: nil)
    

これで、古い投稿に含まれるすべてのリモート画像が、15 分あたり 300 投稿の速度で自動的にダウンロードされるようになります。

簡単な質問ですが、なぜこの処理が必要なのでしょうか?

Post.update_all(baked_version: nil)

「リモート画像のダウンロード対象期間(最大日数)」を20年に設定すればよいのではないですか?

システムが新しいバージョンへの再構築が必要と検知するため、すべての投稿で低速な再構築が開始されます。

しかし、2010 年の投稿にリモート画像が含まれているのを発見しました。私は「リモート画像の最大保存日数」設定以外に変更を加えていないのに、数分後にそのリモート画像が自動的にダウンロードされました。


非常に古い投稿が、リモート画像をダウンロードするためにシステムによって編集されたことが確認されました。

追記:一晩経過後、他の古い画像も自動的にダウンロードされました。これは良いことですが、update_all(baked_version: nil) の部分がなぜ必要なのか、どうしても理解できません。

こんにちは、
スクリプトを適用しましたが、パフォーマンスやサーバー室に大きな影響があるかどうか確認したいです。