Baixar imagens remotas de posts antigos?

Olá.

Importei um fórum phpBB há algum tempo.
Acho que não configurei a opção para baixar as imagens remotas durante a importação, pois as postagens mais antigas têm imagens incorporadas com links externos.

Gostaria de baixar todas essas imagens das postagens mais antigas.

Existe algum comando para fazer isso? Tenho cerca de 150.000 postagens para analisar.

Alguma sugestão aqui, @vinothkannans ou @gerhard?

  • Ative a configuração do site “download remote images to local”.
  • Defina o valor da configuração do site “download remote images max days old” para 3650 (para 10 anos).
  • Aumente o valor da configuração do site “rebake old posts count” para “300”. Para aumentá-lo além de 300, você também deve ajustar a configuração global de limitador de taxa “max_old_rebakes_per_15_minutes”.
  • E defina o “baked_version” das postagens antigas como “NULL” no console do Rails.
    ./launcher enter app
    rails c
    > Post.update_all(baked_version: nil)   # ou Post.created_since(N.days.ago).update_all(baked_version: nil)
    

Agora, todas as imagens remotas em postagens antigas serão baixadas automaticamente na velocidade de 300 postagens a cada 15 minutos.

Pergunta rápida: por que é necessário fazer isso:

Post.update_all(baked_version: nil)

Se eu definir dias máximos de antiguidade para baixar imagens remotas para 20 anos?

Isso iniciará uma nova renderização lenta em todas as postagens, pois o sistema detectará que é necessário renderizar as postagens novamente para a nova versão.

Mas eu vi uma postagem de 2010 que continha uma imagem remota. Não alterei nada além da configuração download de imagens remotas com até X dias, e a imagem remota foi baixada automaticamente após alguns minutos.


A postagem muito antiga foi realmente editada pelo sistema para baixar a imagem remota.

edição: durante a noite, outras imagens antigas foram baixadas automaticamente, o que é ótimo, mas definitivamente não entendo a parte do update_all(baked_version: nil).

Olá,
Appliquei o script, mas tenho dúvidas sobre se haverá um impacto significativo no desempenho e na sala de servidores.