Como distribuir a importação por um período maior para evitar atingir os limites de taxa de serviços externos

Histórico: Imgur images not rendering because server is rate limited

Já tenho um script de importação personalizado escrito em Ruby. Ele funciona e adiciona todos os tópicos, no entanto, é muito rápido. Isso leva o servidor a buscar muitas imagens de serviços externos como o imgur ao processar as postagens.

Qual seria a melhor maneira de desacelerar isso? Quero dizer, a maneira trivial seria simplesmente deixar o processo de importação dormir um pouco entre as postagens. Mas isso levaria a um script potencialmente demorado (dada a quantidade de imagens e o limite de taxa do imgur, aproximadamente 3 dias). Existe alguma outra maneira, como importar todos os tópicos de uma vez, mas dizendo ao Discourse para processar apenas um número específico de postagens por minuto? Dessa forma, os tópicos são criados imediatamente, mas o HTML é construído de forma assíncrona.

Você pode simplesmente reassarar as postagens mais tarde. A cada poucos dias, você pode reassarar as postagens ruins.

Existe uma maneira de encontrar as postagens ruins, para que eu possa reconstruir especificamente essas? Eu sei que posso reconstruir tudo via rake. Mas isso começará sempre com as mesmas postagens e atingirá o limite de taxa antes de chegar às ruins.

Em testes adicionais, preciso realmente evitar atingir o limite de taxa em primeiro lugar. Com a quantidade de imagens incorporadas, parece que o IP acaba sendo listado como bloqueado por pelo menos alguns dias (faz 4 dias que fiz o baking naquela máquina e ainda está listado como bloqueado). Portanto, não posso simplesmente refazer os posts mais tarde.

Alguma ideia sobre como distribuir o baking por um período de tempo mais longo em primeiro lugar?