Cómo distribuir la importación en un período más largo para evitar los límites de tasa de servicios externos.

Historia: Imgur images not rendering because server is rate limited

Ya tengo un script de importación personalizado escrito en ruby. Funciona y añade todos los temas, sin embargo, es demasiado rápido. Esto lleva a que el servidor obtenga muchas imágenes de servicios externos como imgur al hornear las publicaciones.

¿Cuál sería la mejor manera de ralentizar esto? Me refiero a que la forma trivial sería simplemente dejar que el proceso de importación duerma un poco entre publicaciones. Pero eso daría lugar a un script potencialmente de larga duración (dada la cantidad de imágenes y el límite de tasa de imgur, aproximadamente 3 días). ¿Hay alguna otra manera, como importar todos los temas a la vez pero diciéndole a discourse que hornee solo un número específico de publicaciones por minuto? De esa manera, los temas se crean inmediatamente pero el html se construye de forma asíncrona.

Puedes volver a hornear las publicaciones más tarde. Cada pocos días puedes volver a hornear las publicaciones malas.

¿Hay alguna forma de encontrar las publicaciones incorrectas para poder reconstruirlas específicamente? Sé que puedo reconstruir todo con rake. Pero eso comenzará siempre con las mismas publicaciones y alcanzará el límite de velocidad antes de llegar a las incorrectas.

Tras más pruebas, realmente necesito evitar encontrarme con el límite de velocidad en primer lugar. Con la cantidad de imágenes incrustadas, parece que la IP termina siendo incluida en la lista negra durante al menos un par de días (han pasado 4 días desde que horneé en esa máquina y todavía está en la lista negra). Así que no puedo simplemente volver a hornear las publicaciones más tarde.

¿Alguna idea sobre cómo distribuir la cocción durante un período de tiempo más largo en primer lugar?