¿Usar S3 para subidas significa volver a descargar todos los archivos al crear copias de seguridad?

Hola, acabo de configurar un nuevo Discourse y tengo un bucket de subida en S3.

Pero si Discourse comprime todos los archivos al crear una copia de seguridad, ¿significa que cada vez que se crea una copia de seguridad, Discourse vuelve a descargar todo el bucket de subidas de S3?

¿Y ha tenido alguien problemas con límites de ancho de banda al hacerlo?

2 Me gusta

Creo que se refiere a archivos locales; los archivos en S3 deberían respaldarse por separado.

1 me gusta

Esto solo ocurrirá cuando habilites la configuración del sitio include_s3_uploads_in_backups. Está deshabilitada de forma predeterminada.

6 Me gusta

Esa configuración parece estar habilitada por defecto en mi sitio web. Pero, ¿hay alguna recomendación sobre cómo hacer copias de seguridad de los buckets de carga de S3 de manera eficiente?

Esta guía para guardar copias de seguridad en S3 y también archivarlas en Glacier tiene sentido cuando la copia de seguridad es un único archivo zip. Sin embargo, según mi comprensión de los costos de Glacier, estos se cobran por archivo, por lo que los costos aumentarán drásticamente para las copias de seguridad de buckets descomprimidas.

Soy nuevo en AWS, así que cualquier consejo será bienvenido. ¡Gracias!

Edición: alternativamente, si no hay una respuesta sencilla y buena, podría considerar no usar S3 para las cargas.

https://iolap.com/2020/04/06/how-to-avoid-hidden-amazon-glacier-charges/

2 Me gusta

Eso depende de muchos factores. ¿Cuánto dinero estás dispuesto a invertir? ¿Para qué escenarios te gustaría tener copias de seguridad? Errores de software, que un asteroide impacte los centros de datos de Amazon, un administrador malintencionado que elimine archivos de S3, …

Me temo que no podemos ayudarte con eso. Necesitas encontrar soluciones que se adapten a tu caso de uso en otro lugar. El motor de búsqueda de tu elección es un buen punto de partida.

1 me gusta

He investigado un poco más y hablado con varias personas.

Creo que mi mejor opción será replicar el bucket de S3 en otra región. Necesito investigar más sobre la configuración y los costos.

2 Me gusta

En nuestro caso, con un sitio que no usa Discourse, utilizamos awscli para sincronizar buckets (aws s3 sync) entre diferentes regiones en cuentas distintas, de modo que, incluso si una cuenta es comprometida y el bucket eliminado, o si un asteroide cae y destruye un centro de datos de Amazon (esperemos que no), podríamos recuperarnos desde el otro bucket. Si realizas una sincronización, los costos no deberían ser tan altos, ya que solo se sincronizarán los archivos nuevos o modificados.

Bueno, aún existe el caso de que ambas cuentas sean comprometidas en un corto periodo de tiempo y los buckets eliminados, o que Amazon cierre AWS, ambos escenarios muy muy improbables. Pero si algo así ocurre, simplemente puedes jugar a la lotería, eligiendo los números que creas que son incorrectos :slight_smile:

1 me gusta

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.