¿Son suficientes las copias de seguridad diarias?

Soy un poco “controlador” en lo que respecta a no perder ningún dato. Ver solo copias de seguridad diarias siempre me hace sentir que algo puede sucederle a un servidor y, de repente, se pierde un día completo de datos, que pueden ser extremadamente importantes.

Sin ser demasiado técnico, porque no soy un experto, ¿no sería posible un sistema donde lo que se publica/añade se replique a otro servidor? Creo que así es como funciona una plataforma de redes sociales cuando publicamos contenido.

Si esto no es posible con Discourse, ¿no serían las copias de seguridad por hora un poco más seguras? No veo una opción para eso. Parece que solo llega hasta 1 (diario) o 0 (deshabilitado).

¿Cómo manejan esto ustedes?

Un buen VPS en una buena plataforma es muy improbable que tenga algún problema y especialmente no entre actualizaciones.

En casi 8 años de tener uno de mis foros en funcionamiento, no he tenido ni una sola pérdida de datos.

El lote diario está diseñado como una compensación para la mayoría de los autoalojadores.

Es un sistema bastante sencillo, un régimen, y no exige demasiado espacio ni procesamiento.

No me imagino que valga la pena hacerlo más a menudo para la mayoría de la gente.

Nunca he necesitado usar una copia de seguridad para caídas en línea, solo las uso para migrar a nuevos servidores, si es necesario (¡porque me he quedado sin espacio en el más pequeño!).

Sus resultados pueden variar (YMMV)

Sin embargo, si cree que necesita una configuración más frecuente… prepárese para personalizar su configuración y esté preparado para mantener esa personalización (lo que implicaría aprender a hacerlo y/o contratar a alguien para que le ayude).

3 Me gusta

Las copias de seguridad (backups) y la replicación son dos cosas diferentes.

Las copias de seguridad proporcionan una instantánea de los datos en un momento dado. Proporcionan un punto de restauración.

La replicación consiste en distribuir cada acción a un sistema diferente para que la tengas en más de una ubicación. Las eliminaciones también se replican.

Si realmente quieres tolerancia a fallos, necesitas tener ambas cosas. (Y más…)

Por lo tanto, la replicación solo resuelve el problema de tener datos actuales en múltiples lugares. Las copias de seguridad proporcionan el método para restaurar un sistema a un punto específico en el tiempo.

Discourse utiliza 2 mecanismos para el almacenamiento:

  1. Base de datos PostgreSQL para todo excepto los archivos adjuntos
  2. Los archivos adjuntos se almacenan en el sistema local o en S3

Para hacer una copia de seguridad y/o replicar los datos almacenados en la base de datos PostgreSQL, puedes consultar la documentación de PostgreSQL sobre cómo hacerlo. Sobre copias de seguridad, y replicación.

Los archivos adjuntos son un poco más complicados. Si los almacenas en S3, puedes usar copias de seguridad de S3. Para los archivos almacenados localmente, puedes usar varias opciones del sistema local.

Crear copias de seguridad completas es una tarea pesada dependiendo de la cantidad de datos. Por lo que no se puede hacer con más frecuencia fácilmente. El procedimiento de copia de seguridad estándar de Discourse es crear copias de seguridad completas. Si realmente quieres reducir el riesgo de perder datos, debes buscar otras opciones.

Una opción podría ser proporcionada por tu servicio de alojamiento: instantáneas de volumen (volume snapshots). Esto proporciona una forma de hacer una copia “instantánea” de los datos almacenados en un volumen. Esto te permite restaurar el volumen a ese momento. Las instantáneas de volumen también pueden estar disponibles dentro del sistema operativo dependiendo del sistema de archivos utilizado. (btrfs lo soporta, por ejemplo).

Además de eso, la documentación de PostgreSQL también aborda cómo hacer copias de seguridad más continuas de la base de datos, lo que permite una excelente recuperación en un punto específico en el tiempo de la base de datos. (No olvides enviar las copias de seguridad fuera del sitio). Esto es mucho más rápido que las copias de seguridad completas.

Para copias de seguridad de adjuntos más granulares, puedes usar varias herramientas de copia de seguridad que permiten gestionar copias de seguridad completas + diferenciales. Por ejemplo duplicity. O podrías usar rsync (sin eliminación). Entre las instantáneas, aún podrías perder archivos. Usar S3 sin eliminación sería más seguro ya que los archivos ya están en otro sistema.

Para concluir. El mecanismo de copia de seguridad estándar de Discourse no es adecuado para un calendario de copias de seguridad más frecuente. Si deseas tener más copias de seguridad, utiliza una combinación de las características estándar de copia de seguridad/replicación de PostgreSQL, S3, instantáneas de volumen, etc.

En mi sitio no utilizo el sistema de copias de seguridad de Discourse para copias de seguridad regulares. Todavía tengo copias de seguridad diarias, pero utilizo una combinación de configuraciones de pg_dumps y duplicity (coordinadas a través de backupninja).

3 Me gusta

Hago copias de seguridad de la base de datos cada 4 horas. Ese es el plazo en el que puedo vivir con la posible pérdida de publicaciones. En comparación: mi comercio electrónico realiza copias de seguridad cada 5 minutos.

Una vez al día no es suficiente. El valor de un máximo de 24 horas de temas/publicaciones perdidas es simplemente demasiado.

1 me gusta

Se trata de cuánto contenido podrías perder: en un foro tranquilo, una copia de seguridad cada pocos días no sería un problema, en un foro muy activo, incluso una hora podría parecer una gran pérdida. Pero debes considerar la improbabilidad del fallo: si perdieras una hora de publicaciones una vez al año, por ejemplo, ¿sería muy molesto? ¿Cada diez años? Cada uno de nosotros tiene su propia visión del riesgo.

2 Me gusta

Una pérdida aún mayor que las publicaciones podrían ser todas las cuentas nuevas que se crearon en un período de 24 horas.

Especialmente si Discourse se está utilizando como proveedor de SSO para sus otras aplicaciones u otras integraciones.

No creo que esta respuesta de “0 para diario” sea correcta:

Screenshot 2025-12-29 at 13.26.18

1 me gusta

Cero deshabilita las copias de seguridad. Esta configuración solo determina el número de días entre copias de seguridad.

Las copias de seguridad frecuentes y personalizadas de la base de datos de @Jagster suenan como la solución más apropiada que necesita si el diario no es suficiente.

Sí, solo estaba destacando lo peligrosamente equivocadas que son las sugerencias de la IA para las personas.

¿Imagina si alguien viera eso y lo implementara porque eso es lo que le dijeron que hiciera? :confused:

4 Me gusta

Parece que se obtuvo de https://meta.discourse.org/t/staging-test-server-ignored-the-environment-variable/390085/2?u=falco. Actualizaré la publicación para que quede más claro.

5 Me gusta