¿Cómo realizar un mantenimiento importante del discurso con un tiempo de inactividad mínimo?

emonunix · 5 Septiembre, 2025 20:27

Me gustaría abrir una discusión sobre las mejores prácticas para realizar tareas de mantenimiento esenciales en una instancia de Discourse minimizando o eliminando el tiempo de inactividad.

Tareas como cambiar la configuración de recursos críticos (por ejemplo, UNICORN_WORKERS, DISCOURSE_SIDEKIQ_WORKERS, DISCOURSE_DB_POOL) o aplicar actualizaciones importantes suelen requerir un launcher rebuild app, que puede llevar una cantidad de tiempo considerable, a veces 30 minutos o más.

Mi pregunta es:
¿Cuáles son las estrategias recomendadas para que los administradores del sistema realicen estas actualizaciones esenciales y cambios de configuración con la menor cantidad de tiempo de inactividad para el usuario?

¿Existen técnicas avanzadas, como implementaciones “blue/green” u otras estrategias de implementación sin tiempo de inactividad, que sean compatibles o recomendadas para Discourse? ¿O es el proceso estándar de rebuild el único método compatible, y el enfoque debe centrarse en optimizar el tiempo de reconstrucción en sí?

Estoy interesado en escuchar a cualquiera que tenga experiencia en la gestión de instancias grandes o de alto tráfico y cómo es su flujo de trabajo para el mantenimiento.

¡Gracias por cualquier información!

pfaffman · 5 Septiembre, 2025 20:39

Si tiene una instalación de dos contenedores, el nuevo contenedor se compila mientras el antiguo se ejecuta. El tiempo de inactividad es solo la cantidad de tiempo que se tarda en iniciar el nuevo contenedor. El único problema es que necesita suficiente RAM para compilar un contenedor mientras el otro se ejecuta.

Moverse de un contenedor independiente a contenedores web y de datos separados, pero normalmente muevo una nueva máquina virtual.

Si desea tiempo de inactividad cero, necesita un balanceador de carga que mantenga el contenedor antiguo en ejecución hasta que el nuevo se haya iniciado por completo. Luego, apaga el contenedor antiguo y realiza las migraciones posteriores a la actualización.

Ethsim2 · 5 Septiembre, 2025 21:05

¿puedes tener dos contenedores de datos en failover?

¿usas una máquina virtual separada para los datos?

merefield · 5 Septiembre, 2025 21:53

Discourse es tan estable que esto es bastante innecesario para la mayoría de las instalaciones (¡pero supongo que podrías considerarlo para requisitos de alta disponibilidad muy altos o si estás alojando a otros!)

No creo haber tenido una sola interrupción en 7 años debido a un “fallo” de producción…

Los momentos más arriesgados en la vida de un Discourse son siempre en la reconstrucción.

La configuración de dos contenedores te da la capacidad de iniciar una nueva compilación antes de comprometerte con ella, aunque eso no detectará algunos errores en tiempo de ejecución, por supuesto.

El problema es que si tus migraciones se han ejecutado, es posible que necesites comprometerte con la nueva compilación y, por lo tanto, normalmente intentarías rastrear y corregir la fuente de esos errores en lugar de revertir.

En general, la gente no intenta revertir…

pfaffman · 5 Septiembre, 2025 22:47

Me muevo a una nueva VM al hacer una reconfiguración importante.

Es posible ejecutar un espejo de PostgreSQL, pero es mucho trabajo.

itsbhanusharma · 5 Septiembre, 2025 23:42

¿La réplica de lectura sería mejor, no?

pfaffman · 6 Septiembre, 2025 00:41

¡Sí! Réplica. Esa es la palabra que usan. Y luego, si el otro muere, puedes cambiar a la réplica sobre la marcha.

Tema		Respuestas	Vistas
Help with "zero downtime" setup Self-hosting hosting	7	2330	10 Septiembre 2020
How to install a plugin without rebuilding (or set a maintainance message) Support	10	3536	22 Julio 2020
How do I upgrade Discourse in a multiple container configuration? Self-hosting	2	940	8 Octubre 2020
How to speed up container instantiation - if possible at all? Self-hosting	4	322	29 Agosto 2023
Is there any faster way to re-build the site? Self-hosting	4	454	30 Marzo 2024

¿Cómo realizar un mantenimiento importante del discurso con un tiempo de inactividad mínimo?

Temas relacionados