Mi experiencia coincide. He visto tantos fallos pequeños y extraños a lo largo de los años que siempre mantengo copias de seguridad completas para poder empezar de cero y restaurar el sitio. Confiar en la corrección de problemas in situ eventualmente te fallará.
- La guía de instalación estándar utiliza Docker: ¿cómo monitorizas los contenedores en un entorno de producción, ya que parece que la instalación estándar es una única VM con Docker?
Al igual que tú, me quedé en apuros cuando Bitnami dejó de ofrecer imágenes y gráficos gratuitos. Tuve que adaptar y migrar tantas implementaciones. Una de ellas fue mi implementación de Discourse. Si te resulta útil, aquí tienes un enlace al gráfico Helm de reemplazo que creé en muy poco tiempo (lo que significa que funciona pero está lejos de ser un diseño ideal). Es un intento de utilizar el “método de instalación oficial” dado que no he visto emerger ningún gráfico Helm “estándar de la comunidad” después de todos estos años. (Supongo que el gráfico de Bitnami fue efectivamente ese estándar, porque pocos de nosotros predijimos este cambio abrupto). En cualquier caso, este nuevo gráfico que estoy ejecutando para una de mis comunidades de investigación es básicamente solo un pod con dos contenedores: el contenedor oficial Docker-in-Docker y un contenedor personalizado basado en python:3, que instala Docker y luego utiliza la instalación oficial de Discourse. Dado que todos los componentes (servidor Discourse, Redis, PostgreSQL) se ejecutan en la caja negra de la imagen construida localmente por el script del lanzador, no hay escalabilidad ni soporte para alta disponibilidad. Logré reducir el tiempo de inactividad debido a que el pod se reinicia en otro nodo (por ejemplo, al vaciar un nodo para actualizaciones del sistema operativo o un fallo de nodo) utilizando docker save para almacenar la imagen construida en el volumen persistente, y luego cargándola si no se encuentra local_discourse/app:latest.
Pero para responder a tu pregunta, no sé cómo monitorizar nada en esta nueva implementación. Estoy ejecutando “en producción”, pero mi comunidad es lo suficientemente pequeña y el uso es lo suficientemente moderado como para que si el foro se desconecta por un tiempo, no es un gran problema. Aun así, estoy muy cerca de abandonar el auto-alojamiento y migrar a un servicio como Communiteq o Discourse.org.