Me desperté esta mañana con informes de que mi servidor Discourse estaba “caído”.
Pude conectarme por SSH al servidor sin problemas, noté que había algunas actualizaciones de seguridad que debían aplicarse, las apliqué con apt full-upgrade y reinicié el servidor con reboot.
Tardó un poco en volver a estar en línea, pero cuando lo hizo, verifiqué que el contenedor Docker de Discourse estuviera en ejecución. Extrañamente, no hubo ningún problema.
Intenté detenerlo y reiniciarlo con ./launcher app stop y ./launcher app start. No sirvió de nada.
Intenté hacer un ./launcher app rebuild y obtuve el siguiente error.
fatal: unable to access 'https://github.com/discourse/pups.git/': Could not resolve host: github.com
d1412324832190f43a2d51b5f10c53d6fa671056f91d0be2178d17a5ba1ab692
Sé que esto no es mucho en qué basarse, pero estoy atascado. Cualquier sugerencia sería muy apreciada.
# Archivo resolv.conf(5) dinámico para el resolvedor de glibc(3) generado por resolvconf(8)
# NO EDITE ESTE ARCHIVO A MANO; SUS CAMBIOS SERÁN SOBRESCRITOS
# 127.0.0.53 es el resolvedor provisional de systemd-resolved.
# Ejecute "systemd-resolve --status" para ver detalles sobre los servidores de nombres reales.
nameserver 8.8.8.8
nameserver 8.8.4.4
@supermathie No estoy seguro si esto tiene algo que ver, pero en ./launcher logs app veo
[Tue 01 Dec 2020 07:07:13 PM UTC] Consulte https://curl.haxx.se/libcurl/c/libcurl-errors.html para el código de error: 6
[Tue 01 Dec 2020 07:07:13 PM UTC] No se pudo inicializar la API.
[Tue 01 Dec 2020 07:07:13 PM UTC] Los dominios no han cambiado.
[Tue 01 Dec 2020 07:07:13 PM UTC] Omitido. Próxima hora de renovación: Sat Dec 26 00:31:17 UTC 2020
[Tue 01 Dec 2020 07:07:13 PM UTC] Agregue '--force' para forzar la renovación.
[Tue 01 Dec 2020 07:07:13 PM UTC] Instalando clave en: /shared/ssl/community.acescentral.com.key
[Tue 01 Dec 2020 07:07:13 PM UTC] Instalando cadena completa en: /shared/ssl/community.acescentral.com.cer
[Tue 01 Dec 2020 07:07:13 PM UTC] Ejecutando comando de recarga: sv reload nginx
fail: nginx: runsv no está en ejecución
[Tue 01 Dec 2020 07:07:13 PM UTC] Error de recarga para :
[Tue 01 Dec 2020 07:07:33 PM UTC] Consulte https://curl.haxx.se/libcurl/c/libcurl-errors.html para el código de error: 6
[Tue 01 Dec 2020 07:07:34 PM UTC] No se pudo inicializar la API.
[Tue 01 Dec 2020 07:07:34 PM UTC] Los dominios no han cambiado.
[Tue 01 Dec 2020 07:07:34 PM UTC] Omitido. Próxima hora de renovación: Sat Dec 26 00:31:20 UTC 2020
[Tue 01 Dec 2020 07:07:34 PM UTC] Agregue '--force' para forzar la renovación.
[Tue 01 Dec 2020 07:07:34 PM UTC] Instalando clave en: /shared/ssl/community.acescentral.com_ecc.key
[Tue 01 Dec 2020 07:07:34 PM UTC] Instalando cadena completa en: /shared/ssl/community.acescentral.com_ecc.cer
[Tue 01 Dec 2020 07:07:34 PM UTC] Ejecutando comando de recarga: sv reload nginx
fail: nginx: runsv no está en ejecución
[Tue 01 Dec 2020 07:07:34 PM UTC] Error de recarga para :
Se inició runsvdir, el PID es 458
chgrp: grupo no válido: 'syslog'
ok: run: redis: (pid 473) 0s
ok: run: postgres: (pid 470) 0s
rsyslogd: imklog: no se pudo abrir el registro del kernel (/proc/kmsg): Operación no permitida.
rsyslogd: activación del módulo imklog fallida [v8.1901.0 consulte https://www.rsyslog.com/e/2145 ]
PID del supervisor: 471 PID de unicorn: 497
Podría intentar eliminar e reinstalar Docker; es difícil adivinar exactamente qué está ocurriendo aquí y por qué Docker falló.
Antes de hacer cualquier cosa, asegúrate de tener una copia de seguridad de tus datos (ya sea una copia de seguridad de Discourse o, al menos, de PostgreSQL y las cargas). Haz una imagen de la máquina virtual si es posible.
Honestamente, creo que la mejor opción en este momento es reinstalar y copiar tus datos.
Tienes un sistema roto por Razones Misteriosas, y el proceso de instalación es bastante rápido. Probablemente sea lo mejor que puedes hacer con tu tiempo.