Problemas al reconstruir la aplicación

Tengo un problema al reconstruir un dominio de prueba (autoalojado, ha estado funcionando durante ~7 años con actualizaciones infrecuentes, pero funcionaba con la última versión hasta esta semana).

Tuve problemas con un plugin no compatible que ahora he eliminado y creo que eso ha estropeado algo en la base de datos o en la configuración. El error que obtengo al finalizar es:

2024-04-25 01:07:42.098 UTC [34] LOG:  received fast shutdown request
I, [2024-04-25T01:07:42.099067 #1]  INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 96
96:signal-handler (1714007262) Received SIGTERM scheduling shutdown...
2024-04-25 01:07:42.105 UTC [34] LOG:  aborting any active transactions
2024-04-25 01:07:42.121 UTC [34] LOG:  background worker "logical replication launcher" (PID 49) exited with exit code 1
96:M 25 Apr 2024 01:07:42.121 # User requested shutdown...
96:M 25 Apr 2024 01:07:42.122 * Saving the final RDB snapshot before exiting.
2024-04-25 01:07:42.133 UTC [44] LOG:  shutting down
96:M 25 Apr 2024 01:07:42.177 * DB saved on disk
96:M 25 Apr 2024 01:07:42.178 # Redis is now ready to exit, bye bye...
2024-04-25 01:07:42.195 UTC [34] LOG:  database system is shut down
Error response from daemon: invalid JSON: got EOF while reading request body

FAILED TO COMMIT cbaab1290466a63d0a77f5f1e0894b0da632204e63472416674b7fab9ae53b41

He escaneado el resto del log y los únicos errores adicionales que veo se consideran “no importantes” en otras publicaciones aquí.

¿Alguna sugerencia sobre qué hacer a continuación?

Creo que en este punto me quedaré con hacer una instalación limpia y luego intentar una restauración desde una copia de seguridad, pero agradecería cualquier indicio de lo que realmente podría estar pasando…

¡Gracias!

No hay forma de saberlo sin el registro completo.

Mi mejor suposición es que te has quedado sin RAM. Intentaría añadir swap.

¿Cuánta RAM y swap tienes?

2G. Basado en la parte superior, parecía que estaba bien, pero es fácil agregar más e intentarlo de nuevo.

Si todavía hay problemas, subiré el registro.

No lo haré hasta mañana…

Tendrías que estar observando la parte superior mientras se ejecutaba la reconstrucción.

¿2 GB de RAM y 2 GB de intercambio? Puedes revisar el registro para ver el error 137 de falta de memoria.

1 me gusta

Estaba haciéndolo; había olvidado que habíamos estado manipulando la instancia de WordPress que también se está ejecutando en ese droplet, así que definitivamente estamos usando algo de espacio de intercambio. Probablemente necesitemos aumentar ese VPS de todos modos…

Sí.

Hice un grep en el registro y no vi ese error.

Tuve la brillante idea de reiniciar el VPS antes de intentarlo de nuevo. Suponiendo que falle, aumentaré el droplet y lo intentaré de nuevo.

1 me gusta

Todavía falló de la misma manera con 4G de memoria/intercambio, así que aquí está el registro de la compilación.

rebuild.out.240425.txt (202.4 KB)

Espero que puedas ver algo y gracias por tu ayuda hasta ahora…

[

SIGTERM parece que hiciste un control-c.

¿Te aburriste de esperar y mataste el trabajo?

no, supongo que hay algo en uno de los scripts del proceso de compilación; es la misma forma en que lo he compilado durante años (iniciar sesión por ssh en un par de sesiones, una observando a la otra…) — todos ellos desde que comenzó a fallar tienen un sigterm en (supongo) el mismo lugar del script que parece cerrar la aplicación que algo está leyendo…

1 me gusta

No. Creo que la pregunta salió bien. Quizás el error sea el “failed to commit” al final, pero no tengo una exclamación para eso.

¿Hay algo en el script del lanzador que haga algo de vuelta a GitHub? Explicaría el error si hay algún tipo de métrica que rastrean por un commit; si eso está en un pipeline de shell (por ejemplo, Curl o similar), también explicaría el error de tubería cerrada.

En lugar de que yo intente depurar lo que está sucediendo con el lanzador, creo que lo más fácil para mí sería intentar hacer una nueva instalación y restaurar.

Estoy abierto a sugerencias si tienes alguna idea…

¿Tu sistema operativo está desactualizado?

Hay un montón de errores extraños sobre no poder escribir un archivo git.

Una nueva máquina virtual probablemente sea una buena idea. Restaurar una copia de seguridad es lo más fácil, pero también puedes Mover un sitio de Discourse a otro VPS con rsync

1 me gusta

Probablemente excesivo, pero terminé creando una nueva instancia, hice una instalación limpia y luego restauré una copia de seguridad antigua desde allí.

Funciona ahora…

2 Me gusta

Alguien más tuvo un error similar recientemente que creo que se debió a un llavero caducado para los certificados HTTPS. Sospecho que este fue tu problema.

La otra persona hizo una actualización del sistema operativo, lo que resolvió el problema, pero prefiero un nuevo comienzo.