Problemas na reconstrução do app

Tenho um problema ao reconstruir um domínio de teste (auto-hospedado - está em execução há cerca de 7 anos com atualizações infrequentes, mas estava em execução com a versão mais recente até esta semana).

Tive problemas com um plugin não suportado que agora removi e acho que isso pode ter estragado algo no banco de dados ou na configuração. O erro que recebo ao concluir é:

2024-04-25 01:07:42.098 UTC [34] LOG: received fast shutdown request
I, [2024-04-25T01:07:42.099067 #1]  INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 96
96:signal-handler (1714007262) Received SIGTERM scheduling shutdown...
2024-04-25 01:07:42.105 UTC [34] LOG: aborting any active transactions
2024-04-25 01:07:42.121 UTC [34] LOG: background worker "logical replication launcher" (PID 49) exited with exit code 1
96:M 25 Apr 2024 01:07:42.121 # User requested shutdown...
96:M 25 Apr 2024 01:07:42.122 * Saving the final RDB snapshot before exiting.
2024-04-25 01:07:42.133 UTC [44] LOG: shutting down
96:M 25 Apr 2024 01:07:42.177 * DB saved on disk
96:M 25 Apr 2024 01:07:42.178 # Redis is now ready to exit, bye bye...
2024-04-25 01:07:42.195 UTC [34] LOG: database system is shut down
Error response from daemon: invalid JSON: got EOF while reading request body

FAILED TO COMMIT cbaab1290466a63d0a77f5f1e0894b0da632204e63472416674b7fab9ae53b41

Eu escaneei o restante do log e os únicos erros adicionais que vejo são considerados “não importantes” em outros posts aqui.

Alguma sugestão sobre o que fazer a seguir?

Acho que neste ponto terei que fazer uma nova instalação e depois tentar uma restauração a partir do backup, mas agradeceria qualquer dica sobre o que pode realmente estar acontecendo…

Obrigado!

Não há como saber sem o log completo.

Minha melhor suposição é que você está sem RAM. Eu tentaria adicionar swap.

Quanta RAM e swap você tem?

2G. Pelo topo, parecia que estava tudo bem, mas é fácil adicionar mais e tentar novamente.

Se ainda houver problemas, farei o upload do log.

Não poderei fazer isso até amanhã…

Você precisaria estar assistindo ao top enquanto a reconstrução estava em execução.

2 GB de RAM e 2 GB de swap? Você pode verificar o log para o erro 137 de falta de memória.

1 curtida

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]Você precisaria estar observando o top enquanto a reconstrução estivesse em execução.
[/quote]
Eu estava - eu tinha esquecido que estávamos mexendo na instância do WordPress que também está rodando nesse droplet, então definitivamente estamos usando algum espaço de swap. Provavelmente precisaremos aumentar esse VPS de qualquer forma…

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]2gb de ram e 2gb de swap?
[/quote]
Sim.

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]verifique o log para o erro 137 de falta de memória
[/quote]
Eu fiz grep no log e não vi esse erro.

Tive a brilhante ideia de reiniciar o VPS antes de tentar novamente. Presumindo que isso falhe, aumentarei o droplet e tentarei novamente.

1 curtida

Ainda falhou da mesma forma com 4G de memória/swap, então aqui está o log da compilação.

rebuild.out.240425.txt (202,4 KB)

Espero que você consiga ver algo e obrigado por sua ajuda até agora…

[

SIGTERM parece que você fez um control-c.

Você ficou entediado de esperar e matou o job?

não - presumo que haja algo em um dos scripts no processo de compilação - é a mesma maneira que venho compilando há anos (ssh em algumas sessões - uma observando a outra…) - todas elas desde que começou a falhar têm um sigterm em (presumo) no mesmo lugar do script que parece fechar o aplicativo que algo está lendo…

1 curtida

Não. Acho que a solicitação correu bem. Talvez o erro seja o “falha ao confirmar” no final, mas não tenho um ponto de exclamação para isso.

Há algo no script do launcher que faz algo de volta para o GitHub? Explicaria o erro se houver algum tipo de métrica que eles rastreiam por um commit - se isso estiver em um pipeline shell (por exemplo, Curl ou similar), também explicaria o erro de pipe fechado.

Em vez de eu tentar depurar o que está acontecendo com o launcher, acho que a coisa mais fácil para mim seria tentar fazer uma nova instalação e restauração.

Ficarei feliz em aceitar sugestões se você tiver alguma ideia…

Seu sistema operacional está desatualizado?

Há uma série de erros estranhos sobre não conseguir gravar um arquivo git.

Uma nova VM provavelmente é uma boa ideia. Restaurar um backup é o mais fácil, mas você também pode Mover um site Discourse para outro VPS com rsync

1 curtida

Provavelmente exagero, mas acabei criando um novo droplet, fiz uma nova instalação e depois restaurei um backup antigo a partir daí.

Está funcionando agora…

2 curtidas

Alguém mais teve um erro semelhante recentemente, que acho que foi devido a um keychain expirado para os certificados HTTPS. Suspeito que este foi o seu problema.

A outra pessoa fez uma atualização do sistema operacional, o que resolveu o problema, mas prefiro um novo começo.