Problemas na reconstrução do app

Lew_Grothe · Abril 25, 2024, 1:29am

Tenho um problema ao reconstruir um domínio de teste (auto-hospedado - está em execução há cerca de 7 anos com atualizações infrequentes, mas estava em execução com a versão mais recente até esta semana).

Tive problemas com um plugin não suportado que agora removi e acho que isso pode ter estragado algo no banco de dados ou na configuração. O erro que recebo ao concluir é:

2024-04-25 01:07:42.098 UTC [34] LOG: received fast shutdown request
I, [2024-04-25T01:07:42.099067 #1]  INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 96
96:signal-handler (1714007262) Received SIGTERM scheduling shutdown...
2024-04-25 01:07:42.105 UTC [34] LOG: aborting any active transactions
2024-04-25 01:07:42.121 UTC [34] LOG: background worker "logical replication launcher" (PID 49) exited with exit code 1
96:M 25 Apr 2024 01:07:42.121 # User requested shutdown...
96:M 25 Apr 2024 01:07:42.122 * Saving the final RDB snapshot before exiting.
2024-04-25 01:07:42.133 UTC [44] LOG: shutting down
96:M 25 Apr 2024 01:07:42.177 * DB saved on disk
96:M 25 Apr 2024 01:07:42.178 # Redis is now ready to exit, bye bye...
2024-04-25 01:07:42.195 UTC [34] LOG: database system is shut down
Error response from daemon: invalid JSON: got EOF while reading request body

FAILED TO COMMIT cbaab1290466a63d0a77f5f1e0894b0da632204e63472416674b7fab9ae53b41

Eu escaneei o restante do log e os únicos erros adicionais que vejo são considerados “não importantes” em outros posts aqui.

Alguma sugestão sobre o que fazer a seguir?

Acho que neste ponto terei que fazer uma nova instalação e depois tentar uma restauração a partir do backup, mas agradeceria qualquer dica sobre o que pode realmente estar acontecendo…

Obrigado!

pfaffman · Abril 25, 2024, 6:25am

Não há como saber sem o log completo.

Minha melhor suposição é que você está sem RAM. Eu tentaria adicionar swap.

Quanta RAM e swap você tem?

Lew_Grothe · Abril 25, 2024, 7:23am

2G. Pelo topo, parecia que estava tudo bem, mas é fácil adicionar mais e tentar novamente.

Se ainda houver problemas, farei o upload do log.

Não poderei fazer isso até amanhã…

pfaffman · Abril 25, 2024, 10:21am

Você precisaria estar assistindo ao top enquanto a reconstrução estava em execução.

2 GB de RAM e 2 GB de swap? Você pode verificar o log para o erro 137 de falta de memória.

Lew_Grothe · Abril 25, 2024, 11:06pm

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]Você precisaria estar observando o top enquanto a reconstrução estivesse em execução.
[/quote]
Eu estava - eu tinha esquecido que estávamos mexendo na instância do WordPress que também está rodando nesse droplet, então definitivamente estamos usando algum espaço de swap. Provavelmente precisaremos aumentar esse VPS de qualquer forma…

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]2gb de ram e 2gb de swap?
[/quote]
Sim.

[quote=“Jay Pfaffman, post:4, topic:305352, username:pfaffman”]verifique o log para o erro 137 de falta de memória
[/quote]
Eu fiz grep no log e não vi esse erro.

Tive a brilhante ideia de reiniciar o VPS antes de tentar novamente. Presumindo que isso falhe, aumentarei o droplet e tentarei novamente.

Lew_Grothe · Abril 26, 2024, 12:01am

Ainda falhou da mesma forma com 4G de memória/swap, então aqui está o log da compilação.

rebuild.out.240425.txt (202,4 KB)

Espero que você consiga ver algo e obrigado por sua ajuda até agora…

pfaffman · Abril 26, 2024, 12:12am

[

SIGTERM parece que você fez um control-c.

Você ficou entediado de esperar e matou o job?

Lew_Grothe · Abril 26, 2024, 12:29am

não - presumo que haja algo em um dos scripts no processo de compilação - é a mesma maneira que venho compilando há anos (ssh em algumas sessões - uma observando a outra…) - todas elas desde que começou a falhar têm um sigterm em (presumo) no mesmo lugar do script que parece fechar o aplicativo que algo está lendo…

pfaffman · Abril 26, 2024, 1:31am

Não. Acho que a solicitação correu bem. Talvez o erro seja o “falha ao confirmar” no final, mas não tenho um ponto de exclamação para isso.

Lew_Grothe · Abril 26, 2024, 5:12am

Há algo no script do launcher que faz algo de volta para o GitHub? Explicaria o erro se houver algum tipo de métrica que eles rastreiam por um commit - se isso estiver em um pipeline shell (por exemplo, Curl ou similar), também explicaria o erro de pipe fechado.

Em vez de eu tentar depurar o que está acontecendo com o launcher, acho que a coisa mais fácil para mim seria tentar fazer uma nova instalação e restauração.

Ficarei feliz em aceitar sugestões se você tiver alguma ideia…

pfaffman · Abril 26, 2024, 8:00am

Seu sistema operacional está desatualizado?

Há uma série de erros estranhos sobre não conseguir gravar um arquivo git.

Uma nova VM provavelmente é uma boa ideia. Restaurar um backup é o mais fácil, mas você também pode Mover um site Discourse para outro VPS com rsync

Lew_Grothe · Abril 27, 2024, 9:06pm

Provavelmente exagero, mas acabei criando um novo droplet, fiz uma nova instalação e depois restaurei um backup antigo a partir daí.

Está funcionando agora…

pfaffman · Abril 27, 2024, 9:18pm

Alguém mais teve um erro semelhante recentemente, que acho que foi devido a um keychain expirado para os certificados HTTPS. Suspeito que este foi o seu problema.

A outra pessoa fez uma atualização do sistema operacional, o que resolveu o problema, mas prefiro um novo começo.

Tópico		Respostas	Visualizações
Rebuild hangs on bootstrap error with last update Self-hosting	2	1267	22 de Agosto de 2017
Rebuild app has stuck Self-hosting	1	1340	2 de Agosto de 2017
Hanging on app rebuild Self-hosting	2	647	21 de Dezembro de 2023
Rebuild failed because there was no swap Support	2	340	10 de Setembro de 2024
Rebuild Failed: bootstrap failed with exit code 137 Self-hosting	5	205	31 de Julho de 2024

Problemas na reconstrução do app

Tópicos relacionados