Falha ao inicializar

helmi · Junho 4, 2022, 6:46pm

Isto está em uma máquina de teste. Eu estava executando o discourse lá anteriormente - estraguei a instalação e não consegui atualizar para a versão mais recente, o que pensei ser meu erro. Depois de remover todo o diretório do discourse e limpar o docker, tentei fazer uma instalação completamente nova antes de importar um backup do banco de dados ativo.

Estranhamente, ainda estou vendo os mesmos problemas que não consigo resolver.

Aqui está a saída da falha. Tentei o discourse-doctor, mas ele não apresentou nada útil.

...
I, [2022-06-04T18:42:29.087446 #1]  INFO -- : Terminating async processes
I, [2022-06-04T18:42:29.087672 #1]  INFO -- : Sending INT to HOME=/var/lib/postgresql USER=postgres exec chpst -u postgres:postgres:ssl-cert -U postgres:postgres:ssl-cert /usr/lib/postgresql/13/bin/postmaster -D /etc/postgresql/13/main pid: 42
I, [2022-06-04T18:42:29.087881 #1]  INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 103
2022-06-04 18:42:29.088 UTC [42] LOG:  received fast shutdown request
103:signal-handler (1654368149) Received SIGTERM scheduling shutdown...
2022-06-04 18:42:29.118 UTC [42] LOG:  aborting any active transactions
2022-06-04 18:42:29.123 UTC [42] LOG:  background worker "logical replication launcher" (PID 51) exited with exit code 1
2022-06-04 18:42:29.123 UTC [46] LOG:  shutting down
103:M 04 Jun 2022 18:42:29.154 # User requested shutdown...
103:M 04 Jun 2022 18:42:29.154 * Saving the final RDB snapshot before exiting.
103:M 04 Jun 2022 18:42:29.159 * DB saved on disk
103:M 04 Jun 2022 18:42:29.159 # Redis is now ready to exit, bye bye...
2022-06-04 18:42:29.201 UTC [42] LOG:  database system is shut down


FAILED
--------------------
Pups::ExecError: cd /var/www/discourse & bundle exec rake db:migrate failed with return #<Process::Status: pid 1102 exit 1>
Location of failure: /usr/local/lib/ruby/gems/2.7.0/gems/pups-1.1.1/lib/pups/exec_command.rb:117:in `spawn'
exec failed with the params {"cd"=>"$home", "hook"=>"db_migrate", "cmd"=>["su discourse -c 'bundle exec rake db:migrate'"]}
bootstrap failed with exit code 1
** FAILED TO BOOTSTRAP ** please scroll up and look for earlier error messages, there may be more than one.
./discourse-doctor may help diagnose the problem.
69cb25658efb6f16e4479bb98a2d0278d72e56028865730841ac1efacc5b8d9d
==================== END REBUILD LOG ====================

O próprio servidor deve estar bem - espaço em disco suficiente, recursos suficientes, caso contrário. Alguma ideia?

Ed_S · Junho 4, 2022, 7:55pm

Precisamos ver mais do log, eu acho, e em particular o que aconteceu com aquele comando rake.

Por favor, forneça as saídas de

free
df

Também pode ser relevante se o seu log incluir
WARNING overcommit_memory is set to 0!

helmi · Junho 4, 2022, 8:02pm

Ele inclui:

103:M 04 Jun 2022 18:40:07.369 # WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.

Aqui está o resto que você solicitou:

root@testserver-2021:/var/discourse# free
              total        used        free      shared  buff/cache   available
Mem:       16005396      353200    13366988        1100     2285208    15316292
Swap:             0           0           0
root@testserver-2021:/var/discourse# free -h
              total        used        free      shared  buff/cache   available
Mem:           15Gi       343Mi        12Gi       1.0Mi       2.2Gi        14Gi
Swap:            0B          0B          0B
root@testserver-2021:/var/discourse# df -h
Filesystem      Size  Used Avail Use% Mounted on
udev            7.7G     0  7.7G   0% /dev
tmpfs           1.6G  1.1M  1.6G   1% /run
/dev/sda1       226G   44G  173G  21% /
tmpfs           7.7G     0  7.7G   0% /dev/shm
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           7.7G     0  7.7G   0% /sys/fs/cgroup
/dev/sda15       61M  5.2M   55M   9% /boot/efi
overlay         226G   44G  173G  21% /var/lib/docker/overlay2/c9457cf1821fb558a92c79e55bd6a70153b8ae0388732aa5eef17237b6924c25/merged
overlay         226G   44G  173G  21% /var/lib/docker/overlay2/6d350b54871378d4b0e7ac5d30e236df3bdd1c45cd3b5fb2e9ab67ffe7a1bba1/merged
tmpfs           1.6G     0  1.6G   0% /run/user/0
overlay         226G   44G  173G  21% /var/lib/docker/overlay2/104be98cc5c33e73e4119d2186b6d9d08123ffc79df872f48425e94a66ca6749/merged

Acho que as mensagens de overcommit são devido ao swap ser 0? Estranhamente, isso nunca mudou desde que este servidor existe…

Ed_S · Junho 4, 2022, 8:16pm

Hmm… 16G de RAM é bastante, então você pode pensar que não precisa de swap. Mas eu diria que adicionar um pouco pode não fazer mal. Sem ver seu log, não posso dizer que o problema seja escassez de memória. Mas se for, definir o modo overcommit pode ajudar, quer você tenha swap ou não.

Ed_S · Junho 5, 2022, 7:38am

Você também pode tentar
dmesg | egrep -i "oom|memory"
para ver se algum processo foi encerrado devido a uma condição de falta de memória.

Mas, novamente, ver mais do seu log provavelmente ajudará.

Editar: ops, adicionei o -i

helmi · Junho 5, 2022, 12:16pm

Eu criei um swap e também configurei o modo overcommit. Infelizmente, nada mudou.

Aqui está todo o log da compilação do aplicativo https://pastebin.com/raw/R2B8Wneu

Vejo algumas falhas do redis dizendo que a porta está em uso, mas não consigo ver de onde isso vem

root@testserver-2021:~# sudo lsof -i -P -n | grep LISTEN
systemd       1            root   89u  IPv6  15961      0t0  TCP *:9090 (LISTEN)
systemd-r   573 systemd-resolve   13u  IPv4  10890      0t0  TCP 127.0.0.53:53 (LISTEN)
sshd        676            root    3u  IPv4  20387      0t0  TCP *:22 (LISTEN)
sshd        676            root    4u  IPv6  20389      0t0  TCP *:22 (LISTEN)
docker-pr   913            root    4u  IPv4  23665      0t0  TCP *:9100 (LISTEN)
docker-pr   921            root    4u  IPv6  21827      0t0  TCP *:9100 (LISTEN)
docker-pr   981            root    4u  IPv4  24732      0t0  TCP *:3003 (LISTEN)
docker-pr   989            root    4u  IPv6  22636      0t0  TCP *:3003 (LISTEN)
monitorix  1284       monitorix    3u  IPv4  27978      0t0  TCP *:8080 (LISTEN)

Ed_S · Junho 5, 2022, 2:57pm

Obrigado pelo log - parece ser um problema de configuração do S3 (com o qual não posso ajudar, mas tenho certeza que alguém pode).

I, [2022-06-05T09:06:10.144445 #1] INFO – : > cd /var/www/discourse & su discourse -c ‘bundle exec rake db:migrate’
rake aborted!
Discourse::SiteSettingMissing: s3_upload_bucket
/var/www/discourse/lib/file_store/s3_store.rb:267:in `s3_bucket’

helmi · Junho 5, 2022, 4:28pm

boa descoberta, Ed. Obrigado. Parece que s3_bucket em algum momento mudou para s3_upload_bucket e eu tenho esses em containers/app.yml, o que parece ter causado o problema. Pelo menos a compilação ocorreu bem agora depois que mudei DISCOURSE_S3_BUCKET para DISCOURSE_S3_UPLOAD_BUCKET lá.

Gostaria que tais mudanças também introduzissem uma verificação no processo de compilação para evitar que isso aconteça - e boa sorte, nós sempre testamos nossas atualizações em uma máquina de teste.

Tópico		Respostas	Visualizações
Bootstrapping Discourse hangs on Redis "ready to accept connections" on Amazon EC2 Self-hosting	9	2196	27 de Abril de 2015
How to resolve Pups exec errors during Discourse bootstrap Support	21	455	24 de Abril de 2025
Upgrade failed, "FAILED TO BOOTSTRAP", error 137 Self-hosting server-resources	5	1075	12 de Outubro de 2022
Need support with discourse Update Self-hosting	4	162	9 de Outubro de 2024
Troubleshooting bootstrap failures in Discourse Self-hosting	13	307	28 de Julho de 2025

Falha ao inicializar

Tópicos relacionados