Questa è su una macchina di test. In precedenza stavo eseguendo discourse lì - ho rovinato l’installazione e non sono riuscito ad aggiornare all’ultima versione che pensavo fosse un mio errore. Dopo aver rimosso l’intera directory discourse e ripulito docker, ho provato a fare un’installazione completamente nuova prima di importare un backup dal database live.
Stranamente, sto ancora riscontrando gli stessi problemi che non riesco a risolvere.
Ecco l’output del fallimento. Ho già provato discourse-doctor ma non ha prodotto nulla di utile.
...
I, [2022-06-04T18:42:29.087446 #1] INFO -- : Terminating async processes
I, [2022-06-04T18:42:29.087672 #1] INFO -- : Sending INT to HOME=/var/lib/postgresql USER=postgres exec chpst -u postgres:postgres:ssl-cert -U postgres:postgres:ssl-cert /usr/lib/postgresql/13/bin/postmaster -D /etc/postgresql/13/main pid: 42
I, [2022-06-04T18:42:29.087881 #1] INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 103
2022-06-04 18:42:29.088 UTC [42] LOG: received fast shutdown request
103:signal-handler (1654368149) Received SIGTERM scheduling shutdown...
2022-06-04 18:42:29.118 UTC [42] LOG: aborting any active transactions
2022-06-04 18:42:29.123 UTC [42] LOG: background worker \"logical replication launcher\" (PID 51) exited with exit code 1
2022-06-04 18:42:29.123 UTC [46] LOG: shutting down
103:M 04 Jun 2022 18:42:29.154 # User requested shutdown...
103:M 04 Jun 2022 18:42:29.154 * Saving the final RDB snapshot before exiting.
103:M 04 Jun 2022 18:42:29.159 * DB saved on disk
103:M 04 Jun 2022 18:42:29.159 # Redis is now ready to exit, bye bye...
2022-06-04 18:42:29.201 UTC [42] LOG: database system is shut down
FAILED
--------------------
Pups::ExecError: cd /var/www/discourse && su discourse -c 'bundle exec rake db:migrate' failed with return #<Process::Status: pid 1102 exit 1>
Location of failure: /usr/local/lib/ruby/gems/2.7.0/gems/pups-1.1.1/lib/pups/exec_command.rb:117:in `spawn'
exec failed with the params {"cd"=>"$home", "hook"=>"db_migrate", "cmd"=>["su discourse -c 'bundle exec rake db:migrate'"]}
bootstrap failed with exit code 1
** FAILED TO BOOTSTRAP ** please scroll up and look for earlier error messages, there may be more than one.
./discourse-doctor may help diagnose the problem.
69cb25658efb6f16e4479bb98a2d0278d72e56028865730841ac1efacc5b8d9d
==================== END REBUILD LOG ====================
Il server stesso dovrebbe andare bene - abbondante spazio su disco, risorse sufficienti altrimenti. Qualche idea?
103:M 04 Jun 2022 18:40:07.369 # WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
Hmm… 16G di RAM sono parecchi, quindi potresti pensare di non aver bisogno di swap. Ma direi che aggiungere un po’ di swap potrebbe non fare male. Senza vedere il tuo log non posso dire che il problema sia la scarsità di memoria. Ma se lo fosse, impostare la modalità overcommit potrebbe aiutare, indipendentemente dal fatto che tu abbia o meno lo swap.
Potresti anche provare dmesg | egrep -i "oom|memory"
per vedere se qualche processo è stato terminato a causa di una condizione di memoria insufficiente.
Ma, ancora una volta, vedere più del tuo log probabilmente aiuterà.
Ottima scoperta, Ed. Grazie. Sembra che s3_bucket a un certo punto sia stato cambiato in s3_upload_bucket e li ho in containers/app.yml, il che sembra aver causato il problema. Almeno la compilazione è andata bene ora dopo che ho cambiato DISCOURSE_S3_BUCKET lì in DISCOURSE_S3_UPLOAD_BUCKET.
Vorrei che tali modifiche introducessero anche un controllo nel processo di compilazione per evitare di incorrere in questo problema, e buona fortuna, testiamo sempre i nostri aggiornamenti su una macchina di prova.