J’ai rencontré des problèmes lors de la mise à niveau : le premier forum a échoué dès la première tentative (via le tableau de bord), puis a échoué à nouveau lors d’une reconstruction, mais il semble avoir fonctionné lors de la deuxième tentative de reconstruction, bien que j’aie dû effectuer une reconstruction supplémentaire par la suite. Cela m’a rappelé qu’il fallait arrêter toutes les instances de Discourse lors de la mise à jour vers PG12 (il y a trois forums Discourse sur ce serveur, chacun avec son propre conteneur). Ainsi, la procédure suivante a fonctionné pour les deux autres forums :
Cependant, pour une raison inconnue, le premier forum n’est plus accessible ; Safari indique que le serveur a interrompu la connexion de manière inattendue. Une reconstruction semble se dérouler sans problème, mais le forum reste inaccessible. Je peux accéder à l’application et à la console Rails, et la base de données semble intacte.
Les seuls avertissements que j’ai pu voir lors de la reconstruction et qui pourraient être pertinents :
168:M 31 Jan 2021 21:39:22.459 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
168:M 31 Jan 2021 21:39:22.459 # Server initialized
168:M 31 Jan 2021 21:39:22.459 # WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
168:M 31 Jan 2021 21:39:22.459 # WARNING you have Transparent Huge Pages (THP) support enabled in your kernel. This will create latency and memory usage issues with Redis. To fix this issue run the command 'echo madvise > /sys/kernel/mm/transparent_hugepage/enabled' as root, and add it to your /etc/rc.local in order to retain the setting after a reboot. Redis must be restarted after THP is disabled (set to 'madvise' or 'never').
168:M 31 Jan 2021 21:39:22.459 * Loading RDB produced by version 6.0.9
168:M 31 Jan 2021 21:39:22.459 * RDB age 21 seconds
168:M 31 Jan 2021 21:39:22.459 * RDB memory usage when created 4.03 Mb
168:M 31 Jan 2021 21:39:22.466 * DB loaded from disk: 0.006 seconds
168:M 31 Jan 2021 21:39:22.466 * Ready to accept connections
production.log :
Job exception: Error connecting to Redis on localhost:6379 (Errno::ENETUNREACH)
Error connecting to Redis on localhost:6379 (Errno::ENETUNREACH) subscribe failed, reconnecting in 1 second. Call stack /var/www/discourse/vendor/bundle/ruby/2.7.0/gems/redis-4.2.5/lib/redis/client.rb:367:in `rescue in establish_connection'
Des messages similaires apparaissent dans unicorn.stderr.log et unicorn.stdout.log.
En entrant dans le conteneur et en exécutant redis-cli ping, je reçois un PONG. Redis est en cours d’exécution sur le serveur (mais pas dans les conteneurs individuels - bien que cela ait toujours été le cas, à ma connaissance).
Avez-vous des idées sur ce qui pourrait se passer ?
(J’ai également redémarré le serveur et créé un nouveau certificat letsencrypt pour ce domaine, par mesure de précaution, mais le problème persiste.)




