He estado teniendo un problema extraño desde que actualicé Discourse.
cd /var/discourse
./launcher enter app
cd /shared/log/rails
tail -f production.log
da lo siguiente sin fin:
Job exception: MISCONF Redis está configurado para guardar instantáneas RDB, pero actualmente no puede persistir en el disco. Los comandos que pueden modificar el conjunto de datos están deshabilitados, porque esta instancia está configurada para informar errores durante las escrituras si la instantánea RDB falla (opción stop-writes-on-bgsave-error). Por favor, compruebe los registros de Redis para obtener detalles sobre el error RDB.
Error al conectar con Redis en localhost:6379 (Redis::TimeoutError)
unicorn.stderr.log está lleno de:
E, [2022-03-01T20:45:20.703541 #65] ERROR -- : reaped #<Process::Status: pid 30842 exit 1> worker=unknown
Detectado trabajador muerto 30842, reiniciando...
Error al informar error: Error al conectar con Redis en localhost:6379 (Redis::TimeoutError) 3 Job exception: Error al conectar con Redis en localhost:6379 (Redis::TimeoutError)
MISCONF Redis está configurado para guardar instantáneas RDB, pero actualmente no puede persistir en el disco. Los comandos que pueden modificar el conjunto de datos están deshabilitados, porque esta instancia está configurada para informar errores durante las escrituras si la instantánea RDB falla (opción stop-writes-on-bgsave-error). Por favor, compruebe los registros de Redis para obtener detalles sobre el error RDB.
/var/www/discourse/vendor/bundle/ruby/2.6.0/gems/redis-4.1.3/lib/redis/client.rb:126:in `call'
/var/www/discourse/vendor/bundle/ruby/2.6.0/gems/redis-4.1.3/lib/redis.rb:538:in `block in del'
/var/www/discourse/vendor/bundle/ruby/2.6.0/gems/redis-4.1.3/lib/redis.rb:52:in `block in synchronize'
...
Claramente parece ser un problema con Redis y sospeché que se estaba matando de alguna manera, pero no parece ser del registro del kernel fuera de la imagen de docker, sin embargo, dentro de la imagen de docker veo:
$ df -h
Filesystem Size Used Avail Use% Mounted on
overlay 157G 53G 97G 36% /
tmpfs 64M 0 64M 0% /dev
tmpfs 3.9G 0 3.9G 0% /sys/fs/cgroup
shm 512M 0 512M 0% /dev/shm
/dev/sda 157G 53G 97G 36% /shared
tmpfs 3.9G 0 3.9G 0% /proc/acpi
tmpfs 3.9G 0 3.9G 0% /proc/scsi
tmpfs 3.9G 0 3.9G 0% /sys/firmware
$ free
total used free shared buff/cache available
Mem: 8167420 3248628 794816 8596 4123976 4634504
Swap: 524284 268 524016
No es genial, pero tampoco es horrible, parece.
De vuelta en el sistema anfitrión, htop muestra:
¿Alguna idea sobre los pasos para depurar/resolver esto?
