Après une mise à niveau de Discourse, mon instance Ubuntu est morte

J’utilise avec succès des instances AWS EC2 Linux/Ubuntu depuis des années, mais je rencontre aujourd’hui un problème que je n’arrive pas à résoudre :

J’ai effectué une mise à jour de Discourse via l’URL /admin/upgrade. Cela semblait s’être déroulé avec succès.

Malheureusement, depuis, la machine est morte.

Pas d’accès HTTP, pas d’accès SSH.

J’ai déjà essayé de l’éteindre et de la rallumer via l’interface web d’AWS EC2. Sans succès.

Il est actuellement impossible de se connecter en SSH à la machine, ni via PuTTY, ni via la fenêtre de terminal de connexion aux instances AWS EC2 basée sur le web.

Je suis vraiment sans idées et j’ai déjà attendu plusieurs heures.

La surveillance EC2 ne montre également aucune charge serveur élevée de mon côté :

Quand cela s’est produit dans les semaines/mois précédents (environ 2 ou 3 fois au total), redémarrer la machine via l’interface EC2 a toujours permis de la remettre en ligne, mais pas cette fois.

Ma question

Avez-vous des pistes pour rendre la machine accessible à nouveau via SSH ?

(Je sais qu’il s’agit très probablement pas d’un problème lié à Discourse, mais comme cela s’est produit juste après une mise à jour de Discourse, peut-être que d’autres utilisateurs ont déjà rencontré ce même comportement et pourraient me donner des pistes)

Vous devriez vérifier l’utilisation de l’espace disque.

Beaucoup des symptômes que vous décrivez se produisent lorsque le système de fichiers est plein.

Cela devrait vous aider.

Merci.

Bien que cela semble raisonnable, je ne vois actuellement aucun moyen de vérifier cela, car je ne peux pas du tout me connecter à la machine.

Vous devriez pouvoir vérifier cela via votre panneau de contrôle ou d’administration EC2 ; mais je ne suis pas utilisateur d’AWS et ne peux donc pas vous aider davantage.

Après un autre redémarrage et un temps d’attente, le système est de nouveau là, sans crier gare.

Pour moi, il semble que le disque dispose de suffisamment d’espace libre.

Filesystem      Size  Used Avail Use% Mounted on
udev            2.0G     0  2.0G   0% /dev
tmpfs           394M  876K  393M   1% /run
/dev/xvda1       97G   31G   67G  31% /
tmpfs           2.0G     0  2.0G   0% /dev/shm
tmpfs           5.0M     0  5.0M   0% /run/lock
tmpfs           2.0G     0  2.0G   0% /sys/fs/cgroup
/dev/loop1       18M   18M     0 100% /snap/amazon-ssm-agent/1566
/dev/loop0       98M   98M     0 100% /snap/core/10185
/dev/loop2       29M   29M     0 100% /snap/amazon-ssm-agent/2012
/dev/loop3       98M   98M     0 100% /snap/core/10126
overlay          97G   31G   67G  31% /var/lib/docker/overlay2/5a799ab040002ad2ddec94ae85bcbe987543651a0d9478ddc12ab12715da7340/merged
tmpfs           394M     0  394M   0% /run/user/1000

Excellentes nouvelles @uwe_keim

Toujours plus haut et toujours plus loin !

Pour toute personne intéressée, j’ai poursuivi ma question ici :

Il y aura probablement plus de détails dans les heures/jours à venir sur ce site.