Problèmes de reconstruction de l'application

Lew_Grothe · Avril 25, 2024, 1:29

J’ai un problème pour reconstruire un domaine de test (auto-hébergé - fonctionne depuis environ 7 ans avec des mises à jour peu fréquentes mais fonctionnait avec la dernière version jusqu’à cette semaine).

J’ai eu des problèmes avec un plugin non pris en charge que j’ai maintenant supprimé et je pense que cela a peut-être endommagé quelque chose dans la base de données ou la configuration. L’erreur que j’obtiens à la fin est :

2024-04-25 01:07:42.098 UTC [34] LOG:  received fast shutdown request
I, [2024-04-25T01:07:42.099067 #1]  INFO -- : Sending TERM to exec chpst -u redis -U redis /usr/bin/redis-server /etc/redis/redis.conf pid: 96
96:signal-handler (1714007262) Received SIGTERM scheduling shutdown...
2024-04-25 01:07:42.105 UTC [34] LOG:  aborting any active transactions
2024-04-25 01:07:42.121 UTC [34] LOG:  background worker \"logical replication launcher\" (PID 49) exited with exit code 1
96:M 25 Apr 2024 01:07:42.121 # User requested shutdown...
96:M 25 Apr 2024 01:07:42.122 * Saving the final RDB snapshot before exiting.
2024-04-25 01:07:42.133 UTC [44] LOG:  shutting down
96:M 25 Apr 2024 01:07:42.177 * DB saved on disk
96:M 25 Apr 2024 01:07:42.178 # Redis is now ready to exit, bye bye...
2024-04-25 01:07:42.195 UTC [34] LOG:  database system is shut down
Error response from daemon: invalid JSON: got EOF while reading request body

FAILED TO COMMIT cbaab1290466a63d0a77f5f1e0894b0da632204e63472416674b7fab9ae53b41

J’ai scanné le reste du journal et les seules erreurs supplémentaires que je vois sont considérées comme « sans importance » sur d’autres publications ici.

Des suggestions sur la marche à suivre ?

Je pense qu’il ne me reste plus qu’à faire une nouvelle installation, puis à tenter une restauration à partir d’une sauvegarde, mais j’apprécierais tout indice sur ce qui pourrait réellement se passer…

Merci !

pfaffman · Avril 25, 2024, 6:25

Il n’y a aucun moyen de le savoir sans le journal complet.

Ma meilleure supposition est que vous manquez de RAM. J’essaierais d’ajouter du swap.

Combien de RAM et de swap avez-vous ?

Lew_Grothe · Avril 25, 2024, 7:23

2G. D’en haut, on aurait dit que ça allait, mais il est facile d’en ajouter et de réessayer.

S’il y a encore des problèmes, je téléchargerai le journal.

Je ne pourrai pas m’en occuper avant demain…

pfaffman · Avril 25, 2024, 10:21

Il faudrait surveiller top pendant que la reconstruction s’exécutait.

2 Go de RAM et 2 Go de swap ? Vous pouvez vérifier le journal pour l’erreur 137, manque de mémoire.

Lew_Grothe · Avril 25, 2024, 11:06

Je le faisais - j’avais oublié que nous avions tripoté l’instance WordPress qui tourne aussi sur cette goutte, donc nous utilisons certainement de l’espace swap. Il faut probablement agrandir ce VPS de toute façon…

Oui.

J’ai fait un grep dans le log et je n’ai pas vu cette erreur.

J’ai eu la brillante idée de redémarrer le VPS avant de réessayer. En supposant que cela échoue, j’agrandirai la goutte et réessayerai.

Lew_Grothe · Avril 26, 2024, 12:01

Toujours échoué de la même manière avec 4G de mémoire/swap, voici donc le journal de la compilation.

rebuild.out.240425.txt (202.4 Ko)

J’espère que vous pourrez y voir quelque chose et merci pour votre aide jusqu’à présent…

pfaffman · Avril 26, 2024, 12:12

[

SIGTERM ressemble à un contrôle-c.

Vous vous êtes ennuyé d’attendre et avez arrêté le travail ?

Lew_Grothe · Avril 26, 2024, 12:29

non - je suppose qu’il y a quelque chose dans l’un des scripts du processus de construction - c’est la même façon dont je l’ai construit pendant des années (ssh dans quelques sessions - une regardant l’autre…) - tous ceux qui ont commencé à échouer ont un sigterm à (je suppose) la même place dans le script qui semble fermer l’application que quelque chose lit…

pfaffman · Avril 26, 2024, 1:31

Non. Je pense que la demande s’est bien déroulée. Peut-être que l’erreur est le « échec de la validation » tout à la fin, mais je n’ai pas d’exclamation pour cela.

Lew_Grothe · Avril 26, 2024, 5:12

Y a-t-il quelque chose dans le script de lancement qui renvoie des informations à GitHub ? Cela expliquerait l’erreur s’il y a une sorte de métrique qu’ils suivent par un commit - si cela se trouve dans un pipeline shell (par exemple, Curl ou autre), cela expliquerait également l’erreur de canal fermé.

Plutôt que d’essayer de déboguer ce qui se passe avec le lanceur, je pense que le plus simple pour moi serait d’essayer de faire une nouvelle installation et une restauration.

Je suis ouvert aux suggestions si vous avez des idées…

pfaffman · Avril 26, 2024, 8:00

Votre système d’exploitation est-il obsolète ?

Il y a un tas d’erreurs étranges concernant l’impossibilité d’écrire un fichier git.

Une nouvelle VM est probablement une bonne idée. Restaurer une sauvegarde est le plus simple, mais vous pouvez également Déplacer un site Discourse vers un autre VPS avec rsync

Lew_Grothe · Avril 27, 2024, 9:06

Probablement excessif, mais j’ai fini par créer une nouvelle gouttelette, j’ai fait une nouvelle installation, puis j’ai restauré une ancienne sauvegarde à partir de là.

Ça fonctionne maintenant…

pfaffman · Avril 27, 2024, 9:18

Quelqu’un d’autre a eu une erreur similaire récemment, je pense que c’était dû à une chaîne de clés expirée pour les certificats https. Je soupçonne que c’était votre problème.
L’autre personne a effectué une mise à niveau du système d’exploitation, ce qui a résolu le problème, mais je préfère un nouveau départ.

Sujet		Réponses	Vues
Rebuild hangs on bootstrap error with last update Self-hosting	2	1272	Août 22, 2017
Rebuild app has stuck Self-hosting	1	1341	Août 2, 2017
Hanging on app rebuild Self-hosting	2	648	Décembre 21, 2023
Rebuild failed because there was no swap Support	2	346	Septembre 10, 2024
Rebuild Failed: bootstrap failed with exit code 137 Self-hosting	5	207	Juillet 31, 2024

Problèmes de reconstruction de l'application

Sujets connexes