Speicherüberlauf beim Rebuild mit 4GB Swap?

pfaffman · 6. Januar 2026 um 23:41

Ich hatte heute mehrere Zwei-Container-Bootstraps mit Fehlern wie

 ERR_PNPM_RECURSIVE_EXEC_FIRST_FAIL  Command was killed with SIGKILL (Erzwungene Beendigung): ember build -prod"]

Ich denke, es hat beim nächsten Mal funktioniert, nachdem ich Swap hinzugefügt hatte. Aber das hier hat 4 GB Swap:

# free -h
               total        used        free      shared  buff/cache   available
Mem:           1.9Gi       1.1Gi       391Mi        45Mi       661Mi       830Mi
Swap:          4.0Gi       3.1Gi       911Mi

und es schlägt immer noch fehl. Und wenn ich den Container vor dem Bootstrap stoppe, funktioniert es.

david · 6. Januar 2026 um 23:48

Werden die Build-Assets vorab erstellt und verwendet? Oder haben Sie das deaktiviert? (oder den Kern so gepatcht, dass die vorab erstellten Assets nicht verwendet werden können)

Ed_S · 7. Januar 2026 um 09:57

Sie haben viel Swap, aber ein großer Teil davon wird bereits verwendet. Da ein Zwei-Container-Setup weniger Ausfallzeiten hat, ist es vielleicht wahr, dass die aktuelle Ausführung des Servers noch läuft und aufgrund eines Lecks viel Speicher verbraucht hat.

Vielleicht würde ein Neustart helfen, vor dem Update. Messen Sie vielleicht die Swap-Nutzung vor und nach dem Neustart.

merefield · 7. Januar 2026 um 10:13

Ich habe eine Art Speicherleck/Speichererweiterung auf einem meiner Server. Auf den vernünftigen Vorschlag von @RGJ hin habe ich einen Neustart jeden Montag früh (Westeuropa) per Cronjob geplant.

(Wir glauben, dass wir das Plugin mit dem Problem kennen, aber ich habe noch keine Zeit investiert, um herauszufinden, warum es ein Speicherleck/eine Speichererweiterung gibt.)

Ethsim2 · 7. Januar 2026 um 11:39

Dies sieht nach einem OOM-Kill aus: Ich habe ca. 2 GiB RAM und bei Zwei-Container-Neuerstellungen übersteigt die alte App + der neue Build den Speicher. Der Swap ist bereits vor dem Bootstrap auf ca. 3 GiB ausgelastet, sodass der Ember-Build-Spike mit SIGKILL beendet wird. Das Stoppen des laufenden Containers (oder eine Ein-Container-Neuerstellung) vermeidet die Überlappung und ist erfolgreich. Nächster Schritt ist die Bestätigung über dmesg und dann entweder ein Neustart vor den Neuerstellungen / Untersuchung, was den Swap im Laufe der Zeit in die Höhe treibt / RAM hinzufügen (der Swap allein scheint ihn nicht zu retten, wenn er bereits stark genutzt wird).

Thefacto · 7. Januar 2026 um 11:49

Das sieht weniger nach einem pnpm- oder Ember-Problem aus, sondern eher danach, dass dem Host einfach der Arbeitsspeicher ausgegangen ist.

Das Schlüsseldetail ist das SIGKILL. Das bedeutet normalerweise, dass das Betriebssystem eingegriffen und den Prozess beendet hat (oft durch den OOM-Killer), nicht, dass ember build -prod von selbst fehlgeschlagen ist.

Auf kleinen Hosts können Ember-Produktions-Builds leicht auf ein paar GB RAM ansteigen. Selbst wenn Swap aktiviert ist, kann der Kernel, sobald der Swap größtenteils aufgebraucht ist, immer noch entscheiden, einen speicherhungrigen node-Prozess zu beenden.

Ein paar Dinge, die in diese Richtung deuten:

Der Swap wird zum Zeitpunkt des Fehlschlags bereits stark genutzt.
Der Fehler tritt viel wahrscheinlicher auf, wenn gleichzeitig ein anderer Container läuft.
Wenn ich den anderen Container stoppe, bevor ich den Bootstrap ausführe, gelingt derselbe Build.

Swap hilft also ein wenig, verzögert das Problem aber hauptsächlich nur. Das Stoppen anderer Container reduziert den Speicherdruck so weit, dass der Build abgeschlossen werden kann.

Was geholfen hat / helfen könnte:

Vermeiden Sie die parallele Ausführung mehrerer Bootstraps oder Asset-Builds.
Stoppen Sie andere Container während ember build -prod.
Begrenzen Sie die Speichernutzung von Node (z. B. NODE_OPTIONS=--max_old_space_size=1024), um die Spitzenlast zu reduzieren.
Wenn möglich, erhöht eine Erhöhung des Host-RAMs (4 GB+) die Zuverlässigkeit erheblich.

Hoffentlich erklärt dies, warum es sich etwas zufällig anfühlt und warum das Stoppen eines anderen Containers dazu führt, dass es funktioniert.

Ed_S · 7. Januar 2026 um 12:17

Es scheint, als würde mehr Swap helfen. Es würde nicht schaden. Anstatt den gesamten Swap zu betrachten und zu sagen, es sei viel, schauen Sie auf den freien Swap und stellen Sie sicher, dass Sie Spielraum für einen Neuaufbau haben.

Ed_S · 7. Januar 2026 um 12:19

Überprüfen Sie auch, ob Sie Overcommit aktiviert haben.

pfaffman · 7. Januar 2026 um 18:20

Klingt nach einer guten Idee! Starten Sie den Server neu oder nur den Container?

Jedenfalls ist es mir auf einem anderen 2GB+3GB Server wieder passiert. Dann habe ich web_only neu gestartet und es erneut versucht, und es funktionierte einwandfrei. Ich denke, ich werde zu meinen Tools hinzufügen, um web_only neu zu starten, vielleicht wenn der Speicher einen bestimmten Wert als „niedrig“ definiert.

Vielen Dank an alle für eure Ideen!

merefield · 7. Januar 2026 um 19:27

Der ganze Server

pfaffman · 7. Januar 2026 um 20:40

Es ist zum Himmel nicht Windows.

merefield · 7. Januar 2026 um 20:46

Ach du meine Güte, ich erinnere mich an diese Tage!

Ed_S · 8. Januar 2026 um 07:44

Wir haben einen Fall gesehen, in dem ein Neustart von Linux geholfen hat. Ich weiß, dass wir Linux normalerweise nicht so betrachten wollen, aber es besteht immer noch die Möglichkeit von Fragmentierung und die Möglichkeit von Speicherlecks.

Thema		Antworten	Aufrufe
Rebuild failed because there was no swap Support	2	345	10. September 2024
High rebuild memory requirements: April 2025 edition Self-hosting hosting	32	1097	15. Februar 2026
Rebuild fails with exit 1: ERR_PNPM_RECURSIVE_EXEC_FIRST_FAIL Support	15	714	2. März 2025
Ember-cli build memory usage risks failure (OOM) on minimum instance size Self-hosting server-resources	4	1479	15. November 2022
Upgrade from 3.2.0.beta3-dev to 3.2.0.beta3 failed due to out of memory Self-hosting server-resources	18	1624	6. Februar 2024

Speicherüberlauf beim Rebuild mit 4GB Swap?

Verwandte Themen