Ein weiteres discourse Rätsel

fuse · 13. Oktober 2022 um 01:50

Ich erhalte um 21:09 Uhr ET eine AWS CloudWatch-Benachrichtigung, zusammen mit einigen Freunden, die mir schreiben: „Hey, ist Discourse down?“

Ich kann mich nicht per SSH mit der AWS Lightsail-Instanz verbinden, und alle Metriken sind eingefroren/melden nichts.

Schließlich gebe ich auf und stoppe/starte die Lightsail-Instanz neu.
Der Dienst wurde wiederhergestellt.

Ich überprüfe die Protokolle nach der Wiederherstellung des Dienstes, um daraus zu lernen.

Ich betreibe Discourse als einzelne Instanz, daher verwirrt mich der Fehler um 21:05 Uhr bezüglich der Redis-Netzwerkverbindung.

Ich kann nicht herausfinden, was passiert ist, außer dass „etwas“ aus „irgendeinem Grund“ eingefroren/fehlgeschlagen ist.

Jeder, der mir das erklären oder ein paar Anhaltspunkte geben kann, wird geschätzt.

Vielen Dank!

MarcP · 13. Oktober 2022 um 02:08

Wie sind die Server-Spezifikationen? Klingt, als ob ihm die Ressourcen ausgehen? Wahrscheinlich die CPU. Läuft zu dieser Zeit vielleicht eine tägliche Aufgabe?

fuse · 13. Oktober 2022 um 02:18

Es ist eine Lightsail-Instanz mit 1 vCPU, 1 GB RAM und 40 GB SSD.

Der Speicher ist zu etwa 60 % belegt, und wenn ich Bereinigungen durchführe, sinkt er ziemlich stark.

AWS zeigt an, dass mir die Burst-CPU-Guthaben ausgegangen sind, was nur seltsam ist, da die anderen Metriken dies nicht unterstützen.

Es ist eine ziemlich kleine Community (20-30 aktive Teilnehmer), daher wäre ich überrascht, wenn es eine wirkliche CPU- oder RAM-Beschränkung gäbe.

Es gibt keine tägliche Aufgabe, von der ich weiß, außer etwas, das Discourse möglicherweise standardmäßig plant.

Stephen · 13. Oktober 2022 um 02:33

1 GB mit Swap ist das absolute Minimum, um Discourse auszuführen.

Wie lange läuft diese Instanz schon? Wie groß ist die Datenbank?

fuse · 13. Oktober 2022 um 10:47

Ich werde die DB-Größe überprüfen, erwarte nicht, dass sie groß ist (Backups sind alle etwa 57 MB).

Die Uptime der Instanz beträgt jetzt knapp zehn Stunden, da die Wiederherstellung einen Stopp und Neustart des virtuellen Servers erforderte – ich konnte keine Shell- oder Konsolenverbindung herstellen.

Läuft seit dem Bau dieser Instanz (geschätzt Februar 2021) problemlos auf diesem Instanztyp.

Falco · 13. Oktober 2022 um 13:59

Das klingt nach dem, was passiert, wenn AWS Ihre VM von einem Host auf einen anderen verschiebt und sie dadurch in einem seltsamen Zustand hinterlässt. Normalerweise löst ein Neustart das Problem.

fuse · 13. Oktober 2022 um 16:29

Die Gesamtgröße der Datenbank beträgt 423 MB.

Die größten Tabellen sind:
Posts 66 MB
Post_timings 60 MB

fuse · 16. Oktober 2022 um 16:40

Ein zweiter ähnlicher „hoher Last“-Fehler ist aufgetreten.

Ich vermute Ressourcenkonflikte.

Hat jemand versucht, den Lightsail-Snapshot zu verwenden, um die Instanz zu sichern und sie als Upgrade-Methode auf eine größere Instanz wiederherzustellen?

darkpixlz · 16. Oktober 2022 um 17:06

Sie können versuchen, die AWS-Instanz neu zu starten. Das kann viele Probleme beheben.

fuse · 16. Oktober 2022 um 17:10

Ich bin mit Lightsail-Snapshots von 1 CPU, 1 GB RAM, 40 GB SSD auf 2 CPU, 4 GB RAM, 80 GB SSD umgezogen.

Abgesehen davon, dass ich die öffentliche IP trennen und wieder anhängen musste, was einfach genug war, ist meine verbleibende Sorge: „Was habe ich übersehen“?

Gibt es etwas (Backups, E-Mail, S3-Bucket-Konfiguration usw.), das ich überprüfen sollte, oder muss ich irgendwelche anfänglichen Installationsparameter erneut ausführen, um die verbesserten Ressourcen zu nutzen?

fuse · 16. Oktober 2022 um 18:49

Ich denke, basierend auf diesem Link könnte ich den db_shared_buffer auf mindestens 1 GB erhöhen.
Die aktuelle app.yml sagt 128 MB und zeigt auch an, dass er sich beim Start automatisch anpasst.

Stephen · 16. Oktober 2022 um 19:01

1 GB ist in Ordnung für ein 4-GB-System. Stellen Sie sicher, dass Sie auch unicorn_workers auf 4 aktualisieren.

Die übliche Empfehlung, wenn Sie zwischen Servern wechseln würden, wäre, discourse-setup erneut auszuführen, was sich automatisch um das oben Genannte kümmert.

github.com/discourse/discourse_docker

discourse-setup

master


      
          }
          
          
          ##
          ## If we have lots of RAM or lots of CPUs, bump up the defaults to scale better
          ##
          scale_ram_and_cpu() {
          
            local changelog=/tmp/changelog.$PPID
            # grab info about total system ram and physical (NOT LOGICAL!) CPU cores
            avail_gb=0
            avail_cores=0
            os_type=$(check_OS)
            if [ "$os_type" == "Darwin" ]; then
              avail_gb=$(check_osx_memory)
              avail_cores=`sysctl hw.ncpu | awk '/hw.ncpu:/ {print $2}'`
            else
              avail_gb=$(check_linux_memory)
              avail_cores=`lscpu --parse=core | egrep -v ^# | sort -u | wc -l`
            fi
            echo "Found ${avail_gb}GB of memory and $avail_cores physical CPU cores"

fuse · 16. Oktober 2022 um 20:36

Danke. Ich tauche jetzt in die Prometheus-Materie ein.

Gute Arbeit.

Thema		Antworten	Aufrufe
Problem installing Discourse on AWS EC2 instance Installation server-resources	4	488	21. Dezember 2023
Suddenly my server got crashed out of nowhere Installation	8	445	15. Mai 2023
Discourse unavailable with high load average Support	21	2408	26. April 2021
Due to extreme load, this is temporarily being shown to everyone... when it's not really the case Installation server-resources	19	1648	21. Juli 2023
A 1-year gratis one-click hosted solution for Discourse! Hosting	4	1826	27. April 2014

Ein weiteres discourse Rätsel

Verwandte Themen