Aus meiner Erfahrung wird dies durch keinen aktuellen Ansatz direkt gelöst, und es gibt auch keine lineare Lösung. Tatsächlich ist die Trennung auf verschiedene Maschinen keine sofortige Abhilfe für dieses Problem.
Wir erleben ebenfalls starke Einbrüche und die Meldung „Die Seite ist extrem ausgelastet, daher sehen Sie sie so, als wären Sie nicht eingeloggt“, wenn ein großes Ereignis stattfindet (wie ein Spiel, wie @ljpp bereits erwähnte). Das拉gt die gesamte Seite herunter, nicht nur die Nutzer innerhalb dieses Themas.
Daher habe ich zwei verschiedene Ansätze versucht: eine getrennte Einrichtung und eine „große Maschine“. Beide weisen diese Art von Problemen auf. Meine Instanzen werden mit Prometheus überwacht, und die Logs sind in Grafana einsehbar usw. Ich habe also eine sehr granulare Kontrolle über die Hardware-/Container-Performance und kann bestätigen, dass es wirklich keine Rolle spielt, was man tut – das Problem tritt trotzdem auf.
Wenn man eine große Maschine dahinterstellt, kann man den Fehler vielleicht etwas verzögern, aber man wird dennoch Fehler und Session-Verluste erleben, während die Maschine kaum ausgelastet ist – egal ob bei Festplatte, CPU oder RAM. Dies tritt sowohl bei der „Standard-Installation“ als auch bei der „Zwei-Container-Installation“ auf.
Bei verschiedenen Maschinen ist das Problem dasselbe, unabhängig davon, ob es sich um gleichartige Maschinen handelt oder ob eine „CPU-optimiert“ und die andere „Festplatten-optimiert“ ist usw. Hinzu kommt eine zusätzliche Fehlerquelle: die Verbindung zwischen zwei verschiedenen Maschinen, die zwangsläufig zu Verzögerungen führt. Zwar kann das Ausmaß dieser Verzögerung davon abhängen, wie die Verbindung eingerichtet ist und wie „weit entfernt“ die beiden Maschinen voneinander sind, aber das gleiche Verhalten wird sich einstellen.
Als Anmerkung: Dieses Verhalten tritt auch bei Komponenten wie dem Babel-Plugin auf. Allerdings scheint das Babel-Plugin deutlich mehr „gleichzeitige“ Schreibvorgänge bewältigen zu können, auch wenn die „Chats“ eigentlich versteckte Themen sind. Der Unterschied liegt darin, wie sie dargestellt und „aktualisiert“/„abgerufen“ werden. Dieses unterschiedliche Verhalten hat mich zu der Schlussfolgerung geführt, dass es sich um eine anwendungsbezogene Korrelation handelt, die von einem Frontend-bedingten Problem herrührt, das die Anwendung zum Absturz bringt (obwohl Frontend nicht mein Fachgebiet ist – im Gegensatz zu Backend) sowie von den Operationen beim Posten und dem Warten der Nutzer auf ein Thema, das sich mit Dutzenden von Nachrichten innerhalb einer einzigen Minute „selbst aktualisiert“.
Dazu kommt noch der menschliche Faktor: Wenn Nutzer die Seite als „träge“ empfinden oder bemerken, dass ein Thema „nicht so schnell aktualisiert wird, wie es sollte“, drücken sie F5, bis es nicht mehr geht, was die Last weiter erhöht. Aber viel Glück dabei, die Nutzer in dieser Hinsicht zu „erziehen“ 