Hallo zusammen, wir versuchen, die Probleme zu beheben, die unsere Discourse-Installation in den letzten Tagen hatte.
Wir betreiben einen Contabo Cloud VPS, 8 Kerne/32 GB/NVMe, für eine Benutzerbasis von ca. 150 Personen; wir hatten in den letzten zweieinhalb Jahren nur wenige Probleme.
Seit letztem Wochenende hat die Instanz aufgrund einer ungewöhnlich hohen CPU-Auslastung Phasen, in denen sie fast unbenutzbar ist.
Um diese Situation zu untersuchen, haben wir das Forum gestern in den Nur-Lese-Modus versetzt. Ich habe ein paar Grafana-Diagramme, die unsere Situation zeigen – die drei Markierungen zeigen an, wann wir den Nur-Lese-Modus aktiviert haben, wann wir den Container neu gestartet haben und wann wir den Nur-Lese-Modus deaktiviert haben.
(Ein paar weitere Diagramme hier: Imgur: The magic of the Internet )
Wie Sie sehen können, ist die Auslastung ziemlich hoch. Dies begann vor ein paar Tagen, daher gibt es eine Art Problem, das wir noch nicht richtig untersucht haben.
Das Ungewöhnliche, was wir bemerkt haben, ist, dass unser Host den VPS in der Nacht zum Sonntag neu startet, und am letzten Wochenende konnte die Datenbank eine oder mehrere Transaktionen nicht abschließen.
Wir vermuten, dass dies zu Inkonsistenzen in irgendeinem internen Discourse-Prozess geführt hat, und diese Inkonsistenz kämpft gegen die Benutzeraktivität – aber das ist hier nur eine Hypothese.
Nachdem ich den KI-Assistenten gefragt hatte, bevor ich einen neuen Thread eröffnete, kann ich hinzufügen, dass Sidekiq einige Ausreißer-Prozesse aufweist:
- Jobs::ProcessBadgeBacklog dauert etwa 2-5 Sekunden
- das letzte DestroyOldDeletionStubs dauerte 475 Sekunden.
- das letzte DirectoryRefreshDaily dauerte 580 Sekunden.
- das letzte TopRefreshToday dauerte 18 Sekunden.
Die Frage ist also: Was könnte diese Situation bei der Benutzerbasis und der Hardware, die wir verwenden, verursachen?
Gibt es noch etwas Spezielleres, das wir uns ansehen sollten?
Ich denke, unsere Benutzerbasis sollte keine Notsituationen rechtfertigen, aber ich halte an keiner unserer bisherigen Meinungen fest und wäre sehr dankbar für Hinweise, was wir sonst noch untersuchen könnten.
Danke!