Beste Konfigurationen zur Beschleunigung von Standalone Discourse

nildarar · 30. August 2020 um 07:39

Unsere Discourse-Website hat über 10.000 Benutzer und etwa 700 täglich aktive Nutzer, die durchschnittlich 10.000 Beiträge pro Tag verfassen. Unsere Community verzeichnet mehr als 160.000 Seitenaufrufe pro Tag, einschließlich Crawler und anonyme Nutzer. Fast alle unsere Benutzer sind über mobile Geräte mit uns verbunden.

Wir haben die Community im Standalone-Modus auf einem einzelnen VPS mit 16 CPU-Kernen und 24 GB RAM betrieben und die Datei app.yml mit folgenden Werten konfiguriert:

params:
  db_shared_buffers: "6GB"
  db_work_mem: "50MB"
env:
  UNICORN_WORKERS: 16

Wir verwenden folgende Plugins:

docker_manager
discourse-solved
discourse-adplugin
discourse-voting
discourse-push-notifications
discourse-whos-online
discourse-akismet
discourse-data-explorer
discourse-sitemap
discourse-telegram-notifications

Mit der obigen Konfiguration berichten einige Benutzer, dass die Seite für sie langsam lädt. Manchmal wird beim Absenden eines Beitrags der Bildschirm schwarz (der Header bleibt jedoch sichtbar). Außerdem verlangsamt sich die Performance der Seite manchmal während der Spitzenzeiten.

Bitte erläutern Sie, ob wir die Konfiguration falsch vorgenommen haben oder ob mehr Ressourcen benötigt werden.
Vielen Dank

RGJ · 30. August 2020 um 08:33

10.000 Beiträge pro Tag sind im Verhältnis zur Anzahl der Seitenaufrufe ziemlich hoch. Ich kann mir vorstellen, dass Sie hier aufgrund Ihrer Konfiguration an Ressourcenlimits stoßen, und ich vermute, dass es sich um die Datenbank handelt. Sie könnten versuchen, auf ein Multi-Container-Setup umzusteigen und so die Unicorn-Worker effektiv von der Hauptserver entlasten.

nildarar · 30. August 2020 um 08:42

Entsprechend Ihrer Antwort hilft es nicht, die Ressourcen in diesem Setup zu erhöhen, um unser Problem zu lösen? Zum Beispiel 24 CPU-Kerne mit 32 GB RAM.

RGJ · 30. August 2020 um 08:55

Das könnte durchaus der Fall sein, aber ich würde zunächst versuchen, alles, was horizontal skaliert werden kann, horizontal zu skalieren. Das gibt dir auch eine viel bessere Vorstellung davon, wo dein Flaschenhals liegt.

Die meisten Leistungsprobleme lassen sich lösen, indem man einfach mehr Ressourcen auf das Problem wirft. Der schwierige Teil besteht darin, das auf intelligente Weise zu tun, damit du etwas Geld (oder potenziell eine Menge Geld) sparen kannst.

nildarar · 30. August 2020 um 17:48

Vielen Dank für Ihre Expertise und Ihren freundlichen Rat. Ich werde auf jeden Fall lesen, wie man dies umsetzt. Eine weitere Frage von mir ist, welche Einstellungen in der App für die oben genannten Spezifikationen angewendet werden sollten (24 CPU-Kerne mit 32 GB RAM). Sind die aktuellen Einstellungen angemessen oder ist es besser, die Werte zu erhöhen?

RGJ · 30. August 2020 um 19:40

Ohne das System zu untersuchen und zu sehen, was los ist, lässt sich das schwer sagen.

Da Sie sagten, dass die meisten Probleme beim Absenden eines Beitrags auftreten, liegt das Problem wahrscheinlich bei Datenbank-Schreibvorgängen. Ich glaube nicht, dass eine weitere Erhöhung von shared buffers viel bringt, aber Sie können es versuchen. Ich habe gesehen, dass es entgegen aller Ratschläge auf über 50 % des Speichers hochgefahren wurde, also können Sie versuchen, es schrittweise auf bis zu 12 GB zu erhöhen.
Wenn Sie keine 502-Fehler sehen, hat es auch keinen Sinn, UNICORN_WORKERS zu erhöhen.

marianord · 31. August 2020 um 15:41

Du erwähnst nicht, dass du es verwendest, daher denke ich, dass das Erste, was ich tun würde, das Hinzufügen eines CDNs ist. Dies würde die Last auf dem VPS erheblich verringern, da größere Anfragen den Server nicht berühren würden.

Zusätzlich zum CDN würde ich auch einen S3-ähnlichen Speicher verwenden, der es dir ermöglicht, Speicher und VPS-Ressourcen unabhängig voneinander zu skalieren (falls deine Community viele Uploads hat).

Diese Empfehlungen helfen sehr stark, die Last zu reduzieren, und die Preiserhöhung ist viel geringer als bei einem größeren VPS.

nildarar · 31. August 2020 um 15:55

Danke @marianord, leider nutzen wir kein CDN. Die Upload-Rate in unserem Forum ist nicht sehr hoch. Die meisten Nutzer sprechen über verschiedene Themen. Zum Beispiel hatten wir im letzten Jahr etwa 2,8 Millionen Beiträge und 2,7 Millionen Likes, aber nur 25 GB Dateien wurden hochgeladen.

Denkst du, dass die Nutzung eines CDNs wie S3 basierend auf den von mir genannten Informationen die Serverlast reduzieren würde?

RGJ · 31. August 2020 um 15:58

Ich stimme @marianord nicht zu. Ich denke nicht, dass ein CDN einen spürbaren Unterschied für die Auslastung deines Servers machen würde. Es handelt sich hier lediglich um statische Dateien, die überhaupt nicht schwer zu bedienen sind.

marianord · 31. August 2020 um 16:09

CDN und S3 sind zwei verschiedene Dinge.

S3 entlastet die Dateien und Backups auf einen anderen Server, der von einem Cloud-Anbieter verwaltet wird (sehr grobe Zusammenfassung).
CDN cacht die statischen Dateien deines Servers (Bilder, JS, CSS), um sie von mehreren Servern (PoP) weltweit auszuliefern und so die Ladezeit dieser Assets zu beschleunigen.

Zumindest ist das meine Erfahrung: Du reduzierst die Anzahl der Anfragen, die bei deinem Server ankommen, und damit auch die Last. Es ist viel einfacher, nur 10 JSON-Anfragen pro Benutzer zu bedienen als 100 Anfragen pro Benutzer.

Vielleicht löst dies nicht alle Probleme, mit denen @nildarar konfrontiert ist, aber es wird die hohe Last auf dem Server verringern, indem alle statischen Anfragen (die gecachten) vom Discourse-Server entfernt werden.

RGJ · 31. August 2020 um 16:24

Eine Anfrage für eine statische Datei hat keinen großen Einfluss auf die Gesamtlast des Servers. Die Anfragen für dynamische Inhalte sind die, die wirklich belasten.

Im Allgemeinen ist eine json-Anfrage kein statisches Asset, das von einem CDN zwischengespeichert wird. Es handelt sich um dynamische Inhalte, die im Moment der Anfrage generiert werden. Warum sprichst du in einem CDN-Kontext von JSON-Dateien?

Statische Anfragen ≠ höhere Last.

Entschuldigung, aber das ist wirklich schlechte Beratung.

Hier ist ein Beispiel von einer Maschine mit 6 CPUs (die CPU-Leistung addiert sich also auf 600 %), auf der Discourse ohne CDN oder S3 läuft.

Du siehst, dass nginx nur für 6,7 % verantwortlich ist (das sind also 1/100 der Kapazität). Nur ein Teil davon wird für statische Assets genutzt.

Wenn wir die statischen Assets auf S3 und/oder ein CDN auslagern würden, würde sich die Gesamtlast des Servers um weniger als ein Prozent reduzieren.

Falco · 31. August 2020 um 16:38

Stimmt, aber Discourse hat einige Ausnahmen, wie Stylesheets, die von Ruby ausgeliefert werden. Daher bedeutet ein Caching-CDN, dass diese Anfragen keine Unicorn-Prozesse beanspruchen.

Bezüglich des Problems des ursprünglichen Posters ist als Erstes erforderlich, dass eine sachkundige Person während der Stoßzeiten eine Leistungsanalyse durchführt und ermittelt, wo aktuell der Flaschenhals liegt.

marianord · 31. August 2020 um 16:45

Ich meine, dass die JSON-Anfragen den Server erreichen, während die statischen nicht.

nildarar · 1. September 2020 um 03:12

Vielen Dank für Ihre Anleitung. Bis vor einigen Monaten nutzten wir den Cloudflare-CDN-Dienst und haben durch Page Rules erhebliche Verbesserungen bei statischen Inhalten erzielt. Danach habe ich irgendwo gelesen, dass die Verwendung von Proxys wie Cloudflare die Leistung von Discourse drastisch verringert, weshalb wir es deaktiviert haben.

Gestern haben wir die Anzahl der CPU-Kerne von 16 auf 24 erhöht und folgende Änderungen in der app.yml vorgenommen:

params:
  # db_shared_buffers: "6GB"
  db_shared_buffers: "7GB"
env:
  # UNICORN_WORKERS: 16
  UNICORN_WORKERS: 24

Mit diesen Änderungen wurde unser Problem vorübergehend gelöst, aber ich denke, wir sollten in den nächsten Monaten eine grundlegende Änderung vornehmen.

Entsprechend Ihren Empfehlungen hat die Nutzung eines CDNs für die Auslieferung statischer Inhalte sowie die Aufteilung von Discourse in zwei separate Container bei den Leistungsverbesserungen höchste Priorität.

SouperC · 1. September 2020 um 04:01

Das sind möglicherweise veraltete Informationen, aber ich erinnere mich, gelesen zu haben, dass Discourse eine geringere Anzahl leistungsfähigerer CPUs einer höheren Anzahl schwächerer CPUs vorzieht … selbst wenn man die Anzahl der Unicorn-Worker aktualisiert.

@codinghorror, kannst du bestätigen, ob diese Information noch zutrifft?

RGJ · 1. September 2020 um 08:08

Ja, das ist korrekt, die CPU-Kernleistung ist wichtig, aber sie verbessert die gesamte Geschwindigkeit.

@nildarar hat einen Leistungsengpass, und dafür ist ein anderer Ansatz erforderlich.

nildarar · 1. September 2020 um 08:37

Gibt es spezielle Tools zur Identifizierung von Engpässen in der Diskursleistung?

htop-Bildschirm, sortiert nach CPU-Auslastung

Unsere Prognose besagt, dass sich die Anzahl unserer Nutzer im nächsten Jahr verdreifachen wird. Daher müssen wir ab heute die erforderlichen Ressourcen für dieses Wachstum bereitstellen.

marianord · 1. September 2020 um 12:34

Die Verwendung von Tools wie Prometheus + Grafana kann Ihnen helfen, den historischen Verlauf der Daten zu erhalten, anstatt sie live zu betrachten und anschließend eine tiefere Analyse dessen durchzuführen, was gerade passiert.

nildarar · 13. Oktober 2020 um 06:24

Hallo nochmal
Nach Ihren Tipps haben wir Prometheus installiert und die Community-Leistung eine Weile überwacht. Bitte sehen Sie sich die unten stehenden Berichte an und vergleichen Sie die Werte mit denen, die Sie in verschiedenen Installationen sehen.

Jonathan5 · 13. Oktober 2020 um 07:42

Ich habe kürzlich in einem anderen Beitrag gelesen, dass eine Site das „Who’s Online“-Plugin wegen der damit verbundenen Verlangsamung entfernt hat.

Hier ist der Link: Benefits of the who's online plugin? - #6 by neounix

Thema		Antworten	Aufrufe
My discourse speed is very slow Self-hosting	24	4922	4. März 2021
Our discourse overload because of a custom plugin. Please help me Self-hosting hosting	46	1667	22. August 2022
Due to extreme load, this is temporarily being shown to everyone... when it's not really the case Self-hosting server-resources	19	1771	21. Juli 2023
Are there any commands that will speed up the site? Support	19	2290	2. Dezember 2020
Performance, Scaling, and HA requirements Self-hosting hosting	8	7403	2. April 2017

Beste Konfigurationen zur Beschleunigung von Standalone Discourse

Verwandte Themen