Sind tägliche Backups genug?

Ich bin ein bisschen ein „Kontrollfreak“, wenn es darum geht, keine Daten zu verlieren. Nur tägliche Backups zu sehen, gibt mir immer das Gefühl, dass etwas mit einem Server passieren und plötzlich ein ganzer Tag mit Daten, der extrem wichtig sein kann, verloren ist.

Ohne zu technisch zu werden, da ich kein Experte bin, wäre ein System, bei dem gepostete/hinzugefügte Dinge auf einem anderen Server repliziert werden, nicht möglich? Ich glaube, so funktioniert eine Social-Media-Plattform, wenn wir Inhalte posten?

Wenn dies mit Discourse nicht möglich ist, wären stündliche Backups nicht etwas sicherer? Ich sehe keine Option dafür. Es scheint nur bis zu 1 (täglich) oder 0 (deaktiviert) herunterzugehen.

Wie handhabt ihr das?

Ein guter VPS auf einer guten Plattform hat höchstwahrscheinlich keine Probleme, insbesondere nicht zwischen Upgrades.

In fast 8 Jahren Betrieb eines meiner Foren hatte ich noch nie einen einzigen Datenverlust.

Der tägliche Stapellauf ist als Kompromiss für die meisten Self-Hoster konzipiert.

Es ist ein einigermaßen einfaches System, ein Regime, das nicht zu viel Platz und Rechenleistung beansprucht.

Ich kann mir nicht vorstellen, dass es sich für die meisten Leute lohnt, es öfter zu tun.

Ich musste noch nie ein Backup für Online-Abstürze verwenden, sondern nur für die Migration auf neue Server, falls dies notwendig wird (weil ich aus dem kleineren herausgewachsen bin!)

Ihre Erfahrungen können abweichen (YMMV)

Wenn Sie jedoch der Meinung sind, dass Sie eine häufigere Einrichtung benötigen, seien Sie bereit, Ihre Einrichtung anzupassen, und seien Sie bereit, diese Anpassung zu warten (was bedeuten würde, zu lernen, wie man es macht und/oder jemanden einzustellen, der Ihnen hilft).

3 „Gefällt mir“

Backups und Replikation sind zwei verschiedene Dinge.

Backups liefern einen Schnappschuss der Daten zu einem bestimmten Zeitpunkt. Sie bieten einen Wiederherstellungspunkt.

Replikation verteilt jede Aktion auf ein anderes System, sodass Sie sie an mehr als einem Ort haben. Löschungen werden ebenfalls repliziert.

Wenn Sie wirklich ausfallsicher sein wollen, brauchen Sie beides. (Und mehr…)

Replikation löst also nur das Problem, aktuelle Daten an mehreren Orten zu haben. Backups bieten die Methode, ein System auf einen bestimmten Zeitpunkt wiederherzustellen.

Discourse verwendet 2 Mechanismen zur Speicherung:

  1. PostgreSQL-Datenbank für alles außer angehängten Dateien
  2. Angehängte Dateien werden auf dem lokalen System oder in S3 gespeichert

Um die in der PostgreSQL-Datenbank gespeicherten Daten zu sichern und/oder zu replizieren, können Sie die PostgreSQL-Dokumentation konsultieren, wie dies zu tun ist. Bezüglich Backups und Replikation.

Angehängte Dateien sind etwas kniffliger. Wenn Sie sie in S3 speichern, können Sie S3-Backups verwenden. Für lokal gespeicherte Dateien können Sie eine Vielzahl von lokalen Systemoptionen verwenden.

Das Erstellen vollständiger Backups ist je nach Datenmenge eine große Aufgabe. Daher kann dies nicht ohne Weiteres häufiger durchgeführt werden. Das Standard-Backup-Verfahren von Discourse besteht darin, vollständige Backups zu erstellen. Wenn Sie das Risiko eines Datenverlusts wirklich reduzieren möchten, müssen Sie sich andere Optionen ansehen.

Eine Option könnte von Ihrem Hosting-Dienst bereitgestellt werden: Volume-Snapshots. Dies bietet eine Möglichkeit, eine „sofortige“ Kopie der in einem Volume gespeicherten Daten zu erstellen. Dies ermöglicht es Ihnen, das Volume auf diesen Zeitpunkt wiederherzustellen. Volume-Snapshots sind möglicherweise auch im Betriebssystem verfügbar, abhängig von dem verwendeten Dateisystem. (btrfs unterstützt dies zum Beispiel.)

Darüber hinaus geht die PostgreSQL-Dokumentation auch auf die Erstellung kontinuierlicherer Backups der Datenbank ein, was eine ausgezeichnete Point-in-Time-Wiederherstellung der Datenbank ermöglicht. (Vergessen Sie nicht, die Backups extern zu sichern.) Dies ist viel schneller als vollständige Backups.

Für granularere Sicherungen von Anhängen können Sie verschiedene Backup-Tools verwenden, die die Verwaltung von Voll-/Differenzial-Backups ermöglichen. Zum Beispiel duplicity. Oder Sie könnten rsync (ohne Löschen) verwenden. Zwischen den Snapshots könnten Sie immer noch Dateien verlieren. Die Verwendung von S3 ohne Löschen wäre sicherer, da sich die Dateien bereits auf einem anderen System befinden.

Zusammenfassend lässt sich sagen, dass der Standard-Backup-Mechanismus von Discourse nicht gut für einen häufigeren Sicherungsplan geeignet ist. Wenn Sie mehr Backups wünschen, verwenden Sie eine Kombination aus den Standard-PostgreSQL-Backup-/Replikationsfunktionen, S3, Volume-Snapshots usw.

Auf meiner Seite verwende ich das Backup-System von Discourse nicht für regelmäßige Backups. Ich habe immer noch tägliche Backups, aber ich verwende eine Kombination aus pg_dumps und duplicity-Konfigurationen (koordiniert über backupninja).

3 „Gefällt mir“

Ich mache jede vierte Stunde ein Datenbank-Backup. Das ist der Zeitraum, in dem ich mit möglicherweise verlorenen Beiträgen leben kann. Zum Vergleich: Mein E-Commerce-System macht alle 5 Minuten Backups.

Einmal am Tag ist nicht genug. Der Wert von maximal 24 Stunden verlorener Themen/Beiträge ist einfach zu hoch.

1 „Gefällt mir“

Es geht darum, wie viele Inhalte Sie verlieren könnten – in einem ruhigen Forum wäre ein Backup alle paar Tage kein Problem, in einem sehr belebten Forum könnte sich selbst eine Stunde wie ein großer Verlust anfühlen. Aber Sie müssen die Unwahrscheinlichkeit eines Ausfalls berücksichtigen: Wäre es sehr beunruhigend, wenn Sie einmal im Jahr eine Stunde an Beiträgen verlieren würden? Alle zehn Jahre? Jeder von uns hat seine eigene Sichtweise auf das Risiko.

2 „Gefällt mir“

Ein noch größerer Verlust als die Beiträge könnten all die neuen Konten sein, die innerhalb eines 24-Stunden-Zeitraums erstellt wurden.

Besonders wenn Discourse als SSO-Anbieter (Single Sign-On) für Ihre anderen Anwendungen oder andere Integrationen verwendet wird.

Ich glaube nicht, dass diese „0 für täglich“ Antwort korrekt ist:

Screenshot 2025-12-29 at 13.26.18

1 „Gefällt mir“

Null deaktiviert Backups. Diese Einstellung bestimmt lediglich die Anzahl der Tage zwischen den Backups.

Die benutzerdefinierten häufigen DB-Backups von @Jagster klingen nach der passenderen Lösung, die Sie benötigen, wenn täglich nicht ausreicht.

Ja, ich habe nur hervorgehoben, wie gefährlich falsch KI ihre Vorschläge für Leute macht.

Stellen Sie sich vor, jemand würde das sehen und es umsetzen, weil ihm gesagt wurde, er solle das tun? :confused:

4 „Gefällt mir“

Sieht so aus, als käme sie von https://meta.discourse.org/t/staging-test-server-ignored-the-environment-variable/390085/2?u=falco. Ich werde den Beitrag aktualisieren, um ihn klarer zu machen.

5 „Gefällt mir“