Richtiger Weg, um Discourse auf einem selbstgehosteten Server zu sichern/zu backupen?

Hallo,

Auf einem selbst gehosteten Server: Was sind die besten Methoden, um zu verhindern, dass unser Forum für immer verloren geht? Wie können wir unsere wertvollen Daten ordnungsgemäß und sicher sichern?

In einem jetzt gelöschten Thema sagte @falco:

Dateisystem-Snapshots werden nicht unterstützt und können zu Datenverlust führen.

Außerdem schreibt das Unternehmen Hetzner über die Sicherungsfunktion:

Wir empfehlen, Ihren Server herunterzufahren, um die Datenkonsistenz auf der Festplatte zu gewährleisten.

Ich nehme also an, dass dies keine wirklich empfohlene Lösung ist… oder doch?

Auf meinem Forum verwende ich rclone und synchronisiere meine lokalen Sicherungsordner mit einem Google Drive-Ordner.

Wenn mein Server explodiert, habe ich meine wöchentlichen Sicherungen in Google Drive.
Wenn meine lokalen Sicherungen verschwinden und rclone die Sicherungen in Drive löscht, nachdem es meinen nun leeren Ordner synchronisiert hat, sind meine gelöschten Sicherungen dennoch verfügbar, da sie sich im Google Drive-Papierkorb befinden.

Ich habe also das Gefühl, dass dies eine vernünftig gute Methode ist, um meine Forum-Daten zu sichern.

Aber ist es das wirklich? Gibt es noch andere zuverlässige Lösungen, die einfach zu installieren sind?
Zu rclone: Es ist mit vielen Speichersystemen kompatibel. Sind einige davon bessere Optionen zum Speichern und Synchronisieren unserer Sicherungen?

Es wird niemals eine 100% sichere Möglichkeit geben, Daten zu speichern. Mit diesem Verständnis ist zu sagen, dass Discourse einen wirklich hervorragenden Backup-Prozess bietet, der planbar ausgeführt werden kann.

Wenn ich nicht vielen Geräten vertraue und meine monatlichen Ausgaben erhöhen kann, würde ich beginnen, Backups auf S3 auszulagern und die S3-Replikation zu aktivieren. Anschließend würde ich ein Skript verwenden, das diese Backups auf meinen lokalen Rechner kopiert, und vielleicht einmal pro Monat alles auf ein externes Laufwerk übertragen.

Dadurch haben Sie mehrere Fehlerpunkte, die nicht alle gleichzeitig ausfallen. Die Zuverlässigkeit von S3 ist recht hoch, und Ihr lokaler Rechner sollte ebenfalls in einem guten Zustand sein, da Sie ihn täglich nutzen und er bisher nicht ausgefallen ist (obwohl dies möglich ist, und zwar sicher schneller als ein flächendeckender Ausfall bei S3).

Da dieser sichere Ansatz nicht auf Informationssicherheit (Verschlüsselung usw.) setzt, ist der beste Weg, mehrere Kopien an mehreren Orten zu haben.

Wenn du /var/discourse/containers und /var/discourse/shared/standalone/backups remote synchronisierst, bist du auf der sicheren Seite. Sollte dein Server ausfallen, benötigst du nur die Container-yml-Datei(en) und die aktuellste Sicherung. Ich empfehle tägliche Sicherungen. Wenn du besonders clever und engagiert bist, könntest du einen Bereinigungsprozess für dein rsync-Ziel einrichten, der wöchentliche, monatliche und jährliche Sicherungen verwaltet.

Ich habe dies gerade geschrieben: Best Practices for Backups

Siehe auch dies:

Sicherung auf Amazon S3, was automatisch und integriert ist.

Wir nutzen seit Jahren rsync, und es funktioniert für uns einwandfrei. Wir synchronisieren unsere Backups täglich mit einem Offsite-Backup, das wir selbst kontrollieren und verwalten. Sollte das Rechenzentrum also von einer Katastrophe betroffen sein, haben wir alle wichtigen Daten :slight_smile:

Wenn Sie über Backups und Sicherheit nachdenken, beachten Sie bitte, dass IT-Sicherheit aus drei Hauptbereichen besteht:

  • Verfügbarkeit
  • Integrität
  • Vertraulichkeit

Beim Sichern Ihrer Daten müssen Sie alle drei Bereiche berücksichtigen.

Wenn Sie hohe Anforderungen an die Vertraulichkeit haben, könnte die Sicherung bei Drittanbieterlösungen (und in Clouds, die nicht unter Ihrer strengen administrativen Kontrolle stehen und anderen gehören) nicht die beste Option für Sie sein.

Sicherheit ist nicht für alle gleich geeignet und basiert auf Ihrem individuellen Risikomanagement-Modell. Dieses umfasst ebenfalls drei Schlüsselbereiche:

  • Bedrohung
  • Verwundbarkeit
  • Kritikalität

Das Zusammenspiel dieser drei Bereiche hilft dabei, Ihre Backup- und Wiederherstellungsstrategie zu gestalten.

  • Einige Websites sind aufgrund ihres Inhalts oder ihrer Domain (Geschäftsmodell) stärker bedroht als andere; andere sind für Kriminelle kaum von Interesse.

  • Manche Menschen wissen, wie man sicher hostet, die neuesten Patches installiert, das Dateisystem absichert usw. und sind daher weniger verwundbar als diejenigen, die in diesem Bereich weniger erfahren (oder einfach faul) sind.

  • Manche betreiben hochkritische Websites und Foren. Fällt die Website beispielsweise aus, könnten sie an einem einzigen Tag (oder sogar innerhalb einer Stunde) erhebliche Geldverluste erleiden oder ihre Markenintegrität beschädigt werden.

  • Bei anderen fällt der Ausfall kaum jemandem auf, und es gehen keine Gelder verloren.

Ohne dieses spannende Thema in ein umfassendes Sicherheitswerkzeug zu verwandeln, müssen Sie Ihre eigenen Anforderungen an das Risikomanagement basierend auf Ihrem einzigartigen Geschäftsmodell und Ihren Risikofaktoren verstehen – nicht basierend auf den Modellen anderer.

Ein Modell passt nicht für alle – und das ist eine der wichtigsten Lehren, die IT-Fachleute über IT-Sicherheit verstehen sollten (was jedoch nur sehr wenige tatsächlich tun). Backups und Wiederherstellung sind ein wesentlicher Bestandteil der Gleichung.

Nur zur Information: Wir vertrauen unsere Backups niemals einem Drittanbieter an und bewahren sie stets an einem sicheren Ort auf, der unter unserer technischen und administrativen Kontrolle steht.


Als Nebengeschichte: Ein Freund von mir ist einer der weltweit besten Höhlen-Taucher (Forschungstaucher). Wenn er in Unterwasserhöhlen taucht und diese erkundet, verfügt er über eine doppelte und dreifache Redundanz (Gas, Masken, Computer, Lampen, Batterien, Messer, Scooter und mehr). Ich habe gesehen, wie er über 40 Gasflaschen bereitgestellt hat und mindestens zwei Unterwasser-Scooter mit sich führt. Er weiß, wie man Risiken unter Wasser managt.

DENNOCH backuppt dieser weltberühmte Höhlen-Taucher seinen Desktop-Computer nie und geht oft online, weil sein Laptop abgestürzt ist und er alle Daten verloren hat. Er sagt, es sei ihm egal, wenn er seine PowerPoint-Präsentationen verliert – das ist seine persönliche Risikomanagement-Strategie. Er schätzt sein Leben viel mehr als ein paar digitale Dateien.

So ist das Leben…


Um Ihre Frage zu beantworten: Wir hosten seit fast 30 Jahren selbst. Wir lagern unsere Backups stets offsite ab, wobei wir rsync und sogar sftp auf einem Server verwenden, auf den wir Zugriff haben. In 30 Jahren mit Servern im Internet hatten wir niemals ein Problem. Ich habe sogar eine zusätzliche Kopie in meinem Heimnetzwerk auf einem kleinen Mac Mini als privates Speichergerät. Das betrachte ich als „sicher

Vielen Dank für all diese Informationen :+1:t6:

Ich frage mich, warum ich S3 nicht einmal erwähnt habe :thinking: Vielleicht dachte ich unbewusst an kostenlose Backup-Methoden… Obwohl ich ein GDrive-Abonnement habe :upside_down_face:

Wie schätze ich die S3-Kosten für Discourse-Backups korrekt ab?
Ich bin mir nicht sicher, wie ich die Felder im Rechner ausfüllen soll:


In meinem Fall sind meine Backups (mit Uploads) etwa 1 GB groß, und ich würde tägliche Backups mit einer Aufbewahrungsdauer von 4–7 Tagen durchführen.

Eine weitere Sache, die ich nicht erwähnt habe, ist, dass auch mein Co-Administrator Zugriff auf die Remote-Backups haben soll.
Derzeit habe ich ihm auf meinem GDrive das Verzeichnis freigegeben, in dem meine Backups gespeichert sind.
Ist es möglich, den Zugriff auf S3-Backups ebenfalls freizugeben?

Erwarten Sie monatlich Kosten von 7 GB-Monaten (plus etwas Spielraum für Wachstum), zusätzlich zu einer Übertragungsgebühr jedes Mal, wenn Sie eines der Backups abrufen müssen.

Sendet oder ruft eine Sicherungskopie 1 Anfrage ab?