Copia i backup su un altro server con rsync e cron

johncs · 30 Luglio 2019, 1:17am

Ho un server di backup che coordina i backup su molti server. Voglio che il mio server di backup recuperi i backup di Discourse dal server del mio forum.

Ho riflettuto su come permettere al server di backup di accedere ai file di backup sul server del forum. Il metodo migliore che ho trovato è consentire l’accesso remoto all’utente www-data (che possiede i backup di Discourse).

Non volevo permettere al server di backup di accedere tramite shell al server del forum come root (per motivi standard di amministrazione di sistema). Volevo anche evitare di fare qualcosa che potesse causare problemi a Discourse durante i backup o i ripristini. Inoltre, volevo evitare di ospitare un altro servizio sul server del forum.

Comunque, ecco come l’ho fatto.

Consentire l’accesso remoto all’utente www-data

Modifica /etc/passwd e sostituisci la shell di www-data con /bin/bash invece di /usr/sbin/nologin.
Modifica nuovamente /etc/passwd e sostituisci la directory home di www-data con /home/www-data invece di /var/www (opzionale, ma a mio avviso più elegante).
Aggiungi la chiave SSH del server di backup a /home/www-data/.ssh/authorized_keys.

rsync

Infine, sul server di backup, ho aggiunto un comando cron orario che esegue il seguente script:

#!/usr/bin/env bash

set -xe

HOST="$1"
DIR="$2"
if [ -z "$HOST" ] || [ ! -d "$DIR" ]; then
	echo "$0 HOST DIR"
	exit 1
fi

# --ignore-existing farà sì che rsync ignori eventuali backup già copiati.
# --delay-updates garantisce che solo backup completi finiscano in $DIR. Se
# non viene specificato, backup parziali potrebbero finire in $DIR e, poiché
# --ignore-existing non esegue alcun tipo di controllo di uguaglianza, il problema
# non verrà corretto o rilevato.
rsync --ignore-existing --delay-updates "$HOST:/var/discourse/shared/standalone/backups/default/*" "$DIR"

Spero che questo possa essere utile a qualcuno.

Bathinda · 17 Agosto 2024, 8:59am

Wow!!
Apprezzerei molto di più se spiegassi i passaggi forniti di seguito in modo un po’ più dettagliato, in modo che gli utenti alle prime armi come me non possano fare nulla di sbagliato (e anche per farsi un’idea di cosa sta facendo ogni passaggio).

Cosa fa quanto sopra?

Intendi la chiave pubblica qui?

johncs · 17 Agosto 2024, 10:23pm

Consente all’utente www-data di accedere con successo. Questo sta cambiando la “login shell”, che è una buona parola chiave da cercare per saperne di più.

Sì. Le chiavi private non dovrebbero (praticamente) mai essere copiate/condivise al di fuori della loro macchina host.

Bathinda · 28 Agosto 2024, 2:03pm

Dato che sei una persona che cerca in modo un po’ nuovo, ci potrebbe essere anche un modo semplice per trasferire il nostro backup del server locale su diversi bucket S3, come Google S3, iDrive S3 tramite cron job?
(So che possiamo configurarlo direttamente per il bucket S3 di AWS utilizzando la sua chiave e il suo segreto).

pfaffman · 28 Agosto 2024, 2:09pm

Se configuri i backup S3, questi vengono caricati automaticamente su S3, anche se hanno tutti i caricamenti o nessuno, quindi a meno che tu non abbia caricamenti su S3, hai più copie di tutti i caricamenti nei file di backup.

Bathinda · 28 Agosto 2024, 2:14pm

Questo lo so già e finora, da quando ho iniziato 6 anni fa, ho utilizzato proprio questa configurazione (di caricare tutti i media e i backup nel bucket AWS).

Ma stavo chiedendo quanto sopra per un problema di tipo diverso che sto affrontando.
Ora, ho impostato la creazione di backup (che includono i media ‘Uploads’) sul server Ubuntu locale. Ma (come discusso in un altro thread), non sono in grado di ripristinare da quei backup (grandi 1 GB). Manca qualcosa/c’è un problema. Quindi stavo pensando di usare il bucket di Google e di abbandonare del tutto AWS.

pfaffman · 28 Agosto 2024, 2:48pm

Non vedo la differenza tra AWS S3 e quelli di Google. Ma forse https://restic.net/ ti aiuterà? È un programma di backup che può eseguire il backup nei bucket S3.

Non sono sicuro di quale sia il tuo problema di ripristino.

Bathinda · 29 Agosto 2024, 11:33am

John Sullivan:

#!/usr/bin/env bash

set -xe

HOST="$1"
DIR="$2"
if [ -z "$HOST" ] || [ ! -d "$DIR" ]; then
	echo "$0 HOST DIR"
	exit 1
fi

# --ignore-existing will have rsync ignore any backups that have already been
# copied.
# --delay-updates ensures that only complete backups ever make it into $DIR. If
# this isn't specified, partial backups could end up in $DIR, and because
# --ignore-existing won't perform any kind of equality check, the problem will
# not be corrected or detected.
rsync --ignore-existing --delay-updates "$HOST:/var/discourse/shared/standalone/backups/default/*" "$DIR"

Per chiunque arrivi a questo thread come me, vorrei spiegare ulteriormente questo primo post dell’argomento.

Questo è uno script bash, che può essere incollato “così com’è” in un file chiamato qualsiasi cosa, ma con estensione .sh
La prima riga dello script imposta semplicemente l’ambiente per l’esecuzione dello script, per quanto riguarda quale shell o ambiente utilizzare: #!/usr/bin/env bash: questo dice al sistema di utilizzare l’interprete bash trovato tramite il comando env.
flag (set -xe):
-x: abilita il debug, il che significa che ogni comando e i suoi argomenti verranno stampati sul terminale prima di essere eseguiti. Questo è utile per il debug dello script.
-e: causa l’uscita immediata dello script se un comando restituisce uno stato diverso da zero (indicando un errore). Questo è utile per impedire allo script di continuare dopo un fallimento.
E nel prossimo importante passaggio, Variabili (HOST="$1" DIR="$2"):
HOST="$1": assegna il primo argomento passato allo script ($1) alla variabile HOST. Cioè, quando questo script viene eseguito, richiederà un input all’utente e qualsiasi primo input ($1) inserito dall’utente, verrà passato/considerato come valore ‘Host’ (da dove i dati verranno forse copiati).
DIR="$2": assegna il secondo argomento passato allo script ($2) alla variabile DIR. Cioè, qualsiasi (percorso di directory) verrà inserito dall’utente dopo aver inserito il primo valore, (chiamato $2') verrà preso dallo script come ‘Dir- directory di destinazione’.
Se qualcuno è interessato posso spiegare anche i restanti 2 passaggi, ma basti dire che il passaggio successivo controlla semplicemente che l’utente fornisca i valori corretti di host e directory di destinazione quando richiesto. Altrimenti (ultimo passaggio) restituirebbe 1 come output di errore.
La cosa principale che vorrei ribadire è che questo è uno script che, quando eseguito, richiederà all’utente l’host (da dove copiare i dati) e la directory di destinazione (dove incollare i dati). E includeresti il percorso a questo file nel tuo file cron, che potrebbe eseguire questo file script quante volte al giorno imposteresti nel file cron.

Ma quello che non sono riuscito a capire è dove sono i comandi effettivi di copia e incolla (o backup)?
Come avverrà la sincronizzazione effettiva?

Argomento		Risposte	Visualizzazioni
Backup Discourse in DO droplet to NAS device Support	10	816	Gennaio 22, 2020
Extend built-in backup remote destination options Feature backups	4	848	Gennaio 25, 2023
Backup discourse from the command line Self-Hosting backups , how-to	8	12341	Maggio 17, 2026
Powershell script for sysadmin to regularly download backups from server to computer Extras backups	12	2298	Maggio 8, 2025
Sshfs and backup Self-hosting backups	5	535	Marzo 1, 2023

Copia i backup su un altro server con rsync e cron

Consentire l’accesso remoto all’utente www-data

rsync

Argomenti correlati