Bonne méthode pour sécuriser/sauvegarder Discourse sur un serveur auto-hébergé ?

Bonjour,

Sur un serveur auto-hébergé, quelles sont les meilleures méthodes pour éviter que notre forum ne disparaisse définitivement ? Comment sauvegarder correctement et en toute sécurité nos précieuses données ?

Dans un sujet maintenant supprimé, @falco a déclaré :

La prise de clichés instantanés du système de fichiers n’est pas prise en charge et peut entraîner une perte de données.

Par ailleurs, concernant la fonctionnalité de sauvegarde de Hetzner, l’entreprise indique :

nous recommandons d’éteindre votre serveur pour garantir la cohérence des données sur le disque.

Je suppose donc que ce n’est pas vraiment une solution recommandée… Ou si ?

Sur mon forum, j’utilise rclone pour synchroniser mes dossiers de sauvegarde locaux avec un dossier Google Drive.

Si mon serveur explose, j’ai mes sauvegardes hebdomadaires sur Google Drive.
Si mes sauvegardes locales disparaissent et que rclone supprime les sauvegardes sur Drive après avoir synchronisé mon dossier maintenant vide, mes sauvegardes supprimées resteront disponibles, car elles seront dans la corbeille de Google Drive.

Je pense donc que c’est une méthode raisonnablement bonne pour sécuriser les données de mon forum.

Mais est-ce vraiment le cas ? Existe-t-il une autre solution fiable et facile à installer ?
Concernant rclone : il est compatible avec de nombreux systèmes de stockage. Certains sont-ils de meilleurs choix pour le stockage et la synchronisation de nos sauvegardes ?

2 « J'aime »

Il n’existera jamais de méthode de stockage de données à 100 % sécurisée. Une fois cela bien compris, sachez que Discourse dispose d’un processus de sauvegarde excellent qui peut être planifié.

Si je ne fais pas confiance à de nombreux appareils et que je peux augmenter mes dépenses mensuelles, je commencerais par transférer les sauvegardes vers S3 en activant la réplication S3. Ensuite, j’utiliserais un script pour copier ces données sur ma machine locale et, peut-être une fois par mois, transférer l’ensemble sur un disque externe.

Avec cette approche, vous disposez de plusieurs points de défaillance qui ne tomberont pas tous en panne simultanément. La fiabilité de S3 est très élevée, et votre machine locale devrait également être en bon état puisque vous l’utilisez quotidiennement sans qu’elle ait jamais échoué (même si cela pourrait arriver, mais sûrement plus rapidement qu’une panne généralisée chez S3).

Comme cette approche dite « sécurisée » ne relève pas de la sécurité de l’information (chiffrement, etc.), la meilleure solution consiste à disposer de plusieurs copies en plusieurs endroits.

2 « J'aime »

Si vous synchronisez à distance /var/discourse/containers et /var/discourse/shared/standalone/backups, tout sera en ordre. Si votre serveur disparaît, vous aurez uniquement besoin du(s) fichier(s) yml du conteneur et de la sauvegarde la plus récente. Je recommande des sauvegardes quotidiennes. Si vous êtes particulièrement astucieux et dévoué, vous pourriez mettre en place un processus de nettoyage sur votre destination rsync pour conserver des sauvegardes hebdomadaires, mensuelles et annuelles.

3 « J'aime »

Je viens d’écrire ceci : Best Practices for Backups

7 « J'aime »

Voir également ceci :

5 « J'aime »

Sauvegardez vers Amazon S3, ce qui est automatique et intégré.

4 « J'aime »

Nous utilisons rsync depuis des années et cela fonctionne parfaitement pour nous. Nous effectuons quotidiennement une rsync de nos sauvegardes vers un sauvegarde hors site que nous contrôlons et gérons nous-mêmes, de sorte que si le centre de données subit une catastrophe, nous avons toutes les données nécessaires :slight_smile:

De plus, lorsque vous pensez aux sauvegardes et à la sécurité, gardez à l’esprit que la sécurité informatique repose sur trois domaines clés :

  • la disponibilité
  • l’intégrité
  • la confidentialité

Lorsque vous sauvegardez vos données, vous devez prendre en compte ces trois domaines.

Si vous avez une exigence élevée de confidentialité, la sauvegarde vers des solutions tierces (et des clouds qui ne sont pas sous votre contrôle administratif strict et qui appartiennent à d’autres) pourrait ne pas être la meilleure option pour vous.

La sécurité n’est pas une solution universelle ; elle repose sur votre modèle unique de gestion des risques. Celui-ci comprend également trois domaines clés :

  • la menace
  • la vulnérabilité
  • la criticité

C’est l’intersection de ces trois domaines qui aide à définir votre stratégie de sauvegarde et de récupération.

  • Certains sites web sont plus exposés aux menaces que d’autres en raison de leur contenu ou de leur domaine (modèle économique), tandis que d’autres ne suscitent guère l’intérêt des acteurs malveillants.

  • Certaines personnes savent héberger en toute sécurité, installer les derniers correctifs, sécuriser leur système de fichiers, etc., ce qui les rend moins vulnérables que celles qui ne sont pas aussi compétentes (ou simplement paresseuses) dans ce domaine.

  • Certaines personnes gèrent des sites web et des forums très critiques. Si le site tombe en panne, par exemple, elles pourraient perdre beaucoup d’argent en une seule journée (voire une heure) ou voir l’intégrité de leur marque entachée.

  • Pour d’autres, si le site tombe en panne, peut-être que quelques personnes seulement s’en rendent compte ou s’en soucient, et aucune perte financière n’est subie.

Ainsi, sans transformer ce sujet passionnant en un traité de sécurité, vous devez comprendre vos propres exigences de gestion des risques en fonction de votre modèle économique et de vos facteurs de risque uniques, et non du modèle de gestion des risques d’autrui.

Une solution ne convient pas à tous… et c’est l’une des leçons les plus importantes que les professionnels de l’informatique peuvent comprendre concernant la sécurité informatique (mais très peu le comprennent réellement). Les sauvegardes et la récupération constituent un élément clé de l’équation.

Pour information : nous ne faisons jamais confiance à des tiers pour nos sauvegardes (jamais) et les conservons toujours dans un endroit sûr sous notre contrôle technique et administratif.


Par ailleurs, un ami à moi est l’un des meilleurs plongeurs en grottes (explorateurs) au monde. Lorsqu’il plonge et explore des grottes sous-marines, il dispose d’une redondance double et triple (gaz, masques, ordinateurs, lampes, batteries, couteaux, scooters sous-marins, etc.). Je l’ai vu préparer plus de 40 bouteilles de gaz et transporter au moins deux scooters sous-marins. Il sait comment gérer les risques sous l’eau.

CEPENDANT, ce même explorateur de grottes sous-marines, célèbre dans le monde entier, ne fait jamais de sauvegarde de son ordinateur de bureau et se connecte souvent en ligne car son ordinateur portable a planté et il a perdu toutes ses données. Il dit ne pas se soucier de perdre ses présentations PowerPoint… c’est donc sa stratégie personnelle de gestion des risques. Il accorde bien plus de valeur à sa vie qu’à quelques fichiers numériques.

Ainsi va la vie…


Pour répondre à votre question : nous hébergeons nous-mêmes depuis près de 30 ans. Nous conservons toujours nos sauvegardes hors site en utilisant rsync et même sftp sur un serveur auquel nous avons accès, et nous n’avons jamais eu de problème en 30 ans de présence de serveurs sur Internet. J’ai même une copie supplémentaire sur mon réseau domestique, sur un petit Mac Mini agissant comme dispositif de stockage privé. C’est ce que je considère comme “sécurisé”… pour mon modèle de gestion des risques.

5 « J'aime »

Merci pour toutes ces informations :+1:t6:

Je me demande pourquoi je n’ai même pas mentionné S3 :thinking: peut-être que je pensais inconsciemment à des méthodes de sauvegarde gratuites… Même si j’ai un abonnement Google Drive :upside_down_face:

Cela dit, comment puis-je estimer correctement le coût de S3 concernant le stockage des sauvegardes Discourse ?
Je ne suis pas sûr de savoir comment remplir les champs du calculateur :


Dans mon cas, mes sauvegardes (avec les fichiers joints) font environ 1 Go et je ferais des sauvegardes quotidiennes avec une rétention d’environ 4 à 7 jours.

Une autre chose dont je n’ai pas parlé, c’est que j’aimerais que mon co-administrateur ait également accès aux sauvegardes distantes.
Actuellement sur mon Google Drive, je lui ai partagé le dossier où sont stockées mes sauvegardes.
Est-il possible de partager l’accès aux sauvegardes S3 également ?

1 « J'aime »

Prévoyez des coûts de 7 Go-mois (avec une marge pour l’évolution) par mois, avec des frais de transfert supplémentaires à chaque fois que vous devez récupérer une des sauvegardes.

1 « J'aime »

L’envoi ou la récupération d’une sauvegarde compte-t-il pour 1 requête ?