L’auto-hébergement oui, mais sans oublier le backup

L'auto-hébergement, c'est bien

La dégooglisation par Framasoft bat son plein et les services de cloud personnel n'ont jamais été aussi simples à installer. En grand amateur du libre, je ne peux que m'en réjouir. Je m'étonne cependant du manque d'informations concernant une partie importante, que dis-je, cruciale pour toute opération sur des données numériques critiques : la sauvegarde.
Les manuels pour la mise en place et l'utilisation de ces services sont bien fournis. Les guides pour vous aider à basculer d'un service propriétaire centralisé vers ces logiciels libres à installer où bon vous semblent pullulent sur la toile. Mais quid des principes de base de l'auto-hébergement ?

Gérer son infrastructure, c'est mieux

Ces services que vous aviez pris l'habitude d'utiliser tels que Dropbox ou Google Drive ne se contentent pas de synchroniser des données. Leur infrastructure assure :
- une haute disponibilité (la plupart d'entre nous peut plus ou moins s'en accommoder),
- les mises à jour de sécurité côté serveur (étape assez simple sur les 2 solutions citées en début d'article),
- la redondance des données par une vraie politique de sauvegarde automatique.

C'est à cette dernière étape qui m'inquiète particulièrement tant j'ai l'impression qu'elle est sous-estimée et peu présente dans l'esprit des personnes qui se lancent dans l'aventure.
Que se passera-t-il lorsque plusieurs mois ou années de documents versionnés, de calendriers, de carnets d'adresse, se retrouveront coincées à jamais au cœur d'un disque dur ayant décidé de rendre l'âme ? Là où l'utilisateur a tendance à oublier la qualité d'une infrastructure professionnelle sachant se rendre invisible, une personne non-avertie pourrait avoir une bien mauvaise surprise et finir par blâmer l'éditeur de la solution qu'il utilise pour la perte de ses données même si ce dernier n'y est pour rien.

Photo de backup par Tim Reckmann sous licence Creative Commons

photo de Tim Reckmann sous licence Creative Commons

Éduquer à chaque étape

Le sensibilisation à cette problématique de sauvegarde auprès des administrateurs en herbe me semble cruciale. Je conçois que c'est une partie compliquée, moins vendeuse et chronophage en terme de développement et de documentation. Quand on se veut être une solution de stockage, informer ses utilisateurs de ce que ça représente, des risques qu'ils prennent et de comment les éviter ne devrait pas être en option, perdu au fin fond d'une doc', d'un forum ou d'un blog.
Un encart devrait donner des informations d'ordre général sur le sujet au début de l'installation pour expliquer à l'utilisateur à quoi il s'engage et fournir à minima des liens vers des articles de fond sur la mise en place de sauvegarde lors de la dernière étape.

Un disque dur ne suffit pas

Ayant déjà quelques scripts de backup maison à base de rsync, je ne me suis pas encore penché sur la question d'un vrai processus de sauvegarde interne au logiciel que j'utilise. En proposer par défaut pourrait avoir une vraie valeur ajoutée. Vous trouverez ci-dessous quelques idées en vrac pouvant être mises en œuvre.

Le minimum :

  • Un rsync des fichiers de l'instance vers un autre disque que celui utilisé (utiliser une autre partition du même disque ne sert à rien)
  • Backup automatisé de la base de données de l'instance

Aller plus loin :

  • Archive + SSH / FTP
  • Envoyer à un ami, un parent une archive cryptée (entière ou incrémentale)
  • Utilisation d'un service tiers pour gérer les sauvegardes (pas vraiment compatible avec l'idée d'auto-hébergement mais mieux vaut ça que pas de sauvegardes du tout)
  • Service annexe (API) avec un serveur distant pouvant monitorer l'état et la version du backup ainsi que sa restauration en cas de besoin

Pour finir

Le but de cet article n'est en aucun cas de taper sur les solutions libres permettant aux utilisateurs de s'affranchir des géants du net et surtout de contrôler où et comment sont stockées leurs données. Je souhaitais appuyer sur un point important et qui me semble être sous-exposé pour le moment. Que vous vous auto-hébergiez ou pas, prévoyez quoi qu'il arrive la sauvegarde de vos données importantes. N'attendez pas qu'il soit trop tard !

Réflexion à propos des données que nous confions aux services web

Les épisodes rocambolesques de Xmarks ou de Delicious qui risquaient de fermer leurs portes, ou Tumblr down pendant plus d'une journée  m'ont amené à penser une fois de plus à l'importance de la pérennité des services en ligne auxquels je confie mes données. Quel internaute s'adonnant à des pratiques de partage / veille ou une utilisation avancée des réseaux sociaux ne se sert pas de Delicious, Tumblr, Xmarks, ou Bit.ly ... ? Peu importe l'outil, le fait est que vous n'êtes plus le gestionnaire direct de ce que vous déposez. Les avantages y sont énormes, que ce soit pour les nouvelles fonctionnalités, la sécurité, la disponibilité, la bande passante, les frais, et j'en passe, c'est du "plug and play" ! Le revers de la médaille, c'est que le jour où il y a un pépin, ou que votre outil préféré que vous alimentez quotidiennement depuis plusieurs années est down de façons répétées ou décide de mettre la clé sous la porte, ça se complique. Au mieux vous pouvez exporter vos données dans un format qui sera réutilisable par un autre service du même genre mais dans le pire des cas, il n'est plus possible de récupérer quoi que ce soit, vous voici reparti sur une page vierge...

J'en arrive au fait de cet article, plus ça va, et plus j'ai tendance à souhaiter gérer de A à Z l'ensemble de ce que je dépose sur le net. C'est pour cette raison (entre autre) que j'héberge mon blog, mon service d'URLs courtes et désormais mon système de bookmarks (grâce à Scuttle dont je vous ai venté les mérites ici même), il n'y a quasiment que Tumblr qui résiste à cette vendetta. Il est évident qu'il ne faut pas en arriver à l'extrême inverse en n'utilisant plus que des services que nous pourrions auto-héberger, mais je pense qu'il est important de faire un bilan afin de bien nous rendre compte de ce qui est important et que nous ne souhaitons absolument pas perdre, et ce qui l'est moins et ne nécessite pas (ou peu) d'attention en comparaison.
"T'es bien gentil avec tes conseils, mais:

  • j'ai trop craqué sur Tumblr et je ne peux plus m'en passer
  • je n'ai pas de serveur perso pour installer tout ça
  • je n'ai pas les compétences pour le gérer
  • je n'ai pas envie de me prendre la tête
  • rajoutez ici ce que vous voulez

alors bon...", et vous avez tout à fait raison ! Dans ce cas, il me semble nécessaire de bien se renseigner sur la possibilité d'exporter ses données dans un format ouvert de préférence. Une autre astuce peut consister à rechercher un système de backups automatique lié au service à utiliser (dans le style de TweetBackup pour Twitter), ça ne mange pas de pain et ça peut toujours servir. Dans tous les cas, il ne faut surtout pas attendre le dernier moment !

Et vous, quelle tactique avez-vous adoptée ?

Crédit image