Archiefbeleid

Uit De Vliegende Brigade
Naar navigatie springen Naar zoeken springen

Het probleem

In de loop der jaren is me opgevallen, dat als ik niet op een handige manier omga met backups, er gekke dingen kunnen gebeuren:

  • Er worden backups-van-backups gemaakt, en al snel is geen enkele datadrager nog groot genoeg
  • Er worden 'echte' backups gemaakt, dus complete kopiën van 'iets', waarbij 'iets' meestal m'n home-directory is, maar daarnaast ook backups van specifieke zaken, bv. salsa-muziek. Daarnaast bewaar ik voor sommige projecten aparte backups, bv. tussentijdse versies van databases. Die drie soorten objecten lijken los van elkaar te bestaan. Is dat niet raar?
  • Als een project is opgeleverd, moet ik daar iets van een 'archief' van maken, zodat ik het later kan terugvinden en kan hergebuiken
  • Ik kan nooit iets terugvinden (bv. foto's
  • Het lijkt dat de data op m'n harde schijf alleen maar meer wordt, zelfs op momenten dat ik geen actieve klussen heb
  • Ik test zelden of backups wel goed zijn gemaakt, terwijl restoring de achilleshiel is.

De oplossing

Duidelijk: Ik heb een backup-strategie oftewel archiefbeleid nodig.

Offline backups

  • Om simpel te beginnen: Met backups bedoel ik zo letterlijk mogeljke reserverkopieën van data.
  • Met offline bedoel ik backups op externe harde schijven. Die schijven sla ik op in een kluisje, en zijn alleen met m'n laptop verbonden op het moment dat ik een backup maak
  • Backups hebben een tijdelijk karakter: Ze zijn alleen relevant zolang de betreffende brondata relevant is, en/of zolang er geen nieuwe backups zijn. Als ik bv. een tien jaar oude backup zou tegenkomen, dan is deze waarschijnlijk op geen enkele manier nog relevant (althans, als ik de afgelopen tien jaar een perfect archiefbeleid heb gevoerd)
  • Zie Backups voor details.

Dagelijkse backups

  • Ik heb op dit moment vier harde schijven die ik rouleer voor het maken van offline backups. Toevallig had ik vier schijven. Da's de reden. Hoe meer schijven hoe beter. Ook schijven met relatief weinig opslagcapaciteit kan ik prima gebruiken: Dan schrijf ik daar minder complete backups op (ik vind redundantie qua schijven belangrijker dan dagelijkse offline backups)
  • Ik gebruik rsync voor het maken van backups op externe harde schijven
  • Ik kon met Rsync niet zomaar een systeem bouwen met differentiële of incrementele backups. Vandaar dat ik voor alle dagen van de maand een aparte map heb
  • Orginele data en backups worden niet gesynchroniseerd (dus dat het 1-op-1-kopieën zijn), want als er iets mis is met de brondata, heb je een risico dat het kopie gewist wordt. Er wordt uitsluitend data van bronlocatie naar doellocatie geschreven. De map "Day-01" wordt bv. op 1 januari van inhoud voorzien. Op 1 mei is deze schijf vervolgens weer aan de beurt. Alle bestanden die in de afgelopen vier maanden zijn gewijzigd of zijn toegevoegd, worden bijgeschreven in deze map
  • Op deze manier heb ik dagelijkse backups over de afgelopen vier maanden.

Jaarlijkse backups

  • Aan het begin van het nieuwe jaar, maak ik op elke offline-schijf een map aan voor het afgelopen jaar, bv. Year-2019. Daarin zet ik de laatste backup van 2019. Deze is dus 'supercompleet', want hij bevat alles wat er het afgelopen jaar is verzameld
  • Net zo min als voor andere backups, zijn deze jaarbackups 'georganiseerd' of 'opgeruimd'. Het is een zo letterlijk mogelijke weergave van bepaalde brondata
  • Vervolgens maak ik de 'dagmappen' leeg, zodat die schoon het nieuwe jaar in gaan
  • Als ik na een paar jaar vrij zeker weet dat ik zo'n backup nooit meer zal gebruiken, kan ik 'm zonder probleem weggooien.

Static

Met static bedoel ik data die min-of-meer tijdsonafhankelijk is. Denk bv. aan:

  • MP3-collectie
  • Muziekcollectie.

Voorbeeld: Op m'n laptop bewaar ik niet m'n complete MP3-collectie, maar alleen wat me interesseert. De complete collectie staat in mappen Static op m'n externe harde schijven.

Archives

Met archives bedoel ik mappen op jaar, waarin data staat die gesorteerd is en gemakkelijk toegankelijk is. Dat zijn mappen met namen als Archive-2018 en Archive-2019. Denk bv. aan:

  • Alle data van projecten die zijn afgerond
  • Administratie over dat jaar
  • Backups van foto's van m'n mobieltje uit dat jaar

Online backups

  • Ik heb een betaald Dropbox account
  • M'n hosting-provider maakt verschillende soorten backups van m'n servers.

Ook aan denken:

  • Kopieën van servers worden gekopiëerd naar een plek binnen de Dropbox
  • Kopieën van MySQL-databases en locale websites, worden gebackupped naar een plek binnen Dropbox.