Har du sparet din mulighed for restore væk?
I de sidste måneder har vi haft mange gruopvækkende oplevelser i forbindelse med assistance på restore af data. For mange er det sandhedens time, når man skal se, hvad ens backup reelt kan bruges til, og hvor hurtig – eller langsom - ens restoretid egentlig er.
Det skal indskydes, at det har kunnet lade sig gøre at restore, de gange vi har været ude for at assistere. Men i nogle tilfælde er der tabt dagsproduktioner af data, og i andre tilfælde har vitale systemer været utilgængelige i flere dage.
Samtidig kan det være en dyr affære, hvis der ikke er styr på restore. Væsentligt dyrere, end hvis man proaktivt har tilpasset backupsystemet til at levere den nødvendige restoreservice og proaktivt har testet, om den recoveryplan, man regner med at bruge, faktisk kan lade sig gøre.
Det skræmmende er, at reaktionen oven på sådan en oplevelse tit er, at man bruger lang tid på at placere skyld, og derefter stiller sig tilfreds med, at branden nu er slukket. Desværre lukker mange øjnene for, at restoren kun lykkedes med lodder, trisser og lidt held. Faktisk tror jeg, det mange steder står så skidt til, at det ville bekymre virksomhedens revisor, hvis han eller hun kendte til situationens alvor.
Det er, som om nogen har glemt, hvor vigtigt det er at kunne reetablere virksomhedens it-systemer, hvis uheldet er ude. Man er blevet træt af at tage backup og træt af at blive ved med at investere i de backupsystemer, der skal håndtere virksomhedernes voksende datamængder. Det tyder faktisk på, at man har glemt det faktum, at der er mere end 90 % risiko for, at en virksomhed holder op med at eksistere, hvis den mister sine data og ikke kan reetablere dem.
Det er jo en skam, da der faktisk er sket rigtig meget med teknologien på dette område. Mange kan faktisk skifte til et nyt og bedre backupsystem for deres vedligeholdelsesomkostninger på det eksisterende system.
Heldigvis har vi også gode oplevelser ind imellem. Oplevelser med virksomheder, der tager restore alvorligt og derfor laver eller får lavet restoretests. Ved proaktivt at teste opdager man fejl eller uhensigtsmæssigheder, som kan rettes. På den måde kan man også dokumentere, at man ikke bare har et backupsystem men også et restoresystem :)
Jeg oplever, at vi meget tit finder fejl i forbindelse med disse tests. Det kan være alt fra filer, der er ekskluderet fra backuppen, men som man faktisk har brug for ved en restore, til alvorlige ting som domain controllers, DNS og andre vitale services der simpelthen ikke kan restores, fordi der er en fejl på serveren. Det er fejl, som producenterne nogle gange tager flere dage om at løse, og fejl som bestemt ikke havde været sjove at bide skeer med i en restoresituation.
Min opfordring er, at virksomhedernes ledelse sætter sig ind i de problematikker, der kan opstå, når man forsømmer sin restore. Samtidig bør de kigge på, hvilket beredskab der reelt skal til for at sikre virksomhedens eksistens.
Per er partner i Komplex it og en del af et hold, som har mere end 30 års erfaring inden for server- og storageløsninger både i den private og offentlige sektor. Han blogger om hvordan ny teknologi kan bruges i praksis.
Kommentarer (6)
Hvis du er nysgerrig efter at læse mere om teknikker eller få gode råd til, hvad du kan gøre, kan jeg anbefale at bruge et par minutter på min kollega Michael Kolls blogindlæg. Michael har dagligt hands-on med mange forskellige backupinstallationer.
Det kunne også være spændende hvis du tager dig tid til at diskutere hvordan man "brand" sikrer sin backup, altså sørger for at have en kopi et andet sted.
Men det grundlæggende omkring katastrofesikring er
- at nok er risikoen jo er meget lille, hvilket får folk til at glemme at
- konsekvensen af ikke at kunne genoptage sin drift typisk er maksimal. (fimaet går konkurs)
I min optik handler brandsikring om, at man sørger for at have en valid kopi (altså en kopi, man ved, man kan restore fra) af sin backup i en anden brandzone eller på en anden lokation end den, hvor den primære version befinder sig.
Derefter kommer det meget an på, hvilke systemer man tager backup af, datamængder osv., og hvilket backupsystem man bruger. Hos rigtig mange af de virksomheder, som vi rådgiver, løser backupsystemet TSM opgaven rigtig godt, da det har beskyttelsen indbygget i måden, det tager backup på, så man automatisk får en ekstra kopi.
Vi har en kort beskrivelse her, hvis det kan være interessant.
I min optik handler brandsikring om, at man sørger for at have en valid kopi (altså en kopi, man ved, man kan restore fra) af sin backup i en anden brandzone eller på en anden lokation end den, hvor den primære version befinder sig.
Og hvad med reserveudstyr i en anden brandzone, eller garanti for, at man kan få det leveret med f.eks. 12 timers varsel? - Når først serverrummet er brændt, er backupbåndene ikke meget værd uden servere og båndstationer (og nyt serverrum med tilstrækkelig strøm og internetforbindelse).
Det er helt rigtigt, at dét der følger efter at have sikret, at man kan reetablere data er at have noget at restore på. Her er det vigtigt at tænke på, hvor hurtigt man vil kunne have en ny infrastruktur klar, hvorpå man kan få systemet til at køre igen. Dertil kan man så lægge, hvor lang tid det tager at få reetableret data på den nye infrastruktur - altså den faktiske recoverytid.
Det er som regel først når it-afdelingen tager en dialog med virksomhedens ledelse på baggrund af denne tidsudregning, at man kommer til den konklusion, at der skal et bedre beredskab til. Det kunne for eksempel være et dubleret datacenter.

