IBM om nedbruddet: Lidt forsinkelse, men intet datatab

3 kommentarer.  Hop til debatten
IBM forklarer nu, hvad der skete ved datacenter-nedbruddet, der blandt andet lammede Dankortet. Ingen data blev tabt, men batch-kørsel af data blev forsinket, lyder beskeden.
16. oktober 2009 kl. 11:03
errorÆldre end 30 dage

Det er endnu for tidligt til, at IBM kan gå i detaljer med, hvordan nedbruddet tirsdag nat skete. Men et overordnet billede kan det nedbrudsramte firma godt give.

»Klokken halv tolv havde vi et strømudfald i et datarum i vores datacenter i Brøndby. Datacentret er opdelt i områder for at mindske sårbarheden over for den slags problemer, så det var kun de servere, der var i datarummet, der blev berørt af strømudfaldet,« siger Sven Kolstrup, direktør for outsourcing i IBM.

Han har endnu ikke en forklaring på, hvad der helt præcist skete, siden strømudfaldet førte til et nedbrud.

»I et lille tidsinterval manglede der strøm. Vi er ved at undersøge, hvordan det kunne ske, og hvad der gik galt. Men før jeg får en redegørelse fra teknikerne, ved jeg ikke mere,« siger han.

Artiklen fortsætter efter annoncen

Nedbruddet var ikke et hårdt styrt, men skete kontrolleret, fortæller han.

»Serverne lukkede pænt af som de skal og stod så stille. Vi gik i gang med at fejlsøge, og det gik ret hurtigt, men det tog noget tid at få maskinerne op at køre igen, fordi det skal gøres meget kontrolleret. Vi skal sikre, vi er tilbage på normal strøm og er tilbage med databaserne i god ro og orden.«

Pukkel drillede i mange timer

I cirka to timer var systemerne offline, hvilket blandt andet kunne mærkes på Dankort-systemet, som i en periode var helt dødt. Men da systemerne kom op igen, var der et efterslæb, som gav en pukkel, hvilket kunne mærkes helt hen til onsdag formiddag.

»Da man havde kørt de test, der skulle til, startede man så systemerne op igen og begyndte med at afvikle de batch-systemer, der ventede. Det var de batch-systemer, der blev forsinket, og rakte ind over formiddagen. Normalt er de alle kørt i løbet af natten, inden forretningerne starter op igen, og mens batch-kørslerne kører, er der data, man ikke har ordentlig adgang til,« fortæller Sven Kolstrup.

Artiklen fortsætter efter annoncen

Carlsberg, der var hårdt ramt af nedbruddet, måtte dog slås med døde it-systemer i halvandet døgn.

»Når systemerne går ned, kan der ske nogle følgevirkninger. Der kan være data, der skal hentes ud manuelt. Vi starter ikke op igen, før vi er sikre på, at data er ens på begge sider af spejlingen,« siger Sven Kolstrup.

Udover Carlsberg og PBS, der driver Dankortet, var blandt andet Arla og Dansk Supermarked ramt af nedbruddet. Men Sven Kolstrup afviser, at der skulle være mange flere.

»Det er bestemt ikke alle vores kunder, der blev ramt. Jeg kan ikke udtale mig om kundeforhold, men det er ikke helt skævt med dem, der er nævnt i pressen,« siger han.

»Slet ikke som i 2008«

Nedbruddet er slet ikke i samme størrelsesorden som det, der ramte IBM i 2008, forklarer han. Dengang var det hele netværket, der var nede, mens det nu kun var et enkelt datarum.

Men hvordan kunne et strømudfald give så store problemer, hvis datacentret var spejlet, så et andet center kan tage over ved fejl?

»Jo, det er sådan, det har været, men derfor kan du godt ved et strømudfald være nødt til at sikre dig, at systemerne virker og at spejlingen er i orden. Det kommer an på, hvordan strømmen bliver afbrudt,« siger han.

»Det her var batch-kørsler, der blev forsinket. Det var ikke data, der blev korrupt. Så tingene har sådan set virket som de skulle, bortset fra, at vi blev forsinket med kørslerne. Det har ikke været et spørgsmål om, at en spejling ikke har virket, eller at data har været korrupt. Det er udelukkende et spørgsmål om, at vi har fået forsinket batch-kørslerne. På den måde kan du sige, at alt har virket som det skulle. Problemet var bare, at udfaldet gav forsinkelser i driften«, forklarer Sven Kolstrup.

Som jeg forstår et spejlet datacenter, så tager spejlingen over, så snart der er problemer i det første datacenter?

»Jeg er nødt til at have den detaljerede analyse af forløbet, før jeg kan svare i detaljer på, hvad der helt konkret er sket,« lyder svaret.

Det store nedbrud for halvandet år siden fik IBM til at gå alting igennem grundigt og forbedre driftssikkerheden. Sven Kolstrup fortæller, at der er investeret et tre-cifret millionbeløb. Men hvordan kan IBM så forklare, at der sker et nedbrud igen?

»Du får aldrig et datacenter med 100 procent oppetid. Ingen kan gardere sig mod fejl - sådan her noget vil altid kunne ske. Vores opgave er at minimere risikoen og køre den maksimale sikring. Jeg tror også, det vil vise sig, at procedurerne var, som de skulle være,« siger Sven Kolstrup.

3 kommentarer.  Hop til debatten
Debatten
Log ind for at deltage i debatten.
settingsDebatindstillinger
1
16. oktober 2009 kl. 11:16

Sven Kolstrup,

Vi starter ikke op igen, før vi er sikre på, at data er ens på begge sider af spejlingen.

3
16. oktober 2009 kl. 13:57

"Er spejling en fordel eller ulempe?" Det kommer vel an på hvad man prøver at opnå. I tilfælde af det ene datacenter forsvinder (brand eller lignede) er spejling da en god ide. Hvis data er meget vigtigt kan det godt give mening at man kun kører hvis begge sider af spejlet er oppe.

4
16. oktober 2009 kl. 14:52

Hvis data er meget vigtigt kan det godt give mening at man kun kører hvis begge sider af spejlet er oppe.

Hvordan ved man hvilket spejl eller hvilke dele af spejlene der er det/de "rigtige"?