NNIT efter drøj certificering af datacenter: »Der er ikke noget, der er et nedbrud værd«

Nu har NNIT's datacenter overstået den Tier-3-certificeringsproces, som i april foranledigede et omfattende nedbrud.

NNIT har opnået en Tier-3-certificering af virksomhedens datacenter ‘1P’ i Bagsværd. Og det har ikke været et helt problemfrit forløb.

Det var nemlig direkte i forbindelse med certificeringsprocessen, der skal være med til at dokumentere oppetid, at datacenteret tilbage i april blev ramt af et omfattende nedbrud, som blandt andet rev DSB's systemer med sig.

Senior Vice President ved NNIT Ricco Larsen er glad for, at certificeringen er i hus, men han anerkender også, at processen ikke har været uproblematisk for NNIT's kunder.

»Det var jo i forbindelse med netop nogle af disse demonstrationer, at vi rent faktisk mistede strømmen tilbage i april, fordi vi fandt uhensigtsmæssigheder, som desværre havde en enorm konsekvens for vores kunder. Og derfor er jeg noget ydmyg omkring det her, fordi det selvfølgelig også har påvirket vores kunder,« siger han.

Som Version2 tidligere har fortalt, var NNIT - som et led i certificeringsprocessen - i gang med at teste et scenarie, hvor en strømgenerator er taget ud til vedligehold, og hvor det er meningen, at redundante kredsløb skal holde datacenteret kørende.

Det gik dog ikke som ventet - delvist som følge af batterier, der ikke er tilstrækkeligt opladede.

»Vi har valgt alligevel at gennemføre certificeringen, fordi det giver vores kunder ro i maven i forhold til, at vi har et datacenter, der er robust og lever op til de specifikationer, vi har designet det efter. Og det kører uden problemer alle døgnets timer. Det er jo det, sådan en blåstempling af nogen udefra er garant for, og det forventer vores kunder, at vi kan leve op til,« siger Ricco Larsen.

Var nedbruddet Tier-3-certificeringen værd?
»Der er ikke noget, der som udgangspunkt er nedbrud værd i forhold til den påvirkning, det har haft af vores kunder.«

Når det er sagt, så peger Ricco Larsen på, at en reel udefrakommende begivenhed - i princippet ville have kunnet forårsage et nedbrud i datacenter-setuppet via den sårbarhed, som nu er fjernet i forbindelse med certificeringsprocessen.

»Det kunne også være sket ved udefrakommende faktorer, hvis uheldet virkeligt havde været ude. Der er ikke noget, der er et nedbrud værd, og slet ikke når det rammer vores kunder på den måde, men vi har nu en garant for, at vi har et datacenter, der kan modstå også sådanne udefrakommende faktorer, hvis uheldet skulle være ude.«

Nye batterier

Nogle af de konkrete tiltag, NNIT har søsat for at sikre, at datacenteret holder sig kørende - skulle uheldet være ude - involverer blandt andet udvidet, automatiseret overvågning af systemerne.

Et andet eksempel på et tiltag fra NNIT på baggrund af nedbruddet involverer, at de ældste blybatterier blevet udskiftet med nyere lithium-ion-batterier - for en sikkerheds skyld.

»Ikke fordi de fejlede noget, men sådan noget batterier har en levetid på måske 10 år. Vi valgte at skifte dem, der var 6-7 år gamle,« siger han og tilføjer:

»Batterier kan leve længe og stadig holde sig inden for specifikationerne, men et nyt batteri har bare mere kraft.«

Nedbruddet har tjent som en påmindelse for NNIT om, hvor kritisk det er at have et datacenter, der kører 24 timer i døgnet, året rundt, forklarer Ricco Larsen.

»På bagkant af det der skete har vi haft en glimrende, men også følelsesladet dialog med alle vores kunder. Vi har givet dem adgang helt ind i maskinrummet, så de også har fået tryghed i forhold til, at der var en række faktorer, der spillede ind, og at der var nogle uhensigtsmæssigheder i vores samlede setup, som vi så har fanget i denne sammenhæng.«

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (3)
Baldur Norddahl

vi har nu en garant for, at vi har et datacenter, der kan modstå også sådanne udefrakommende faktorer, hvis uheldet skulle være ude.

Man kan kun bifalde at der bliver testet, men desværre er det ikke en garanti for noget. Hvis der også var et vist element af uheld i det der skete, så kunne det ligeså godt være gået godt, og så havde man kørt videre med et sårbart system uden at kende til problemet.

Tilsvarende kan der være andre svagheder der ikke blev konstateret fordi det tilfældigvis gik godt denne gang.

Dertil kommer at man kun kan teste de scenarier man har fantasi til og virkeligheden overgår altid enhvers fantasi :-).

Casper Pedersen

Når der er mennesker involveret så er der ikke noget der hedder 100% oppetid.

Prøv at spørge BA - det nedbrud de havde i sidste uge var grundet et mennesker der kom til at hive den store afbryder, og efter at have fundet ud af hvad han gjorde satte strømmen til igen, og forudsagde en powersurge i et helt datacenter.

Såååå, så langtid der er mennesker så vil der være en der trykke på den røde knap... (eller omkonfigure et eller andet er livsvigtigt).

Michael Fjeldsted

Men det er da nu meget rart at finde ud af at ens setup ikke kan holde til man tager en generator ud til vedligehold. Det kunne selvfølgelig have været rart at man havde opdaget fejlen uden at det gav nedetid.

Man kunne også forstille sig at de ikke havde taget certificeringen, men at de bare havde skulle lave noget vedligehold - vil det have været et nedbrud værd?

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017