Database-fejl er NemID's ømme ligtorn

Database-fejl står for 64 procent af NemID's uplanlagte nedetid. DanId siger, selskabet ikke kunne forudse kapacitetsbehovet ? og er i øvrigt selv utilfreds med den megen nedetid.

Fejl i NemID's database har på fem måneder medført 4 timer og 4 minutters uplanlagt nedetid. Det svarer til 64 procent af den samlede nedbrudstid på 6 timer og 19 minutter. Det viser beregninger, Version2 har foretaget på baggrund af aktindsigt i DanID's produktionsrapporter til IT- og Telestyrelsen.

Dermed er databasefejl isoleret set nok til at overskride den tilladte, samlede nedetid på 3 timer og 40 minutter, som oppetidskravet på 99,9 procent efterlader rum for.

Læs også: Sandheden om NemID: 1,7 gange mere nede end tilladt

Der er tale om to hændelser, hvor fejl i databasen har medført nedbrud af danskernes fælles, logintjeneste. Den ene skete 21. oktober, hvor NemID-appletten fejlede på grund af 'nogle database-tabeller, der ikke dynamisk kunne udvides,' som produktionsrapporten formulerer det. Det medførte et NemID-nedbrud på 2 timer og 31 minutter.

Den anden hændelse skete ti dage senere den 31. oktober. NemID var her nede i 1 timer og 33 minutter på grund af 'nogle database-tabeller, der blev reorganiseret,' som der står.

Version2 har bedt DanID forklare, hvorfor databaserne tilsyneladende er så sårbar en komponent i hele setup'et og har fået følgende skriftlige svar fra Søren Winge, der er pressechef i DanID's moderselskab Nets.

»Databasen er en meget central komponent i den samlede infrastruktur, men den første periode med rigtig drift har desværre afsløret nogle mangler, det ikke har været muligt at fange i pilotdriften. (Kapacitet og særligt hastigheden, hvormed kapacitetsbehovet indtraf). Vi har nu lavet nødvendige justeringer, som imødekommer de øgede kapacitetskrav og endvidere har vi ændret måden, hvorpå vi overvåger databasen. Så det forventer vi vil gøre, at vi ikke vil opleve samme problemstillinger i fremtiden,« skriver han.

Læs også: NemID kører fint: Kun 1 måned med mere end 0,1 procents nedetid

Samtidig svarer han her på en række andre spørgsmål, som Version2 har stillet på baggrund af oplysningerne om, at den uplanlagte nedetid er 1,7 gange højere end den samlede, tilladte nedetid i perioden juni-oktober 2010:

»Man kan regne på de opgjorte SLA'er som man har lyst til, men vi forholder os til de aftalte krav for de månedsvise opgørelser. Og her er faktum, at vi i den nævnte periode har levet op til de opstillede servicemål i alle måneder på nær oktober.

Hele juni måned kan alene betegnes som intern pilotdrift, hvor der kun har været et begrænset antal udvalgt brugere på løsningen. SLA rapporten for juni måned er derfor ikke en officiel rapport, men et resultat af at man ønskede afprøve rapporteringsmodellen. Så nedetiden fra den periode bør ikke ses som en del af det samlede billede.«

Er DanID tilfreds med den statistik?

»Vi kan naturligvis ikke være tilfredse i de måneder, hvor vi ikke kan leve op til kravene.«

Hvordan forventer DanID, at udviklingen i statistikken vil være fremover?

»Vi forventer, at tallene for de kommende måneder vil nærme sig eller ligge over den aftalte kvalitet. For november forventer vi, at tallene er bedre end for oktober. Og december har indtil nu været præget af stabil drift.

DanID analyserer alle hændelser, der indtræffer i infrastrukturen, med henblik på at iværksætte tiltag, der skal sikre mod gentagelser. Endvidere arbejdes der hele tiden med generelt at optimere driften af NemID.«

Læs også: Minister skal opliste alle NemID-nedbrud

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (8)
Palle Simonsen

For de teknisk interesserede læsere kunne det være rart at høre hvilken Database/OS kombination der tales om? Ikke for at starte en vi vs. emacs krig (den har v2 selv startet andetsteds) men simpelthen af ren og skær nysgerrighed - for bedre at kunne forstå NemID's udfordringer og hvem ved - måske en af læserne har tilsvarende erfaringer?

Er det DB2 på z/OS, Oracle Enterprise på Unix, MsSQL på Server 2008 ??? eller noget helt fjerde?

Jonas Høgh

Er ret sikker på at have læst i en tidligere kommentar her på siden at det er z/OS og DB2, der driver de primære komponenter i NemID. Om årsagen til de konkrete nedbrud ligger her, eller i sekundære systemer på andre platforme skal jeg ikke kunne sige.

Edit: Her er et link til en præsentation med nogle få tekniske detaljer, som bekræfter, at det er z/OS:

https://www-950.ibm.com/files/form/anonymous/api/library/2ab2dda6-41db-4...

Palle Simonsen

Udvidelse af tablespaces samt reorganisering (efter ændring i index?) er sædvanlig database drift der ikke bør kunne genererer uforudset nedetid.
Som brugere og skattebetalende med-sponsorer må vi så gå ud fra, at der er lært nok af disse hændelser, til at systemet nu udviser en væsentlig større stabilitet.

Lars Christensen

Som omtalt ganske mange gange før - ville det have klædt DanId/Nets bedre om de selv havde meldt ud omkring deres database problemer af egen kraft - fremfor at afvente spørgsmål fra en journalist.

Der er simpelthen ikke nogen problemer der glemmes hurtigere, end dem der er undskyldt offentligt for.

Prøv f.eks. at tænke tilbage på situationen hvor Toyota lod hånt om pressedækningen af deres bremsepedaler - de blev nærmest jordet globalt. Denne situation har bl.a betydet at ALLE bilproducenter hellere trækker en million biler til værksteder, fremfor at blive udstillet som uansvarlige - det kunne DanId/Nets lære meget af.

Mvh Lars plbrake.dk

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 10:31

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017