Det var en netværkskomponent, der 21. oktober lukkede og slukkede for adgangen til det digitale Danmark fra klokken 08.31 om morgenen til klokken 09.45 samme morgen. I dette tidsrum var det ikke muligt at anvende NemID.
Digitaliseringsstyrelsen har nu modtaget en foreløbig redegørelse på baggrund af episoden fra NemID-leverandøren Nets, hvor det fremgår, hvad der foranledigede NemID-nedbruddet.
Det er er endnu uklart, hvad der præcist forårsagede fejlen, men ifølge redegørelsen er der mistanke om, at nedbruddet kan skyldes en softwarefejl i netværkskomponenten, som fordeler trafikken mellem systemerne bag NemID, fortæller Carsten Møller Jensen, vicedirektør i Digitaliseringsstyrelsen.
»Det er en loadbalancer, der er sat op, så selvom der er meget høj belastning, så opleves svartiden lav,« siger han.
Carsten Møller Jensen forklarer, at systemet bag NemID er bygget op med redundans, altså så systemerne kan tage over for hinanden, skulle noget gå galt i det ene system.
»Det er vigtigt at slå fast, at de kritiske komponenter inde i systemerne er dubleret. Så hvis komponenter sætter ud, kan vi skifte over. Det er et redundant system,« siger han.
Imidlertid er det også loadbalanceren, der fordeler trafikken mellem de redundante systemer. Og da netværkskomponenten blev ramt af fejl, betød det, at trafikken ikke blev videresendt til nogle af de bagvedliggende systemer. Først da det ene system af blev koblet af, kunne borgerne igen koble på banker, offentlige selvbetjeningsløsninger og andre NemID-afhængige tjenester.
»I forbindelse med nedbruddet fejlsøger man og gennemfører en ændring, så al trafikken ryger over på det ene (redundante, red.) system. NemID-systemet er dimensioneret på en sådan måde, at man selv med maksimal belastning kan afvikle det hele på det ene system,« siger Carsten Møller Jensen.
Det er endnu uklart, hvad der skulle have forårsaget softwarefejlen i loadbalanceren. Det skal en nærmere redegørelse opklare, så lignende fejl på den måde også kan undgås, forklarer Carsten Møller Jensen.
Ikke en egentlig backup-løsning
Men selvom der altså er flere bagvedliggende systemer, der kan tage over for hinanden, så den kritiske digitale samfundsstruktur kan holdes flyvende, så kan en fejl i netværket foran systemerne altså stadig medføre nedbrud.
I dag er serverne og systemerne bag NemID etableret på to fysisk adskilte adresser. En måde at gøre løsningen mere fejltolerant på kunne være at opbygge det, Carsten Møller Jensen kalder en ‘egentlig back up-løsning’, som er helt uafhængig af den nuværende løsning, og som der uden videre vil kunne skiftes til, skulle den primære løsning blive ramt af fejl.
»Så er det ikke længere kun et redundant system, men en egentlig backup-løsning. Og sådan en er der ikke i øjeblikket, siger Carsten Møller Jensen og fortsætter:
»Når vi ikke har købt en egentlig backup-løsning, er det, fordi vi sammen med Nets har vurderet, at omkostningen ved at opbygge en backup-løsning vil være så store i forhold til risikoen, at det ikke vil stå mål med nødvendigheden.«
Han henviser i den forbindelse til de nuværende oppetider for NemID, der ligger tæt på 100 pct. Til og med august i år var oppetiden for NemID således på 99,82 pct.
Når det er sagt, anerkender Carsten Møller Jensen også, at NemID - blandt andet i kraft af, at Digital Post er blevet obligatorisk - spiller en stadig større rolle som samfundskritisk infrastruktur. Og dermed er konsekvenserne også større, når systemet var nede i dag, end de var, da systemet blev lanceret.
»Betydningen er så stor i dag, at det er at sidestille med kritisk infrastruktur. Og det er derfor vigtigt, at det har høj oppetid og acceptable svartider,« siger han.
Og derfor er Carsten Møller Jensen heller ikke afvisende over for, at en egentlig backup-løsning kan komme på tale i forhold til NemID's afløser, som Digitaliseringsstyrelsen arbejder med i øjeblikket.
Hvornår danskerne kan forvente at kunne klikke sig rundt i forskudsopgørelsen med NemID 2.0, er dog endnu uvist. Et forsigtigt bud fra Carsten Møller Jensen er 'i slutningen af 2018.'.
Arbejder med bedre kommunikation og ITIL
Digitaliseringsstyrelsen arbejder i øjeblikket med at forbedre effektiviteten og professionaliseringen i it-systemforvaltningen af de fællesoffentlige løsninger, som styrelsen har ansvaret for. I den forbindelse er der også fokus på kommunikationen, når der eksempelvis er nedbrud i NemID-systemet.
Arbejdet med kommunikation er et led i en længerevarende effektiviseringsproces, der blev iværksat i starten af 2015 og er sat til at løbe frem mod slutningen af 2017.
»Noget af det, der er et omdrejningspunktet for effektiviseringsprogrammet for 2015, er kommunikationssiden,« siger Carsten Møller Jensen og fortsætter:
»Det er virkelig afgørende, at vi ved, hvordan vi kører processen, når der faktisk er nedbrud. Både ud mod slutbrugerne, men også ud mod myndigheder og andre, der er afhængige af løsningen.«
Et nedbrud som det, der i oktober ramte NemID, bliver betegnet som 'major incident', fortæller han:
»Vi går ind og vurderer, hvilken betydning den har for de enkelte interessenter, og hvordan vi skal informere dem.«
En af de platforme, Digitaliseringsstyrelsen bruger til at informere om NemID-nedbrud, er digitaliser.dk. Carsten Møller Jensen forklarer, at denne platform står over for en relancering med nyt design, større brugervenlighed og tydeligere driftsinformation for alle de fællesoffentlige systemer. Relanceringen forventes at finde sted i løbet af 2016.
I forbindelse med effektiviseringsarbejdet frem mod slutningen af 2017 har Digitaliseringsstyrelsen også indført processer for ITIL (Information Technology Infrastructure Library). De skal være med til at sikre ensartede arbejdsgange i styrelsen og en bedre udnyttelse af it-ressourcerne, fortæller Carsten Møller Jensen.
Du kan læse mere om Digitaliseringsstyrelsens arbejde med at effektivisere forvaltningen her.