Routing-fejl sendte Nem-login til tælling i 17 timer: Borgere kunne ikke få corona-svar

5. januar 2021 kl. 03:4513
Routing-fejl sendte Nem-login til tælling i 17 timer: Borgere kunne ikke få corona-svar
Illustration: Region Midt.
Der er pres på tjenester som Sundhed.dk under pandemien, og derfor var det ubelejligt for mange, da NemLog-in var nede i knap et døgn i slutningen af oktober. Nu viser en aktindsigt, at nedbruddet skyldes koks i kommunikationen mellem de to leverandører.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Det var en fejl i dirigeringen af trafik mellem Nets og NNIT, der i slutningen af oktober sendte Nemlog-in i gulvet i 17 timer, mens borgere forgæves forsøgte at logge på Sundhed.dk for at få resultater af deres corona-prøver.

Ifølge en rapport fra Nets til Digitaliseringsstyrelsen, som Version2 har fået aktindsigt i, lå problemet i kommunikationen mellem Nets, der er udviklingsleverandør på NemLog-in, og NNIT der er driftsleverandør.

Log ind og læs videre
Du kan læse indholdet og deltage i debatten ved at logge ind eller oprette dig som ny bruger, helt gratis.
13 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
12
6. januar 2021 kl. 11:02

De fleste fejl tager 10 minutter at rette. Men det kan godt tage 17 timer at finde fejlen, vurdere hvad der går i stykker, når man ruller tilbage, og finde en eller anden leder der får løn for at skrive under på, at det er en okay beslutning.

Især når det er to forskellige organisationer. Hvis organisation 1 bestiller en ændring, organisation 2 udfører ændringen ukritisk (for det har organisation 1 nok styr på, og de har i øvrigt været ret insisterende på at ændringen hastede fordi de er kommet bagud med bestillingerne), og en hel anden del af organisation 1 så bliver ramt af fejl - så er det nok ikke så nemt længere.

10
5. januar 2021 kl. 13:20

Kunne man ikke have rullet ændringen tilbage hurtigere og derved undgået 17 timers nedetid? 17 timer er lang tid. Hvis man har en klar proces for at rulle ændringen tilbage, burde et så kritisk system vel ikke være nede så længe?

9
5. januar 2021 kl. 12:38

Hvis netværket er blevet uoverskueligt, er det så ikke en designfejl. Der er måske råd til en lille internetforbindelse og IP til testformål med de budgetter der arbejdes med. Det kunne give mere awarness, om hvad der arbejdes med

6
5. januar 2021 kl. 12:06

Jeg tror ikke der mangler flere process/projekt/change managere, blot nogle basale kompetencer. At kende formålet er en forudsætning for at løse opgaven, alt andet er held. Når man kender målet, er det så ikke naturligt at teste om det er nået?

Når der er en person der rykker stikket ud til det rackskab hvor sundhed.dk køre, eller router produktions IP'er ud i det blå, mangler der så produktviden, omhu og samvittighedsfuldhed. Altså lige præcist det der ikke kan købes i Indien.

5
5. januar 2021 kl. 11:50

De har formodentelig allerede en intern AAR som de bare ikke viser til andre end dem som betalere regningen direkte

4
5. januar 2021 kl. 11:45

Her lyder det som den banale grundregel: Hvis du har rettet noget for ganske nylig, og tingene holder op med at fungere, så undersøg om din rettelse kan være årsagen (og begynd at svede).

Af og til er det ikke ens nyeste rettelse, men så har man da afkræftet dét.

3
5. januar 2021 kl. 11:38

Her havde det været rigtig godt med en IT-havarikommision som udgav en rapport hvis anbefalinger for alle praktiske formål ville blive obligatoriske fremover.

2
5. januar 2021 kl. 10:58

Tja. Får man først introduceret assymetrisk routning i et større netværk kan det godt være svært at finde ud af hvor fejlen ligger, og hvis man så har problemer i kommunikationen mellem leverandører så ingen reelt ved hvad den anden part laver og forventer. så går tiden.

Og uden at vide det i dette tilfælde, men hvis man så også benytter en outsourcing leverandør i asien, så går tiden bare, og så er 17 timer ikke engang lang tid.

Og er der noget en Firewall som regel ikke kan lide, så er det netop assymetrisk routning.

1
5. januar 2021 kl. 10:43

Trist at alle nedbrudene blot er unødvendige begynderfejl, manglende styr på configuration og change. Man kan også undre sig at det tager 17 timer at opdage en fejl som man lige har lavet, ved personen ikke hvad det er der rodes ved? Men det er måske gået tabt i oversættelsen.