Fejl på to sikkerhedsservere fik NemLog-in i sort

22. oktober 2010 kl. 11:3125
NemLog-in er oppe igen. Det var en fejl i to ud af fire sikkerhedsservere med certifikater, der lagde login til det offentlige Danmark i sort i en halv times tid.
Artiklen er ældre end 30 dage

Den fællesoffentlige tjeneste NemLog-in, der logger danskere med digital signatur på diverse hjemmesider, er oppe at køre igen efter en halv times tid med fejl.

**LÆS OGSÅ **Nyt nedbrud spærrer adgang til alle offentlige sites med NemID

»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort. CSC har nu genstartet serverne, og alt virker igen,« forklarer kontorchef i Skats Koncern IT, Johnni Mandrup Jensen.

De omtalte sikkerhedsservere er såkaldte Hardware Security Modules af typen Luna SA.

Artiklen fortsætter efter annoncen

»Det er nogle fuldstændigt lukkede, amerikanske bokse. Mine folk fik en alarm ved 10.30-tiden, og som sagt skulle alt være i orden nu,« siger Johnni Mandrup Jensen.

Fejlen har kun berørt de brugere af NemLog-in, der blev ledt ind over de to fejlramte servere. Brugere, der havnede på to andre, identiske servere, har ikke mærket noget til nedbruddet.

25 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
1
22. oktober 2010 kl. 12:17

Hvorfor sker der så ikke automatisk failover til de 2 andre servere som kørte?

14
22. oktober 2010 kl. 14:30

Sikkert fordi systemerne fungere ligesom nogle af de centrale servere sundhedsdatanettet... det har ikke et "single point of failure" de har to... meget bedre...

Når den ene går ned så er det ca halvdelen af edi beskederne i danmark der ikke kan komme frem... for den server der står for den anden halvdel den kan ikke overtage byrden fra den første halvdel...

Her med NemID er der ikke firedobbelt redundans. Der er fire single points of failure, så hvis en går ned så er det kun en hvis del af de servere der faktisk skal bruge NemID det der kan tilgå tjenesten...

Sikkert fordi de der bokse koster kassen og de rent faktisk kun har købt nok af dem til lige at dække det behov de har ikke overskudskapacitet for det er jo overinvestering og det koster på bundlinjen.

Jep det kaldes failure by design, altid et hit og Nets burde spænde hjælmen og finde pengepungen frem så de faktisk har redundant overskuds kapacitet.

/Jakob

15
22. oktober 2010 kl. 14:38

Igen Nem-Login og ikke NemID...

16
22. oktober 2010 kl. 14:56

NemID er en certifikatløsning til NemLog-in.

Så hvis NemLog-in ikke virker, virker NemID heller ikke.

Så jo, same shit.

18
22. oktober 2010 kl. 15:07

Nej, NemID er en single-sign-on løsning, forstået på den måde at du bruger samme brugernavn og password på alle netbanker og offentlige sider.

NemLog-in er en fødereret single-sign-on løsning ovenpå NemID, der ydermere sikrer, at du kun skal indtaste dette brugernavn og password 1 gang, når du besøger forskellige offentlige hjemmesider.

Dvs. sandsynligvis vil NemLog-in ikke virke, hvis NemID er nede, men det omvendte burde ikke være tilfældet.

19
22. oktober 2010 kl. 15:22

Ja, NemLog-in bruger NemID til autentificering af brugere (og bruger også den gamle OCES-I - digital signatur) Derfor vil NemLog-ins oppetid ikke have nogen effekt på NemID, men NemIDs oppetid vil have en effekt på de brugere der bruger der bruger den nye OCES-II løsning (NemID med OCES certifikat)

24
23. oktober 2010 kl. 12:13

Det er nogle fuldstændigt lukkede, amerikanske bokse

og reboot er løsningen. Greeeaaat! Bliver helt 'warm and fuzzy' indeni, og leder tankerne hen på et andet OS jeg kender....

25
25. oktober 2010 kl. 11:38

Tror de skal til at genstarte maskinerne hver dag. Lidt forskudt af hinanden.

Det virkede for JP.

17
22. oktober 2010 kl. 15:05

Man kan vel ikke give NemID (DanID) skylden for at NemLogin (skat, CSC) har problemer med hardware?

2
22. oktober 2010 kl. 12:28

Er der nogen der holder regnskab med hvad oppe tiden er på NemID ?

Er vi ikke allerede helt nede omkring 99.9% ?

Poul-Henning

22
22. oktober 2010 kl. 17:54

PHK, du kom mig i forkøbet. Det var lige præcis hvad jeg sad og tænkte. Hvis det er 3 timer, så er vi nu ved:

2> 100 - 3 / (24 * 365). 99.99965753424658

Det bliver spændende om vi kan komme under 99.9%, men lidt hurtig overslagsberegning siger at du skal have omkring 8 dages samlet nedetid, hvis jeg ellers kan regne. Det kommer nok til at kræve et DDoS angreb mod de centrale servere, men så kan det også nås rimeligt hurtigt.

23
22. oktober 2010 kl. 22:19

øøhhh

5 nines 99.999% svarer til ca 5 1/4 minutters nedetid om året 4 nines 99.99% svarer så til 52 minutters nedetid om året 3 nines 99.9% ...... 8 3/4 times nedetid om året 2 nines 99% svarer til ca 3.6 dages nedetid om året

sån lige fra lommeregneren

Så de 3 timers nedetid - eller hvad det nu var rykker det langt væk fra five nines...

Og jeg er ret sikker på at der falder minut bøder!

20
22. oktober 2010 kl. 16:07

Ja, så skal man vist ikke basere sig på de officielle meldinger om nedbruds længder fra DanID. Det her omtalte "timelange" nedbrud lyder nøjagtig som de problemer jeg havde med brug af NemID på 4-5 forskellige sites torsdag aften. Så jeg vil tror at det har varet mindst 12 timer.

21
22. oktober 2010 kl. 16:16

Men igen to forskellige services der er nede. NemLog-in (skat) som der var fejl ved her til formiddag (Hardware hos CSC), og NemID (DanID) hvor der var fejl i går aftes (Database).

Det er to forskellige fejl ved to forskellige service providers (kan dog selvfølgelig ikke ses af den bruger der prøver på at logge ind hvor fejlen ligger.)

5
Indsendt af Anonym (ikke efterprøvet) den fre, 10/22/2010 - 12:39

NB: Hvor mange 9-taller er ligegyldigt.

Det eneste der tæller, og som man kan forholde sig til, er SLA'en.

Hvis SLA'en siger 98% (ja ja overdrivelse fremmeer forståelsen), så nytter det ikke noget at klage over, at den kun er 99%.

8
22. oktober 2010 kl. 13:00

Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?

Hvem er skats alarm kilde?

Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?

Se svaret i næste afsnit af NemID gyseren...

9
22. oktober 2010 kl. 13:06

Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?</p>
<p>Hvem er skats alarm kilde?</p>
<p>Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?</p>
<p>Se svaret i næste afsnit af NemID gyseren...

Skat har vel en gut til at sidde og trykke F5 på version2. Når der så kommer en nyhed om at NemID er nede trykker han på knappen der starter rotor blinket.......

11
22. oktober 2010 kl. 13:14

Til flere af de ovenstående debattører som kommenterer på NemID!

I ved godt at artiklen omhandler et nedbrud i NemLOGIN...ikk'?

--René

13
22. oktober 2010 kl. 13:31

Det er jo fredag og det kan jo godt gå lidt hurtigt når man ser frem til fredagsbaren... (og der lige var en mulighed for at kritisere nogle...)

10
22. oktober 2010 kl. 13:10

Der står

Driften af NemID sker med udgangspunkt i en kontrakt med IT- og Telestyrelsen. Kravet til DanID er 99,9 procent oppetid, fortæller Søren Winge. Hvis NemID er utilgængelig mere end det, kan DanID risikere at skulle betale bod til staten.</p>
<p>99,9 procent svarer til højst 8 timer og 45 minutters nedetid i løbet af et år. Dermed har NemID nu omkring seks timer tilbage på ’klippekortet’.

http://www.version2.dk/artikel/16704-danid-om-nedbrud-det-var-et-database-problem

4
Indsendt af Anonym (ikke efterprøvet) den fre, 10/22/2010 - 12:37

Er der nogen der holder regnskab med hvad oppe tiden er på NemID ?

Det ville undre mig meget hvis der er nogen (offentlige), der holder øje med oppetiden.

Eet er, at man definerer en SLA i udbudet, og (måske) afprøver det ved en driftsprøve, men traditionelt lægges disse projekter over i den administrative 'mølpose', hvor ingen bekymrer sig om SLA'en.

(NB: SLA omfatter normalt også svartidsgaranti, men det bliver slet ikke tjekket).

3
22. oktober 2010 kl. 12:35

Det er nogle fuldstændigt lukkede, amerikanske bokse.

Man føler sig allerede helt varm og tryg inden i.

Men i øvrigt. Selvom det er meget underholdende igen og igen at læse om diverse tekniske børnesygdomme hos NemID, så er det nu forstemmende at medierne åbenbart syntes det er vigtigere end en debat om tillidsmodellen i NemID og dens demokratiske implikationer.

Det kan altså ikke få mit pis i kog at NemID bliver overbelastet et par gange de første par måneder eller at der er en fejl, der skal rettes med at folk kan riskere at modtage to breve samme dag. Det er småting, der nemt kan fikses sammenlignet med de egentlige problemer ved NemID. Men de er åbenbart for komplekse til at være interessante.

6
22. oktober 2010 kl. 12:49

»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort..."

Luna SA fås kun i farven sort så det er vel naturligt nok at de går i sort... (http://www.safenet-inc.com/uploadedFiles/About_SafeNet/Resource_Library/Resource_Items/Product_Briefs_-_EDP/SafeNet_Product_Brief_Luna_SA.pdf)

Technical Specifications operating System • Windows 2000, 2003, 2008 • Solaris 9, 10 (SPARC and x86) • Linux redHat enterprise 4,5 • AiX 5.3 • HP-UX 11i (PA-RISC and Itanium) • VM Ware

Hvordan den bærer sig ad med at køre 13 OS'er på en gang er mig en gåde...

2 ud af 4 som går ned på samme tid. Betryggende!

12
22. oktober 2010 kl. 13:20

Det er listen af OS'er, hvor de understøtter at man benytter Luna boksen fra. Hvad boksen selv kører skriver de vist ikke noget om...

7
22. oktober 2010 kl. 12:59

Jeg blander måske software med hardware, men operativsystemerne står listet sammen med de fysiske specs.

Måske kan leverandøren fortælle dem hvordan man kobler de 4 enheder rigtigt sammen:

"for mission-critical applications that require uninterrupted up-time, the Luna SA’s High Availability (HA) feature allows multiple Luna SA appliances to be grouped together to form one virtual device. to clients, the HA Group appears as a single Luna SA.the HA Group technology shares the transaction load, synchronizes data among members of the group, and gracefully redistributes the processing capacity in the event of failure in a member machine, to maintain uninterrupted service to clients.the Luna SA HA feature provides load-balancing to improve performance and response time while providing availability assurance through redundancy, as well as the ability to easily recover a unit when it returns to service."