Fejl på to sikkerhedsservere fik NemLog-in i sort

NemLog-in er oppe igen. Det var en fejl i to ud af fire sikkerhedsservere med certifikater, der lagde login til det offentlige Danmark i sort i en halv times tid.

Den fællesoffentlige tjeneste NemLog-in, der logger danskere med digital signatur på diverse hjemmesider, er oppe at køre igen efter en halv times tid med fejl.

**LÆS OGSÅ **Nyt nedbrud spærrer adgang til alle offentlige sites med NemID

»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort. CSC har nu genstartet serverne, og alt virker igen,« forklarer kontorchef i Skats Koncern IT, Johnni Mandrup Jensen.

De omtalte sikkerhedsservere er såkaldte Hardware Security Modules af typen Luna SA.

»Det er nogle fuldstændigt lukkede, amerikanske bokse. Mine folk fik en alarm ved 10.30-tiden, og som sagt skulle alt være i orden nu,« siger Johnni Mandrup Jensen.

Fejlen har kun berørt de brugere af NemLog-in, der blev ledt ind over de to fejlramte servere. Brugere, der havnede på to andre, identiske servere, har ikke mærket noget til nedbruddet.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (25)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Peter Mogensen

Det er nogle fuldstændigt lukkede, amerikanske bokse.

Man føler sig allerede helt varm og tryg inden i.

Men i øvrigt. Selvom det er meget underholdende igen og igen at læse om diverse tekniske børnesygdomme hos NemID, så er det nu forstemmende at medierne åbenbart syntes det er vigtigere end en debat om tillidsmodellen i NemID og dens demokratiske implikationer.

Det kan altså ikke få mit pis i kog at NemID bliver overbelastet et par gange de første par måneder eller at der er en fejl, der skal rettes med at folk kan riskere at modtage to breve samme dag.
Det er småting, der nemt kan fikses sammenlignet med de egentlige problemer ved NemID. Men de er åbenbart for komplekse til at være interessante.

  • 0
  • 0
Anonym

Er der nogen der holder regnskab med hvad oppe tiden er på NemID ?

Det ville undre mig meget hvis der er nogen (offentlige), der holder øje med oppetiden.

Eet er, at man definerer en SLA i udbudet, og (måske) afprøver det ved en driftsprøve, men traditionelt lægges disse projekter over i den administrative 'mølpose', hvor ingen bekymrer sig om SLA'en.

(NB: SLA omfatter normalt også svartidsgaranti, men det bliver slet ikke tjekket).

  • 0
  • 0
Anonym

NB:
Hvor mange 9-taller er ligegyldigt.

Det eneste der tæller, og som man kan forholde sig til, er SLA'en.

Hvis SLA'en siger 98% (ja ja overdrivelse fremmeer forståelsen), så nytter det ikke noget at klage over, at den kun er 99%.

  • 0
  • 0
Peter Hansen

»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort..."

Luna SA fås kun i farven sort så det er vel naturligt nok at de går i sort... (http://www.safenet-inc.com/uploadedFiles/About_SafeNet/Resource_Library/...)

Technical Specifications
operating System
• Windows 2000, 2003, 2008
• Solaris 9, 10 (SPARC and x86)
• Linux redHat enterprise 4,5
• AiX 5.3
• HP-UX 11i (PA-RISC and Itanium)
• VM Ware

Hvordan den bærer sig ad med at køre 13 OS'er på en gang er mig en gåde...

2 ud af 4 som går ned på samme tid. Betryggende!

  • 0
  • 0
Peter Hansen

Jeg blander måske software med hardware, men operativsystemerne står listet sammen med de fysiske specs.

Måske kan leverandøren fortælle dem hvordan man kobler de 4 enheder rigtigt sammen:

"for mission-critical applications that require uninterrupted up-time, the Luna SA’s High Availability (HA) feature allows multiple Luna SA appliances to be grouped together to form one virtual device. to clients, the HA Group appears as a single Luna SA.the HA Group technology shares the transaction load, synchronizes data among members of the group, and gracefully redistributes the processing capacity in the event of failure in a member machine, to maintain uninterrupted service to clients.the Luna SA HA feature provides load-balancing to improve performance and response time while providing availability assurance through redundancy, as well as the ability to easily recover a unit when it returns to service."

  • 0
  • 0
Martin Lund Askøe

Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?

Hvem er skats alarm kilde?

Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?

Se svaret i næste afsnit af NemID gyseren...

  • 0
  • 0
Jens Schumacher

Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?

Hvem er skats alarm kilde?

Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?

Se svaret i næste afsnit af NemID gyseren...

Skat har vel en gut til at sidde og trykke F5 på version2. Når der så kommer en nyhed om at NemID er nede trykker han på knappen der starter rotor blinket.......

  • 0
  • 0
Jens Schumacher

Der står

Driften af NemID sker med udgangspunkt i en kontrakt med IT- og Telestyrelsen. Kravet til DanID er 99,9 procent oppetid, fortæller Søren Winge. Hvis NemID er utilgængelig mere end det, kan DanID risikere at skulle betale bod til staten.

99,9 procent svarer til højst 8 timer og 45 minutters nedetid i løbet af et år. Dermed har NemID nu omkring seks timer tilbage på ’klippekortet’.

http://www.version2.dk/artikel/16704-danid-om-nedbrud-det-var-et-databas...

  • 0
  • 0
Jakob Damkjær

Sikkert fordi systemerne fungere ligesom nogle af de centrale servere sundhedsdatanettet... det har ikke et "single point of failure" de har to... meget bedre...

Når den ene går ned så er det ca halvdelen af edi beskederne i danmark der ikke kan komme frem... for den server der står for den anden halvdel den kan ikke overtage byrden fra den første halvdel...

Her med NemID er der ikke firedobbelt redundans. Der er fire single points of failure, så hvis en går ned så er det kun en hvis del af de servere der faktisk skal bruge NemID det der kan tilgå tjenesten...

Sikkert fordi de der bokse koster kassen og de rent faktisk kun har købt nok af dem til lige at dække det behov de har ikke overskudskapacitet for det er jo overinvestering og det koster på bundlinjen.

Jep det kaldes failure by design, altid et hit og Nets burde spænde hjælmen og finde pengepungen frem så de faktisk har redundant overskuds kapacitet.

/Jakob

  • 0
  • 0
Jonas Høgh

Nej, NemID er en single-sign-on løsning, forstået på den måde at du bruger samme brugernavn og password på alle netbanker og offentlige sider.

NemLog-in er en fødereret single-sign-on løsning ovenpå NemID, der ydermere sikrer, at du kun skal indtaste dette brugernavn og password 1 gang, når du besøger forskellige offentlige hjemmesider.

Dvs. sandsynligvis vil NemLog-in ikke virke, hvis NemID er nede, men det omvendte burde ikke være tilfældet.

  • 0
  • 0
Søren Dybro

Ja, NemLog-in bruger NemID til autentificering af brugere (og bruger også den gamle OCES-I - digital signatur)
Derfor vil NemLog-ins oppetid ikke have nogen effekt på NemID, men NemIDs oppetid vil have en effekt på de brugere der bruger der bruger den nye OCES-II løsning (NemID med OCES certifikat)

  • 0
  • 0
Esben Haabendal

Ja, så skal man vist ikke basere sig på de officielle meldinger om nedbruds længder fra DanID. Det her omtalte "timelange" nedbrud lyder nøjagtig som de problemer jeg havde med brug af NemID på 4-5 forskellige sites torsdag aften. Så jeg vil tror at det har varet mindst 12 timer.

  • 0
  • 0
Søren Dybro

Men igen to forskellige services der er nede.
NemLog-in (skat) som der var fejl ved her til formiddag (Hardware hos CSC), og NemID (DanID) hvor der var fejl i går aftes (Database).

Det er to forskellige fejl ved to forskellige service providers (kan dog selvfølgelig ikke ses af den bruger der prøver på at logge ind hvor fejlen ligger.)

  • 0
  • 0
Jesper Louis Andersen

PHK, du kom mig i forkøbet. Det var lige præcis hvad jeg sad og tænkte. Hvis det er 3 timer, så er vi nu ved:

2> 100 - 3 / (24 * 365).
99.99965753424658

Det bliver spændende om vi kan komme under 99.9%, men lidt hurtig overslagsberegning siger at du skal have omkring 8 dages samlet nedetid, hvis jeg ellers kan regne. Det kommer nok til at kræve et DDoS angreb mod de centrale servere, men så kan det også nås rimeligt hurtigt.

  • 0
  • 0
Jens Dalsgaard Nielsen

øøhhh

5 nines 99.999% svarer til ca 5 1/4 minutters nedetid om året
4 nines 99.99% svarer så til 52 minutters nedetid om året
3 nines 99.9% ...... 8 3/4 times nedetid om året
2 nines 99% svarer til ca 3.6 dages nedetid om året

sån lige fra lommeregneren

Så de 3 timers nedetid - eller hvad det nu var rykker det langt væk fra five nines...

Og jeg er ret sikker på at der falder minut bøder!

  • 0
  • 0
Log ind eller Opret konto for at kommentere
IT Company Rank
maximize minimize