Fejl på to sikkerhedsservere fik NemLog-in i sort
Den fællesoffentlige tjeneste NemLog-in, der logger danskere med digital signatur på diverse hjemmesider, er oppe at køre igen efter en halv times tid med fejl.
**LÆS OGSÅ **Nyt nedbrud spærrer adgang til alle offentlige sites med NemID
»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort. CSC har nu genstartet serverne, og alt virker igen,« forklarer kontorchef i Skats Koncern IT, Johnni Mandrup Jensen.
De omtalte sikkerhedsservere er såkaldte Hardware Security Modules af typen Luna SA.
»Det er nogle fuldstændigt lukkede, amerikanske bokse. Mine folk fik en alarm ved 10.30-tiden, og som sagt skulle alt være i orden nu,« siger Johnni Mandrup Jensen.
Fejlen har kun berørt de brugere af NemLog-in, der blev ledt ind over de to fejlramte servere. Brugere, der havnede på to andre, identiske servere, har ikke mærket noget til nedbruddet.
- emailE-mail
- linkKopier link

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.
- Sortér efter chevron_right
- Trådet debat
Hvorfor sker der så ikke automatisk failover til de 2 andre servere som kørte?
- more_vert
- insert_linkKopier link
Sikkert fordi systemerne fungere ligesom nogle af de centrale servere sundhedsdatanettet... det har ikke et "single point of failure" de har to... meget bedre...
Når den ene går ned så er det ca halvdelen af edi beskederne i danmark der ikke kan komme frem... for den server der står for den anden halvdel den kan ikke overtage byrden fra den første halvdel...
Her med NemID er der ikke firedobbelt redundans. Der er fire single points of failure, så hvis en går ned så er det kun en hvis del af de servere der faktisk skal bruge NemID det der kan tilgå tjenesten...
Sikkert fordi de der bokse koster kassen og de rent faktisk kun har købt nok af dem til lige at dække det behov de har ikke overskudskapacitet for det er jo overinvestering og det koster på bundlinjen.
Jep det kaldes failure by design, altid et hit og Nets burde spænde hjælmen og finde pengepungen frem så de faktisk har redundant overskuds kapacitet.
/Jakob
- more_vert
- insert_linkKopier link
NemID er en certifikatløsning til NemLog-in.
Så hvis NemLog-in ikke virker, virker NemID heller ikke.
Så jo, same shit.
- more_vert
- insert_linkKopier link
Nej, NemID er en single-sign-on løsning, forstået på den måde at du bruger samme brugernavn og password på alle netbanker og offentlige sider.
NemLog-in er en fødereret single-sign-on løsning ovenpå NemID, der ydermere sikrer, at du kun skal indtaste dette brugernavn og password 1 gang, når du besøger forskellige offentlige hjemmesider.
Dvs. sandsynligvis vil NemLog-in ikke virke, hvis NemID er nede, men det omvendte burde ikke være tilfældet.
- more_vert
- insert_linkKopier link
Ja, NemLog-in bruger NemID til autentificering af brugere (og bruger også den gamle OCES-I - digital signatur) Derfor vil NemLog-ins oppetid ikke have nogen effekt på NemID, men NemIDs oppetid vil have en effekt på de brugere der bruger der bruger den nye OCES-II løsning (NemID med OCES certifikat)
- more_vert
- insert_linkKopier link
og reboot er løsningen. Greeeaaat! Bliver helt 'warm and fuzzy' indeni, og leder tankerne hen på et andet OS jeg kender....Det er nogle fuldstændigt lukkede, amerikanske bokse
- more_vert
- insert_linkKopier link
Tror de skal til at genstarte maskinerne hver dag. Lidt forskudt af hinanden.
Det virkede for JP.
- more_vert
- insert_linkKopier link
Man kan vel ikke give NemID (DanID) skylden for at NemLogin (skat, CSC) har problemer med hardware?
- more_vert
- insert_linkKopier link
Er der nogen der holder regnskab med hvad oppe tiden er på NemID ?
Er vi ikke allerede helt nede omkring 99.9% ?
Poul-Henning
- more_vert
- insert_linkKopier link
PHK, du kom mig i forkøbet. Det var lige præcis hvad jeg sad og tænkte. Hvis det er 3 timer, så er vi nu ved:
2> 100 - 3 / (24 * 365). 99.99965753424658
Det bliver spændende om vi kan komme under 99.9%, men lidt hurtig overslagsberegning siger at du skal have omkring 8 dages samlet nedetid, hvis jeg ellers kan regne. Det kommer nok til at kræve et DDoS angreb mod de centrale servere, men så kan det også nås rimeligt hurtigt.
- more_vert
- insert_linkKopier link
øøhhh
5 nines 99.999% svarer til ca 5 1/4 minutters nedetid om året 4 nines 99.99% svarer så til 52 minutters nedetid om året 3 nines 99.9% ...... 8 3/4 times nedetid om året 2 nines 99% svarer til ca 3.6 dages nedetid om året
sån lige fra lommeregneren
Så de 3 timers nedetid - eller hvad det nu var rykker det langt væk fra five nines...
Og jeg er ret sikker på at der falder minut bøder!
- more_vert
- insert_linkKopier link
Ja, så skal man vist ikke basere sig på de officielle meldinger om nedbruds længder fra DanID. Det her omtalte "timelange" nedbrud lyder nøjagtig som de problemer jeg havde med brug af NemID på 4-5 forskellige sites torsdag aften. Så jeg vil tror at det har varet mindst 12 timer.
- more_vert
- insert_linkKopier link
Men igen to forskellige services der er nede. NemLog-in (skat) som der var fejl ved her til formiddag (Hardware hos CSC), og NemID (DanID) hvor der var fejl i går aftes (Database).
Det er to forskellige fejl ved to forskellige service providers (kan dog selvfølgelig ikke ses af den bruger der prøver på at logge ind hvor fejlen ligger.)
- more_vert
- insert_linkKopier link
NB: Hvor mange 9-taller er ligegyldigt.
Det eneste der tæller, og som man kan forholde sig til, er SLA'en.
Hvis SLA'en siger 98% (ja ja overdrivelse fremmeer forståelsen), så nytter det ikke noget at klage over, at den kun er 99%.
- more_vert
- insert_linkKopier link
Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?
Hvem er skats alarm kilde?
Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?
Se svaret i næste afsnit af NemID gyseren...
- more_vert
- insert_linkKopier link
Skat har vel en gut til at sidde og trykke F5 på version2. Når der så kommer en nyhed om at NemID er nede trykker han på knappen der starter rotor blinket.......Nu mangler der datoer til tiderne, men som jeg kan se det fik version2 publiceret artiklen "Nyt nedbrud spærrer adgang til alle offentlige sites med NemID" ca. 1 minut før Skat fik en alarm om nedbruddet?</p>
<p>Hvem er skats alarm kilde?</p>
<p>Hvad var årsagen til at de to servere var gået ned, og hvordan kan det hele være i orden igen nu?</p>
<p>Se svaret i næste afsnit af NemID gyseren...
- more_vert
- insert_linkKopier link
Til flere af de ovenstående debattører som kommenterer på NemID!
I ved godt at artiklen omhandler et nedbrud i NemLOGIN...ikk'?
--René
- more_vert
- insert_linkKopier link
Det er jo fredag og det kan jo godt gå lidt hurtigt når man ser frem til fredagsbaren... (og der lige var en mulighed for at kritisere nogle...)
- more_vert
- insert_linkKopier link
Der står
på http://www.version2.dk/artikel/16704-danid-om-nedbrud-det-var-et-database-problemDriften af NemID sker med udgangspunkt i en kontrakt med IT- og Telestyrelsen. Kravet til DanID er 99,9 procent oppetid, fortæller Søren Winge. Hvis NemID er utilgængelig mere end det, kan DanID risikere at skulle betale bod til staten.</p>
<p>99,9 procent svarer til højst 8 timer og 45 minutters nedetid i løbet af et år. Dermed har NemID nu omkring seks timer tilbage på ’klippekortet’.
- more_vert
- insert_linkKopier link
Er der nogen der holder regnskab med hvad oppe tiden er på NemID ?
Det ville undre mig meget hvis der er nogen (offentlige), der holder øje med oppetiden.
Eet er, at man definerer en SLA i udbudet, og (måske) afprøver det ved en driftsprøve, men traditionelt lægges disse projekter over i den administrative 'mølpose', hvor ingen bekymrer sig om SLA'en.
(NB: SLA omfatter normalt også svartidsgaranti, men det bliver slet ikke tjekket).
- more_vert
- insert_linkKopier link
Det er nogle fuldstændigt lukkede, amerikanske bokse.
Man føler sig allerede helt varm og tryg inden i.
Men i øvrigt. Selvom det er meget underholdende igen og igen at læse om diverse tekniske børnesygdomme hos NemID, så er det nu forstemmende at medierne åbenbart syntes det er vigtigere end en debat om tillidsmodellen i NemID og dens demokratiske implikationer.
Det kan altså ikke få mit pis i kog at NemID bliver overbelastet et par gange de første par måneder eller at der er en fejl, der skal rettes med at folk kan riskere at modtage to breve samme dag. Det er småting, der nemt kan fikses sammenlignet med de egentlige problemer ved NemID. Men de er åbenbart for komplekse til at være interessante.
- more_vert
- insert_linkKopier link
»Fejlen er fundet og rettet. Det viste sig at være to ud af fire sikkerhedsservere, der var gået i sort..."
Luna SA fås kun i farven sort så det er vel naturligt nok at de går i sort... (http://www.safenet-inc.com/uploadedFiles/About_SafeNet/Resource_Library/Resource_Items/Product_Briefs_-_EDP/SafeNet_Product_Brief_Luna_SA.pdf)
Technical Specifications operating System • Windows 2000, 2003, 2008 • Solaris 9, 10 (SPARC and x86) • Linux redHat enterprise 4,5 • AiX 5.3 • HP-UX 11i (PA-RISC and Itanium) • VM Ware
Hvordan den bærer sig ad med at køre 13 OS'er på en gang er mig en gåde...
2 ud af 4 som går ned på samme tid. Betryggende!
- more_vert
- insert_linkKopier link
Det er listen af OS'er, hvor de understøtter at man benytter Luna boksen fra. Hvad boksen selv kører skriver de vist ikke noget om...
- more_vert
- insert_linkKopier link
Jeg blander måske software med hardware, men operativsystemerne står listet sammen med de fysiske specs.
Måske kan leverandøren fortælle dem hvordan man kobler de 4 enheder rigtigt sammen:
"for mission-critical applications that require uninterrupted up-time, the Luna SA’s High Availability (HA) feature allows multiple Luna SA appliances to be grouped together to form one virtual device. to clients, the HA Group appears as a single Luna SA.the HA Group technology shares the transaction load, synchronizes data among members of the group, and gracefully redistributes the processing capacity in the event of failure in a member machine, to maintain uninterrupted service to clients.the Luna SA HA feature provides load-balancing to improve performance and response time while providing availability assurance through redundancy, as well as the ability to easily recover a unit when it returns to service."
- more_vert
- insert_linkKopier link