Ekstra sekund nedlægger it-systemer på stribe

Flere it-systemer kunne ikke håndtere skudsekundet. En række internettjenester røg offline natten til søndag.

Da skudskundet blev indført lørdag nat forvirrede det mange it-systemer til døde. Systemerne var simpelthen ikke lavet til, at man midt om natten lige pludselig havde 61 sekunder i et minut.

I Danmark gik det blandt andet ud over vejrtjenesten dmi.dk. Sidens database gik ned, og måtte genstartes før den kunne affinde sig med den nye tid.

Læs også: Skudsekund 30 juni 2012 23:59:60

Men flere internationale tjenester fik også det nye sekund galt i halsen. Det store sociale netværk Reddit havde problemer med databasen Cassandra, som er skrevet i programmeringssproget Java.

Et lignende problem ramte Firefox udvikleren Mozilla. Virksomheden kunne rapportere problemer med open-source platformen Hadoop, som også er skrevet i Java.

Derudover blev FourSquare, LinkedIN, StumbleUpon og blognetværket Gawker også ramt.

Gawker forklarer nyhedssiden Wired, at problemerne opstod på web-serveren Tomcat, som også er dybt afhængig af Java.

Læs også: Skudsekunder er territoriepisseri

Heller ikke Version2 gik fri af skudsekund-problematikken, da vores leverandør Fynske Medier af den grund var nødt til at genstarte et par servere.

Hvis du sidder og undrer dig over, hvorfor man besværer alle de it-systemer med et ekstra sekund, så er det, fordi man med jævne mellemrum må kompensere for ændringer i jordens rotationshastighed.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (23)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Cristian Ambæk

Nu bliver man nød til at spøger. Når du siger Linux hvad tænker du så? Ubuntu? SuSe? OpenSuSe? Debian? Andet?

Linux er kernen i alle disse OS systemer som andre så bygger deres systemer omkring. Så hvis Linux kernen har sådanne en fejl så har alle de OS systemer der bruger denne kerne den samme fejl.

  • 3
  • 0
Christian Poulsen

Hey,

Er der ikke en venlig sjæl med en basal viden der er sød og kontakte DIBS, vi er nu begyndt på 3. Døgn hvor deres system kører på nedsat kraft - vi ef faktisk nogle som godt kunne tænke os og sælge nogle varer....

Ellers er det fn oplagt historie til v2....

  • 1
  • 0
Michael Lykke

Jeg har allerede tippet V2 om historien. Men det "pudsige" er hvordan DIBS' har haft den samme statusbesked på deres side i flere dage, men de ændre dato og klokkeslet på den mange gange om dagen for at få det til at se ud som om problemet ikke har stået på ret længe. Personligt synes jeg det er svineri på den måde at kamouflere over at man har haft alvorlige problemer i flere dage.

  • 5
  • 0
Søren Lund

Det er/var en livelock i ntpd. Hvis ntpd ikke kører, så er "du" ikke ramt.

Flere distributioner med nyere kerne har været ramt.

Mere info her: http://serverfault.com/questions/403732/anyone-else-experiencing-high-ra...

Fejlen har så haft en specielt uheldig indflydelse på Java-baseret software, der pludseligt åd 100% CPU. Er ikke helt klar over hvorfor Java har været specielt sårbar.

  • 3
  • 0
Ove Andersen

Hvorfor? Du gider vel ikke høre en remse om dem der har klaret det uden problemer. Det er da mere interessant at høre om problemerne og lære af dem.

Hvis vi skal snakke Windows, så har det ikke haft problemer da det slet ikke ved skudsekunder eksisterer.
En Windows klient der modtager en NTP pakke med et skudsekund ignorerer blot dette, så den 1. juli var Windows maskiner 1 sekund foran alle andre maskiner, indtil de modtager en ny NTP pakke, hvor tiden nu er beregnet efter skudsekundet. Dvs. alle Windows maskiner der ikke har synkroniseret tid efter 1. juli er nu 1 sekund foran resten af verden.

Så Windows havde ikke problemer, fordi Windows aner ikke der eksisterer skudsekunder. Ved næste NTP synkronisering tror Windows bare at tiden er løbet et sekund for hurtigt for computeren, og klokken vil blive korregeret 1 sekund tilbage.

Så hvis tiden er vigtig i Windows skal man virkelig tænke sig om..

http://support.microsoft.com/kb/909614

  • 8
  • 1
Poul-Henning Kamp Blogger

Det er fordi Windows er så elendig til tids-synkronisering at skudsekunder går helt hen over hovedet på de fleste Windows maskiner.

Flertallet af windows maskiner vil først opdage skudsekundet 10-15 minutter efter det er sket.

  • 8
  • 1
Martin Frandsen

Kunne godt tænke mig at en journalist opklarede om skudsekund-problematikken og DIBS nedbrud hænger sammen. Første "historie" fra dem var noget med at de havde skiftet nogle diske i et datacenter og det var "vistnok" gået galt.

Hvis der blot var tale om nogle diske, så er det (for mig) en smule underligt at der tilsyneladende stadig er problemer. Så spørgsmålet er om skudsekund har haft en rolle at spille?

Jeg kunne også godt tænke mig at man stillede ministeren et § 20 spørgsmål. Hvordan "syntes han selv det går," med at sikre Danskernes adgang til et moderne digitalt samfund.
Mener ministeren at man fortsat skal lovgive opgaven til én leverandør og én teknisk løsning? Hvordan sikrer man redundans når lovgivningen i praksis forbyder kilde-review og nægter andre at byde ind med en anden løsning?

Hvis systemet er der for at identificere individer så finansielle opgaver og borgerservice kan løses og leveres, så vil nedbrud velsagtens forsage en knock-on effekt hvor ingen kan købe noget og ingen kan modtage offentlige tjenester - et reelt nedbrud på loven fordi staten/kommunernes autoritet bygger på deres hjemmel til at udskrive og inddrive skatter som en procentdel af borgernes indtjening. Andre love der brydes har at gøre med hvordan stat/kommune er forpligtet til at anvende de inddrevne midler. Har staten underskrevet lov og kontrakt med en 3rd party software-leverandør som leverer et produkt der ikke virker, så er stat/kommune reelt afhængige af at den software virker før de kan efterleve loven (inddrive skatter.)

Man bør derfor spørge sig selv om NETS/DanID/DIBS er modne nok til at løfte denne opgave? Har antallet af nedbrud ikke vist at man har designet et single-point-of-failure system som bare venter på at gå ned og tvinge hele samfundet til at sidde og kigge på en...

LOADING SCREEN... PLEASE WAIT.

  • 2
  • 1
Jan Lunddal Larsen
  • 2
  • 0
Jørgen Jensen

Sorry Guys,
Nu har skudsekunder ikke den store relevans og interesse for mig til daglig, med mindre - selvfølgelig - systemerne lægger sig ned. Så mit spørgsmål var mere en slags åben kommentar/spørgsmål.

Men jeg fik (desværre) bare bekræftet mine fordomme om hvordan den slags kommentarer ville blive besvaret.

Hvorfor? Du gider vel ikke høre en remse om dem der har klaret det uden problemer. Det er da mere interessant at høre om problemerne og lære af dem.


... vil jeg mene er nede på John Strand-niveau.

LOL. Nej, det er ikke så stor en historie efter hele Azure gik ned i 8 timer fordi der var 29 dage i februar i år


Jeg medgiver gerne at det var decideret pinligt at Microsoft ikke en gang havde taget højde for et fænomen der kommer ca hvert fjerde år, specielt med den lancering af Azure. Må bare også her konstatere at mit min kommentar bliver mødt af et hånligt, patetisk – nærmende sig ”John Strandsk” svar.

Takker.

  • 0
  • 6
Martin Frandsen

DIBS, Nets, DanID, og andet nedfald fra bankerne kategoriseres ens - monopolistiske gebyrmaskiner der nu FAILER på stibe.

Systemerne har det til fælles at de alle bygger på lovhjemmel, er blevet pumpet kraftig op (jeg vil sige skamrost af medierne,) og nu viser sig at være noget værre bras. Hvor der ER alternativer (som ved DIBS) kan markedets handlende vælge alternativer, men hvor der er monopol kan vi ikke.

Min pointe ved sammenligningen er at lovgivningen der dækker disse løsninger er præget af den samme form for virkelighedsfjerne utopiske fremstilling af IT som løsningen der kan alt. Når det så bryder ned, så er "det ingens skyld. der er noget galt med EDB-maskinen... vi... erhhh. ved ikke helt..." Disse no-one-is-responsible løsninger tillader at alvorlige nedbrud ikke bare sker, men at ingen har ansvar og derfor interesse i at opklare hvorfor de sker så fejlen kan findes og udbedres. Det er tydeligt når man læser noget af det lort disse "chefer" lukker ud at de tror at de kan "berolige kunderne" ved at sige INTET og dermed afsløre at de (ligesom jeg) ikke ved noget om det konkrete tekniske set up.

Af hensyn til markedet så bør det at "kunne betale" ikke være i hænderne på en organisation der er konstrueret så alle kan vaske hænder. DIBS er et monopol. De har misbrugt deres position til at holde konkurrenter ude ved at insistere på at nye DIBS-godkendte betalingssystemer skal igennem stadig vildere validering. Noget som de ikke selv skulle da de var upstarts. Resultatet er at de af os som vil have en butik som sælger noget online har skiftet til udenlandske systemer. Det er kun de aller dummeste eller allerstørste der har råd til at drive nethandel i Danmark (eller fra en EU adresse.)

  • 0
  • 1
Anonym

Lige modtaget følgende mail (uddrag) sendt til alle kunder hos hetzner.de:

"During the night of 30.06.2012 to 01.07.2012 our internal
monitoring systems registered an increase in the level of
IT power usage by approximately one megawatt.

The reason for this huge surge is the additional switched
leap second which can lead to permanent CPU load on Linux
servers."

  • 0
  • 0
Ove Andersen

... vil jeg mene er nede på John Strand-niveau.

Det var da ellers ikke meningen at fornærme nogen, beklager du opfattede det sådan.

Jeg opfattede bare dit indlæg om en troll, der lige gerne ville have Microsoft ind i debatten for evt. at starte en MS/Linux bashing. Syntes ikke Microsoft havde så meget med dette at gøre, men gav en forklaring på hvordan Microsoft havde klaret det alligevel.

Så hvis jeg er på John Strand niveau (hvad end han skal blandes ind i dette for?), så er vi nok i samme båd, Strand og jeg :)

  • 1
  • 0
Jesper Høgh

Kunne denne leaptime ikke inkorporeres i king level time serverne, således at - f.eks. over et år - et sekund forlænges eller forkortes efter behov?
Disse digitale eksistenser er jo ikke så dumme som vi andre, som hævder at i skudår falder Langfredag på en lørdag. :o)

  • 0
  • 0
Log ind eller Opret konto for at kommentere