Regnefejl skyld i omfattende Gmail-nedbrud
Googles populære e-mailtjeneste Gmail bukkede under for et omfattende nedbrud tirsdag aften dansk tid. Nedbruddet betød, at det var umuligt at tilgå Gmail via Googles webmail-grænseflade i omkring 100 minutter. Det oplyser Google på selskabets officielle blog.
Nedbruddet skyldes ifølge Google en fejlberegning af, hvor stor en belastning der ville blive lagt på routerne i selskabets datacentre i forbindelse med en rutinemæssig opdatering af nogle af Gmail-serverne.
Routerne bliver brugt til at omdirigere brugerne til ledige servere, men den større belastning fik routerne til at falde som dominobrikker.
»Vi havde lige knap undervurderet belastningen på routerne fra en nylig opdatering, som ironisk nok skulle have forbedret oppetiden. Omkring klokken 21:30 blev et par af routerne overbelastede og sendte besked til de andre routere om at lade være med at sende trafik. Det flyttede belastningen over på de resterende routere og fik nogle af dem til at gå ned. Efter få minutter var næsten alle routerne overbelastede,« skriver teknisk chef og ansvarlig for Googles oppetide, Ben Treynor, på Googles blog.
Kunderne kunne stadig hente post fra Gmail via IMAP og POP, da det sker gennem et andet netværk end det, der gik ned tirsdag.
For at løse nedbruddet startede Googles teknikere et stort antal ekstra routere op for at skaffe tilstrækkelig kapacitet til at gøre Gmail tilgængelig igen.
Google vil nu analysere nedbruddet for at løse de problemer, som det har kastet lys over. Blandt andet skriver Ben Treynor, at overbelastningen af routerne i ét af Googles datacentre ikke skulle påvirke oppetiden for servere i de andre datacentre. Samtidig vil Google forbedre routernes reaktion på en overbelastning, så alle routerne gearer ned og kører langsommere i stedet for blot at lukke af for trafik og på den måde øge belastningen på de resterende routere.


Tilføj kommentar