En stribe websider og firmaer blev tirsdag og onsdag hårdt ramt af et langvarigt nedbrud på leverandøren Netgroups cloud-platform.
Og mens alle servere i løbet af onsdag formiddag var online igen, efter nedbruddet klokken 6.30 om morgenen dagen før, har op til ti procent af kunderne mistet data på cloud-tjenesten og skal bruge egen backup.
Men det var en risiko, som kunderne kendte til, fortæller Netgroups direktør Finn Vagner.
»Vores cloud-miljø har enkelte steder single points of failure, og det er vores partnere, der sælger produktet videre, godt klar over,« siger Finn Vagner til Version2.
I modsætning til Netgroups enterprise-miljø, der er redundant efter alle kunstens regler, er cloud-miljøet altså et billigt alternativ, tænkt som en nem måde at få en test-server op at stå, forklarer direktøren.
»Det er en løsning til dem, der ikke skal have en den dyre enterprise-model, hvor det hele er fuldt redundant,« siger han.
Dermed er det også kundernes egen opgave at sørge for en fail-over-løsning, for eksempel ved at have en anden cloud-udbyder i baghånden, og at tage backup af data.
»Under ti procent må ty til egen backup efter nedbruddet. Når du køber adgang til en server i et cloud-miljø hos os - eller hos Amazon - er du selv ansvarlig for sikkerhedsmodellen og for backup. Til gengæld betaler du næsten ingenting,« siger Finn Vagner.
Han fraråder direkte at hoste en webside i firmaets cloud-miljø, med mindre den kan tåle at være offline af og til.
»Det skal ikke være eneste platform for en webside. For en lokal fodboldklub eller andelsboligforening kan det godt være den rigtige løsning, men er man afhængig af, at siden kører, for eksempel en e-handels-side, så er det absolut ikke den rigtige platform,« siger Finn Vagner.
Fejlen i Netgroups cloud-setup var svær at finde, men blev 7,5 timer efter nedbruddet lokaliseret til et backplane. Det er et slags simpelt bundkort i rackskabene, som forbinder blade-serverne, der er stukket ind.
»Det er et slags printkort i op til 40 lag, så hvis der er en løs forbindelse, kan man få denne her slags fejl. Det sker meget sjældent,« siger han og tilføjer, at fejlen kan have være skyld i nedbrud tidligere.
Nu skal Netgroup kigge på, om det giver mening at hæve graden af redundans for cloud-miljøet.
»Så skal vi regne på, hvor meget dyrere, det så bliver, og om kunderne vil betale det. Når der lige har været et nedbrud, er de nok mere tilbøjelige til at ville betale mere for en højere oppetid,« siger Finn Vagner.
Men netop denne balance mellem pris og driftssikkerhed har ikke været nogen hemmelighed, understreger direktøren. Der er heller ikke nogen garanteret oppetid, så nedbruddet udløser ikke nogen form for kompensation til kunderne, udover at de ikke betaler for brug af serverne, mens de har været offline.
»Vores store slutkunder kender godt risikoen og lever med den. Typisk har de deres produktionsmiljø i vores enterprise-setup og test-servere i cloud-miljøet. Så er det værste, der kan ske, at man mister en dags udviklingsarbejde,« siger Finn Vagner til Version2.