Genstart i Microsofts sky gav kø i Fakta og Brugsen

Pressefoto fra Fakta, København Ø Illustration: Siine Fiig
Medlemskort-tjeneste, som ikke ville starte af sig selv i Microsoft Azure, var onsdag årsag til et minuts ekstra ekspederingstid i COOP's butikker over hele landet.

Tjenester i Microsofts sky, Azure, var årsag til, at kassebetjeningen i COOP's butikker, så som Fakta og Brugsen, gik væsentligt langsommere omkring kl. 18 onsdag over hele landet.

»I forbindelse med et ‘servicevindue’ i Azure havde man ikke fået genstartet alle de nødvendige tjenester. Det betød, at vores kasser, ved bonafslutning, var længere tid om det, end de burde være, og samtlige butikker brugte et minuts tid ekstra på bonafslutning - og samtlige butikker forsøgte at få en forklaring fra vores servicedesk.«

Det forklarer Svend Envoldsen, som er ansvarlig for innovation i COOP Teknologi.

I én Fakta-butik på Østerbro i København gav fejlen anledning til kø med 20 minutters ventetid. Her måtte personalet vente 30 minutter for at komme igennem til COOP's it-support på telefonen. Også andre steder var der køer i COOP's butikker.

Fejlen ramte alle koncernens dagligvarebutikker, med omkring 5000 kasser i alt.

Kasser ventede på time out fra sky-tjeneste

»Vi har tjenester som kører i Microsofts sky, Azure. Nogle af de tjenester leverer forskellige oplysninger til kasseapparaterne, i forbindelse med medlemskort og betalinger. «

Årsagen til problemet var en tjeneste, der ikke ville starte op. Kasserne ventede på tjenesten, og da der ikke kom svar fra skyen, 'timede' kasserne ud efter en minut. Tjenesten registrerer blandt andet medlemmernes køb.

COOP ved endnu ikke, hvorfor tjenesten i Azure ikke startede af sig selv. Problemet har ikke opstået tidligere.

»Det er ikke det første servicevindue, vi har haft i de halvandet år, vi har kørt løsningen.«

Microsoft har ifølge Svend Envoldsen ret til at køre de såkaldte servicevinduer, hvor der udføres vedligeholdelse i skytjenesten.

»Hvad der præcis er gået galt ved vi ikke endnu.«

COOP har selv ansvaret at få tjenesterne op, efter servicevinduet er gennemført.

Problemet var løst omkring klokken 19.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (12)
Kenneth Dornhoff

Så må vi jo håbe, at COOPs it-afd. får sat lidt overvågning op eller gennemgået en evt. eksisterende en af slagsen, så de opdager, når en tjeneste ikke kører. ;-) I samme ombæring kan de jo overveje at reducere time-out til 30 sek. :-D

Henrik Madsen

Tænker også at man nok skal se på en max svartid målt over X uger/måneder og så sætte timeout til X+5 sekunder.

Hvis man er nødt til at vente i 1 minut inden timeout fordi det somme tider tager så lang tid, så skal man nok nærmere kigge lidt på sin applikation.

Per Jeppesen

Interessant fænomen, at Coop kunde vælger at udstille leverandøren i medierne. Er det taktisk oplæg til at komme ud af en aftale, genforhandle prisen eller en bod? Er det Coop der har bestilt en forkert løsning, eller valgt et forkert design?

Bjarke I. Pedersen

Det er ret sjældent der er service vinduer som forårsager at de ting der er kørende oppe i Azure skal genstartes.

Generelt laver de rullende opdatering/genstart af den underliggende infrastruktur, hvor workload blot flyttes rundt imens.

Hvis det er fordi Coop kun har én instans af deres ting kørende, og de har været lukket ned i forbindelse med opdatering af dem, så burde de måske overveje at følge Microsofts anvisninger for hvordan de bør konfigurere deres scaling, så det kan overleve at dele genstartes uden at det hele lukkes ned.

Artiklen mangler desværre lidt oplysninger om hvad der var lukket ned, og hvorfor det var lukket ned - uden det er det svært at gisne mere præcist om, hvorfor det burde skabe problemer.

Jacob Smedegård

Planned Maintenance events are periodic updates made by Microsoft to the underlying Azure platform to improve overall reliability, performance, and security of the platform infrastructure that your virtual machines run on. Most of these updates are performed without any impact upon your Virtual Machines or Cloud Services (see VM Preserving Maintenance). While the Azure platform attempts to use VM Preserving Maintenance in all possible occasions, there are rare instances when these updates require a reboot of your virtual machine to apply the required updates to the underlying infrastructure. In this case, you can perform Azure Planned Maintenance with Maintenance-Redeploy operation by initiating the maintenance for their VMs in the suitable time window. For more information, see Planned Maintenance for Virtual Machines.

https://docs.microsoft.com/en-us/azure/virtual-machines/windows/manage-a...

Leif Neland

Det er måske også spild af tid at 1200 butikker bruger tid på at stå i kø for at få at vide at der er en kendt fejl.

Når den 5. butik har ringet ind, burde der gå en besked ud til alle butikker om at der er en kendt fejl (at årsagen ikke er kendt endnu er ligegyldigt),

Det kan så være et popup på kasseterminalen eller en sms til butikschefen (ved hjælp af en sms-udbyder, der kan nås fra en mobiltelefon udenom COOPs netværk)

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017