Studerende forudsiger ølsalg med machine learning: »Men brugeradfærden er meget broget«
I sidste uge vandt fire studerende fra DTU konkurrencen Open Innovation X (Oi-X) med en model, der kan forudsige ølsalget.
Holdet bag modellen, der retteligt hedder Beer Forecast, består af Jakob Okkels, Valentin Liévin, Emilie Hvashøj og Kristian Nielsen. De fire studerende er alle på udvekslingsophold på universitetet KAIST, der er placeret på den koreanske halvø - den sydlige del vel at mærke.
Oi-X er en case-baseret konkurrence på DTU, der i år blev afholdt i samarbejde med Royal Unibrew.
De fire studerende fortæller, at ideen opstod, fordi de deler en fælles frustration over tomme kølemontrer om sommeren, når man har lyst til en kold øl.
Jakob Okkels fortæller, at de stillede sig selv spørgsmålet:
»Kunne supermarkedet og distributøren virkelig ikke have forudset stor efterspørgsel, når vejrudsigten spår godt vejr?«
De fire studerende besluttede sig derfor for at finde ud af, hvor stor indflydelse vejret egentlig har på ølsalget.
Deep learning
Modellen bygger på sammenhængen i meget store datamængder og adfærdsmønstre heri. Til det har de fire studerende brugt deep learning.
»Med deep learning er det muligt at bygge nogle meget komplekse matematiske modeller op, der efterligner de komplekse forhold, der er mellem parametrene,« forklarer Jakob Okkels og fortsætter:
»Ved hjælp af deep learning-algoritmer har vi sat en matematisk model op omkring ølsalget i Danmark på baggrund af vejret og andre parametre.«
Data fra Royal Unibrew
Til konkurrencen var et stort datasæt blevet stillet til rådighed af Royal Unibrew. Datasættet indeholdt blandt andet information om dato, øltype, indpakning, mængde og information om vejret i form af temperatur, nedbør, solskinstimer og vindforhold.
»I vores model var inputtet information om vejret. Det gav så et output om, hvilken volumen der forventes at blive solgt af en bestemt øltype i en given region på given dag,« siger Jakob Okkels.
Han forklarer videre, at modellen er i stand til at lære komplekse relationer mellem input-variablerne, da ølsalget er afhængig af blandt andet den overordnede kvalitet af vejret som eksempelvis sol, regn, vind og temperatur.
»En multilayer-perceptron var en oplagt mulighed til dette formål, fordi brugen af 'hidden layers' gør modellen i stand til at modellere high-level-relationer mellem inputtene,« forklarer Jakob Okkels.
Da de fire studerende havde designet modellen, implementerede de den ved at bruge Googles open source machine learning-bibliotek, TensorFlow.
Herefter blev dataene splittet, så de kunne træne modellen på én del og derefter teste den på en ukendt del af dataen.
»Træningen udføres iterativt med en 'gradient descent-algoritme' for at minimere fejlmarginen mellem det forudsagte output og det reelle output,« fortæller Jakob Okkels.
Datagrundlaget er spinkelt
Jakob Okkels påpeger endvidere, at modellen er lavet på et relativt tyndt grundlag. De data, de har haft til rådighed, begrænser sig til en periode på halvandet år.
Derudover blev det hurtigt klart for holdet, at vejret alene absolut ikke er afgørende for ølsalget.
»Data fra events, kampagner, levering af øl med mere ville have været meget brugbart for at kunne lave en bedre model,« pointerer Jakob Okkels.
De fire studerende understreger videre, at selv med en mere sofistikeret model vil der stadig være usikkerheder som eksempelvis konkurrenternes tiltag, som de af gode grunde ikke vil have noget data omkring.
Broget brugeradfærd
De fortæller, at outputtet, de fik fra datasættet, understøttede deres tese om, at salget af øl stiger betragteligt i løbet af sommeren, mens en dårlig sommer vidner om et lavere salg.
Hvad holdet selv fandt var den største overraskelse, var kompleksiteten i ølsalget på baggrund af vejret. Folk render ikke pludselig ud og køber en masse øl, når vejret er godt, og de mister heller ikke lysten til øl, når vejret er dårligt.
»Sådan fungerer den virkelige verden ikke. Brugeradfærden er noget mere broget. Der er adskillige større faktorer, der ligger til grund for svingningerne i salget, herunder kampagner og events,« siger Jakob Okkels.
Potentiale på flere markeder
Holdet bag Beer Forecast håber naturligvis, at Royal Unibrew vil implementere dele af konceptet. De håber desuden, at projektet vil skabe mere opmærksomhed på brugen af data science hos danske virksomheder, så også de kan få udbytte af teknologien.
De forklarer, at modellen vil være attraktiv at implementere på andre markeder end ølmarkedet.
»Oplagte eksempler på, hvor man kan benytte sig af forecasting i forhold til vejret, er salg af is,« siger Jakob Okkels og tilføjer på vegne af holdet:
»Men derudover er der et stort potentiale inden for andre industrier. Vi mener, at det bliver en nødvendighed for mange virksomheder at introducere avancerede forecasting-algoritmer for at være et skridt foran konkurrenterne.«

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.