Danske Spil forudsiger churn: Vi gik efter en model, man kan forklare

Illustration: Danske Spil
Danske Spil arbejder på at gøre mere og bedre brug af data, og her er en nyudviklet churnmodel et af nøgleområderne.

Når tusindvis af danskere sveder over de bedste VM-odds, de næste Lotto-numre eller tipper en 13'er, genereres der samtidig enorme datamængder hos Danske Spil. Data, der kan bruges til at gøre den statsejede spiludbyder mere datadreven.

»Vi har et ønske om at sætte endnu mere fokus på brug af data i Danske Spil og har igennem de seneste år opbygget en organisation, der skal understøtte vores forretningsenheder i brug af data for derigennem at højne indsigten i Danske Spil,« fortæller Rasmus Jørner, der er chef for Insights i Danske Spil.

Et led i den strategi, og et nøgleområde for Danske Spil, er en churnmodel for abonnementskunder.

Danske Spil har mere end én million onlineregistrerede kunder. En del af disse er aktive abonnementskunder, hvilket vil sige, at de betaler et månedligt beløb for at være med i alle trækninger i f.eks. Lotto.

Kundegruppen har stor forretningsværdi for Danske Spil, og derfor ville spilselskabet gerne blive klogere på dem, fortæller data scientist hos Danske Spil Astrid Enslev Vestergård.

»Vi ville lave en model, der kan finde ud af, hvilke kunder der har høj risiko for at afmelde deres abonnement, og på den måde give forretningen konkrete værktøjer at arbejde med,« fortæller Astrid Enslev Vestergård og fortsætter:

»I min optik tager et godt projekt udgangspunkt i et forretningsproblem. Hvis der ikke er nogen, der efterspørger analysen, så har du ikke nogen aftagere af resultatet, og så kan det være lige meget, at du har lavet en god model.«

Betydning af store puljer

Et af projektets første trin i et projekt er ifølge Astrid Enslev Vestergård at finde ud af, hvilke data der er til rådighed, og hvordan de kan udnyttes. Fordi brugerne er verificeret med NemID er datakvalitet god, fortæller hun.

»Vi havde møde med forretningen for at høre, hvad deres bud var på, hvorfor kunder stopper deres abonnement. De nævnte blandt andet en faktor som, hvor lang tid der er gået, siden der har været en stor pulje. Og det viste sig at have en ret stor betydning for churn,« fortæller Astrid Enslev Vestergård.

Visualisering af Danske Spils fremgangsmåde i churn-projektet. Illustration: Danske Spil

Foruden pulje-størrelser har Danske Spil medregnet data som, hvor lang tid har man været kunde, hvor lang tid har man haft abonnement, antal og typer af abonnementer, køn og region.

»Nogle data har vi haft som stamdata – f.eks. køn – andre har vi skulle beregne eller aggregere ud fra data, vi har til rådighed,« fortæller Astrid Enslev Vestergård.

Danske Spil valgte at fokusere på, om kunden havde risiko for at sige sit abonnement op inden for de næste tre måneder. På den måde får kundecenteret rent faktisk tid til at forsøge at rette op på det – f.eks. via en mail.

Simpelt og intuitivt

I valget af model fokuserede Astrid Enslev Vestergård på logistisk regression og beslutningstræer – og fravalgte fra starten mere komplekse machine learning-modeller.

Det var der to grunde til, forklarer Astrid Enslev Vestergård.

»Danske Spil er en organisation, der er vant til at se på rapporter og analyser, men først for nylig på modeller, der siger noget om fremtiden. Derfor har det være vigtigt for mig, at vi har haft en model, vi kunne forklare for hele forretningen, der skal bruge den.«

For det andet var det et spørgsmål om, hvad der er teknisk muligt i den SAS-pakke, som Danske Spil bruger til analyseprojektet.

»Vi har ikke licensen til SAS Enterprise Miner, hvor de fleste machine learning-modeller ligger. Vi ville gerne i gang med det samme og var ikke sikre på, om vi skulle investere i et større setup, så det var sådan, vi gjorde. På den måde er dette projekt også lidt et proof-of-concept, der skal vise, om vi kan få noget ud af det, vi har, og det mener vi godt, vi kan.«

Valget endte med et beslutningstræ, som er en forholdsvis simpel model og meget intuitiv at forstå, forklarer Astrid Enslev Vestergård.

Test af hyperparametrer med makro

Modellen blev programmeret i SAS Base og SAS Stats, hvori Astrid Enslev Vestergård også gik i gang med at optimere modellen.

»Ved at tune modellens hyperparametre, kan man bestemme elementer som, hvor mange splits træet skal lave, og hvor stor slutnoden skal være. Hvis man f.eks. har en stor population, vil man formentlig gerne have, at der skal være en vis mængde af kunder i slutnoden, så man ikke risikerer at overfitte modellen til sin træningsdata,« forklarer hun.

For at teste kombinationer af hyperparametre systemastisk lavede Astrid Enslev Vestergård en makro, der endte med producere 99 forskellige beslutningstræer.

For at finde frem til den bedste model blandt de 99 lavede Astrid Enslev Vestergård endnu en makro, der beregnede elementer som area under curve, lift og confusion matrix for hver model på både træningsdata og valideringsdata.

Churn-forudsigelse i BI og CRM

Et eksempel på, hvordan churn-forudsigelsen kan præsenteres for en bruger. Illustration: Danske Spil

Når først forudsigelsen er på plads, skal resultatet i spil og vises til de rigtige personer.

»Indtil videre har vi fået dem op i Power BI, men vi vil også gerne have det ind i vores CRM-systemer Salesforce og Eloqua, så det er integreret,« fortæller Astrid Enslev Verstergård.

Hvor stærk modellen reelt er til at forudsige churn, vil først vise sig om nogle måneder.

»I og med, at vi har modelleret, om man opsiger sit abonnement inden for tre måneder, så skal der også gå tre måneder, før man kan se, om personen opsiger sit abonnement, og dermed hvor godt modellen klarer sig. Derfor er der en del forsinkelse på, at vi kan måle på resultaterne,« forklarer Astrid Enslev Vestergård.

I de måneder, hvor modellen har kørt, har Eurojackpot-puljen ramt dens maksimalbeløb for første gang i et år. Det betyder, at de seneste måneder har haft et usædvanligt puljeforløb, som ikke har været i træningsdatasættet.

Der skal gå nogle måneder, før vi har nok data til at sige, om det virker eller ej,« siger Astrid Enslev Vestergård.

Artiklen stammer fra Ingeniørens nyeste PRO-medie DataTech, som er målrettet professionelle i såvel private virksomheder som offentlige organisationer, der arbejder med data og analytics.

DataTech sætter fokus på anvendelse af data i en stadig mere digitaliseret verden. Udgivelsen følger danske virksomheder, kommuner og institutioners arbejde og strategier med at skabe mere værdi ud af data. Du får inspiration, råd og erfaringer om, hvordan du analyserer og udnytter data, hvordan du navigerer ansvarligt og effektivt i junglen af love og regler på området, samt hvordan du udbreder værdien af dataanalyse til alle hjørner af organisationen.

DataTech giver dig viden om de nyeste teknologiske løsninger på tværs af fagområder, markeder og landegrænser. Og er medspiller i en fælles mission om at fostre etisk og sikker brug af data fordel for virksomheder og borgere.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (0)
Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017