I mit første indlæg her på Version2, gav jeg en opsang til beslutningstagerne her i Danmark og i de danske virksomheder og organisationer – offentlige og private, om vigtigheden i at forholde sig aktivt og pragmatisk til de fordele forretningsapplikationer af kunstig intelligens kan give os i dag, i stedet for berøringsangst at holde disse i arms længde som noget der kommer til at ske ”i fremtiden”. Disse forretningsapplikationer kan bringes i spil nu, og i denne artikel vil jeg tale om én af dem – nemlig forudsigelse af kundeafgang – også kendt som ’Churn Prediction’.
Churn Prediction: at forudse kundeafgang
Churn prediction består som disciplin i at forudsige hvilke af ens kunder (eller medlemmer for medlemsorganisationers vedkommende) som står til at afslutte deres engagement hvis ikke man gør noget aktivt for at fastholde dem.
Det må generelt betegnes som en svær disciplin, som dog har et meget stort økonomisk potentiale, da identifikation af disse, kan understøtte tiltag som kan reducere kundeafgang, og det er samtidigt alment kendt inden for forskning i økonomi, at det som regel har større værdi at fastholde en eksisterende kunde, end det har at gå ud og vinde en ny.
Statistiske metoder kommer til kort
Traditionelt set har man brugt statistiske metoder til at forudse kundeafgang. Man har derfor haft størst succes i forretningsscenarier hvor kundeengagementet er let at definere. Et godt eksempel på dette er teleindustrien hvor en kunde enten har et aktivt telefonabonnement eller ikke. Her kunne data om kunden bruges til at lave en statistisk vurdering af risikoen for at denne var på vej væk. Men hvordan fungerer dette i mere komplekse scenarier, hvor der er mange undtagelser og periodiske udsving, som ikke kan håndteres af statistiske værktøjer?
Ofte findes der i datavarehuset en stor mængde transaktionelle data om kunder, som har potentiale til at afsløre kundeafgang før det sker. Problemet er at disse mønstre er så komplekse at de ligger uden for statistiske værktøjers rækkevidde. Årsagen er at de givet kontekstuel kompleksitet repræsenterer en ikke-lineær funktion. Det betyder at hvis vi forestiller os at der findes en funktion der, givet en række kundeparametre, kunne give en procentuel risikovurdering for en kundes kundeafgang i fremtiden, så er denne funktion ikke-lineær.
Ikke-lineære funktioner repræsenterer ofte undtagelser samt periodiske udsving. Undtagelser betyder sådan set at hele kombinatorikken i årsagssammenhængen bag kundeafgang er meget kompleks, og periodiske udsving kan betyde at hele billedet ændrer sig fra dag til nat, vinter til sommer, højsæson til lavsæson, osv. Spørgsmålet bliver så hvordan vi kan løse denne udfordring, som af ovenstående årsager ikke kan håndteres af gængse, traditionelle, statistiske værktøjer. Hvordan kan vi forudse kundeafgang i disse komplekse scenarier?
Kunstige neurale netværk og mønstergenkendelse
Løsningen er at lave mønstergenkendelse på transaktionelle kundedata. Det er en udpræget kunstig intelligens programmeringsopgave at lave mønstergenkendelse. Eksempler herpå som man kender til i dag er ansigtsgenkendelse, vejrmodeller og meget andet, men jeg vælger som lovet at blive ved den meget konkrete forretningsapplikation af kunstig intelligens, som er emnet for denne artikel – at finde det mønster i kundeadfærd der kan afsløre kundeafgang før det sker.
Der er flere modeller og valget af model er altid baseret på de tilgængelig data, men et udmærket eksempel er ’kunstige neurale netværk’ – eller ’Artificial Neural Networks’, som de hedder på engelsk. Kunstige neurale netværk henter inspiration fra den måde den menneskelige hjerne fungerer på, og lige som vores hjerner kan, kan et kunstigt neurale netværk også lave mønstergenkendelse. Denne mønstergenkendelse består i det man kalder ’funktionsapproksimering’.
Læring som funtionsapproksimering
Kort sagt betyder dette at vi antager at der i datavarehusets kundetransaktionsdata findes en kompleks (og sandsynligvis ikke-lineær) funktion der kan afsløre kundeafgang. Denne funktion ønsker vi at approksimere – dvs. at vi tilnærmer os den i vores kunstige neurale netværk. Jeg har tidligere talt om den moderne definition af ’Big Data’, og her dukker den op igen. Et kunstigt neuralt netværk skal nemlig lære af ganske store mængder data. Mere specifikt skal der typisk bruges et 6-cifret antal eksempler på kundeafgang, som det kunstige neurale netværk kan lære af ved at se 1-2 år tilbage i tiden.
Jeg vil ikke gå i dybden med hvordan kunstige neurale netværk fungerer i denne artikel, men jeg kan sige at måden man træner det på, er at lade den gennemløbe disse eksempler og lære af dem – altså pr. eksempel. Derfor trænes det kunstige neurale netværk altid på historiske data (ting der ér sket). Vi viser den så at sige alle de kunder som er, eller ikke er mistet i fortiden, og lader den komme med et gæt på om der var kundeafgang eller ikke. Når den tager fejl retter vi lidt i de neurale forbindelser som vi også gør i den menneskelige hjerne når vi lærer – bortset fra at der her er tale om matematik - ikke neurobiologi, for det er hvad et kunstigt neuralt netværk er: en matematisk model.
Slutresultatet er altså en matematisk model, som givet enhver kundes nuværende data og kontekst, kan risikovurdere kundeafgang for denne gennem funktionsapproksimering af en ikke-lineær funktion. Dette virker i praksis ved at man i den ene ende giver en række data om en ny ukendt kunde og konteksten, og ved at aktivere det trænede kunstige neurale netværk, får man så i den anden ende en vurdering af hvor stor risiko der er for kundeafgang for netop den kunde. Det her med at lave en vurdering af data man aldrig har set før, er en af de ting som er så stærkt ved kunstig intelligens og kunstige neurale netværk. Det er det man kalder at kunne ’generalisere på data’.
Tilpasser sig et skiftende datalandskab
En anden vigtig fordel ved at bruge kunstig intelligens til Churn Prediction, er at man kan sætte sin AI-model til at lære helt forfra med jævne intervaller – for eks. hver uge. Hver gang man kigger, for eks. et år tilbage, har man glemt den sidste uge bagest i halen på datasegmentet og fået en ny uge at forholde sig til (den uge som er passeret siden sidste træning). Hvis det mønster der bedst afslører kundeafgang ændrer sig over tid, vil modellen derfor tilpasse sig løbende.
Jeg ser en del virksomheder hvis forretningseksperter har brugt lang tid på at sidde og skrue en fast, statisk model sammen der forudser kundeafgang, og så sker der en ændring i markedet der betyder at den kan kastes over skulderen. Med løbende træning af et kunstigt neuralt netværk vil dette ikke længere være nødvendigt at bruge tid på, og præcisionen er oftest også dramatisk højere. En høj præcision vil sige at de forudsigelser der laves nærmere rammer rigtigt 7 ud af 10 gange snarere end 1 eller 2 ud af 10 gange. Så kan man kan i stedet koncentrere sig om noget andet, som for eksempel at reagere på de forudsigelser som det kunstige neurale netværk gør løbende, og derigennem forsøge at fastholde sine kunder.
Værdien ligger i operationaliseringen
Som det sidste skal det nævnes at Churn Prediction projekter i virkeligheden burde deles op i 2 områder: At forudse kundeafgang, og så dernæst at reagere på disse forudsigelser. Det er vigtigt at huske at den første ingen værdi har uden den anden! Typisk kan man operationalisere regelmæssigt opdaterede risikovurderinger på ens kunder i sin CRM-løsning (Customer Relations Management) såsom ’Dynamcis CRM’ eller ’Salesforce’, hvor der automatisk via monitorerende forretningsprocesser kan oprettes opgaver i Dashboards til kundeansvarlige, som instruerer dem i at forholde sig til stigninger i risiko for bestemte kunder.
Ikke alle kunder skal have løbende, personlig opmærksomhed, og man kan også lade automatiseret marketing sørge for automatisk at reagere ved at sende personaliserede opfølgninger ud til kunder som man ønsker at gøre lidt ekstra for at fastholde. Alt efter værdien af kunden, antallet af kunder over for antal kundeansvarlige, og så videre, kan man benytte forskellige kombinationer af disse strategier – det vigtige er bare at man sørger for at operationalisere den kritiske data, som præcise forudsigelser om kundeafgang trods alt er. Det er data som skal i spil – ikke data som skal ligge og støve i en rapport på en direktørs skrivebord!

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.