AI i praksis – Hvilke kunder mister jeg?

I mit første indlæg her på Version2, gav jeg en opsang til beslutningstagerne her i Danmark og i de danske virksomheder og organisationer – offentlige og private, om vigtigheden i at forholde sig aktivt og pragmatisk til de fordele forretningsapplikationer af kunstig intelligens kan give os i dag, i stedet for berøringsangst at holde disse i arms længde som noget der kommer til at ske ”i fremtiden”. Disse forretningsapplikationer kan bringes i spil nu, og i denne artikel vil jeg tale om én af dem – nemlig forudsigelse af kundeafgang – også kendt som ’Churn Prediction’.

Churn Prediction: at forudse kundeafgang

Churn prediction består som disciplin i at forudsige hvilke af ens kunder (eller medlemmer for medlemsorganisationers vedkommende) som står til at afslutte deres engagement hvis ikke man gør noget aktivt for at fastholde dem.

Det må generelt betegnes som en svær disciplin, som dog har et meget stort økonomisk potentiale, da identifikation af disse, kan understøtte tiltag som kan reducere kundeafgang, og det er samtidigt alment kendt inden for forskning i økonomi, at det som regel har større værdi at fastholde en eksisterende kunde, end det har at gå ud og vinde en ny.

Statistiske metoder kommer til kort

Traditionelt set har man brugt statistiske metoder til at forudse kundeafgang. Man har derfor haft størst succes i forretningsscenarier hvor kundeengagementet er let at definere. Et godt eksempel på dette er teleindustrien hvor en kunde enten har et aktivt telefonabonnement eller ikke. Her kunne data om kunden bruges til at lave en statistisk vurdering af risikoen for at denne var på vej væk. Men hvordan fungerer dette i mere komplekse scenarier, hvor der er mange undtagelser og periodiske udsving, som ikke kan håndteres af statistiske værktøjer?

Ofte findes der i datavarehuset en stor mængde transaktionelle data om kunder, som har potentiale til at afsløre kundeafgang før det sker. Problemet er at disse mønstre er så komplekse at de ligger uden for statistiske værktøjers rækkevidde. Årsagen er at de givet kontekstuel kompleksitet repræsenterer en ikke-lineær funktion. Det betyder at hvis vi forestiller os at der findes en funktion der, givet en række kundeparametre, kunne give en procentuel risikovurdering for en kundes kundeafgang i fremtiden, så er denne funktion ikke-lineær.

Ikke-lineære funktioner repræsenterer ofte undtagelser samt periodiske udsving. Undtagelser betyder sådan set at hele kombinatorikken i årsagssammenhængen bag kundeafgang er meget kompleks, og periodiske udsving kan betyde at hele billedet ændrer sig fra dag til nat, vinter til sommer, højsæson til lavsæson, osv. Spørgsmålet bliver så hvordan vi kan løse denne udfordring, som af ovenstående årsager ikke kan håndteres af gængse, traditionelle, statistiske værktøjer. Hvordan kan vi forudse kundeafgang i disse komplekse scenarier?

Kunstige neurale netværk og mønstergenkendelse

Løsningen er at lave mønstergenkendelse på transaktionelle kundedata. Det er en udpræget kunstig intelligens programmeringsopgave at lave mønstergenkendelse. Eksempler herpå som man kender til i dag er ansigtsgenkendelse, vejrmodeller og meget andet, men jeg vælger som lovet at blive ved den meget konkrete forretningsapplikation af kunstig intelligens, som er emnet for denne artikel – at finde det mønster i kundeadfærd der kan afsløre kundeafgang før det sker.

Kunstige Neurale Netværk

Der er flere modeller og valget af model er altid baseret på de tilgængelig data, men et udmærket eksempel er ’kunstige neurale netværk’ – eller ’Artificial Neural Networks’, som de hedder på engelsk. Kunstige neurale netværk henter inspiration fra den måde den menneskelige hjerne fungerer på, og lige som vores hjerner kan, kan et kunstigt neurale netværk også lave mønstergenkendelse. Denne mønstergenkendelse består i det man kalder ’funktionsapproksimering’.

Læring som funtionsapproksimering

Kort sagt betyder dette at vi antager at der i datavarehusets kundetransaktionsdata findes en kompleks (og sandsynligvis ikke-lineær) funktion der kan afsløre kundeafgang. Denne funktion ønsker vi at approksimere – dvs. at vi tilnærmer os den i vores kunstige neurale netværk. Jeg har tidligere talt om den moderne definition af ’Big Data’, og her dukker den op igen. Et kunstigt neuralt netværk skal nemlig lære af ganske store mængder data. Mere specifikt skal der typisk bruges et 6-cifret antal eksempler på kundeafgang, som det kunstige neurale netværk kan lære af ved at se 1-2 år tilbage i tiden.

Jeg vil ikke gå i dybden med hvordan kunstige neurale netværk fungerer i denne artikel, men jeg kan sige at måden man træner det på, er at lade den gennemløbe disse eksempler og lære af dem – altså pr. eksempel. Derfor trænes det kunstige neurale netværk altid på historiske data (ting der ér sket). Vi viser den så at sige alle de kunder som er, eller ikke er mistet i fortiden, og lader den komme med et gæt på om der var kundeafgang eller ikke. Når den tager fejl retter vi lidt i de neurale forbindelser som vi også gør i den menneskelige hjerne når vi lærer – bortset fra at der her er tale om matematik - ikke neurobiologi, for det er hvad et kunstigt neuralt netværk er: en matematisk model.

Slutresultatet er altså en matematisk model, som givet enhver kundes nuværende data og kontekst, kan risikovurdere kundeafgang for denne gennem funktionsapproksimering af en ikke-lineær funktion. Dette virker i praksis ved at man i den ene ende giver en række data om en ny ukendt kunde og konteksten, og ved at aktivere det trænede kunstige neurale netværk, får man så i den anden ende en vurdering af hvor stor risiko der er for kundeafgang for netop den kunde. Det her med at lave en vurdering af data man aldrig har set før, er en af de ting som er så stærkt ved kunstig intelligens og kunstige neurale netværk. Det er det man kalder at kunne ’generalisere på data’.

Tilpasser sig et skiftende datalandskab

En anden vigtig fordel ved at bruge kunstig intelligens til Churn Prediction, er at man kan sætte sin AI-model til at lære helt forfra med jævne intervaller – for eks. hver uge. Hver gang man kigger, for eks. et år tilbage, har man glemt den sidste uge bagest i halen på datasegmentet og fået en ny uge at forholde sig til (den uge som er passeret siden sidste træning). Hvis det mønster der bedst afslører kundeafgang ændrer sig over tid, vil modellen derfor tilpasse sig løbende.

Jeg ser en del virksomheder hvis forretningseksperter har brugt lang tid på at sidde og skrue en fast, statisk model sammen der forudser kundeafgang, og så sker der en ændring i markedet der betyder at den kan kastes over skulderen. Med løbende træning af et kunstigt neuralt netværk vil dette ikke længere være nødvendigt at bruge tid på, og præcisionen er oftest også dramatisk højere. En høj præcision vil sige at de forudsigelser der laves nærmere rammer rigtigt 7 ud af 10 gange snarere end 1 eller 2 ud af 10 gange. Så kan man kan i stedet koncentrere sig om noget andet, som for eksempel at reagere på de forudsigelser som det kunstige neurale netværk gør løbende, og derigennem forsøge at fastholde sine kunder.

Værdien ligger i operationaliseringen

Som det sidste skal det nævnes at Churn Prediction projekter i virkeligheden burde deles op i 2 områder: At forudse kundeafgang, og så dernæst at reagere på disse forudsigelser. Det er vigtigt at huske at den første ingen værdi har uden den anden! Typisk kan man operationalisere regelmæssigt opdaterede risikovurderinger på ens kunder i sin CRM-løsning (Customer Relations Management) såsom ’Dynamcis CRM’ eller ’Salesforce’, hvor der automatisk via monitorerende forretningsprocesser kan oprettes opgaver i Dashboards til kundeansvarlige, som instruerer dem i at forholde sig til stigninger i risiko for bestemte kunder.

Operationalisering af Churn prediction

Ikke alle kunder skal have løbende, personlig opmærksomhed, og man kan også lade automatiseret marketing sørge for automatisk at reagere ved at sende personaliserede opfølgninger ud til kunder som man ønsker at gøre lidt ekstra for at fastholde. Alt efter værdien af kunden, antallet af kunder over for antal kundeansvarlige, og så videre, kan man benytte forskellige kombinationer af disse strategier – det vigtige er bare at man sørger for at operationalisere den kritiske data, som præcise forudsigelser om kundeafgang trods alt er. Det er data som skal i spil – ikke data som skal ligge og støve i en rapport på en direktørs skrivebord!

Relateret indhold

Erik David Johnsons billede
Erik er manager i firmaet Netcompany, og han leder firmaets Cognitive Computing videnscenter, som arbejder med forretningsapplikationer af kunstig intelligens.

Kommentarer (3)

Mogens Bluhme

Det virker måske også lidt pretentiøst at sammenligne direkte. Back propagation som jeg går ud fra er underforstået her, er mere at sammenligne med regressionsanalyse. Alle AI-teknikker har deres force. Problemet er at forklare hvorfor det virker hvis det får konsekvenser for levende væsener uden en sekundær metode at checke op imod.

EU har foreslået en "ret til forklaring", som tillader borgerne at kræve transparens i algoritmiske baserede beslutninger, som vedrører dem. Der er et trade-off mellem nøjagtighed og forklaringsevne i forudsigelser. Backpropagation hører til de, som prioriterer førstnævnte højst men har tilsvarende lav forklaringsevne, mens decision trees hører hjemme i den anden ende.

Der er også udviklet en del machine learning via statistiske metoder som Bayes eller sågar Naive Bayes - sidstnævnte med overraskende stor klassifikationsevne ifølge forskere.

Der er også support vector machine, unsupervised learning på basis af clustering (Self Organizing Maps), Adaptive resonance theory mm.

En flerstrenget strategi vil nok bidrage mest - og hvis borgere udsættes for afgørelser af myndigheder, forsikringsselskaber mm. truffet på algoritmisk grundlag, har de krav på forklaring, alternativt et ankenævn, som hælder al AI ud og voterer på et rent etisk grundlag.

Men som det illustreres i artiklen er det nok rimelig ukontroversielt, hvis der ryger en kunde, fordi netværket er over-eller underfittet.

Erik David Johnson Blogger

Tak for jeres kommentarer og kritik. For at svare vil jeg gerne lige holde fast i hvad der faktisk står i artiklen:

"Kunstige neurale netværk henter inspiration fra den måde den menneskelige hjerne fungerer på, og lige som vores hjerner kan, kan et kunstigt neurale netværk også lave mønstergenkendelse. Denne mønstergenkendelse består i det man kalder ’funktionsapproksimering’."

Jeg ser det ikke som en direkte sammenligning at sige at det ene henter inspiration fra det andet. Tværtimod er det alt for ofte sådan at disse teknikker bliver gjort sværere at forstå end de behøver at være af dem som ønsker at holde barren højt for at gøre den eksklusive klub af dem der forstår hvad der foregår så lille som muligt.

Jeg mener ikke at "Det er mere konstruktivt at beskrive neurale net som et antal projektioner efterfulgt af en lineær classifier". Det er tværtimod ekskluderende (måske endda pretentiøst?) over for de læsere der ikke har en vidergående matematisk/teknisk uddannelsesmæssig baggrund - og det kunne vel at mærke sagtens være en person med stor beslutningskompetence, som skal tage stilling til om der skal laves AI-tiltag i en virksomhed eller organisation.

At kunstigeneurale netværk henter inspiration fra den menneskelige hjerne (biologiske neurale netværk) og laver møsntergenkendelse er korrekt og noget alle kan forstå til en vis grad, og for at der ikke skal være nogen tvivl skriver jeg endda at der er tale om "funktionsapproksimering".

Lad mig understrege at jeg ønsker at gøre emnet så tilgængeligt som muligt men samtidigt tage de tekniske detaljer alvorligt. Jeg håber at der trods alt er forståelse for at det kan være en svær øvelse og en svær balance at holde, når man addresserer et forholdsvist diverst publikum.

Log ind eller opret en konto for at skrive kommentarer