I 1954 udgav Darrell Huff den ikoniske bog ‘How to lie with statistics'. Bogen oplister nogle af de mest hyppige fejl, der begås i arbejdet med data – som f.eks. at undgå sample bias, at blande kausalitet sammen med korrelation og lægge for meget vægt på gennemsnittet.
I dag – 64 år efter – er det ikke desto mindre de samme fodfejl, der begås i dataarbejdet.
»Jeg er ked af at sige det, men det ser ikke ud til, at forretningsverdenen har lært lektien, der blev udlagt i den bog,« sagde VP hos Gartner Debra Logan på analysefirmaet Data & Analytics-konference i London i sidste måned.
Der er brug for data-literacy, lyder pointen fra Gartner, der beskriver data-literacy som evnen til at læse, analysere og argumentere med data.
Ifølge undersøgelser, som Gartner har lavet, er mangel på data-literacy den næststørste stopklods for at forbedre brugen af analytics i virksomheder.
Linda-problemet
I årtierne, siden ‘How to lie with statistics’ udkom, har vi set adskillige studier, der peger på, at mennesker generelt ikke er særlig gode til intuitiv forståelse af statistik og sandsynligheder, forklarer analytikeren.
Et af de mest toneangivende eksempler kommer fra den israelske forsker Amos Tversky, der sammen med kollegaen Daniel Kahneman demonstrerede den såkaldte conjunction fallacy.
I forskernes eksempel præsenteres den fiktive Linda – en 31-årig single, der har læst filosofi og i sin studietid gik meget op i problemer med diskrimination. Testpersonerne får herefter lov til at bedømme, om Linda er bankansat, eller om hun er en bankansat, der er aktiv i feministbevægelsen.
Selv om det matematisk mest sandsynlige svar altid er mulighed nummer et, valgte størstedelen af respondenterne mulighed nummer to – et fænomen, som forskerne tilskriver menneskers tendens til at foretrække det svar, der bedst repræsenterer deres forståelse af Linda.
Datakørsel uden kørekort
Conjunction fallacy er blot en af de måder, hvorpå menneskehjernen har tendens til at fejlfortolke data. Og den tendens er naturligvis uheldig, hvis man vil bruge data til at træffe beslutninger. Særligt hvis man – som Gartner længe har været fortaler for – vil udbrede dataanalyse til alle dele af virksomheden eller organisationen.
»Vi mennesker er ikke bygget med en naturlig evne for statistisk inferens. Det er de dårlige nyheder,« siger Debra Logan.
»Den gode nyhed er, at vi kan gøre noget ved det. Med en indsats og med træning kan vi forbedre vores evner.«
Der er behov for at fastsætte en ny baseline for data-literacy, understreger Debra Logan, der sammenligner det med et kørekort.
»Der var en tid, hvor ingen havde brug for et kørekort. Men som veje blev bygget, og infrastrukturen blev mere kompleks begyndte det at give god mening, at man certificerer, hvor gode folk er til at køre en metalboks på hjul ved høje hastigheder.«
På samme måde skal virksomheder og organisationer kunne måle og certificere, hvor stærke medarbejderes data-evner er.
»Er det ikke vanvittigt, at vi giver ansatte adgang til missionskritisk data uden certificering?« spørger Debra Logan.
»Det er bydende nødvendigt at tilføje certificering i takt med, at vi åbner op for adgang til data. Og ligesom vi har forskellige kørekort til forskellige køretøjer – biler, motorcykler, lastbiler – skal vi have forskellig træning og certificering til forskellige typer brugere.«
Stigende data-gap
Mange virksomheder har anerkendt behovet for at træne medarbejderes dataforståelse.
På Ann og Robert H. Lurie Children's Hospital of Chicago opdagede man f.eks., at klinikkere ikke havde den nødvendige viden om statistik, og hospitalet er derfor i gang med at lancere interne kurser samt en data-blog, der skal skabe et fælles sprog omkring data.
I forsikringsvirksomheden Lloyds of London, der tilbyder forsikring af alt fra satellitter til fodboldspilleres ben, har man sat sig som mål at øge data-literacy. Det har krævet obligatoriske kurser for alle medlemmer.
Mængden af data, der er i hænderne på virksomheder, er i voldsom vækst. Omvendt vokser data literacy højest linært, hvilket øger afstanden mellem muligheder og faktiske evner. Hvis alle bliver i stand til at udnytte den data, vil det være en revolution, mener Debra Logan, der sammenligner det med udbredelsen af læse- og skrivefærdigheder.
»Det er vores æras revolution. Men hvis vi vil have data-oplysning, må vi have data literacy.«