Data science hos Nets: Undgå sumpen af halvfærdige projekter
Når man først er begyndt at mine et datasæt for mønstre og tendenser, kan der ende med at være en lang række interessante veje at undersøge. For at undgå en række ufærdige data-projekter har Nets lavet en regel: Fra et nyt koncept starter, eller en ny hypotese testes, skal der ikke gå mere end tre måneder, før du kan vise noget frem.
Det fortæller Claus Aagaard Pedersen, der er chef for Nets’ Data Analytics Factory.
»Uanset hvor spændende det måtte være, og hvor mange veje det kan gå – hvis ikke du kan vise noget på din oprindelige hypotese inde for tre måneder, så skal du droppe det. Det er en form for fail fast-tilgang. Uden den kan det vokse til at blive en kæmpestor sump af halvgjorte koncepter,« siger han.
»Det er nogle gange hårdt at stoppe sådan et projekt. Du bliver meget kompetent, når du dykker ned i noget og arbejder med det i tre måneder. Men i sidste ende skal det hjælpe forretningen. Det er muligvis megaspændende, men vi er her jo ikke, for at det skal være en intellektuel legeplads.«
Artiklen her er fra DataTech, et nyt PRO-medie fra Ingeniøren om data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning-modeller til dataetik.DataTech
Følg med på pro.ing.dk/datatech
Tænk stort - start småt
Nets gik i 2016 i gang med at grundlægge en afdeling for advanced analytics.
»Vi startede helt fra bunden med at etablere ny teknologi og et Hadoop-cluster, som så mange gør. Vi fik on boarded data scientists og skabt nye roller omkring data – som f.eks. data engineers,« fortæller Claus Aagaard Pedersen og fortsætter:
»I det første år brugte vi meget tid på at lave proof of concepts. Vi brugte meget tid på at sikre, at måden, vi arbejder med data på, er fuldstændig compliant med lovgivningen. Datasikkerhed er nummer et hos Nets, så vi skulle finde ud af, hvad der er det muliges kunst, så vi samtidig kunne få nogle indsigter, vi ikke har været i stand til at få tidligere.«
Som alle andre selskaber betragtede Nets big data-hypen og forsøgte at se gennem salgstalerne:
»Vores approach var meget omkostningsbevidst og risikominimerende. Vi tog en inkrementel tilgang, hvor vi startede med at tage data ud manuelt og dykke ned i det. Jeg mener, det er et godt råd til andre virksomheder – start inkrementelt. Tænk stort, men start småt. Der er en lead time, før du kommer ud med noget, der er modent,« siger Claus Aagaard Pedersen.
Dokumentation afgørende i data lake
Det første år forløb med intensiv inddragelse af hele C-suiten, for at topledelsen også kunne tage det nye paradigme til sig, fortæller Claus Aagaard Pedersen. I løbet af andet år kunne Nets for alvor begynde at se værdien i det, som dataafdelingen kom frem til.
På det tidspunkt havde afdelingen brugt tid på at etablere fuldt udviklede produktionsomgivelser med stabile datastrømme til en data lake. Ved at abstrahere data fra kernesystemet ud i data-søen kan Nets arbejde med it i to tempi – eller bimodalt. Det betyder, at data-folkets behov for at hive fat i data og prøve nyeste værktøjer af kan forenes med et systemlandskab, hvor Nets også skal sikre stabilitet og levere til tiden.
Nets’ data lake har været en central del af løsningen på den udfordring. Men søen skal bruges med omtanke, fortæller Claus Aagaard Pedersen.
»Når man starter med at lægge data ned i en data lake, så er dokumentering og katalogisering sindsygt vigtigt. Den beskrivelse af det data, der ligger dernede, hjælper de her data scientists og data engineers med hurtigt at komme ind og forstå, hvad de kan bruge denne data til. Det er virkelig vigtigt, at man får skabt den transparens. Det betyder også, at du har helt styr på, hvor du har data, der er underlagt compliance, og hvor der ikke er,« siger han og tilføjer:
»Nu er vi et sted, hvor jeg er klippefast i min tro på, at vi har bygget et meget robust rammeværk til at lave dataanalyser.«
Denne artikel er en forkortet version af en artikel bragt hos DataTech. I den fulde version uddyber Claus Aagaard Pedersen blandt andet værdien af at inddrage topledelsen fra starten og fortæller, hvordan oprettelsen af et fagligt netværk er med til at sikre udveksling af best practice internt i huset.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.