Data science hos Nets: Undgå sumpen af halvfærdige projekter

Data science hos Nets: Undgå sumpen af halvfærdige projekter
Illustration: Nets.
Målet er ikke at lave en intellektuel legeplads, men at skabe værdi, fortæller Nets.
7. februar 2019 kl. 10:14
errorÆldre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Når man først er begyndt at mine et datasæt for mønstre og tendenser, kan der ende med at være en lang række interessante veje at undersøge. For at undgå en række ufærdige data-projekter har Nets lavet en regel: Fra et nyt koncept starter, eller en ny hypotese testes, skal der ikke gå mere end tre måneder, før du kan vise noget frem.

Det fortæller Claus Aagaard Pedersen, der er chef for Nets’ Data Analytics Factory.

»Uanset hvor spændende det måtte være, og hvor mange veje det kan gå – hvis ikke du kan vise noget på din oprindelige hypotese inde for tre måneder, så skal du droppe det. Det er en form for fail fast-tilgang. Uden den kan det vokse til at blive en kæmpestor sump af halvgjorte koncepter,« siger han.

»Det er nogle gange hårdt at stoppe sådan et projekt. Du bliver meget kompetent, når du dykker ned i noget og arbejder med det i tre måneder. Men i sidste ende skal det hjælpe forretningen. Det er muligvis megaspændende, men vi er her jo ikke, for at det skal være en intellektuel legeplads.«

Artiklen fortsætter efter annoncen

DataTech

Artiklen her er fra DataTech, et nyt PRO-medie fra Ingeniøren om data og analytics. Vi giver dig inspirerende cases, nyheder og debat om alt fra machine learning­-modeller til dataetik.
Følg med på pro.ing.dk/datatech

Tænk stort - start småt

Nets gik i 2016 i gang med at grundlægge en afdeling for advanced analytics.

»Vi startede helt fra bunden med at etablere ny teknologi og et Hadoop-cluster, som så mange gør. Vi fik on boarded data scientists og skabt nye roller omkring data – som f.eks. data engineers,« fortæller Claus Aagaard Pedersen og fortsætter:

»I det første år brugte vi meget tid på at lave proof of concepts. Vi brugte meget tid på at sikre, at måden, vi arbejder med data på, er fuldstændig compliant med lovgivningen. Datasikkerhed er nummer et hos Nets, så vi skulle finde ud af, hvad der er det muliges kunst, så vi samtidig kunne få nogle indsigter, vi ikke har været i stand til at få tidligere.«

Artiklen fortsætter efter annoncen

Som alle andre selskaber betragtede Nets big data-hypen og forsøgte at se gennem salgstalerne:

»Vores approach var meget omkostningsbevidst og risikominimerende. Vi tog en inkrementel tilgang, hvor vi startede med at tage data ud manuelt og dykke ned i det. Jeg mener, det er et godt råd til andre virksomheder – start inkrementelt. Tænk stort, men start småt. Der er en lead time, før du kommer ud med noget, der er modent,« siger Claus Aagaard Pedersen.

Dokumentation afgørende i data lake

Det første år forløb med intensiv inddragelse af hele C-suiten, for at topledelsen også kunne tage det nye paradigme til sig, fortæller Claus Aagaard Pedersen. I løbet af andet år kunne Nets for alvor begynde at se værdien i det, som dataafdelingen kom frem til.

På det tidspunkt havde afdelingen brugt tid på at etablere fuldt udviklede produktionsomgivelser med stabile datastrømme til en data lake. Ved at abstrahere data fra kernesystemet ud i data-søen kan Nets arbejde med it i to tempi – eller bimodalt. Det betyder, at data-folkets behov for at hive fat i data og prøve nyeste værktøjer af kan forenes med et systemlandskab, hvor Nets også skal sikre stabilitet og levere til tiden.

Nets’ data lake har været en central del af løsningen på den udfordring. Men søen skal bruges med omtanke, fortæller Claus Aagaard Pedersen.

»Når man starter med at lægge data ned i en data lake, så er dokumentering og katalogisering sindsygt vigtigt. Den beskrivelse af det data, der ligger dernede, hjælper de her data scientists og data engineers med hurtigt at komme ind og forstå, hvad de kan bruge denne data til. Det er virkelig vigtigt, at man får skabt den transparens. Det betyder også, at du har helt styr på, hvor du har data, der er underlagt compliance, og hvor der ikke er,« siger han og tilføjer:

»Nu er vi et sted, hvor jeg er klippefast i min tro på, at vi har bygget et meget robust rammeværk til at lave dataanalyser.«

Denne artikel er en forkortet version af en artikel bragt hos DataTech. I den fulde version uddyber Claus Aagaard Pedersen blandt andet værdien af at inddrage topledelsen fra starten og fortæller, hvordan oprettelsen af et fagligt netværk er med til at sikre udveksling af best practice internt i huset.

Ingen kommentarer endnu.  Start debatten
Debatten
Log ind for at deltage i debatten.
settingsDebatindstillinger