Kæmpe oprydning af statens grunddata koster 930 millioner kroner
Det skal være slut med flere forskellige parallelle statslige databaser, som rummer samme stamdata. I stedet skal der kun være ét autoritativt register for eksempelvis adresser og persondata.
Det lyder måske indlysende, men det er slet ikke en let øvelse, fortalte kontorchef Jens Krieger Røyen fra Digitaliseringsstyrelsen på Business Intellicence-konferencen IM2013 onsdag.
»For to år siden satte vi fokus på genbrug af offentlige data. Vi ville sikre, at kvaliteten på stamdata var i orden, og at de blev brugt fuldt ud, og den øvelse troede vi var hurtigt overstået. Da vi kom i gang, kunne vi konstatere, at kvaliteten var langt fra, hvad brugerne kunne forvente,« sagde han.
Frem til 2016 skal Grunddataprogrammet, som missionen er døbt, rydde alvorligt op i de mange databaser, der i dag bliver brugt til statens grunddata. Det dækker over stamdata om borgere og virksomheder, i CPR og CVR, samt adresser, ejeroplysninger og geografiske data om veje og bygninger i Danmark.
»Disse data hænger sammen og bliver meget ofte anvendt i sammenhæng med andre data. De er blevet forvaltet af hver deres myndighed, efter hver sin lov. De er ikke blevet bygget til at blive brugt sammen,« sagde Jens Krieger Røyen.
Foreløbigt er der sat omkring 930 millioner kroner af til projektet, som så til gengæld skal udløse årlige besparelser på 250 millioner kroner i den offentlige sektor og en halv milliard kroner hos private virksomheder. Men at få rusket op i de helt centrale databaser i Danmark har vist sig at være ganske kompliceret.
»Vi vidste godt, at det var komplekst, og at det var mere komplekst end vi regnede med – men det er endnu mere komplekst, end vi regnede med. Vi er voldsomt udfordret på vores budget og tidsplaner, selvom vi tog højde for det,« sagde kontorchefen.
Fra fire til tre registre om boliger
På bygge- og boligområdet er der for eksempel i dag fire centrale databaser, med en række overlap af data, men med svære vilkår for udveksling af data. Dermed er tingbogen, BBR-registret, data om byggetilladelser og data om ejendomsskatter i hver deres database.
»Fire registre - det er ét for meget. Og det er tydeligt, at disse data ikke hænger sammen. Der er betydeligt overlap og ikke en fælles datanøgle, så det er svært at koble disse data. I dag er koblingen meget håndholdt, og det giver grå hår i hovedet og risiko for fejl,« sagde Jens Krieger Røyen.
I stedet bliver der indført en fælles nøgle, Bestemt Fast Ejendom, og med tiden kan oprydningsholdet så aflive én af de fire databaser.
»Der er fire myndigheder involveret. Det er svært, men vi forsøger, og når vi er færdige, får vi en væsentlig mere sømløs adgang til disse data,« sagde Jens Krieger Røyen.
Samtidigt skal BBR-registret fremover være det autoritative register for adresser, som andre databaser så skal trække på, i stedet for selv at have egne adressedata. I dag er adresser i CPR-registret for eksempel ikke bare en henvisning til en BBR-adresse, men bliver hentet og lagt ind i CPR. Det er i sig selv en fejlkilde.
»Adressedata skulle man tro var relativt enkle, men det er det på ingen måde. Ved at gøre BBR til det autoritative register kan vi realisere meget store besparelser og få en massiv forøgelse af datakvaliteten,« sagde Jens Krieger Røyen.
Vil modernisere CPR-registret - men ikke numrene
Persondata er i dag mere klart defineret: De stammer fra CPR-registret, der blev indført i 1968. Og netop CPR-konceptet blev fremhævet af kontorchefen som en succes.
»Vi kan i høj grad takke vores forgængere, som designede og indførte CPR-registret, for, at vi er kommet så langt med digitalisering i dag. Det er en massiv succes. Men vi oplever også, at CPR på nogle områder er bedaget, og at der er nogle udfordringer, det ikke kan imødekomme,« sagde han.
Derfor arbejder Grunddataprogrammet også på forslag til moderniseringer af CPR-registret. For eksempel lød en af anbefalingerne, at udlændinge, som arbejder i Danmark, skal have et CPR-nummer, så de nemt kan blive kørt ind i alle statens andre systemer og registre. Der skal også kunne være flere oplysninger om en person i CPR-dataene.
Til gengæld er der ikke lagt op til at ændre selve CPR-nummeret, selvom der på det seneste har været en del kritik af konceptet med fødselsdato og modulus-11-tjek, som gør det nemt at finde frem til de sidste fire, hemmelige cifre.
»Kunne vi gratis lave det om, så der ikke længere var fødselsdato i CPR-nummeret, men at man i stedet fik et neutralt nummer, gjorde vi det. Problemet er, at det er hardkodet ind i systemerne rundt omkring. Det ville få år 2000-problemerne til at blegne, hvis vi skulle lave det om,« forklarede Jens Krieger Røyen.
Bruger SOA 6-8 år efter hypen
Ud over det juridiske og politiske arbejde med at få samlet registre og undgå dobbeltregistreringer, har Grunddataprogrammet også som mål at gøre dataene mere tilgængelige rent teknisk. Det skal ske gennem Datafordeleren, som bliver én samlet indgang til alle statens grunddata.
CPR-registret og de andre centrale databaser kopierer så løbende deres data til Datafordeleren. Med tiden kan det blive en helt central nervebane af alverdens data fra den offentlige sektor.
»Vi er ved at realisere visionen om en serviceorienteret arkitektur, 6-8 år efter det var på Gartners hype-cycle. Jeg ser for mig, at det bliver en markant infrastruktur i den offentlige sektors datadistribution, og at den bliver brugt til mange andre data. Det bliver en resurse, som er tilgængelig for både den offentlige og private sektor,« sagde Jens Krieger Røyen.
Selve opbygningen af Datafordeleren bliver lagt ud til en leverandør, og opgaven er lige nu i udbud. Planen er at få Datafordeleren klar til brug i 2015 - og så skal den også køre bundstabilt, med meget høj oppetid, sagde kontorchefen. Til gengæld slipper de forskellige registre så for at skulle købe hardware ind til store besøgstal. De skal blot sende dataene til Datafordeleren.
Bølgegang og ingen ros
Et år efter Grunddataprogrammet gik i gang, kan Jens Krieger Røyen konstatere, at det giver meget ballade internt, når man rusker op i registrene.
»Det griber ind i alle processer i den offentlige sektor, så det er den slags, der giver størst bølgegang indadtil,« fortalte han.
Derfor er der også mange konflikter mellem forskellige myndigheder undervejs, og meget brandslukning. Andelen af it og teknik i projektet er kun en femtedel af budgettet, så det er faktisk ikke rigtigt et it-projekt, mente kontorchefen, der kaldte it-delen for den nemmeste del af projektet.
Til gengæld bliver en bedre organisering af statens grunddata helt afgørende for mange it- og digitaliseringsprojekter fremover, lød vurderingen.
»De her grunddata strukturerer alle de andre data i den offentlige sektor. Hvis ikke vi har styr på dem, bliver det rigtigt vanskeligt at komme videre. Vi får ikke ros for det, og når det virker, vil ingen tænke over det – men det er rigtig vigtigt at gøre, og vi investerer i at få det gjort.«

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.