Kæmpe oprydning af statens grunddata koster 930 millioner kroner

Fire offentlige databaser med bygge- og boligoplysninger er alt for mange. Staten er i fuld gang med en at rydde op et væld af data og databaser - og det er mere kompliceret, end man troede.

Det skal være slut med flere forskellige parallelle statslige databaser, som rummer samme stamdata. I stedet skal der kun være ét autoritativt register for eksempelvis adresser og persondata.

Det lyder måske indlysende, men det er slet ikke en let øvelse, fortalte kontorchef Jens Krieger Røyen fra Digitaliseringsstyrelsen på Business Intellicence-konferencen IM2013 onsdag.

»For to år siden satte vi fokus på genbrug af offentlige data. Vi ville sikre, at kvaliteten på stamdata var i orden, og at de blev brugt fuldt ud, og den øvelse troede vi var hurtigt overstået. Da vi kom i gang, kunne vi konstatere, at kvaliteten var langt fra, hvad brugerne kunne forvente,« sagde han.

Frem til 2016 skal Grunddataprogrammet, som missionen er døbt, rydde alvorligt op i de mange databaser, der i dag bliver brugt til statens grunddata. Det dækker over stamdata om borgere og virksomheder, i CPR og CVR, samt adresser, ejeroplysninger og geografiske data om veje og bygninger i Danmark.

»Disse data hænger sammen og bliver meget ofte anvendt i sammenhæng med andre data. De er blevet forvaltet af hver deres myndighed, efter hver sin lov. De er ikke blevet bygget til at blive brugt sammen,« sagde Jens Krieger Røyen.

Foreløbigt er der sat omkring 930 millioner kroner af til projektet, som så til gengæld skal udløse årlige besparelser på 250 millioner kroner i den offentlige sektor og en halv milliard kroner hos private virksomheder. Men at få rusket op i de helt centrale databaser i Danmark har vist sig at være ganske kompliceret.

»Vi vidste godt, at det var komplekst, og at det var mere komplekst end vi regnede med – men det er endnu mere komplekst, end vi regnede med. Vi er voldsomt udfordret på vores budget og tidsplaner, selvom vi tog højde for det,« sagde kontorchefen.

Fra fire til tre registre om boliger

På bygge- og boligområdet er der for eksempel i dag fire centrale databaser, med en række overlap af data, men med svære vilkår for udveksling af data. Dermed er tingbogen, BBR-registret, data om byggetilladelser og data om ejendomsskatter i hver deres database.

»Fire registre - det er ét for meget. Og det er tydeligt, at disse data ikke hænger sammen. Der er betydeligt overlap og ikke en fælles datanøgle, så det er svært at koble disse data. I dag er koblingen meget håndholdt, og det giver grå hår i hovedet og risiko for fejl,« sagde Jens Krieger Røyen.

I stedet bliver der indført en fælles nøgle, Bestemt Fast Ejendom, og med tiden kan oprydningsholdet så aflive én af de fire databaser.

»Der er fire myndigheder involveret. Det er svært, men vi forsøger, og når vi er færdige, får vi en væsentlig mere sømløs adgang til disse data,« sagde Jens Krieger Røyen.

Samtidigt skal BBR-registret fremover være det autoritative register for adresser, som andre databaser så skal trække på, i stedet for selv at have egne adressedata. I dag er adresser i CPR-registret for eksempel ikke bare en henvisning til en BBR-adresse, men bliver hentet og lagt ind i CPR. Det er i sig selv en fejlkilde.

»Adressedata skulle man tro var relativt enkle, men det er det på ingen måde. Ved at gøre BBR til det autoritative register kan vi realisere meget store besparelser og få en massiv forøgelse af datakvaliteten,« sagde Jens Krieger Røyen.

Vil modernisere CPR-registret - men ikke numrene

Persondata er i dag mere klart defineret: De stammer fra CPR-registret, der blev indført i 1968. Og netop CPR-konceptet blev fremhævet af kontorchefen som en succes.

»Vi kan i høj grad takke vores forgængere, som designede og indførte CPR-registret, for, at vi er kommet så langt med digitalisering i dag. Det er en massiv succes. Men vi oplever også, at CPR på nogle områder er bedaget, og at der er nogle udfordringer, det ikke kan imødekomme,« sagde han.

Derfor arbejder Grunddataprogrammet også på forslag til moderniseringer af CPR-registret. For eksempel lød en af anbefalingerne, at udlændinge, som arbejder i Danmark, skal have et CPR-nummer, så de nemt kan blive kørt ind i alle statens andre systemer og registre. Der skal også kunne være flere oplysninger om en person i CPR-dataene.

Til gengæld er der ikke lagt op til at ændre selve CPR-nummeret, selvom der på det seneste har været en del kritik af konceptet med fødselsdato og modulus-11-tjek, som gør det nemt at finde frem til de sidste fire, hemmelige cifre.

»Kunne vi gratis lave det om, så der ikke længere var fødselsdato i CPR-nummeret, men at man i stedet fik et neutralt nummer, gjorde vi det. Problemet er, at det er hardkodet ind i systemerne rundt omkring. Det ville få år 2000-problemerne til at blegne, hvis vi skulle lave det om,« forklarede Jens Krieger Røyen.

Bruger SOA 6-8 år efter hypen

Ud over det juridiske og politiske arbejde med at få samlet registre og undgå dobbeltregistreringer, har Grunddataprogrammet også som mål at gøre dataene mere tilgængelige rent teknisk. Det skal ske gennem Datafordeleren, som bliver én samlet indgang til alle statens grunddata.

Læs også: Fri adgang til statens data vil koste 120 millioner kroner

CPR-registret og de andre centrale databaser kopierer så løbende deres data til Datafordeleren. Med tiden kan det blive en helt central nervebane af alverdens data fra den offentlige sektor.

»Vi er ved at realisere visionen om en serviceorienteret arkitektur, 6-8 år efter det var på Gartners hype-cycle. Jeg ser for mig, at det bliver en markant infrastruktur i den offentlige sektors datadistribution, og at den bliver brugt til mange andre data. Det bliver en resurse, som er tilgængelig for både den offentlige og private sektor,« sagde Jens Krieger Røyen.

Selve opbygningen af Datafordeleren bliver lagt ud til en leverandør, og opgaven er lige nu i udbud. Planen er at få Datafordeleren klar til brug i 2015 - og så skal den også køre bundstabilt, med meget høj oppetid, sagde kontorchefen. Til gengæld slipper de forskellige registre så for at skulle købe hardware ind til store besøgstal. De skal blot sende dataene til Datafordeleren.

Bølgegang og ingen ros

Et år efter Grunddataprogrammet gik i gang, kan Jens Krieger Røyen konstatere, at det giver meget ballade internt, når man rusker op i registrene.

»Det griber ind i alle processer i den offentlige sektor, så det er den slags, der giver størst bølgegang indadtil,« fortalte han.

Derfor er der også mange konflikter mellem forskellige myndigheder undervejs, og meget brandslukning. Andelen af it og teknik i projektet er kun en femtedel af budgettet, så det er faktisk ikke rigtigt et it-projekt, mente kontorchefen, der kaldte it-delen for den nemmeste del af projektet.

Til gengæld bliver en bedre organisering af statens grunddata helt afgørende for mange it- og digitaliseringsprojekter fremover, lød vurderingen.

»De her grunddata strukturerer alle de andre data i den offentlige sektor. Hvis ikke vi har styr på dem, bliver det rigtigt vanskeligt at komme videre. Vi får ikke ros for det, og når det virker, vil ingen tænke over det – men det er rigtig vigtigt at gøre, og vi investerer i at få det gjort.«

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (7)
Jørgen Elgaard Larsen

I OpenStreetMap-miljøet har vi længe vidst, at der er en del fejl i de offentlige adressedata. Og at der går meget lang tid, før nye/ændrede adresser er propageret ud i alle systemer.

Begge dele lader til at blive bedre med det beskrevne tiltag, ligesom det vil blive nemmere at få fat på data.

Personligt synes jeg, at 930 mio kr. lyder af meget, men KMD/CSC/de andre sædvanlige blodsugere skal jo også have deres luns kød.

Bent Østergaard Olsen

Det er fint med kun ét adressedatasæt.Problemet er, at der er 98 kommuner som skal føde og vedligeholde disse data. 98 kommuner har 98 forskellige fortolkninger af adressebekendtgørelsen og prioriteringer heraf. Der er for meget "kan og bør" i adressebekendgørelsen og alt for lidt "SKAL STRAKS!". Jeg har f.eks. anmodet Hillerød Kommune om at få registreret nogle kolonihaveadresser, der får leveret strøm fra os og det derfor er en kæmpefordel at få registreret disse adresser. De meddeler mig, at adressebekendtgørelsen ikke pålægger dem at gøre det og derfor ønsker man ikke at foretage sig noget. Så er jeg nødt til at oprette et fiktivt vejnavn og vejnummer og omkring 100 husnumre. Hvis nu Hillerød Kommune om et halvt år kommer til fornuft, skal jeg så tilfældigvis opdage det og rette alle de adresser, som jeg oprettede fiktivt. Der er også spørgsmålet om hvornår en adresse oprettes. Når man leverer infrastruktur som el, fjernvarme, drikkevand og fiber, er det en rigtig god ting at få vejnavne og husnumre på plads inden. Det letter administrationen markant. Men kommunerne har ikke lyst til at gøre det, før husene bliver bygget - eller er helt færdigbygget. Og ingen tvinger dem! Adressebekendtgørelsen er for vag i sine formuleringer.
I det hele taget: Hvor er pisken? Der findes en hjemmeside, hvor man kan se hvornår og hvor tit kommunerne indberetter adresser til BBR. Det er tydeligt, at der bliver sanket til bunke og først, når den er ved at falde ned af skrivebordet, tager man fat på arbejdet. Ja - jeg ved godt at man skærer ned og at kommunerne må prioritere, men denne opgave burde slet ikke ligge hos kommunerne, hvis ikke de kan finde ud af at prioritere den.

Markus Hornum-Stenz

Det lyder godtnok vildt....

Den altoverskyggende problematik er en uvilje i det bureaukratiske og teknokratiske til at se i øjnene, i hvor høj grad tekniske løsninger dikterer rationelle arbejdsgange.
Det viser sig på mange niveauer: IT-arkitekter som ikke bliver hørt i god tid; IT-chefer som ikke er fagligt med når de vigtigste forretningsbeslutninger vedr. IT-rationaliseringer bliver besluttet; IT-folks generelle begejstring for udvikling og irritation over driftshensyn; manglende forståelse for brugere og borgere ikke tænker som de selv gør.
Med tiden skal vi såmænd nok få høvlet hjørnerne af, men det er et vildt ridt pt. og ikke uden omkostninger.

Rasmus Rask

Som datadistributører har vi i flere år arbejdet med at kombinere data om adresser, virksomheder, ejendomme og personer. Vi kan derfor godt skrive under på at kvaliteten af grunddata er forfærdelig. Til gengæld kan vi skrive under på at man kan kombinere og koordinere systemerne for et langt mindre budget.

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017