Et af dansk digitaliserings flagskibe - Den fællesoffentlige Datafordeler - skal fra senest 2017 give en fælles indgang til bunker af data, som indtil nu har været samlet i hvert sit register.
Med et udkast til den fælles datamodel, Grunddatamodellen, der skal skitsere den komplette sammenhæng mellem data om personer, virksomheder, ejendomme, grunde, geografi og klima, er flagskibet nu kommet lidt tættere på havn.
Grunddataprogrammet består af otte delprogrammer, som er Ejendomsdata, Adressedata, Vanddata, Geodata, Persondata, Virksomhedsdata, Datafordeler og It-arkitektur. Projektets samlede udgift er sat til 930 mio. kroner Ved at rydde op i og forbedre offentlige registre med centrale grunddata og samtidig gøre disse data frit tilgængelige for alle myndigheder, virksomheder og borgere kan færre dobbeltregistreringer, mindre paralleldrift af registre og færre udgifter til administration ifølge Digitaliseringsstyrelsen give effektiviseringsgevinster for ca. en kvart milliard kroner årligt i det offentlige, når programmet er fuldt indfaset i 2020. Virksomheder og borgere slipper samtidig for at give det offentlige de samme oplysninger flere gange. Endvidere kan fri adgang til de offentlige grunddata af høj kvalitet give besparelser og nye og bedre muligheder for vækst og innovation i det private erhvervsliv på op mod en halv milliard årligt. Kilde: DigitaliseringsstyrelsenGrunddataprogrammet
Den samlede model blev - i sin nuværende form - præsenteret tirsdag af Digitaliseringsstyrelsen på konferencen med den lovende titel ‘Bedre grunddata på vej’.
»Den viser en ny fælles måde at organisere data på. Det er det arbejde, der betyder, at alle datasæt bliver sammenhængende og standardiserede ud fra de samme principper,« fortæller Allan Mollerup, der leder hele grunddataprogrammet.
Netop standardiseringen på tværs af en lang række meget forskellige styrelser og register har været en udfordring for forarbejdet til Datafordeleren, fortæller han.
»Det har været et oprydningsarbejde. Vi fandt ting, som vi skulle håndtere, som var vanskelige og større end vi havde regnet med,« siger Allan Mollerup til forsamlingen.
Ingen kan lave modellen alene
Digitaliseringsstyrelsen opstillede i 2014 en række krav til, hvordan registrene skulle modelleres. De vidt forskellige databaser er indtil nu modelleret på hver sin måde og uden nogen strømlinet dokumentation.
»Nu har vi en model, vi mener er komplet, der hænger sammen og hvor alting er forbundet,« fortæller styrelsens informationsarkitekt Per De Place Bjørn, som er hovedarkitekten bag Grunddatamodellen.
Modellen rummer ikke blot konkrete sammenhænge som mellem virksomhed og dens ejere. Den kan også placere virksomheden på en matrikel, fortælle om bygningen har en kælder, og om der er grund til at frygte, at den bliver oversvømmet.
Hertil kommer, at datamodellen til en hvis grad udtrykker den specifikke lov, der eksisterer på området. Derfor kan man heller ikke modellere dataet efter forgodtbefindende.
»Der er ingen, der er i stand til at levere en sådan model alene. Hver enkelt registerejer har hjulpet ved at modellere netop deres data,« fortæller Per De Place Bjørn.
Data i sammenhæng
Styrelsen har efterfølgende knoklet med at kvalitetstjekke de forskellige modeller, så de giver mening sammen med resten af Danmarks data udfra 14 modelleringsregler. Den strømlinede modellering er ifølge Per De Place Bjørn nødvendig, hvis Datafordeleren ikke kun skal være et nyt sted at hente de samme data.
»Vi skal ikke bare sende data fra et sted til et andet. Vi skal sætte det i sammenhæng,« understreger han.
Det betyder også, at dataformater skal være ens på tværs af forskellige registre, så datamodellen ikke rummer flere måder at angive et grundareal for eksempel.
»Der er ikke frit slag. Man kan ikke sige, at en grund går fra kanten af gården og ned til åen. Alting skal være standardiseret,« siger Per De Place Bjørn.
Mindre bøvl - mere vækst
Efter mantraet ‘mindre bøvl - mere vækst’ skal Datafordeleren og den frie grunddata give virksomheder mulighed for at bygge forretningen op omkring den enorme viden, der eksisterer i offentlige registre.
Derfor kan de mange registerejere fra nu af heller ikke køre sololøb og ændre deres del af modellen uden at afklare det med styrelsen og de andre spillere, mener Per De Place Bjørn.
»På den måde er grunddataprogrammet jo en klub. CPR-registret kan heller ikke bare ændre sin model, for der er mange andre, som er afhængige af den,« siger informationsarkitekten.
Direktør for Digitaliseringsstyrelsen, Lars Frelle, sammenligner vilkårene med tinglysningsregisteret, som også er afhængigt af andre registre for at fungere. Hvis en af de registre bliver ændret i sin opbygning kan tinglysningsregisteret gå ned.
»Lige nu kan vi opdaterer så tit vi har lyst til, men bliver vi ikke med at kunne når Datafordeleren går i drift,« forklarer direktøren.
Ændringer i modellen bliver nødvendig
Det vil dog blive nødvendigt at ændre i modellen i fremtiden, vurderer styrelsen. I takt med at arbejdsgange og lovgivning ændrer sig må datamodellerne følge med.
»Selvfølgelig ændrer virkeligheden sig, og derfor er modellen også dynamisk,« siger Per De Place Bjørn og tilføjer, at modellen stadig bliver ændret ugentligt.
Hvis der laves ændringer i Grunddatamodellen vil styrelsen opretholde flere versioner, så virksomheder ikke pludselig mister datagrundlaget for forretningen. Det kræver dog, at de enkelte databehandlere er med på dobbeltarbejde.
»Det vil være op til hver enkelt registerejer, om man vil servicere flere forskellige registre,« understreger Per De Place Bjørn.
Du kan gå på opdagelse i den samlede Grunddatamodel i PDF-form her - eller bruge det interaktive diagram på Datafordelerens hjemmeside.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.