Fra CPR-numre til vandløb: Dyk ned i den samlede model for danske grunddata

Digitaliseringsstyrelsen har præsenteret sin samlede Grunddatamodel. Modellen findes som PDF i bunden af artiklen.
Grunddatamodellen, der er grundstenen til den kommende Datafordeler, er klar til demonstration. Datamodellen viser sammenhænge mellem alt fra CPR-register til Geodata.

Et af dansk digitaliserings flagskibe - Den fællesoffentlige Datafordeler - skal fra senest 2017 give en fælles indgang til bunker af data, som indtil nu har været samlet i hvert sit register.

Med et udkast til den fælles datamodel, Grunddatamodellen, der skal skitsere den komplette sammenhæng mellem data om personer, virksomheder, ejendomme, grunde, geografi og klima, er flagskibet nu kommet lidt tættere på havn.

Den samlede model blev - i sin nuværende form - præsenteret tirsdag af Digitaliseringsstyrelsen på konferencen med den lovende titel ‘Bedre grunddata på vej’.

»Den viser en ny fælles måde at organisere data på. Det er det arbejde, der betyder, at alle datasæt bliver sammenhængende og standardiserede ud fra de samme principper,« fortæller Allan Mollerup, der leder hele grunddataprogrammet.

Læs også: Australien foran med datafordeler: Stiller nu API'er til rådighed for alle

Netop standardiseringen på tværs af en lang række meget forskellige styrelser og register har været en udfordring for forarbejdet til Datafordeleren, fortæller han.

»Det har været et oprydningsarbejde. Vi fandt ting, som vi skulle håndtere, som var vanskelige og større end vi havde regnet med,« siger Allan Mollerup til forsamlingen.

Ingen kan lave modellen alene

Et meter langt udprint af Grunddatamodellen lå frem til frit skue på konferencen i Industriens Hus.

Digitaliseringsstyrelsen opstillede i 2014 en række krav til, hvordan registrene skulle modelleres. De vidt forskellige databaser er indtil nu modelleret på hver sin måde og uden nogen strømlinet dokumentation.

»Nu har vi en model, vi mener er komplet, der hænger sammen og hvor alting er forbundet,« fortæller styrelsens informationsarkitekt Per De Place Bjørn, som er hovedarkitekten bag Grunddatamodellen.

Læs også: GIS-fagfolk: Offentlig datahub er et kæmpe skridt i den rigtige retning

Modellen rummer ikke blot konkrete sammenhænge som mellem virksomhed og dens ejere. Den kan også placere virksomheden på en matrikel, fortælle om bygningen har en kælder, og om der er grund til at frygte, at den bliver oversvømmet.

Hertil kommer, at datamodellen til en hvis grad udtrykker den specifikke lov, der eksisterer på området. Derfor kan man heller ikke modellere dataet efter forgodtbefindende.

»Der er ingen, der er i stand til at levere en sådan model alene. Hver enkelt registerejer har hjulpet ved at modellere netop deres data,« fortæller Per De Place Bjørn.

Data i sammenhæng

Styrelsen har efterfølgende knoklet med at kvalitetstjekke de forskellige modeller, så de giver mening sammen med resten af Danmarks data udfra 14 modelleringsregler. Den strømlinede modellering er ifølge Per De Place Bjørn nødvendig, hvis Datafordeleren ikke kun skal være et nyt sted at hente de samme data.

»Vi skal ikke bare sende data fra et sted til et andet. Vi skal sætte det i sammenhæng,« understreger han.

Læs også: Agil udbudsproces gør Datafordeleren 5,6 millioner kroner dyrere end planlagt

Det betyder også, at dataformater skal være ens på tværs af forskellige registre, så datamodellen ikke rummer flere måder at angive et grundareal for eksempel.

»Der er ikke frit slag. Man kan ikke sige, at en grund går fra kanten af gården og ned til åen. Alting skal være standardiseret,« siger Per De Place Bjørn.

Mindre bøvl - mere vækst

Efter mantraet ‘mindre bøvl - mere vækst’ skal Datafordeleren og den frie grunddata give virksomheder mulighed for at bygge forretningen op omkring den enorme viden, der eksisterer i offentlige registre.

Derfor kan de mange registerejere fra nu af heller ikke køre sololøb og ændre deres del af modellen uden at afklare det med styrelsen og de andre spillere, mener Per De Place Bjørn.

»På den måde er grunddataprogrammet jo en klub. CPR-registret kan heller ikke bare ændre sin model, for der er mange andre, som er afhængige af den,« siger informationsarkitekten.

Læs også: Opgør med dyre databasekopier af CPR-registret

Direktør for Digitaliseringsstyrelsen, Lars Frelle, sammenligner vilkårene med tinglysningsregisteret, som også er afhængigt af andre registre for at fungere. Hvis en af de registre bliver ændret i sin opbygning kan tinglysningsregisteret gå ned.

»Lige nu kan vi opdaterer så tit vi har lyst til, men bliver vi ikke med at kunne når Datafordeleren går i drift,« forklarer direktøren.

Ændringer i modellen bliver nødvendig

Det vil dog blive nødvendigt at ændre i modellen i fremtiden, vurderer styrelsen. I takt med at arbejdsgange og lovgivning ændrer sig må datamodellerne følge med.

»Selvfølgelig ændrer virkeligheden sig, og derfor er modellen også dynamisk,« siger Per De Place Bjørn og tilføjer, at modellen stadig bliver ændret ugentligt.

Læs også: KMD skal bygge datafordeler til offentlige grunddata

Hvis der laves ændringer i Grunddatamodellen vil styrelsen opretholde flere versioner, så virksomheder ikke pludselig mister datagrundlaget for forretningen. Det kræver dog, at de enkelte databehandlere er med på dobbeltarbejde.

»Det vil være op til hver enkelt registerejer, om man vil servicere flere forskellige registre,« understreger Per De Place Bjørn.

Du kan gå på opdagelse i den samlede Grunddatamodel i PDF-form her - eller bruge det interaktive diagram på Datafordelerens hjemmeside.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk

Følg forløbet

Kommentarer (11)

Poul-Henning Kamp Blogger

En datamodel og et IT system kommer altid til at reflektere den organisation der producerer dem.

Denne datamodel burde i allerhøjeste grad inspirere Folketinget til at forsimple lovgivningen.

PS: Er der slet ikke nogen der undervejs har undret sig over hvorfor der er to tabeller der hedder "bygning" ?

Mogens Hansen

Er der slet ikke nogen der undervejs har undret sig over hvorfor der er to tabeller der hedder "bygning" ?


Jeg ser ingen tabeller, kun objekttyper. Kan ikke lige se hvor du ser "bygning" defineret 2 gange, men hvis det er inden for hvert deres domæne og ikke indeholder duplikerede data kan det da godt give mening.
Jeg er i princippet enig med dine øvrige kommentarer, men nu ved vi jo rent faktisk ikke, hvor meget det er forsimplet allerede - ud fra artiklen at dømme er der allerede sket et stort oprydningsarbejde.
Og så synes jeg i øvrigt at man bør give credit for at det overhovedet er lykkes at nå så langt rent organisatorisk. Det må have været en kamp uden lige at overbevise div. institutioner om at de skal overgive deres datamodellering til en fælles enhed.

Carsten Hansen

http://data.gov.dk/model/model.htm

Person->Navn

Muligt at angive, at virkning fra og til er usikker :-)

Jeg kan ikke lige gennemskue hvornår VirkningFra og -Til er med. Det virker lidt tilfældigt. Mangler ved CVR-adresse, men er ved f.eks. telefonnr under CVR-register. Derudover må der være yderligere et historiklag med alle de gamle ændringer.

Public DiscreteTruth virkningFraUsikkerhedsmarkering
Details:
definition=Angiver at virkningFra er usikker, hvilket vil sige, at det ikke har været muligt af verificere datoens korrekthed

Simon Mikkelsen

Én datamodel over dem alle! Er dette en parodi på <indsæt et af mange fejlede kæmpesystemer>? Det er ikke 1. april endnu.

Når jeg læser artiklen synes jeg den kort og præcist beskriver snart sagt alle de advarselslamper der burde kunne lyse op som juletræer om natten. Men i et sprog som om det naturligvis kommer til at ske alt sammen. Jeg får lyst til at slå mit hoved ned i bordet og råbe: Nej, nej, nej: Har de intet lært!

Kan de ikke bare brænde vores penge. Så får vi i det mindste varme ud af dem. Hvordan kan man banke noget fornuft ind i det offentliges IT-projekter?

Jesper Frimann

Jeg håber da der er nogen, der har tænkt noget sikkerhed in i det her. Det er måske ikke alle data der sådan lige .. når man læser det her sådan bare skal udstilles til alle og enhver.

// Jesper

Henrik Høyer

Jeg tror helt sikkert at de bliver færdige før planlagt :-) De er garanteret allerede 1 dag foran i deres tidplan - de opdagede nemlig en uforudset ekstra dag i februar måned.

..og de har jo allerede lavet en model over deres data. At implementere denne med en eller anden standard pdf-diagram til database og CRUD kode generater kan da ikke tage ret mange dage - de kan sikker også bare fiverr.com til at få andre til at gøre det for dem.

...ironi kan forekomme...

Jacob Nordfalk

Jeg synes det er rigtig godt at vi forsøger os med at lave en fælles datamodel - det er et pionerarbejde, der SKAL gøres, og som vil afstedkomme en række vigtige erkendelser.
Hvordan man får (og hvorvidt man skal lade) en teknisk datamodel afspejle skiftende opfattelse og lovgivning på tværs af folketing og en række organisationer er det spørgsmål jeg er allermest spændt på.
Det kommer helt sikkert til at give problemer (tænk SOA), men det er modigt at ville tage disse problemer væk fra de aftagere der ellers ville have haft et helt uoverskueligt gravearbejde, der gjorde at data ikke ville blive brugt.
Derfor skal det her gøres, uanset at det er et meget udfordrende projekt.

Anne-Marie Krogsbøll

Har netop hørt "Aflyttet" http://www.radio24syv.dk/programmer/aflyttet/12965908/aflyttet-uge-9-2016/

Jeg må indrømme, at indslaget om grunddata lidt inde i udsendelsen får det til at løbe koldt ned ad ryggen på mig. Det lyder som om, alle forbehold, alle principielle overvejelser vedr. privatliv på dataområdet nu er totalskrottet - et paradigmeskift hos politikerne i retning af at se data som råstof, som det udtrykkes.

Hvordan er dette sket? Har politikerne på noget tidspunkt spurgt os, om vi er indstillede på at blive gjort til "råstof"? Hvem har givet politikerne ret til at ekspropriere mine private data som samfundsejendom?

Det lyder som om, løbet er kørt. Det lyder overhovedet ikke som om, man mener, at det er noget, borgerne har ret til at kende til eller tage stilling til.

Mig bekendt har denne debat ikke været oppe i valgkampen. Ingen har fortalt os, at nu ville man begynde at sælge vores privatliv til højestbydende - det er sket under radaren. Men hvor er disse beslutninger taget? Og hvem er det, der har taget disse beslutninger bag om ryggen på os?

Jeg er rasende....

Log ind eller opret en konto for at skrive kommentarer