Fra CPR-numre til vandløb: Dyk ned i den samlede model for danske grunddata

2. marts 2016 kl. 06:2311
Fra CPR-numre til vandløb: Dyk ned i den samlede model for danske grunddata
Illustration: Grunddataprogrammet.
Grunddatamodellen, der er grundstenen til den kommende Datafordeler, er klar til demonstration. Datamodellen viser sammenhænge mellem alt fra CPR-register til Geodata.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Et af dansk digitaliserings flagskibe - Den fællesoffentlige Datafordeler - skal fra senest 2017 give en fælles indgang til bunker af data, som indtil nu har været samlet i hvert sit register.

Med et udkast til den fælles datamodel, Grunddatamodellen, der skal skitsere den komplette sammenhæng mellem data om personer, virksomheder, ejendomme, grunde, geografi og klima, er flagskibet nu kommet lidt tættere på havn.

Grunddataprogrammet

Grunddataprogrammet består af otte delprogrammer, som er Ejendomsdata, Adressedata, Vanddata, Geodata, Persondata, Virksomhedsdata, Datafordeler og It-arkitektur. Projektets samlede udgift er sat til 930 mio. kroner

Ved at rydde op i og forbedre offentlige registre med centrale grunddata og samtidig gøre disse data frit tilgængelige for alle myndigheder, virksomheder og borgere kan færre dobbeltregistreringer, mindre paralleldrift af registre og færre udgifter til administration ifølge Digitaliseringsstyrelsen give effektiviseringsgevinster for ca. en kvart milliard kroner årligt i det offentlige, når programmet er fuldt indfaset i 2020.

Virksomheder og borgere slipper samtidig for at give det offentlige de samme oplysninger flere gange. Endvidere kan fri adgang til de offentlige grunddata af høj kvalitet give besparelser og nye og bedre muligheder for vækst og innovation i det private erhvervsliv på op mod en halv milliard årligt.

Kilde: Digitaliseringsstyrelsen

Den samlede model blev - i sin nuværende form - præsenteret tirsdag af Digitaliseringsstyrelsen på konferencen med den lovende titel ‘Bedre grunddata på vej’.

»Den viser en ny fælles måde at organisere data på. Det er det arbejde, der betyder, at alle datasæt bliver sammenhængende og standardiserede ud fra de samme principper,« fortæller Allan Mollerup, der leder hele grunddataprogrammet.

Artiklen fortsætter efter annoncen

Netop standardiseringen på tværs af en lang række meget forskellige styrelser og register har været en udfordring for forarbejdet til Datafordeleren, fortæller han.

»Det har været et oprydningsarbejde. Vi fandt ting, som vi skulle håndtere, som var vanskelige og større end vi havde regnet med,« siger Allan Mollerup til forsamlingen.

Ingen kan lave modellen alene

Digitaliseringsstyrelsen opstillede i 2014 en række krav til, hvordan registrene skulle modelleres. De vidt forskellige databaser er indtil nu modelleret på hver sin måde og uden nogen strømlinet dokumentation.

»Nu har vi en model, vi mener er komplet, der hænger sammen og hvor alting er forbundet,« fortæller styrelsens informationsarkitekt Per De Place Bjørn, som er hovedarkitekten bag Grunddatamodellen.

Artiklen fortsætter efter annoncen

Modellen rummer ikke blot konkrete sammenhænge som mellem virksomhed og dens ejere. Den kan også placere virksomheden på en matrikel, fortælle om bygningen har en kælder, og om der er grund til at frygte, at den bliver oversvømmet.

Hertil kommer, at datamodellen til en hvis grad udtrykker den specifikke lov, der eksisterer på området. Derfor kan man heller ikke modellere dataet efter forgodtbefindende.

»Der er ingen, der er i stand til at levere en sådan model alene. Hver enkelt registerejer har hjulpet ved at modellere netop deres data,« fortæller Per De Place Bjørn.

Data i sammenhæng

Styrelsen har efterfølgende knoklet med at kvalitetstjekke de forskellige modeller, så de giver mening sammen med resten af Danmarks data udfra 14 modelleringsregler. Den strømlinede modellering er ifølge Per De Place Bjørn nødvendig, hvis Datafordeleren ikke kun skal være et nyt sted at hente de samme data.

»Vi skal ikke bare sende data fra et sted til et andet. Vi skal sætte det i sammenhæng,« understreger han.

Det betyder også, at dataformater skal være ens på tværs af forskellige registre, så datamodellen ikke rummer flere måder at angive et grundareal for eksempel.

»Der er ikke frit slag. Man kan ikke sige, at en grund går fra kanten af gården og ned til åen. Alting skal være standardiseret,« siger Per De Place Bjørn.

Mindre bøvl - mere vækst

Efter mantraet ‘mindre bøvl - mere vækst’ skal Datafordeleren og den frie grunddata give virksomheder mulighed for at bygge forretningen op omkring den enorme viden, der eksisterer i offentlige registre.

Artiklen fortsætter efter annoncen

Derfor kan de mange registerejere fra nu af heller ikke køre sololøb og ændre deres del af modellen uden at afklare det med styrelsen og de andre spillere, mener Per De Place Bjørn.

»På den måde er grunddataprogrammet jo en klub. CPR-registret kan heller ikke bare ændre sin model, for der er mange andre, som er afhængige af den,« siger informationsarkitekten.

Direktør for Digitaliseringsstyrelsen, Lars Frelle, sammenligner vilkårene med tinglysningsregisteret, som også er afhængigt af andre registre for at fungere. Hvis en af de registre bliver ændret i sin opbygning kan tinglysningsregisteret gå ned.

»Lige nu kan vi opdaterer så tit vi har lyst til, men bliver vi ikke med at kunne når Datafordeleren går i drift,« forklarer direktøren.

Ændringer i modellen bliver nødvendig

Det vil dog blive nødvendigt at ændre i modellen i fremtiden, vurderer styrelsen. I takt med at arbejdsgange og lovgivning ændrer sig må datamodellerne følge med.

»Selvfølgelig ændrer virkeligheden sig, og derfor er modellen også dynamisk,« siger Per De Place Bjørn og tilføjer, at modellen stadig bliver ændret ugentligt.

Hvis der laves ændringer i Grunddatamodellen vil styrelsen opretholde flere versioner, så virksomheder ikke pludselig mister datagrundlaget for forretningen. Det kræver dog, at de enkelte databehandlere er med på dobbeltarbejde.

»Det vil være op til hver enkelt registerejer, om man vil servicere flere forskellige registre,« understreger Per De Place Bjørn.

Du kan gå på opdagelse i den samlede Grunddatamodel i PDF-form her - eller bruge det interaktive diagram på Datafordelerens hjemmeside.

11 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
11
10. marts 2016 kl. 18:15

Har netop hørt "Aflyttet" http://www.radio24syv.dk/programmer/aflyttet/12965908/aflyttet-uge-9-2016/

Jeg må indrømme, at indslaget om grunddata lidt inde i udsendelsen får det til at løbe koldt ned ad ryggen på mig. Det lyder som om, alle forbehold, alle principielle overvejelser vedr. privatliv på dataområdet nu er totalskrottet - et paradigmeskift hos politikerne i retning af at se data som råstof, som det udtrykkes.

Hvordan er dette sket? Har politikerne på noget tidspunkt spurgt os, om vi er indstillede på at blive gjort til "råstof"? Hvem har givet politikerne ret til at ekspropriere mine private data som samfundsejendom?

Det lyder som om, løbet er kørt. Det lyder overhovedet ikke som om, man mener, at det er noget, borgerne har ret til at kende til eller tage stilling til.

Mig bekendt har denne debat ikke været oppe i valgkampen. Ingen har fortalt os, at nu ville man begynde at sælge vores privatliv til højestbydende - det er sket under radaren. Men hvor er disse beslutninger taget? Og hvem er det, der har taget disse beslutninger bag om ryggen på os?

Jeg er rasende....

10
4. marts 2016 kl. 09:37

Jeg synes det er rigtig godt at vi forsøger os med at lave en fælles datamodel - det er et pionerarbejde, der SKAL gøres, og som vil afstedkomme en række vigtige erkendelser. Hvordan man får (og hvorvidt man skal lade) en teknisk datamodel afspejle skiftende opfattelse og lovgivning på tværs af folketing og en række organisationer er det spørgsmål jeg er allermest spændt på. Det kommer helt sikkert til at give problemer (tænk SOA), men det er modigt at ville tage disse problemer væk fra de aftagere der ellers ville have haft et helt uoverskueligt gravearbejde, der gjorde at data ikke ville blive brugt. Derfor skal det her gøres, uanset at det er et meget udfordrende projekt.

9
3. marts 2016 kl. 10:12

Jeg tror helt sikkert at de bliver færdige før planlagt :-) De er garanteret allerede 1 dag foran i deres tidplan - de opdagede nemlig en uforudset ekstra dag i februar måned.

..og de har jo allerede lavet en model over deres data. At implementere denne med en eller anden standard pdf-diagram til database og CRUD kode generater kan da ikke tage ret mange dage - de kan sikker også bare fiverr.com til at få andre til at gøre det for dem.

...ironi kan forekomme...

8
2. marts 2016 kl. 15:13

Det eneste der behöves er da en fornuftig standardisering af dataudvekslingen - for eksempel baseret på ISO 15926-*

7
2. marts 2016 kl. 13:57

Jeg håber da der er nogen, der har tænkt noget sikkerhed in i det her. Det er måske ikke alle data der sådan lige .. når man læser det her sådan bare skal udstilles til alle og enhver.

// Jesper

6
2. marts 2016 kl. 13:24

Det er gået mere end 2 år allerede. Jeg hørte rygter om et udbud tilbage i 2013.

5
2. marts 2016 kl. 11:10

Én datamodel over dem alle! Er dette en parodi på <indsæt et af mange fejlede kæmpesystemer>? Det er ikke 1. april endnu.

Når jeg læser artiklen synes jeg den kort og præcist beskriver snart sagt alle de advarselslamper der burde kunne lyse op som juletræer om natten. Men i et sprog som om det naturligvis kommer til at ske alt sammen. Jeg får lyst til at slå mit hoved ned i bordet og råbe: Nej, nej, nej: Har de intet lært!

Kan de ikke bare brænde vores penge. Så får vi i det mindste varme ud af dem. Hvordan kan man banke noget fornuft ind i det offentliges IT-projekter?

4
2. marts 2016 kl. 09:56

http://data.gov.dk/model/model.htm

Person->Navn

Muligt at angive, at virkning fra og til er usikker :-)

Jeg kan ikke lige gennemskue hvornår VirkningFra og -Til er med. Det virker lidt tilfældigt. Mangler ved CVR-adresse, men er ved f.eks. telefonnr under CVR-register. Derudover må der være yderligere et historiklag med alle de gamle ændringer.

Public DiscreteTruth virkningFraUsikkerhedsmarkeringDetails:definition=Angiver at virkningFra er usikker, hvilket vil sige, at det ikke har været muligt af verificere datoens korrekthed

3
2. marts 2016 kl. 09:23

Er der slet ikke nogen der undervejs har undret sig over hvorfor der er to tabeller der hedder "bygning" ?

Jeg ser ingen tabeller, kun objekttyper. Kan ikke lige se hvor du ser "bygning" defineret 2 gange, men hvis det er inden for hvert deres domæne og ikke indeholder duplikerede data kan det da godt give mening. Jeg er i princippet enig med dine øvrige kommentarer, men nu ved vi jo rent faktisk ikke, hvor meget det er forsimplet allerede - ud fra artiklen at dømme er der allerede sket et stort oprydningsarbejde. Og så synes jeg i øvrigt at man bør give credit for at det overhovedet er lykkes at nå så langt rent organisatorisk. Det må have været en kamp uden lige at overbevise div. institutioner om at de skal overgive deres datamodellering til en fælles enhed.

2
2. marts 2016 kl. 09:05

En datamodel og et IT system kommer altid til at reflektere den organisation der producerer dem.

Denne datamodel burde i allerhøjeste grad inspirere Folketinget til at forsimple lovgivningen.

PS: Er der slet ikke nogen der undervejs har undret sig over hvorfor der er to tabeller der hedder "bygning" ?

1
2. marts 2016 kl. 08:52

Fra våd drøm til brugbar realitet på kun under to år? Det kommer helt sikkert til at ske.