Datafordeleren: Her er udfordringerne når det offentlige skal dele sine data

7. juli 2014 kl. 06:299
Datafordeleren: Her er udfordringerne når det offentlige skal dele sine data
Illustration: Geomatic.
I stedet for at hente data fra 30 forskellige myndigheder, så skal offentlige data snart gennem den særlige datafordeler.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Det offentlige har en lang række store databaser med grunddata, som myndighederne skal stille rådighed både for hinanden og for andre interesserede. Hidtil har alle myndighederne haft deres egne snitflader til at få fat i data, men det skal snart være slut.

KMD er for nylig blevet valgt til at levere den såkaldte datafordeler, som skal samle myndighedernes data ét sted. Det er imidlertid en opgave, som rummer visse udfordringer, der ikke kun er tekniske.

»Det er en løsning, som er en central infrastruktur, så der er et stort og broget interessentbillede, og det er det altid en udfordring at navigere i. Vi skal passe på ikke at tilgodese nogle, hvis det går ud over andre,« siger it-arkitekt David Graff Nielsen fra Digitaliseringsstyrelsen til Version2.

I dag driver de enkelte myndigheder selv en række portaler og andre former for indgange til dataene, men tanken med datafordeleren er, at det fremover skal ske gennem én fælles løsning.

Artiklen fortsætter efter annoncen

Derfor skal datafordeleren også udvikles under hensyntagen til, at der allerede findes løsninger, og det kan lige så meget være et forandringsprojekt som et it-teknisk projekt.

»Det er en stor udfordring at møde fire forskellige løsningers krav og behov, når folk har været vant til selv at være tæt på forretningen. Så vi skal sikre, at de stadig selv har styringen,« siger David Graff Nielsen.

Datafordeleren er en del af det større projekt i staten med at få gjort flere af de såkaldte grunddata tilgængelige. I dag har eksempelvis Geodatastyrelsen stillet data som den danske højdemodel til rådighed. Tanken er, at det både skal gøre det nemmere at udvikle nye tjenester til det offentlige, men også at private virksomheder kan bruge data til kommercielle løsninger.

Også forretningsmodellerne er forskellige rundt om i staten. Visse datasæt koster i dag penge, og der er mange forskellige tekniske løsninger og ikke mindst servicemål.

Artiklen fortsætter efter annoncen

»Vi har kigget på de eksisterende distributionsløsninger, og de har eksempelvis hver deres mål om oppetid,« siger David Graff Nielsen.

En del af målet med datafordeleren er, at alle tjenesterne kan hæves til samme niveau for oppetid, ligesom sikkerheden også skal være i orden.

»Der vil ligge både persondata og andre typer data, så det er vigtigt, at designet lever op til sikkerhedskravene for datatyperne,« siger David Graff Nielsen.

Arkitekturen for datafordeleren er inspireret af den måde, cloud-baserede løsninger er opbygget efter. Når alle skal gennem samme indgangsvej, så skal systemet også kunne skalere, hvis én af løsningerne pludselig begynder at trække ekstraordinært mange data.

Selve datafordeleren er én teknisk løsning, men derudover skal dataene også kobles på. Det vil foregå i en serie af små agile forløb, hvor eksempelvis Geodatastyrelsens 30 forskellige registre bliver klaret som enkelte iterationer.

9 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
8
7. juli 2014 kl. 14:13

Det lyder måske åndssvagt, men ja, jeg kunne godt tænke mig et glorificeret ftp server.

Men bliver hurtig træt af at vedlige holde mange vpn forbindelser for at kunne logge på forskellige ftp servere eller MSSQL servere som alle står på hver deres domæne hos forskellige kommuner eller andre instanser. De har alle forskellige administratorer med forskellige ideer til hvornår ftp passwords skal udløbe. Og de sidder tit og piller i entet filsystem, konti, netværk, domæne, router eller vpn forbindelser.

Og så skal man sætte det hele op igen.

Når det er sundhedsdata man skal have fat i, så kan man tit bruge Sundhedsdatanettet i stedet for VPN forbindelser. Og så skal man slet ikke tænke på kryptering og brugerkontrol. Dette er allerede klaret. det er bare http://dns/filnavn.type når man er på produktionsserverne. Det er simpelt og genialt.

9
7. juli 2014 kl. 15:46

Det lyder måske åndssvagt, men ja, jeg kunne godt tænke mig et glorificeret ftp server.

Jeg kunne egentlig også godt tænke mig et rejsekort som jeg kan bruge når jeg skal rejse med det offentlige i stedet for at skulle bruge alle mulige forskellige typer billetter.

Så spørgsmålet er nok nærmere om Geodatastyrelsen kan levere varen eller om der går rejsekort i den. Og jeg kan jo godt blive lidt bekymret for at det er sådan det ender når IT-arkitekten udtaler at:

Derfor skal datafordeleren også udvikles under hensyntagen til, at der allerede findes løsninger, og det kan lige så meget være et forandringsprojekt som et it-teknisk projekt.</p>
<p>»Det er en stor udfordring at møde fire forskellige løsningers krav og behov, når folk har været vant til selv at være tæt på forretningen. Så vi skal sikre, at de stadig selv har styringen,« siger David Graff Nielsen.

6
7. juli 2014 kl. 11:08

Hvis ikke det var fordi jeg har læst om datafordeleren i forbindelse med et data warehouse projekt for et år siden til det offentlige, så havde jeg heller ikke forstået noget af denne artikel.

Kort fortalt er datafordeleren en glorificeret distributør af filer. Man sender til én inbox, som distribuere til en eller flere outboxes.

I bund og grund er det FTP med metadata++ - fx kan rækkefølgen af filer styres, så inkrementel delta-filer kan tilføjes i den rigtige rækkefølge.

Jeg kan desværre ikke huske så mange detaljer.

5
7. juli 2014 kl. 09:30

KMD er for nylig blevet valgt til at levere den såkaldte datafordeler, som skal samle myndighedernes data ét sted. Det er imidlertid en opgave, som rummer visse udfordringer, der ikke kun er tekniske.

Jamen, så stopper man vel her og kigger lidt rundt, inden man fortsætter, gør man ikke?

Ikke også?

Måske burde opgaven løses lidt længere tilbage i systemet, hvor hver myndighed følger veldokumenterede standarder lidt efter lidt i stedet for at man forsøger sig med en one-size-fits-all løsning af gaffetape klistret ind i spartelmasse.

Hvad nu hvis myndigheden beslutter sig for at ændre sit system? Skal KMD så ind og lave deres interface om?

4
7. juli 2014 kl. 08:56

Man kan godt blive noget nervøs når man læser om "den centrale datafordeler" drevet af KMD, for det lugter langt væk af endnu en monolitisk konstruktion, i øvrigt drevet af et amerikansk ejet firma (ikke at NSA betyder så meget i dette spil, da data jo gerne skulle være offentlige, men alligevel).

Imo havde det være lidt (læs: ret meget) mere hensigtsmæssigt at specificere samme grænsesnit for alle offentlige dataudbydere, og så følge op på at de også overholder dem, i stedet for direkte at søge on-point-of-failure.

Som bruger af data er det ligegyldigt om de kommer fra dencentraledatafordeler.kmd.dk eller fra geodatastyrelsen.dk og energistyrelsen.dk, bare de er opbygget efter samme veldokumenterede struktur.

3
7. juli 2014 kl. 08:04

Igen et projekt der er budgeteret til 120mill. Ender på 360mill. for så at blive kasseret om 3år. Historien gentager sig selv.

10
7. juli 2014 kl. 17:35

Igen et projekt der er budgeteret til 120mill. Ender på 360mill. for så at blive kasseret om 3år. Historien gentager sig selv.

Er du tov'li mand ;), det er da KMD som ragede jobbet til sig, så historien bliver en anden.

Det starter nogenlunde til tiden og kun med lille overskridelse (blødt og pænt :) og efter nogle tid, så triller det fuldautomatiske seddeltrykkeri (gebyr) på højeste gear.

De får jo et Kgl. blåstemplet monopol, og kan som utallige andre (ingen nævnt og ingen glemt) pelse de offentlige styrelser, der blot sender regningen videre til skatteyderne.

De gamle offentlige ejede KMD og Datacentralen (nu CSC) havde netop deres guldbelagte og kronede dage pga. monopoliseringen.

I dag fortsætter Dannevang velkendte dumheder i moderniseret form - hvem sagde 'Kejserens nye Klæder'. Men nu i armslængde afstand fra de 179 på borgen (= vil ikke hænges op på ulykkerne) og godt kamufleret hos private, der mærkeligt nok alle har høj indtjening og store pengetanke som interesse... KMD, CSC, TDC, Nets m.fl.

2
7. juli 2014 kl. 07:21

Hmm synes den lyder lidt spøjs denne datafordeler. Præcis hvad er dens arkitekturelle funktion?

  1. Skal den sammenkøre data på tværs af datakilder? I så fald kunne det give mening, men der står ikke det er funktionen.
  2. Er det en slags cache? Sådan lyder det mere af artiklen, men i så fald, hvorfor skal den være central?
  3. Er dens funktion at give en ensartet grænseflade - det fremgår også af artiklen. I så fald, hvor ens kan grænsefladen blive når datakilderne er vidt forskellige? Det kan hurtigt gå hen og blive blot en yderligere indpakning af de meget forskellig-artede data. Alternativt en radikal transformation af det eksisterende format, som sjældent går godt.