Fri adgang til statens data vil koste 120 millioner kroner

Illustration: REDPIXEL.PL/Bigstock
Der er brug for en ny tjeneste, hvor danske borgere nemt kan hente alle de netop frigivne offentlige data. Derfor sender staten nu et udbud ud på en ny ’datafordeler’.

Før var de bag lås og slå eller kostede mange kroner at købe. Men i oktober besluttede regeringen, at en lang række offentlige data, for eksempel digitale kort, skulle gøres frit tilgængelige.

Læs også: Værsgo: Staten forærer CVR- og matrikelnumre væk i datafest

Ændringen affødte dog et praktisk problem - at få samlet og præsenteret dataene - og derfor sender staten nu et udbud på gaden om en såkaldt datafordeler. Det er en server, der rummer alle de nødvendige data og hurtigt kan levere dem til interesserede.

I dag ligger data rundt omkring i mange forskellige systemer, og de fleste af systemerne er ifølge udbudsteksten ’tæt på at være teknisk forældede’. Derfor er det urealistisk bare at trække data efter behov, for det vil hurtigt give flaskehalse, hvis interessen for dataene stiger som forventet.

I stedet skal datafordeleren fyldes med alle de frigivne data, i alt omkring 24 terabyte lige nu, som så skal gøres nemt tilgængelige for borgerne. Trafikmængderne vil gå fra 11 terabyte om måneden til 77 terabyte om seks år, lyder vurderingen. Samtidigt stiger antallet af transaktioner hver måned fra i dag 134 millioner til 800 millioner over seks år, estimerer Digitaliseringsstyrelsen, som står bag udbuddet.

Leverandører, som byder på opgaven, skal også stå for driften i seks år, men kravene her til for eksempel oppetid er ikke fastlagt. Det vil ske, når styrelsen har fået nogle mere præcise bud på en teknisk løsning, fremgår det af udbuddet.

De frigivne data er blandt andet kort fra Kortforsyningen, bolig- og byggedata fra OIS, samt nogle data fra CVR- og CPR-registrene.

Læs også: Folketingets datafest: Følg lovmøllen gennem åbne API'er

Digitaliseringstyrelsen forventer, at den samlede pris for datafordeleren vil lande et sted mellem 80 og 120 millioner kroner.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (16)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
s_ mejlhede

Når alle data er fri, og der med ingen sikkerhed spørgsmål er det da lige til skyen, en enkelt FTP server med alle data. Og data må så opbevares i udlandet. Enten betalt for backup, eller laver det selv, aftalt trafik og pris.
Det vil da være det nemmest og sikker også meget billigere ind en forkromet og dyr special løsning.

Kunne da sætte en NAS server med 8 * 3 GB Hardiske, og opgradere min fiber fra 60 Mb til 100 det burde da kunne gøre det. Og prisen 3000,- for forbindelse, og 15.000 for NAS. Også yderligere 15.000 for hver yderligere 24 TB. Og lidt til Hardiske og andet. Så vil jeg lige putte de 199 milioner i lommen.

  • 2
  • 7
Henrik Korsgaard

Selvfølgelig skal en åben data 'fordeler' i udbud. Hvorfor dog bruge CKAN, som anbefales af EU, data.gov.uk og mange andre åbne data initiativer, fx i Berlin - det er jo open source og distribueret. Det betyder at man kan lave en instans hos den enkelte dataejer, hvilket ofte giver en del 'tryghed' og mulighed for at kontrollere hvilke datasæt de udstiller. Der er desuden en fin API - både til dataejer og -bruger. API'en er både til metadata og direkte ind i datastore. Ganske fint - fik jeg sagt det er anbefalet og i brug i resten af EU :P

Det er f.... kun i Danmark at man sætter ting i udbud, uden at kigge sig lidt omkring og evt. lære af initiativer der er længere fremme . Så kan CSC evt. genbruge lidt .NET2 fra Polsag eller måske det hele skal hostes hos KMD med en begrænset adgangsaftale :/

  • 9
  • 1
Bjarke Walling

Jeg regnede lidt på det og indtastede tallene i AWS Calculator for hosting på EC2/S3 i Irland. Driften løber op i højst 5-6 mio. kr over seks år. Så har jeg 75 mio. kr at udvikle/vedligeholde for og stadig ligge i den lave ende.

Desværre er min konsulentbiks for lille til at byde på disse offentlige udbud, medmindre vi indgår i et konglomerat: Vi er fire ansatte og omsætningen er ikke høj nok (kravet er min. 100 mio. kr). Typisk! :-)

  • 1
  • 0
Henrik Korsgaard

Enig, men jeg mener at sådan et initiativ og udbud bør skele lidt mere til de erfaringer man har i UK, Berlin og mange andre steder. Der har man valgt CKAN af forskellige årsager. Der er gode ting ved CKAN, men også mange udfordringer.

Nu står der ikke noget i udbuddet (kort version) om API’er og hvordan denne tilgængelighed skal tænkes. Men hvis præmissen for frigivelsen af data er, at data skal udnyttes bedre på tværs, skabe nye services og forretninger, så er det efter min mening ret vigtigt, at man tænker en vis standardisering ind omkring tilgængeligheden ift. de der skal arbejde med udvikling af applikationer ovenpå data. Alt andet lige, så tror jeg at platformen og tilgængeligheden har meget at sige i forhold til optag og brug. Åbne data er ikke kun tænkt til udvikling af services, men også i forhold til besparelse i aktindsigt, data-journalisme og adgang for fagligheder som ikke er så teknisk orienteret. Det vil kun være en fordel at koordinere på tværs af EU ( se evt. http://publicdata.eu/ eller data.gov.uk). Igen - der er andre initiativer der er betydeligt længere - hvad med at kigge lidt på dem og skrive dette ind i udbuddet - i stedet for at lade det være op til pris og tilfældigheder (groft sagt).

Det skulle vel næppe være det første udbud, der ender med at skabe barrierer for den fremtidige brug...

Men nu er det jo også åbne data – så jeg kan vel bare hoste det jeg vil på min egen CKAN om et par år :P

  • 4
  • 0
s_ mejlhede

Du kom til at skrive, at du ville putte 199 millioner i lommen, men der bliver kun 119 millioner tilbage til dig selv.

Så er det jo næsten ikke længere besværet værd, din stakkel :-)

Min hjerne have set det som 200 millioner, sådan kan det gå.
Det er godt jeg ikke er byggeingeniør og regner på bygninger :-)

Det jeg har imod udbudet er at de opregner deres krav som meget store.
hele 24 Tb Trafikmængderne på 11 terabyte om måneden, antallet af transaktioner hver måned 134 millioner, krav om oppe tid.

Hvis det er meget statisk data som højde kort over danmark, er det jo kun noget der hentes en gang, og hvis siden er nede eller overbelastet kan man vel vente på det. 24 Tb, ja det var NASA for mange år siden, men jeg har 30 Tb i min hjemmeserver, og en 60 Mb fiber og det er jo nok til at kunne leve op til deres krav. Der for synes jeg at beløbet på 120 milioner lyder meget højt. Eller det er måske bare den overpris vi skatteborger skal acceptere fordi det er "noget offentligt". De første 10 millioner går vel til en konsulent som skal lave udbudet LOL (Ja det er næsten til at grine ad.)
Men som Bjarke Walling skriver, selve server og data kan købes for 5-6 millioner i skyen, så hvis man lade det hele på en ftp server, var det lige ved at man sparet udbudet, som vel koster det samme samme som driften.
De som har givet mig en pil ned af, er det nogen som lever af at malke det offentlige, eller er de en af konsulenterne som skal levere udbudet.

  • 2
  • 4
s_ mejlhede

"Det er nok snarere folk, der er klar over hvor useriøst dit bud er."

Lige som CSC og POLSAG, eller AnsaldoBreda og IC4 tog. Store seriøse udbyder.

Tager da bare en slapper og beder om 100 millioner om et år, så skal jeg lige få det fixet, med kun 1 eller 2 års forsinkelse.

Vil mene at jeg for 20-30 millioner have større chance for at få dette "tilbud" til at spille, ind at IC4 kommer til at køre/blive godkendt med 4 sammenkoblet vogntog.

  • 1
  • 3
Tine Müller

Drupal har jo vist, at det kan klare alverdens ting, så hvorfor ikke også dette. Eneste problem er at det ikke vil komme til at koste 120 millioner, men kan gøres meget billigere, og det er jo nok ikke så godt. :-)

Jeg deler selv OpenData i mindre målestok v.hja. af Drupal http://beta.findtoilet.dk/feeds/municipality - yderligere info til de interesserede http://digitaliser.dk/forum/2389109.

Jeg ville ikke selv kunne påtage mig opgaven, men det er der jo nok nogle drupal-firmaer/udviklere der ville kunne.

  • 0
  • 1
Thorbjørn Nielsen

CKAN og Drupal er gode værktøjer, men kan ikke stå alene. De kan sikkert - hvis den bydende part ønsker det - inddrages som elementer, men den bagvedliggende infrastruktur (servere, lagerplads, synkronisering med basisregistre, båndbredde og i særdeleshed support) er det, som vil presse prisen op mod de 80 - 120 mio nævnt i artiklen.

CKAN: (se eksempel på data.gov.uk) virker meget ustruktureret. Der er ikke en ensartet indgang til data. De enkelte forvaltningsorganer kan på sitet offentliggøre deres data i en selvvalgt form. Hvis opsætningen på data.gov.uk skulle bruges som eksempel, vil CKAN kunne spille en rolle som en samlet indgang til offentlige data, hvor Datafordeleren blot er én af de kilder, der linkes til. CKAN ser ud til at have det bedst med statiske data, som uploades i form af kommaseparerede filer. De 34 TB som Datafordeleren skal distribuere må forventes at tilflyde som "live" datasæt, hvis ideen skal give mening.

Drupal: En content management platform. Kan måske finde anvendelse til FAQ, driftsblog, brugerforum og Datafordelerens hjemmeside, men næppe mere.

  • 1
  • 0
Log ind eller Opret konto for at kommentere