Nu bliver danske adressedata sluppet fri

Illustration: REDPIXEL.PL/Bigstock
De officielle danske adressedata fra BBR bliver nu frit tilgængelige for alle i digital form. Det skal sparke liv i nye, kreative tjenester og applikationer.

Hvorfor skal grunddata om vores fælles samfund være låst inde bag lås og slå eller koste dyrt at købe? Sådan har det lydt fra især udviklere, der er stødt mod muren, når de har forsøgt at finde et åbent API til data, den offentlige sektor har liggende.

Men nu bliver et af de store ønsker opfyldt, nemlig fri adgang til adressedata direkte fra BBR, som er det officielle danske register for adresser. Det oplyser Ministeriet for By, Bolig og Landdistrikter i en pressemeddelelse.

»Ved at stille adressedata til fri afbenyttelse giver vi en masse kreative hoveder en række byggeklodser at lege med. Med disse klodser kan vi forvente mange spændende og nytænkende løsninger, der både gavner iværksættere og borgerne. For gode data er et grundstof, som kan skabe udvikling, arbejdspladser og ændre vores dagligdag. Og så vidt jeg ved, er vi det land i Europa, der er længst fremme med frie grunddata,« udtaler Carsten Hansen, minister for by, bolig og landdistrikter, i den forbindelse.

Vil man have fingrene i dataene, som rummer adresser og koordinater, er der flere forskellige adgangsveje. Man kan downloade alle data som for eksempel i kommasepareret format, eller man kan hente dem via et web-API.

I pakken af data, som ministeriet har kaldt Adresse Web Services (AWS), er der også en komponent, der gør det nemt hurtigt at slå en adresse op, som alle kan bruge gratis. Den har fået navnet Smartadresse.

Frigivelsen af adressedata sker som en del af Grunddataprogrammet, der skal sikre, at data fra den offentlige sektor i højere grad end før bliver frit tilgængelige.

AWS-tjenesten og kvaliteten af dataene vil løbende blive forbedret, lover ministeriet. For eksempel skal flere adresser lægges ind i databasen, fra erhvervslejemål, kolonihavehuse og andre områder, der i dag ikke er noteret så finkornet. Alle adresser skal også med tiden have tilknyttet et punkt på nærmeste vej.

Læs mere om de frigivne adressedata på www.aws.dk

Frie adressedata skal skabe kreative løsninger

Danmarks adresser bliver nu stillet til frit til rådighed i digital form. De åbne data er til brug for alle med
kreative ideer til, hvordan adressedata kan bruges i fremtidens digitale tjenester – og det er i sidste ende
til gavn for borgerne, der får nye, spændende værktøjer i hverdagen.

Det er gode adressedata som gør at ambulancen kan nå frem uden slinger – og at man kan
bestille en taxi med bare ét klik på mobiltelefonen, uanset hvor man er. Og fra i dag bliver
det endnu nemmere og billigere at udvikle tilsvarende kreative og effektive løsninger, når
ministeriet for By, Bolig og Landdistrikter åbner for en vifte af digitale tjenester, der stiller
Danmarks adresser frit til rådighed.

”Ved at stille adressedata til fri afbenyttelse giver vi en masse kreative hoveder en række
byggeklodser at lege med. Med disse klodser kan vi forvente mange spændende og nytænkende
løsninger, der både gavner iværksættere og borgerne. For gode data er et grundstof, som kan
skabe udvikling, arbejdspladser og ændre vores dagligdag. Og så vidt jeg ved, er vi det land i
Europa, der er længst fremme med frie grunddata,” siger Carsten Hansen, minister for by, bolig
og landdistrikter.

Med de åbne adressedata bliver det nemmere og billigere for virksomheder og
myndigheder, der udvikler digitale løsninger, hvori der indgår adresser – fx korttjenester,
selvbetjeningsløsninger og apps til mobiltelefoner. Og dermed giver ministeriet en række
mindre virksomheder og innovative iværksættere gode muligheder for let at udtænke kreative
produkter baseret på adressedata.

Ingen personfølsomme oplysninger

De nye digitale tjenester indeholder både selve adressen og dens geografiske position,
så oplysningen kan bruges i en GPS eller på et digitalt kort. Der er derimod ingen
personoplysninger, f.eks. om hvem der bor eller ejer ejendommen på adressen, og dermed
kan man ikke misbruge adressedatabasen til fx chikane eller udstilling af personfølsomme
oplysninger.

De åbne adressedata er en del af det offentlige ”grunddataprogram” hvor regeringen,
kommunerne og regionerne stiller en række offentlige data frit til rådighed. Igennem dette
håber myndighederne at skabe helt nye måder at bruge offentlige data på. Samtidig er det en
del af Grunddataprogrammet at dataene løbende skal udvikles og forbedres. Det gælder også for
de offentlige adressedata, der i løbet af de kommende år skal opdateres og præciseres.

De nye digitale tjenester præsenteres under navnet ”AWS-suiten” på en ny hjemmeside. Herfra
kan interesserede både hente data i flere forskellige åbne formater, og tilgå adresserne ved
hjælp af on-line tjenester. Adresserne bliver ajourført dagligt, hvilket sikrer at adressebaserede
løsninger og apps kan holde sig opdaterede med de nyeste informationer.

Faktaboks: AWS-suiten – de offentlige adressedata

AWS suiten er en fælles betegnelse for en række services, som tilbyder it-systemer adgang til Danmarks
adresser. Formålet med AWS Suiten er at give myndigheder, virksomheder og borgere mulighed for
at anvende autoritative adresser i deres it-systemer. Kilden til de autoritative adresser er Bygnings- og
Boligregisteret, BBR, der er grunddataregister for adresser i Danmark. AWS er en forkortelse for Adresse
Web Services.

AWS Suiten består i øjeblikket af følgende services:

• AWS Web API, som giver en service baseret adgang til adressedata.

• AWS Download, som giver mulighed for download af alle adressedata (INSPIRE og CSV).

• AWS Korttjenester, som giver mulighed for at vise adresser på kort (WMS og WFS).

• AWS Smartadresse, er en komponent, som kan anvendes i web applikationer til adresseudvælgelse/indtastning.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (30)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#2 Kenneth Nielsen

Er det kun mig der får fejl i forbindelse med import af data?

Det drejer sig om import af Enhedsadresser eller AdressAccess som det kaldes her.

Fejlen jeg får er flg. [Flat File Source [124]] Error: The column delimiter for column "BuildingName" was not found. [Flat File Source [124]] Error: An error occurred while processing file "C:\Projekter\Demo\BBR Demo\AddressAccess.csv" on data row 570041.

Så den første ½ mio rækker kommer fint ind, men ikke de resterende ;(

  • 1
  • 0
#3 Uffe Kousgaard

Hvis du kigger i linie 570041, så skyldes det at Rishøjgaard står med dobbelte anførselstegn. Det kan dit import-program åbenbart ikke lide. Nemt at rette. Til gengæld er det lidt spøjst, at de har valgt gz som format, når 7zip kun fylder 75-80% af gz. Netop testet med et par af filerne. De kender åbenbart godt til 7zip for de anbefaler det til udpakning.

  • 3
  • 0
#4 Thue Kristensen

Jeg har altid syntes at det var absurd at vi i Danmark har valgt semikolon som separator i CSV-filer, når nu filformatet nu hedder "Comma Separated Values".

Det er jo også derfor du er nød til at få en dialog i dit spreadsheet før filen kan åbnes, hvor du skal vælge separator. Helt sindsygt at det skal være så besværligt i et format som jo er designet til at udveksle data på tværs af systemer.

PS: der var til min store skuffelse ikke nogen is i filen med PostCodeIsdentifier.

  • 1
  • 4
#5 Ove Andersen

Så har du ikke modtaget din første ægte komma reparerede fil endnu, hvor data virkeligt er adskilt ad komma, og du så opdager at nogle decimaltal er danske, så du har værdien 10,32?

Når du har brugt lang tid på at bygge parsere, der kan gennemskue om et komma er en del af en separator eller et decimaltal, så er du lykkelig når du modtager en ny datakilde og ser, at filen er opdelt af semikolon ;)

Har også set "engelske" CSV filer, hvor der var en kort tekst beskrivelse, og også her var der af og til komma i beskrivelserne. Og teksten var ikke quoted eller andet.

Been there, several times..

  • 6
  • 0
#7 Thue Kristensen

Så har du ikke modtaget din første ægte komma reparerede fil endnu, hvor data virkeligt er adskilt ad komma, og du så opdager at nogle decimaltal er danske, så du har værdien 10,32?

Når du har brugt lang tid på at bygge parsere, der kan gennemskue om et komma er en del af en separator eller et decimaltal, så er du lykkelig når du modtager en ny datakilde og ser, at filen er opdelt af semikolon ;)

CSV standarden siger at der gerne må være kommaer, og definerer hvordan man håndterer dem korrekt. Hvis du har haft problemer med kommaer, så er det fordi dine værktøjer eller dit input har været defekte.

Jeg har faktisk selv skrevet en CSV-parser til PHP, fordi PHP's indbyggede CSV-parser er defekt. Min parser har intet problem med kommaer.

  • 0
  • 0
#8 Thue Kristensen

Jeg har for skæg prøvet at komprimere AddressAccess.csv med forskellige programmer; her er resultatet:

-rw-rw-r-- 1 thue thue 960920034 Jun 12 18:53 AddressAccess.csv  
-rw-rw-r-- 1 thue thue  99916929 Jun 12 18:53 AddressAccess.csv.bz2  
-rw-rw-r-- 1 thue thue 127328452 Jun 12 20:18 AddressAccess.csv.gz  
-rw-rw-r-- 1 thue thue  81666111 Jun 12 18:53 AddressAccess.csv.lzma  
-rw-rw-r-- 1 thue thue  93969988 Jun 12 18:53 AddressAccess.csv.xz  
-rw-rw-r-- 1 thue thue 134204169 Jun 12 20:18 AddressAccess.csv.zip
  • 1
  • 0
#9 Kenn Leth Hansen

Hvad er det nye i den her nyhed? Jeg har gennem de seneste to år kunne bruge geo.oiorest.dk til nøjagtig det samme - og mere til. Er det bare et ministerie der insisterer på at have sin egen løsning for at hævde sig overfor et andet ministerie?

  • 2
  • 3
#10 Hans Schou

Smukt? Jamen, altså UTF-8 og ISO-8601 Strict. Det tegner godt. Hvis så semikolon kun er brugt som adskiller, og ikke optræder inde i values, så er det perfekt.

Der er nok ligegyldigt for de fleste, men den vej og husnummer der forekommer oftest i DK er "Lærkevej 3":

zcat AddressAccess.csv.gz | cut -d\; -f6-7 | sort | uniq -c | sort -nr | head -n 1  
    183 "Lærkevej";"3"
  • 2
  • 0
#12 Sune Marcher

Til gengæld er det lidt spøjst, at de har valgt gz som format, når 7zip kun fylder 75-80% af gz.

Til gengæld kan du forvente at finde .gz support pretty much everywhere, hvad enten vi snakker fra en shell eller fra et scriptsprog - det er ikke alle steder man har mulighed for at tilføje .7z support. Hvis man endeligt en interesseret i datastørrelse, ville det vel også være mere relevant med en bulk-update service der kan give ændringer siden en given revision/dato?

Jeg har faktisk selv skrevet en CSV-parser til PHP, fordi PHP er defekt.

There, fixed that for you ;)

  • 2
  • 1
#14 Niels Hansen

Jeg har gennem de seneste to år kunne bruge geo.oiorest.dk til nøjagtig det samme - og mere til.

Det er ikke helt det samme. Jeg skal ikke kunne sige om jeg rammer helt rigtigt, men når man læser om geoservicen, så står der

"Adressedata omfatter alene adgangsadresser". AWS har også enhedsadresser. Det vil sige at man ikke alene kan finde og validere husnumre, men også sal, dør, mm.

Desuden opdateres AWS dagligt, og ikke kvartalsvist.

Der er sikkert også andre forskelle, men det er lige hvad jeg kunne finde. For mig virker det lidt som at sammenligne en cykel med en bil (for lige at bruge en bilanalogi).

  • 3
  • 0
#15 Peter Brodersen

Hvad er det nye i den her nyhed? Jeg har gennem de seneste to år kunne bruge geo.oiorest.dk til nøjagtig det samme - og mere til.

Du har ikke kunnet hente et samlet udtræk fra geo.oiorest.dk før. I forbindelse med OpenStreetMap-arbejdet har vi været nødt til at lave opslag for hver eneste vej (dvs. ca. 110.000 opslag for alle veje) for at få et samlet adressesæt ind på OpenStreetMap. Det tager ret lang tid at komme det hele igennem, og er som sådan også blot en unødvendig belastning.

Dertil kommer, at data hele tiden er frisk. Geoservicen blev kun opdateret med friske adresser en gang i kvartalet.

Er det bare et ministerie der insisterer på at have sin egen løsning for at hævde sig overfor et andet ministerie?

Det er Ministeriet for By, Bolig og Landdistrikter (der driver AWS), som i første omgang har myndigheden over alle adresser i Danmark.

Geoservicen startede som et "hobbyprojekt" under IT- og Telestyrelsen, lidt i hånd med deres gode ODIS-projekter. Så blev IT- og Telestyrelsen opløst, og tjenesten røg så over til Kort- og Matrikelstyrelsen (som så blev til Geodatastyrelsen).

På længere sigt kan man dog forestille sig, at det hele kommer til at ligge hos datafordeleren.

  • 3
  • 0
#16 Kenneth Nielsen

Det ville være dejligt hvis der kom flere BBR attributter på adresserne.

Tænker især på Boligtype, tagtype etc. etc. så det kunne blive muligt at lave analyser på disse attributter også. UDEN at skulle købe et helt udtræk af OIS databasen fra en distributør.

  • 1
  • 0
#17 Niels Hansen

Jeg tror at det er et spørgsmål om at vente til de har det klar. Det kan godt være at du skal vente til datafordeleren (se Peters link ovenfor).

Jeg håber dog at de bruger ressourcerne på at stille data til rådighed i rå form, og så må du selv sørge for at binde adresser og relevante felter fra grunde, bygninger og enheder sammen.

  • 2
  • 0
#19 Hans Schou

Hvorfor skulle det dog gøre nogen forskel om semikolon optræder inde i values?

'cut' er en linje-baseret splitter, og kan kun bruge et ét tegne som adskiller (delimiter). Så selv om der er gåseøjne (double qoutes) om værdien, så vil den alligevel blive splittet ved det semi-kolon som er i værdien (value).

En anden skrev ovenfor, at han havde lavet sin egen CSV-parser, og det kan jeg sagtens forstå, for det er noget værre rod. Kan man så regne med at den virker? Nej, jeg har set output hvor der var komma-decimal-tal og komma som delimiter, og det var ikke gåseøjne om tal-værdier. Det var helt umuligt for selv et menneske at parse. Så adskiller bør være et tegne der ikke forekommer i værdierne.

  • 0
  • 0
#20 Lars Tørnes Hansen

Smukt? Jamen, altså UTF-8 og ISO-8601 Strict. Det tegner godt. Hvis så semikolon kun er brugt som adskiller, og ikke optræder inde i values, så er det perfekt.

citat: "Hvorfor skulle det dog gøre nogen forskel om semikolon optræder inde i values?"

(ciat: "..." skal læses som en quote blok - af en eller anden grund virker quote-i-en-quote ikke længere på version2.dk

Fordi at en ";"-brik så har en tvetydig mening, og du bliver nødt til at bruge stærkere (og langsommere) parsing algoritmer.

For en ";"-brik med en tvetydig mening kan man løse det med:

  • altid læse flere brikker (tokens), og huske dem, så de ikke skal parses igen
  • og når du så kommer til ";"-brikken bruges så en predicate (true/false svar) funktion, der fortæller parseren om ";"-brikken er en del af / inde i en værdi, eller adskiller 2 værdier fra hinanden.
  • 0
  • 0
#24 Baldur Norddahl

Findes der en officiel vejledning i hvordan man parser CSV filerne?

Der er to steder hvor sekvensen "" forekommer.

Det ser ud til at filen kan parses efter følgende regler:

1) Hvis det første tegn i et felt er " så slutter feltet med "[;\n]. Alt indimellem skal tages med, uanset om det er " eller ; tegn. Sekvensen "; er ikke mulig i et felt så lad os håbe at ingen taster det ind.

2) Ellers så afsluttes feltet med [;\n].

CSV er ikke en egentlig standard så man er aldrig helt sikker på hvordan de har valgt at lave den.

  • 0
  • 0
#25 Niels Hansen

OIS-data (BBR mv.) har været "frie" siden 2001. Nu er de bare blevet "gratis" også. Før skulle man betale for leveringen, nu er de fragtfrie.

Jeg er med på at der nu er en øget tilgængelighed, men data har længe ikke været fortrolige.

  • 0
  • 0
#26 Kenneth Nielsen

Bare fordi at data er registreret hos det offentlige er det ikke det samme som at det er deres data

Man har som virksomhed alle dage kunnet købe disse oplysninger, og korrekt det er ikke tilladt at lave direkte markedsføring overfor kunder baseret f.eks på deres tagtype.

Men da data er til rådighed, finder jeg det utroligt interessant at lave diverse statistikker på dette, og bevares alt kan misbruges.

/Kenneth

  • 0
  • 0
#27 Gert Madsen

Jeg vil gerne forfægte en skilnen mellem det offentliges data, så som veje, offentlige toiletter, og den slags, og så privates data der af en eller anden årsag er kommet i det offentliges besiddelse.

Den første del er det fint at gøre frit tilgængeligt, men den anden del mener jeg kun bør offentliggøres i anonymiseret form.

Det kan så godt være informationen har været tilgængelige længe, men det ændrer egentligt ikke min holdning.

  • 0
  • 0
#28 Kenneth Nielsen

og så privates data der af en eller anden årsag er kommet i det offentliges besiddelse.

Anonymiseret form, det forstår jeg ikke hvordan du vil gøre, om en bygning har det ene eller det andet tag, kan jo ikke stå alene??? En bygning har jo en adresse og taget hører til en bygning?

Jamen, det er jo ikke sådan at data om din bolig er kommet i det offentliges besiddelse ved en fejl. Vi har alle dage haft pligt til at vedligeholde oplysninger om vores boliger/ejendomme i Bygge og Bolig Registeret, og alle disse oplysninger skal jo desuden oplyses ved enhver byggesag. Endvidere bruges data til at udregne din boligbeskatning, hvorfor der er mange der ikke "lige" har fået meldt at de har opført endnu et badeværelse eller inddraget tørreloft til beboelse, da ens ejendomsskater så ville stige.

Og hvori ligger det forfærdelige egentligt i at, jeg måske vil kunne trække data ud om at dine bygninger står på kampestens fundament, har eternittag og forøvrigt har en anden adgangsadresse end den der eroplyst via Krak?

Alle disse oplysninger har ligget tilgængelige på www.ois.dk, men det har ikke været muligt at lave masse udtræk, med mindre man købte hele eller dele af BBR databasen via en OIS distributør.

Data bør være frie ;)

Edit: Tilføjet passus om anonymitet.

/Kenneth

  • 0
  • 0
#29 Gert Madsen

Jeg er helt med på at disse data ikke er kommet der ved en tilfældighed, og der kan være gode grunde til at de er kommet i registeret.

Men det ændrer ikke rigtigt noget.

Jeg mener stadig at det er mine data, og ikke en eller anden styrelses. Der er ikke noget forfærdeligt i om nogen ved hvilke fliser jeg har valgt til mit badeværelse, eller hvor mange plumber jeg har i mine tænder. Men eftersom det er mine data, så er det nok at jeg synes at det ikke kommer nogen ved.

At få data i anonymiseret form giver information. At henføre dem direkte til privatboliger lugter af snageri.

  • 1
  • 0
Log ind eller Opret konto for at kommentere