Åbne offentlige data og privatliv: »Det er ikke nogen nem opgave«
I den offentlige sektor er der fokus på at åbne op for offentlige data, så diverse datasæt bliver tilgængelige online. Alle kan eksempelvis tilgå diverse data online i registre som CVR, Den Digitale Tinglysning, Skats motorregister, diverse kommunale data og så videre.
Men i takt med, at datasæt bliver tilgængelige online, øges risikoen umiddelbart også for, at data kan præsenteres på en måde, der kan ramme borgernes privatliv.
Eksempelvis var der i 2016 historien om, hvordan en person havde høstet data fra Tingbogen under den digitale Tinglysning, så det nu var direkte muligt at søge på personnavne i stedet for adresser.
Og i den forbindelse er der hele den generelle udfordring ved, at datasæt kan sammenkøres.
På den måde kan data fra myndighed x sammenkørt med data fra myndighed y måske pludselig sige en masse om en person, som slet ikke var meningen, da dataene blev gjort offentligt tilgængelige.
Lektor Christian Damsgaard Jensen, sektionen for cybersikkerhed på DTU, peger på, at det er svært at beskytte privatlivet, når der bliver åbnet op for data. Og det skal ses i lyset af, at beslutningerne om at åbne op for data ofte bliver truffet lokalt af en myndighed, altså en slags silotankegang.
»Hvis man taler med folk i sundhedssektoren, så lader de til at have en fornemmelse af, at hvis man fjerner navn og adresse og personnummer, men beholder postnummer og alder, måske helt ned på fødselsdag i data, så er det stadig anonyme data,« siger Christian Damsgaard Jensen, der deltager på eventet Infosecurity Denmark til maj i København i en keynotedebat med Digitaliseringsstyrelsen om privacy ved åbning af borgerdata (se nederst).
Mulige kandidater indsnævrer sig
Christian Damsgaard peger på, at det med viden om fødselsdag og et postnummer sagtens kan være muligt at finde frem til en person, da antallet af mulige kandidater, der passer på kriterierne i en kommune, kan vise sig at være begrænset.
Formålet med at åbne op for data fra det offentliges side er at skabe en ekstra værdi i forhold til, hvordan data kan anvendes. Og Christian Damsgaard Jensen peger i den forbindelse på, at denne værdi først bliver skabt, når data bliver sammenkørt med andre åbne datasæt.
»Det er jo en silobeslutning at åbne data, men man får kun værdi af de data, fordi man ikke tænker i silotankegangen. Så man frigiver data under en form for tænkning, velvidende at hele formålet med det er at bruge det under en anden form for tænkning. Og det virker jo lidt paradoksalt.«
Data i fremtiden
Og selvom en offentlig myndighed måtte gøre sig nok så mange overvejelser i forhold til privacy og hvilke attributter, der skal knyttes til et datasæt, når der åbnes op, så kan det være svært at kontrollere, hvordan data ender med at blive brugt.
»Jeg tror, det er utroligt svært. Dybest set handler det om, hvilke andre datasæt man kan lave fællesmængder med,« siger Christian Damsgaard Jensen.
I den forbindelse bruger han udtrykket ‘snitte', som her henviser til at reducere et datasæt ved at danne fællesmængde med et andet datasæt, hvor man ved, at det objekt, man søger, også er repræsenteret
»Problemet er, at muligheden for at snitte jo ikke kun er i forhold til de datasæt, der er i dag. Der kommer jo nye datasæt frem næste måned og til næste år. Og hvad de indeholder, kan vi jo ikke forudsige i dag. Så nogle af de måder, vi tænker om tingene i dag på, vil jo blive invaliderede. Og der kan ligge kopier.«
Drop det person-centriske
En løsning i forhold til at gøre sammenkøring af data mindre problematisk set fra et privacy-mæssigt perspektiv kunne ifølge Christian Damsgaard Jensen være i mindre grad at knytte data til personer.
»Hele den måde, vi tænker vore databaser på, med at vi skal have bundet ting op på en person - det kan godt være, vi skal prøve at binde det op på en anden måde. Hvis man gerne vil lave et nyt grunddata-system, så skulle man måske gå radikalt til værks og se på, hvordan man kunne knytte ting sammen, uden det er gennem personer, men så man kan få den samme værdi.«
Han peger på, at det også ville betyde, at når der eksempelvis sker et læk af data fra også private virksomheder, så vil værdien af sådanne data være mindre, hvis dataene ikke kan kobles til en person.
Og i den forbindelse fremhæver Christian Damsgaard Jensen cpr-nummeret, som mange data i både private og offentlige virksomheder bliver knyttet til, og i sagens natur er cpr-nummeret personhenførbart.
»Problemet er jo den måde, vi bruger cpr-nummeret på. Som autentifikationselement, samtidig med at vi bruger det som identifikation. Som identifikation skal vi give det til gud og hvermand, som autentifikation skal det være dybt hemmeligt,« siger Christian Damsgaard Jensen.
I forhold til, hvordan private og offentlige databaser så skal indrettes, hvis data generelt ikke skal være personhenførbare, fremhæver Christian Damsgaard Jensen mulighederne for, at borgerne selve kan vælge, hvordan de vil identificere sig over for forskellige aktører.
Digitaliseringsstyrelsen og Christian Damsgaard diskuterer sikkerhed for persondata i dataåbningen på Infosecurity Denmark 2017, som Version2 er medarrangør af.
Annonce:
Kom gratis med til Danmarks største IT-sikkerhedsevent!
Infosecurity, Europas mest populære IT-sikkerhedsevent, afholdes i Danmark den 3. og 4. maj 2017. 60 udstillere, 5 konferencesale og mere end 80 seminarer og caseoplæg fra ind- og udland. Læs mere her.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.