Keynote på Infosecurity: Anonymisering af masseindsamlede lokationsdata er en narresut

Det er relativt nemt at identificere et individ ud fra masseindsamlede lokationsdata, der i udgangspunktet påstås og lader til at være anonymiserede, lyder det fra lektor på Imperial College i London, der holder keynote på Version2 Infosecurity 2. maj.

Det er stærkt tvivlsomt, om brugernes privacy reelt er beskyttet, når myndigheder og it-leverandører lover at anonymisere lokationsdata, der opsamles fra apps, Google og wifi-tracking på smartphones.

Lektor Yves-Alexandre de Montjoye: Tro ikke på påstande om 'anonymisering' ved masseindsamling af lokationsdata. Illustration: Privatfoto/Twitter

Det har en af hovedtalerne på Version2s Infosecurity-konference, der finder sted 2. og 3. maj i København, lektor Yves-Alexandre de Montjoye, Imperial Collega i London, udtalt:

»Vi har allerede set så mange eksempler på datasæt, der er blevet solgt og re-identificeret, at vi ikke rigtig tror på de storskala-datasæt, der hævder at være anonyme – eller i det mindste mener vi, at der skal ses meget nøje på dem,« har Yves-Alexandre de Montjoye sagt til TechCrunch.

Han er også special advisor for EU's konkurrencekommissær, Margrethe Vestager. Til daglig underviser Yves-Alexandre de Montjoye i ’computational privacy’ på Imperial College’s Data Science Institute.

I Storbritannien har et forsøg med indsamling af lokationsdata via wifi og MAC-adresser fra passagerne i metroen, The Underground, været genstand for heftig debat.

Yves-Alexandre de Montjoye kalder debatten meget vanskelig ('really thorny').

»Data er som sådan ikke anonyme,« siger han.

»Det er ikke umuligt at re-identificere personer, hvis rådata blev gjort offentlige — det er meget sandsynligt, at man ville være i stand til at re-identificere individer i dette datasæt. Og helt ærligt, det ville heller ikke være så svært for TfL (Transport for London, red.) selv at matche disse data med f.eks. Oyster Card-data [Londons kontaktløse rejsekortsystem, der bruger TfL’s netværk, red.].«

»De siger også direkte, at de ikke gør det, men det ville ikke være svært for dem at gøre det.«

Yves-Alexandre de Montjoye har i årevis forsket i udfordringerne med beskyttelse af privacy, blandt andet set i lyset af den massive dataindsamling, der finder sted på en daglig basis om mange af os.

Og helt generelt vurderer han, at det er nemt at identificere et individ ud fra masseindsamlede lokationsdata, der i udgangspunktet lader til at være anonymiserede.

For at bevare anonymiteten kan en løsning være at indføre 'støj' i datasættene, men det er ikke nødvendigvis en enkel proces, hvis deanonymisering altså skal kunne forhindres.

Hør keynote med Yves-Alexandre de Montjoyes på Version Infosecurity i Øksnehallen onsdag d. 2. maj kl. 10.30-11-15, hvor han også vil komme ind på, hvordan der kan dæmmes op for problemerne med beskyttelse af privacy på den ene side og big data på den anden.
Læs mere her. Vil du gå direkte til tilmelding, klik her.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (5)
Maciej Szeliga

Hvis man bærer sig fornuftigt ad kan man gøre det meget omkostningstungt at re-identificere så det ikke kan betale sig


Jf. reklamebanchen så behøver de 5 uidentificerbare oplysninger kørt sammen for at identificere dig med rimelig sikkerhed - så den eneste måde at gøre det "omkostningstungt" er at lægge en høj afgift på samkøring af data fra anonymiserede kilder.

Bjarne Nielsen

Inden vi går alt for meget i løsningsmode, så skulle vi måske tænke lidt over problemet og de udfordringer det giver.

Lokationsdata er adfærdsdata. Det er meget nemmere at sige noget andet end man mener, end det er at ændre adfærd. Og hvis du ændrer adfærd, så har du ændret dig på en langt mere grundlæggende måde, end hvis du ikke siger det, som du ellers ville have sagt.

Kort sagt er det nemmere at lyve om den man er, end det er at løbe fra den man er. Det er også derfor, at metadata ofte er mere værdifulde end data.

For nogen tid siden advarede jeg imod, at den omsiggribende "selvbetjening" til vores sundhedsdata ville betyde at vi ville blive tilbageholdende med afgive vores oplysninger, og man derfor ville skyde sig selv i foden. Svaret var ganske arrogant: når du bliver syg nok, skal vi nok få de oplysningerne! Og det er sandt. Når jeg bliver syg nok, så er det ligegyldigt, hvad jeg siger - så er det nok at se på, hvad jeg gør.

Lokationsdata er derfor meget identificerende. Vi kan ikke lave om på, at vi tit er der, hvor vi bor, og hvor vi arbejder. Og at vi kommer på vores børn skole (og hvornår!) er også med til identificere os.

Vi kan måske godt prøve at snyde nogen, ved at bruge mere tid hos grønthandleren, men vi får ingen pizza eller burgere der. For det er vi nødt til at gå et andet sted hen. Vi vil også afsløre, hvem der er vores venner og bekendte, ved hvor vi er, medmindre vi er villige til at bryde enhver kontakt med dem.

Dine lokationsdata siger også, hvor tit eller sjældent du besøger dine forældre ... eller din ex. De fortæller også om du har fået en ny kæreste, og hvem det er, før du siger noget om det til dine venner eller din familie. Måske endda før du selv er klar over det. Tænk over det.

Og det er ikke noget, som vi sådan lige kan lave om på. Ikke medmindre at vi lægger vores liv om, og er vi så den samme? Og mindst lige så vigtigt: skal det virkelig være nødvendigt?

Maciej Szeliga

Afgifter er nøjagtig ligeså effektivt som ingenting at gøre. For statens agenter er fuldstændig upåvirkede af evt. afgifter. De sendes jo fra samme kasse som finansierer agenten.


Statens agenter har i forvejen adgang til dine data... de kan bare starte i CPR-registret, derfra har de unik nøgle til alle finansielle, uddannelses, sundhedsdata og så kan de fortsætte til teleselskaberne for at få resten.
Derfor er staten uden for scope - de har jo allerede alle data.

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017