Snart bliver din mobil sporet, når du bruger undergrundsbanen i London

Illustration: salajean/Bigstock
Skal give bedre tjenester.

Sporing af smartphones kan fortælle rigtig meget om brugernes adfærd. Det kan blandt andet afsløre, hvor de bor, arbejder, handler, og hvem de besøger. Det kan også fortælle meget om, hvordan brugerne kommer de forskellige steder hen.

Dette ønsker Transport for London (TfL), som har ansvaret for den kollektive transport i den britiske hovedstaden, at udnytte for at kunne forbedre tjenesten knyttet til London Underground, også kaldet The Tube.

Wifi-enheder

Den 8. juli begynder TfL at indhente data fra alle enheder med wifi-understøttelse, som befinder sig på de omkring 260 undergrundsstationer i storbyområdet, som i dag tilbyder wifi-baseret internetadgang. Det oplyser TfL i en pressemeddelelse.

I dag bruges billetsystemet til at registrere, når passagererne ankommer og forlader undergrundsstationerne. Men disse data fortæller ingenting om, hvordan passagererne bevæger sig gennem stationen.

Dette kan derimod registreres af wifi-routere på stationen, så længe passagererne bærer på en enhed, hvor wifi er aktiveret.

MAC-adresser og anonymisering

Systemet, som er udviklet af TfL selv, vil registrere MAC-adressen (Media Access Control) på wifi-modulen i enheden. Dette sker uafhængigt af, om brugeren har koblet enheden på wifi-nettet eller ikke, men det er stort set kun enheder, som faktisk er koblet på TfL’s wifi, som kan give nogen meningsfyldt information.

Årsagen til dette er, at de fleste moderne enheder oplyser vilkårlige MAC-adresser til ukendte routere, ind til brugeren kobler enheden på wifi-nettet for første gang. Så vil enheden normalt opgive den faktiske MAC-adresse.

Dataene fra de ikke-autentifcerede enheder bliver ikke brugt i selve analysen. Det gør derimod den autentificerede enhed, altså dem, som har været eller er logget på TfL’s wifi-netværk. For at anonymisere brugerne bliver selve MAC-adressen ikke registreret. Før dataene lagres, benyttes det, som TfL kalder en automatisk, envejs ‘pseudonymiseringsproces’, formentlig en form for hashing.

For at være helt uberørt af systemet skal enhedens wifi slukkes.

Dataene, som processeres, er så tidspunktet, hvor hver af de autentificerede enheder blev registreret, og positionen på den router, som registrerede enheden.

Tidligere pilotprojekter

Dette kan blandt andet fortælle TfL, hvor lang tid enheden bruger på rejsen mellem forskellige stationer, hvilken rute som benyttes samt ventetiden i de travleste perioder.

TfL regner med at kunne drage nytte af de indsamlede data ret hurtigt. Noget af årsagen til dette er, at det ikke er første gang, TfL registrerer wifi-enheder på denne måde. I 2016 gennemførte de et begrænset pilotprojekt (pdf), som kørte i fire uger og var baseret på data fra 54 forskellige undergrundsstationer og mere end 509 millioner dataposter. Disse blev indsamlet fra 5,6 millioner enheder, som tilsammen udgjorde 42 millioner rejser.

Analysen af disse data viste blandt andet passagerer, som rejser mellem stationerne King's Cross St Pancras og Waterloo, benyttede mindst 18 forskellige ruter. Af disse var det omkring 40 procent, som ikke tog nogen af de to mest populære ruter.

Åbent API

Allerede senere i år begynder TfL at tilbyde kunderne data om trængslen på stationerne. Dette skal gøres på TfL's website og skal hjælpe kunderne med at planlægge rejser på tværs af London.

Der planlægges også tidligt varsel om ophobning af mennesker i billetområderne og på perronerne - noget, som skal give passagererne bedre mulighed for at ændre deres rute undervejs. Varslet skal foretages via websitet eller sociale medier.

Dataene skal også gøres tilgængelige gennem et frit tilgængeligt og åbent programmeringsinterface (API), som kan benyttes af både tredjeparter til at udvikle nye produkter og tjenester, inklusive mobilapps.

Derudover skal de ansatte ved stationerne få adgang til informationen og vil dermed kunne give passagererne bedre råd om, hvordan de enklest kan komme frem til rejsemålet.

TfL vil opsætte tydelige skilte i de berørte områder, hvor passagererne informeres om systemet, og om hvordan deres enheder kan undgå at blive registreret.

Stort ansvar

Lauren Sager Weinstein, datadirektør i TfL, siger i en pressemeddelelse, at fordelene med dette anonymiserede datasæt er enorme.

»Selv om jeg er begejstret over potentialet i dette nye datasæt, er jeg tilsvarende bevidst om ansvaret, som følger med det. Vi tager hver eneste kundes privacy ekstremt alvorlig og vil ikke identificere individer fra wifi-dataene, som indsamles. Dataarbejdet i samfundet skal være baseret på åbenhed, privacy og etik, og vi erkender, at tilliden, som kunderne giver os, og sikringen af kundernes data, er absolut fundamental,« siger Weinstein.

Arbejdet med systemet skal være foretaget i tæt samarbejde med det nationale datatilsyn i Storbritannien, Information Commissioner's Office.

Artiklen er fra digi.no.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (9)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Hans Nielsen

"Dataene skal også gøres tilgængelige gennem et frit tilgængeligt og åbent programmeringsinterface (API), som kan benyttes af både tredjeparter til at udvikle nye produkter og tjenester, inklusive mobilapps."

og

" Vi tager hver eneste kundes privacy ekstremt alvorlig"

Da annonymitet ikke kan garanteres når man overlader noget til 3'part. Som vi så det i sagen med facebook cambridge analytica.

Men resultat kan vel blive, at den også vil bliver brugt vilkårlige MAC-adressernår man kobler sig på på wifi-nettet. Og mere brug af VPN og ligende. ?

Bjarne Nielsen

Hvorved adskiller dette sig fra den udvikling, som blev beskrevet i 2013 i dette medie:

https://www.version2.dk/artikel/saadan-afsloerer-mobilen-din-faerden-53398

Dengang (dvs. i 2013) bragte man flg. citat:

Blip Systems Blip Systems' BlipTrack anvendes i dag på vejen i 15 af de 20 største byer i Danmark, mange steder i udlandet samt i flere end 20 internationale lufthavne, herunder København. BlipTrack fungerer ved, at man placerer små sensorer på strategiske steder langs veje, i lufthavne eller ved andre transportcentre. Ved at spore Bluetooth og wifi-enheder såsom mobiltelefoner, tablets og håndfri systemer i biler, er det muligt at måle trafikken og beregne rejsetider.

Senere blev det genstand for en yderst erhvervsvenlig afgørelse fra Erhvervsstyrelsen.

(jeg mener, at det er politikernes opgave at sikre et sundt erhvervsliv for borgernes skyld, ikke på bekostning af borgerne - og det virker til, at det er kammet ganske meget over, ikke kun hos ERST, men på stort set alle politiske niveauer helt op til ministerrådet).

Anne-Marie Krogsbøll

"100 togbusser sparret
I et konkret projekt har DSB anvendt anonymiserede mobildata fra passagererne, for at identificere hvor i Valby togbusserne skulle sættes ind i forbindelse med et sporarbejde. Og de mange data fra passagererne var medvirkende til, at DSB kunne reducere antallet af togbusser med ca. 100, fordi man ved hjælp af data kunne sætte busserne ind præcis på de strækninger, hvor passagererne havde behov for det"

https://mst.dk/media/173776/microsoft_rapport_raekkefoelge.pd (s. 30)

ER det overhovedet lovligt herhjemme? Er det ikke ulovlig logning?

Henrik Madsen

Må man foreslå at bluetooth og wifi standarderne bliver lavet om så ens device ikke giver meningsfulde data ud til tilfældige routere og andre enheder den møder på sin vej.

Vi er vel reelt set nået dertil at hvis man vil bruge de her data på denne måde så må producenterne begynde at indbygge noget mac spoofing i deres enheder så telefonen har X forskellige MAC adresser den kan veksle imellem for at forhindre dette misbrug.

Simon Mikkelsen

Det kommer da helt an på hvilke data de stiller til rådighed. Jeg regner ikke med, at de frigiver de rå data, men kun oplysning om, hvor der er trængsel eller antallet af personer de forskellige steder, osv.

Det skriver de netop ikke. Det kan jo være at nogle får de agregerede data og andre de rå "anoniserede" data.

Personligt slår jeg wifi og bluebooth fra når jeg går hjemmefra. Der er formegentlig allerede butikker mm. der indsamler data på samme måde.

Henrik Madsen

Umiddelbart ville jeg gætte på at for de fleste personer vil blot på- og afstigningstid for en enkelt arbejdsdag på den lokale station være nok til at linke den pseudonymiserede MAC adresse en konkret person.

Man må håbe at de ikke udleverer ikke-aggregeret data.

Og ellers så klinker man lige en gang ansigt genkendelse på (selvfølgelig for at fange terrorister og pædofile) og vupti, så kan man hurtigt regne ud hvilket ansigt der passer til hvilken bluetooth eller WiFi profil.

Log ind eller Opret konto for at kommentere