Snart bliver din mobil sporet, når du bruger undergrundsbanen i London
Sporing af smartphones kan fortælle rigtig meget om brugernes adfærd. Det kan blandt andet afsløre, hvor de bor, arbejder, handler, og hvem de besøger. Det kan også fortælle meget om, hvordan brugerne kommer de forskellige steder hen.
Dette ønsker Transport for London (TfL), som har ansvaret for den kollektive transport i den britiske hovedstaden, at udnytte for at kunne forbedre tjenesten knyttet til London Underground, også kaldet The Tube.
Wifi-enheder
Den 8. juli begynder TfL at indhente data fra alle enheder med wifi-understøttelse, som befinder sig på de omkring 260 undergrundsstationer i storbyområdet, som i dag tilbyder wifi-baseret internetadgang. Det oplyser TfL i en pressemeddelelse.
I dag bruges billetsystemet til at registrere, når passagererne ankommer og forlader undergrundsstationerne. Men disse data fortæller ingenting om, hvordan passagererne bevæger sig gennem stationen.
Dette kan derimod registreres af wifi-routere på stationen, så længe passagererne bærer på en enhed, hvor wifi er aktiveret.
MAC-adresser og anonymisering
Systemet, som er udviklet af TfL selv, vil registrere MAC-adressen (Media Access Control) på wifi-modulen i enheden. Dette sker uafhængigt af, om brugeren har koblet enheden på wifi-nettet eller ikke, men det er stort set kun enheder, som faktisk er koblet på TfL’s wifi, som kan give nogen meningsfyldt information.
Årsagen til dette er, at de fleste moderne enheder oplyser vilkårlige MAC-adresser til ukendte routere, ind til brugeren kobler enheden på wifi-nettet for første gang. Så vil enheden normalt opgive den faktiske MAC-adresse.
Dataene fra de ikke-autentifcerede enheder bliver ikke brugt i selve analysen. Det gør derimod den autentificerede enhed, altså dem, som har været eller er logget på TfL’s wifi-netværk. For at anonymisere brugerne bliver selve MAC-adressen ikke registreret. Før dataene lagres, benyttes det, som TfL kalder en automatisk, envejs ‘pseudonymiseringsproces’, formentlig en form for hashing.
For at være helt uberørt af systemet skal enhedens wifi slukkes.
Dataene, som processeres, er så tidspunktet, hvor hver af de autentificerede enheder blev registreret, og positionen på den router, som registrerede enheden.
Tidligere pilotprojekter
Dette kan blandt andet fortælle TfL, hvor lang tid enheden bruger på rejsen mellem forskellige stationer, hvilken rute som benyttes samt ventetiden i de travleste perioder.
TfL regner med at kunne drage nytte af de indsamlede data ret hurtigt. Noget af årsagen til dette er, at det ikke er første gang, TfL registrerer wifi-enheder på denne måde. I 2016 gennemførte de et begrænset pilotprojekt (pdf), som kørte i fire uger og var baseret på data fra 54 forskellige undergrundsstationer og mere end 509 millioner dataposter. Disse blev indsamlet fra 5,6 millioner enheder, som tilsammen udgjorde 42 millioner rejser.
Analysen af disse data viste blandt andet passagerer, som rejser mellem stationerne King's Cross St Pancras og Waterloo, benyttede mindst 18 forskellige ruter. Af disse var det omkring 40 procent, som ikke tog nogen af de to mest populære ruter.
Åbent API
Allerede senere i år begynder TfL at tilbyde kunderne data om trængslen på stationerne. Dette skal gøres på TfL's website og skal hjælpe kunderne med at planlægge rejser på tværs af London.
Der planlægges også tidligt varsel om ophobning af mennesker i billetområderne og på perronerne - noget, som skal give passagererne bedre mulighed for at ændre deres rute undervejs. Varslet skal foretages via websitet eller sociale medier.
Dataene skal også gøres tilgængelige gennem et frit tilgængeligt og åbent programmeringsinterface (API), som kan benyttes af både tredjeparter til at udvikle nye produkter og tjenester, inklusive mobilapps.
Derudover skal de ansatte ved stationerne få adgang til informationen og vil dermed kunne give passagererne bedre råd om, hvordan de enklest kan komme frem til rejsemålet.
TfL vil opsætte tydelige skilte i de berørte områder, hvor passagererne informeres om systemet, og om hvordan deres enheder kan undgå at blive registreret.
Stort ansvar
Lauren Sager Weinstein, datadirektør i TfL, siger i en pressemeddelelse, at fordelene med dette anonymiserede datasæt er enorme.
»Selv om jeg er begejstret over potentialet i dette nye datasæt, er jeg tilsvarende bevidst om ansvaret, som følger med det. Vi tager hver eneste kundes privacy ekstremt alvorlig og vil ikke identificere individer fra wifi-dataene, som indsamles. Dataarbejdet i samfundet skal være baseret på åbenhed, privacy og etik, og vi erkender, at tilliden, som kunderne giver os, og sikringen af kundernes data, er absolut fundamental,« siger Weinstein.
Arbejdet med systemet skal være foretaget i tæt samarbejde med det nationale datatilsyn i Storbritannien, Information Commissioner's Office.
Artiklen er fra digi.no.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.