Præciseret 30.06.2017 kl 12:00
Hvis du downloader Roskilde Festival-appen, er det første, du møder, en privacy policy, hvor det eneste du kan gøre for at komme videre, er at acceptere vilkårene. Accepterer du ikke disse, må du have fat i et gammeldags papirprogram, for appen kan du ikke bruge.
Med accept af appen giver du adgang til data som din IP-adresse, din telefons ID-nummer samt adgang til de tre apps Google Maps, Spotify og Facebook, og bidrager desuden til blandt andre IBM's big data-undersøgelser på Roskilde Festivalen.
Det er blandt andre analytic architect hos IBM Henrik Hammer Eliassen og 13 af hans kolleger fra IBM, som undersøger og fremstiller modeller om festivalgængernes adfærd.
»Det, vi lavede sidste år, var at visualisere, hvordan publikum bevæger sig rundt på festivalen med blot 5-6 sekunders forsinkelse. Det, vi gør i år, er at vi vil kigge ind i fremtiden. Vi vil ikke kun visualisere i realtid. Vi vil kunne forudse, hvad der sker,« siger han.
Bruger Spotify til at forudse koncertgængerantal
Det handler blandt andet om, at Henrik Hammer Eliassen ser på Spotify for at forsøge at forudsige, hvor mange deltagere der vil komme til en given koncert. Det beregner han ved at bruge en model, han fremstillede sidste år.
Her indsamlede han statistik om, hvor mange følgere de forskellige kunstnere har på Spotify og sammenkørte med data om, hvor mange deltagere der kom til koncerterne på Roskilde Festival 2016. Det viste en god sammenhæng mellem antal følgere og antal koncertgæster.
Sammen med de data, som IBM kan hive ud af festivalappen om, hvor mange likes - eller hjerter - de forskellige kunstnere har fået i Roskilde Festival-appen, mener Henrik Hammer Eliassen at kunne estimere et relativt præcist antal.
»Modellen bruges på 2017 line-uppet deres Spotifyfølgere samt en række andre faktorer som for eksempel scene og dag. Det giver os en forudsigelse af, hvor mange der kommer til en koncert. Roskilde Festival har en interesse i at kunne estimere et godt bud på, hvor mange deltagere der kommer til en koncert, og så hvor meget plads der er foran en given scene,« siger han.
Hvor meget af den data, som CBS Big Data-projektet indsamler, festivalen egentlig bruger, kan Henrik Hammer Eliassen ikke udtale sig om. Men han håber, at de vil tage nogle af de hjælpemidler, som blandt andre IBM er ved at udvikle, til sig »så de også får mulighed for at se ind i fremtiden«.
Data anonymiseres og gemmes
Der er endnu ikke tal på, hvor mange der har og vil downloade Roskilde Festival-appen, men Henrik Hammer Eliassen estimerer, at det er ca. 60-70 procent af festivalgængerne. Festivalen har ca. 130.000 gæster inklusive frivillige og partnere.
Alle de data, som Henrik Hammer Eliassen og hans kolleger modtager, er anonymiserede af festivalen, også Facebook og GPS-data.
Data for 2015 og 2016 er stadig gemt og også i anonymiseret form.
»Det er en stor fordel at have historiske data, da vi så kan se udvikling og tendenser gennem forskellige festivalår, og for eksempel også hvordan vejret påvirker festivalen,« siger Henrik Hammer Eliassen.
IBM oplyser, at de kun kan se tracking data anonymt via et ID, som genereres i appen, og som ikke kan henføres til en person. Der trackes desuden kun, når festivaldeltageren befinder sig på festivalens område.
Præcisering: IBM oplyser, at man ikke - som det tidligere fremgik - bruger Spotify- og Facebookdata indsamlet via Roskilde Festival-appen. IBM og CBS har adgang til lokationsdata, der af festivalen er anonymiserede inden de sendes videre. Derudover havde IBM sidste år også adgang til en statistik, der blev formet over, hvor mange brugere af appen, der havde markeret de forskellige bands med et lille hjerte.
Oplysninger om Spotify og Facebook er offentligt tilgængelige data. Det drejer sig blandt andet om, hvor mange følgere bands, bands der spiller på festivalen, har i Spotify, samt hvilken aktivitet der er på de forskellige bands sider på Facebook.
- emailE-mail
- linkKopier link

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.
Fortsæt din læsning
- Sortér efter chevron_right
- Trådet debat
Spændende læsning. Men...ifølge prediction modellen, ville Rüfüs få koncerten få flest publikum af alle koncerter! Hvad? Her mangler algoritmen vist lidt realitetsans, udover kun at se på Spotify afspilninger :-) Men interessante målte effekter
Som kommentar til påstanden om "anonymitet" kan man høre dette spændende og skræmmende indslag (efter ca. 20 minutter) på Radio24syv om privacy by design:https://www.radio24syv.dk/programmer/aflyttet/18221296/privacy-by-hvadfornoget
Her siges det direkte, at der lyves, når man i sådanne sammenhænge tales om anonymitet.
og når man ved, at de fleste unge - som Stig Nygaard (kender ikke din alder :-)) får læst de tilknyttede betingelser.<br />
Der skal selvfølgelig stå færreste unge!
Tvang er muligvis et forkert ord - men manipulation/vildledning/udnyttelse er vist ikke helt ved siden af, når man tager i betragtning, at man udnytter, at det er svært at klare sig i ungdomsverdenen, hvis man siger nej til sådanne "services", og når man ved, at de fleste unge - som Stig Nygaard (kender ikke din alder :-)) får læst de tilknyttede betingelser. Og når de ud fra mine egne erfaringer er ret svært at få et klart billede af, hvad f.eks. CBS-projekterne egentligt indebærer (har ikke forsøgt mig hos Roskilde Festivalen endnu, da det jo - så vidt jeg har forstået - ikke er festivalen selv, der står for forskningen - kun dataindsamlingen).
Mit næste skridt - hvis jeg orker der - bliver at bede om at få oplyst, hvorledes data "anonymiseres", og på hvilke betingelser de udleveres til anden brug.
Jeg har ikke selv været på festivalen, så jeg kan desværre ikke selv bede om at få indsigt i, hvilke data festivalen og CBS opbevarer og indsamler om mig. Men jeg håber, at nogle festivalgæster finder på at bede om at få oplyst dette (det har man vel efter lovgivningen krav på at få oplyst?), så det kan blive klart, hvor meget man samler ind, hvem man giver data videre til, og til hvilke formål. For lige nu synes jeg ikke, at det ser ud til kun at være med henblik på at tilrettelægge selve festivalen bedre.
Jeg kan tage fejl - men lige nu får jeg indtryk af, at der også er andre kommercielle interesser, der snylter på de unges festiver - som nok ikke bliver klare over, at de har solgt deres privatliv.
PS, Stig: Har du det helt fint med, hvis nogen (CBS, festivalen, andre, du slet ikke ved noget om) tegner kort over din færden på festivalen og henter dine og dine venners private billeder (og kommunikation?), sådan som det kunne se ud til kan ske, at dømme efter powerpoint-præsentationen på side 15-16 ("We follow Stephen") i linket ovenfor? Vil du ikke føle dig trådt over tæerne og udnyttet, hvis det sker?
App'en har i øvrigt også settings hvor man kan slå "Use of data" samt "Location reporting" til/fra. Så, tvang synes jeg bestemt ikke der er meget af.
Med hensyn hvad præcis jeg så da jeg installerede (og om det var i app'en eller jeg har læst om projektet andre steder), husker jeg ikke helt præcist må jeg indrømme. Jeg har nok godt været klar over big-data projektets eksistens i et par år.
Jeg synes, at det er en ret overfladisk åbenhed. Jeg har forsøgt at få præciseret, hvad det egentligt er, de gør med data, men det er ikke rigtigt til at få oplyst. Det bliver meget vagt - men det lader til ikke bare at være til samfundsgavnlig forskning, men også til marketing o.l.husker det da som om Roskilde er ret åbne omkring deres big data projekt og indsamling af data.
Og fra en af projektlederne fra CBS, Per Østergaard Jacobsen, har jeg fået det svar (sådan som jeg forstår det), at man får anonymiserede data, men at man samkører disse med personhenførbare data, som man "scraper" fra de sociale medier som Facebook, Twitter etc. I følge Per Østergaard Jacobsen kræver det ikke anmeldelse til Datatilsynet og tilladelse til at hente personhenførbare data ind i Big Data databaser via scraping fra de sociale medier. Jeg håber ikke, at han har ret.
Og se denne præsentation som Per Østergaard Jacobsen gav sidste år til en IBM-begivenhed: https://www-05.ibm.com/fi/businessconnect/assets/files/CBS_Per_Ostergaard_Jacobsen.pdf
Det ser da temmelig meget ud som om, at data bliver brugt til kommercielle formål - og det ser da også ud til, at de ikke forbliver anonymiserede ret længe, når først de er udleverede til f.eks. CBS-projekter. Se f.eks. s. 15-16.
Jeg er ikke helt sikker på, hvordan disse PowerPoints skal forstås - igen: Det er meget overfladisk beskrevet, hvad det egentligt går ud på - men det ser da ud til, at man via lokalisationsdata og disse scrapede data fra sociale medier ligefrem tracker gæsterne og henter deres billeder fra sociale medier, og på denne måde kan få et meget nærgående og præcist billede af de gæster, man måtte ønske at zoome ind på. Hvad hjælper det så, at data anonymiseres, inden de udleveres fra festivalens app?
Brugerbetingelserne knyttet til appen er ligeledes meget vage og vidtfavnende. Jeg kan ikke se, at de er ret mange begrænsninger på, hvad man må anvende data til, og hvilke data man må hente via appen.
Mon virkeligt de unge mennesker er klare over, at de kan blive kortlagt på så nærgående måde mens de fester og dummer sig, og at man ser ud til ligefrem at hente deres billeder?
Og hvorfor siger Roskilde Festivallen ja til dette? Får de ligefrem betaling for disse data?
Nu er det et stykke tid siden jeg installerede Roskilde app, men husker det da som om Roskilde er ret åbne omkring deres big data projekt og indsamling af data. Og jeg synes da kun det lød spændende og som noget jeg gerne ville bidrage til. Men du får jo også et "analogt" omfattende program som hæfte, og er på ingen måde tvunget til at installere app'en. Du går selvfølgelig glip af live opdateringer, men alt vigtigt information er også at finde i det officielle papir program.
Netop, Bjarne - det lyder også forkert i mine, men IANAL either, og det er utroligt svært at få greb om, hvad han faktisk siger IMHO. Det er muligt, at det er fordi, det simpelthen er kompliceret - men hvordan kan man så samtidig hævde, at man netop gør sign umage for at være "best in class" mht. gennemsigtighed, som det fremgår her?:https://www.cbs.dk/pressen/nyheder/paa-roskilde-festival-forskningens-tegn-0men det lyder helt forkert i mine ører!
I så fald siger det ikke så meget at være "best in class".
Som jeg har forstået det, indsamler og gemmer festivalen disse enorme mængder data i pesonhenførbar form, men giver dem kun videre i "anonymiseret" form. Men kan man faktisk i kraft af det givne tilsagn give dem videre i personhenførbar form, hvis man senere ønsker det (ikke at det sikkert gør den store forskel i praksis)?
Det lyder næsten som om, Roskilde Festival netop i kraft af sit greb om ungdommen og sit "brand" kan køre med klatten og indsamle alle disse personhenførbare data, og gemme den i årevis - og bruge dem senere, hvor ingen af de unge mennesker mere har styr på, hvad de egentligt har sagt ja til - på en måde, som facebook ville få store tæsk for.
Og som jeg læser tilsagnet, som Jesper Lund har linket til ovenfor, så indeholder det primært marketingsformål. Men de forskningsprojekter, som fremgår af Rio til Roskildes hjemmeside, er vel ikke kun "marketing"?
Hvis det virkeligt er det tilsagn, som anvendes i appen, så synes jeg, det er meget langt fra gennemskueligt for menigmand (og det er vel det vigtigste kriterium) - som man ellers brøster sig af at gøre sig umage med. For mig ligne det røgslør for noget mere.
Lad præcisere - SOME data hentes ikke fra app men fra Facebook, Instagram og Twitter hvor folk skriver om RF. Offentlige tilgængelige post der ikke kræver nogen form godkendelse.
Så man må godt opbygge detaljerede dossiers om konkrete personer bare man baserer det på OSINT? IANAL, men det lyder helt forkert i mine ører!
Og forskere burde om nogen anerkende, at der kan opstå unik ny viden, når man sammenstiller eksisterende kendt viden på en ny måde.
Oplysninger deles med et formål, og jeg synes personligt at det er forkert, hvis de frit kan bruges til helt andre, og i situationen helt uforudsigelige, formål. Specielt hvis man ikke kan være uvidende om, at det kan være sket i kådhed; hvor kynisk må man være?
Jeg har forsøgt at spørge til BigData forskningsprojekterne hos Rio til Roskilde. Det er garanteret min egen fejl, men jeg forstår simpelthen ikke de forklaringer, jeg har fået - det virker meget uklart og uafgrænset, hvad der egentlig gemmer sig i disse projekter - og det er åbenbart "a Work in Progress", hvor man ikke på nuværende tidspunkt kan vide, hvad man har sagt ja til. Den fortsatte korrespondance med Rio til Roskilde (se ovenfor) lyder:
"Hej. Tak for svar. Jeg er stadig mystificeret. Der står jo meget lidt konkret på hjemmesiden for Rio til Roskilde. Kan man finde en nærmere beskrivelse af de enkelte projekter nogen steder? Er der indgivet anmeldelser til Datatilsynet? Det ene af projekterne drejer sig om personlighedsprofilering af de frivillige. Indhenter man deres tilladelser til at hente deres facebook m.m. data? Hvor har de givet tilladelse til personlighedsprofileringer? Via appen? Det kan godt være, at Big Data kan forbedre sikkerheden, men det gør jo ikke disse sprøgsmål irrelevante. Og personlighedsprofilering af de frivillige har jo intet med sikkerhed at gøre - hvad kan man overhovedet bruge det til? Venlig hilsen Anne-Marie Krogsbøll"
"Per Østergaard Jacobsen skrev den 2017-06-30 08:43: Hej Nej - det er i working proces og findes kun i overskrift form. Vi har mange projekter i forhold til forskningspublikationer og alt efter data og observationer kan scope ændres. Omkring de frivillige ser vi på ord-analyser og ord-klynger der relater sig til frivillighed og Ankers projekt. Vi ser på om der er sammenhænge. Dette sker efter festivalen Vi ved endnu ikke om der er disse sammenhænge. Disse data er offentlig tilgængeligt via sociale medier (hvis man forstår at hente dem.) Det er er ikke relevant i forhold til datatilsynet. Ankers studie bygger på feltobservationer og interview. Der er ingen personhenførbare data. Omkring projekt med de frivillige profil kender jeg ikke detaljerne - Du kan se mere i Roskildes årsskrift (side 24-25) Med venlig hilsen / Best regards Per Østergaard Jacobsen Projektleder – Rio til Roskilde CBSwww.riotilroskilde.dk"
"Hej. Tak for svar. Jeg kan se, at jeg nok har svært ved helt at forstå konceptet. "Disse data er offentlig tilgængeligt via sociale medier (hvis man forstår at hente dem.) Et sidste spørgsmål: Jeg troede netop, at det er det, folk giver tilladelse til at hente via appen? Hvis ikke - hvad er så egentligt Roskilde Festivallens rolle i dette projekt? Feltstudier og interviews har jo ikke meget med Big Data at gøre. Det fremgår ikke af årsskriftet, hvorledes data er indsamlede, synes jeg. venlig hilsen Anne-Marie Krogsbøll"
"Hej Big Data kommer i mange formater og fra mange forskellige kilder, i struktureret form og ustruktureret form. / Feltdata og interview kan naturligvis indgå. Lad præcisere - SOME data hentes ikke fra app men fra Facebook, Instagram og Twitter hvor folk skriver om RF. Offentlige tilgængelige post der ikke kræver nogen form godkendelse. Check her betingelserne fra de respektive kanaler. Jeg kender ikke Ankers projekt i detaljer - men det er baseret på interview og felt studier. Med venlig hilsen / Best regards Per Østergaard Jacobsen Projektleder – Rio til Roskildewww.riotilroskilde.dk"
Som sagt: Det er sikkert min fejl, men jeg synes simpelthen, at svarene stikker i alle retninger og er selvmodsigende. Jeg kan ikke få dem til at hænge sammen. Måske kan andre gennemskue, hvilke af de på Rio til Roskildes hjemmeside nævnte BigData forskningsprojekter, der faktisk får data fra appen? Og er der to projekter (eller endnu flere), der specifikt beskæftiger sig med de frivillige? Det virker uklart, hvilke af projekterne, der faktisk hører under Rio til Roskilde, og hvilke der er enkeltmandsprojekter. Er det røgslør?
Jeg forstår ikke rigtigt, hvorfor projekter, der måske slet ikke har med appen at gøre (så vidt jeg forstår svaret), er nævnt på en side som eksempler på samarbejde mellem CBS og Roskilde Festival. At høste data fra facebook (som det nævnes) er vel ikke et samarbejde med Roskilde Festivalen? Eller måske sker det faktisk i samarbejde med festivalen - tilladelser fra gæsterne eller ej? Og bliver det så gjort i personhenførbar form? Hvilke regler gælder der der, hvis man blot scraper (er det ikke det, det hedder?) offentlig tilgængelige, men personhenførbare data fra sociale medier? Må man i så fald opbygge bigdata-databaser og profilere lige så lystigt, man har lyst til - også personhenførbart?
Og får projektet oplyst fra festivalen, hvem der er frivillige - en oplysning, man så kan arbejde videre med ved at scrape de sociale medier til brug for denne profilering? Hvordan kan CBS ellers vide, hvem der er frivillige? I givet fald: Er det lovligt at gøre uden de involveredes tilladelse?
Den ansvarlige professor for projektet udtaler: "- Det er i dag helt umuligt at 'stay off the grid', det vil have en stor effekt på kvaliteten af dit liv. I stedet for skal du være opmærksom på de tilladelser, du giver, når du downloader app's og sætter dine privatlivsindstillinger. Du kan ikke stole på virksomhederne, og lovgivningen er langsom med at følge med, advarer Ravi."https://www.cbs.dk/pressen/nyheder/paa-roskilde-festival-forskningens-tegn-0
I så fald er det jo uheldigt, at det er så uigennemskueligt, hvad det egentligt går ud på, at selv Rio til Roskildes egne folk har svært ved (for mig at se) at forklare det.
God advarende kronik om emnet i Politiken lørdag (kræver desværre abonnement):https://politiken.dk/debat/kroniken/art6018222/Facebook-ved-om-du-er-glad-trist-eller-stresset-og-de-kan-udnytte-det-og-manipulere-dig
Det gør ingen forskel i forhold til "anonymitet". Det er pseudonyme persondata, som minimum sålænge der kan ske sammenkædning med nye data.
Mit indlæg var alene et bud på en forklaring på, hvordan man rent teknisk kan identificere/genkende brugeren (installationen) uden at kende selve telefonens ID.
Here we go again... påstande om "anonymitet", der ikke holder. Fra folk, der har en personlig interesse i at mene, at de arbejder med "ikke personhenførbare data".
Hvis vi - for argumentets skyld - antager at der er indsamlet oplysninger med løfte om anonymitet og at de oplysninger som antydet i brugsbetingelserne er overgivet til andre i bearbejdet form, men at der sandsynligvis desværre er tale om oplysninger som omfatter fysiske personer, som stadig er identificerbare ... hvilke muligheder er der så for at påtale dette? Lad os for argumentet skyld også antage, at det fastholdes af disse andre, at oplysninger er anonyme og at der ingen mulighed længere er for at identificere en.
- Skal man kunne sandsynliggøre at man personligt er omfattet af indsamlingen?
- Skal man kunne sandsynliggøre at man personligt er identificerbar?
- Skal "de andre" uddybe deres påstand om anonymitet?
- Hvilke muligheder ville man have for at få rettet op på det?
- Hvem skulle man henvende sig til?
Kort sagt, hvor står vi henne, hvis det skulle ske?
PS: Betyder det i den sammenhæng noget, om der er væsentlige samfundsmæssige interesser på spil, som f.eks. invaliderende sygdom, eller om der bare er tale om at optimere toiletkøernes længde på en festival?
Tak, Jesper Lund.
Men jeg kan ikke se, at der fremgår formål som profilering i personlighedstyper i forskningsøjemed?
Har man styr på tilladelserne til alle projekterne? Ved de frivillige, at de bliver profilerede?
Brugerne af Roskilde app'en klikker ja til nogle Facebook-lignende brugerbetingelser, hvor de giver "samtykke" til at data kan deles med stort set hvem som helst til stort set alle mulige formål.https://s3.amazonaws.com/external-greencopper/privacy_policy/index_da.html
Link er fra app'ens Google Play side.
Here we go again... påstande om "anonymitet", der ikke holder.
Ja, og jeg har mærkeligt nok fået dette svar på mit opfølgende spørgsmål:
"*Fra: annemarie Sendt: 29-06-2017 17:19 Til: Per Østergaard Jacobsen Emne: Re: SV: spørgsmål til Rio-projekt"Hej Per. Tak for svar. Nu er jeg forvirret. Bygger de opremsede 7 projekter slet ikke på data indsamlede med appen? https://riotilroskilde.dk/Hvor kommer data til disse Big Data projekter så fra? Venlig hilsen Anne-Marie Krogsbøll"
"SV: SV: spørgsmål til Rio-projekt
Afsender Per Østergaard Jacobsen
Modtager annemarie
Dato I dag 17:45
Nej ikke alle sammen
Mvh.
Per"
Jeg er mystificeret ... Er disse projekter BigData-projekter i forbindelse med appen eller er de ikke? Ser det ikke sådan ud på hjemmesiden? https://riotilroskilde.dk/Hvilke andre BigData-projekter er der på Roskilde?
Jeg beklager, hvis det er mig, der har misforstået det hele - men hvis det ikke er det, så begynder det at "lugte" lidt. Har man styr på tilladelserne til alle projekterne? Ved de frivillige, at de bliver profilerede?
Baseret på ikke personhenførbare data.
Here we go again... påstande om "anonymitet", der ikke holder. Fra folk, der har en personlig interesse i at mene, at de arbejder med "ikke personhenførbare data".
Ellers er jeg enig i at det burde være muligt at downloade Roskilde app'en og få fordelene når man nu allerede har betalt indgang, uden at man skal tvinges til at bidrage med viden, anonymt eller ej - og første led i den kæde er i hvert fald IKKE anonymt
Det er faktisk bare med til at gøre det sådan endnu mere lumsk at man har betalt for indgangen. Det sjove er jo at app'en burde være væsentligt billigere end et papirprogram, som iøvrigt også belaster miljøet (mange ender sikkert lynhurtigt i smatten...)
Ja, netop, Robbert Winther. Det er der, hvor jeg synes, at man omgås sandheden lidt "frit", når man forsøger at berolige folk med, at man ikke får telefonernes ID, for det er jo i virkeligheden irrelevant, så vidt jeg kan forstå, man kan identificere ejeren ad andre veje.Man kan identificere på andet et telefonens ID. App'en kan fx. generere et ID som så kan bruges til at identifikation af brugen.
Det er måske et spørgsmål, jeg kan foreslå journalisten at følge op med: En ting er, at man kun må modtage "anonyme" data fra Roskildefestivalen. Men gør man efterfølgende noget for at afanonymisere data? Eller sker det, at man ved et tilfælde/uheld kommer til at identificere konkrete personer? Og sælger man materialet og resultaterne af forskningen? Hvad er f.eks. IBM's rettigheder i dette. Kommer IBM/Watson til at "eje" de data, som man behandler i Watson? Har IBM ret til at genanvende disse data i andre sammenhænge?
Og hvor behandles disse data - udelukkende herhjemme eller også i udlandet? I øvrigt fra artiklen:"din IP-adresse, din telefons ID-nummer samt adgang til de tre apps Google Maps, Spotify og Facebook, og bidrager desuden til blandt andre IBM's big data-undersøgelser på Roskilde Festivalen." Ret omfattende, synes jeg - hvordan man kan kalde det "anonymiseret" - det er mig en gåde.
Jeg troede ikke, at de får telefonens ID i følge interviewet i Radio24syv? Måske husker jeg forkert.
Mht. projekterne nævnt her https://riotilroskilde.dk/, så er jeg lige nu lidt forvirret. Jeg har fået dette svar derfra:
"Til Rio til Roskilde. I anfører bl.a. dette projekt: Project #6: Volunteers profile and movements Kan jeg få oplyst, hvorledes I rekrutterer disse frivillige? Er man frivillig, hvis man siger ja til appens betingelser? venlig hilsen Anne-Marie Krogsbøll"
"Hej Nej - Vi har intet med de frivillige at gøre. Roskilde Festival har anmodet deres frivillige om at angive dette ved download. Vi modtager p.t. ikke disse informationer. Spørgsmål om App bedes rettet til festivalen. I vores forskning oversigt refereres der til et helt andet projekt med professor Anker Brink Lund, CBS. Han har studeret det sociale liv blandt frivillige på Roskilde Festival. Altså alle dem som får mulighed for at deltage gratis på festivalen mod at lægge en arbejdsindsats enten i en drinksbod, på scenerne, som vagt eller nogle af de mange andre funktioner som sådan en kæmpe non-profit festival har behov for. Brink Lund har i Roskildes årsskrift (side 24-25) opdelt de frivillige i fire arketyper inspireret af The Simpsons. Lisa; pligtopfyldende og yder en ekstra indsats for reel medindflydelse. Bart; leverer minimalt med arbejde for ellers at feste. Homer; selskabelig og holder sig til ét bestemt frivillig-"sjak" uden for alvor at være interesseret i resten af festivalen. Marge; foreningsfrivillig og kommer for at tjene penge til sin forening – ikke for musikkens skyld. Vi arbejder generelt med forskning i dette projekt som skaber værdi for såvel samfund som borgere. Baseret på ikke personhenførbare data. Med venlig hilsen / Best regards"
Så nu er jeg lidt forvirret - måske er det ikke alle projekterne i Rio til Roskilde, der anvender data fra appen? Så forstår jeg ikke helt, hvad det projekt har med Big Data i Roskilde at gøre. Der må åbenbart være andre Big Data kilder der. Men de har i hvert fald IBM som samarbejdspartner. https://riotilroskilde.dk/partners/
Man kan identificere på andet et telefonens ID. App'en kan fx. generere et ID som så kan bruges til at identifikation af brugen.
Det gør ingen forskel i forhold til "anonymitet". Det er pseudonyme persondata, som minimum sålænge der kan ske sammenkædning med nye data.
Kravene til anonymitet er beskrevet i forordningens betragtning 26. Her skal man være opmærksom på at "alle midler tages i betragtning, der med rimelighed kan tænkes bragt i anvendelse af den dataansvarlige eller en anden person til direkte eller indirekte at identificere, herunder udpege, den pågældende" afhænger af de teknologiske muligheder for re-identifikation, som løbende vokser.
Mængden af hvad der kan anses for at være anonyme data vil således blive mindre og mindre år for år.
Der er desværre alt for mange mennesker, som mener at data er anonyme blot personens navn eller telefonnummer ikke optræder. IMO ses det synspunkt især hos personer (fx folk i big data industrien) som har en økonomisk interesse i at mene dette.
Det fremføres, at dataene ikke er personhenførbare, og at man ikke får telefonens id. Hvordan kan man så bruge lokalisationsdata til at følge folks bevægelser rundt på pladsen (som jeg forstår det), for det kræver vel, at man kan identificere de enkelte telefoner?
Man kan identificere på andet et telefonens ID. App'en kan fx. generere et ID som så kan bruges til at identifikation af brugen.
Jesper, hvilke ord skal vi så bruge i stedet? Idenficeret/idenficerbar?
Uddrag af betragtning 26 i forordningen
Principperne for databeskyttelse bør gælde for enhver information om en identificeret eller identificerbar fysisk person. Personoplysninger, der har været genstand for pseudonymisering, og som kan henføres til en fysisk person ved brug af supplerende oplysninger, bør anses for at være oplysninger om en identificerbar fysisk person. For at afgøre, om en fysisk person er identificerbar, bør alle midler tages i betragtning, der med rimelighed kan tænkes bragt i anvendelse af den dataansvarlige eller en anden person til direkte eller indirekte at identificere, herunder udpege, den pågældende. For at fastslå, om midler med rimelighed kan tænkes bragt i anvendelse til at identificere en fysisk person, bør alle objektive forhold tages i betragtning, såsom omkostninger ved og tid der er nødvendig til identifikation, under hensyntagen til den tilgængelige teknologi på behandlingstidspunktet og den teknologiske udvikling.
Pseudonyme personoplysninger (hvor henføring til en fysisk person kræver yderligere oplysninger) er også personoplysninger i forordningens forstand, fordi det er oplysninger vedrørende en identificeret og identificerbar person.
Ordene "identificeret og identificerbar" optræder også i det nuværende direktiv 95/46 og persondataloven. Så pseudonyme oplysninger (om en identificerbar person) er også personoplysninger i dag. Det fremgår fx af Breyer-dommen C-582/14, hvor en dynamisk IP-adresse er en personoplysning, også selv om det kræver yderligere oplysninger fra en internetudbyder for at henføre IP-adressen til en person.
Det nye i forordningen er at visse krav i forordningen lempes, hvis den dataansvarlige behandler pseudonyme data (fx oplysningspligter ved brug på datasikkerheden) og at artikel 25 om databeskyttelse gennem design kan indebære et krav om pseudonymisering.
Anonymitet har faktisk en meget præcis definition i persondatalovgivningen, og især fra 25. maj 2018 skal man være varsom med at bruge dette ord.
Jesper, hvilke ord skal vi så bruge i stedet? Idenficeret/idenficerbar?
Og hvordan med pseudonymiseret, som jo er nævnt et par gange i GPDR?
Og der skal ikke mere til, end at nogen har postet et billede med passende metadata (hvad faktisk er meget almindeligt), hvor du kan genkendes. Så jeg behøver ikke engang have været på stedet og set dig (og måske er du allerede blevet tagget af dine venner, så jeg behøver faktisk ikke engang selv kunne genkende dig).
Uha, sådan noget ville jo komme frem, hvis man havde lavet en ordentlig konsekvensanalyse vedr. databeskyttelse.
Det er meget bedre at stikke hovedet i busken og påstå at databehandlingen er helt sikkert og anonymt.
Uden big data kan vi jo ikke vide hvor mange der er til de enkelte koncerter. Gad vide hvad arrangørerne gjorde før alle deltagerne rendte rundt med digitale tracking devices?
Det begynder jo at ligne, at man direkte lyver om, at personhenførbarheden....? Eller taler man bare juristsprog?Fx projektet Geographies of Being, Sharing and Feeling, som er analyse af en kombination af gps-data, hvad gæster deler på sociale medier og en vurdering af, hvordan de føler imens.
Det fremgår sikkert af appen, at der i et eller andet omfang samles data om brugeren (til marketingformål etc?) - men fremgår det også klart og tydeligt, hvis man indsamler, samkører og profilerer i en grad, så anonymiteten måske (som man kan mistænke) i praksis forsvinder? Fremgår det klart og tydeligt, at "Ja, hvis du siger "ja", overvåger og profilerer vi dig og dine venner - det kan vi godt, selv om vi modtager data såkaldt "anonymt", og ikke har telefonens IMEI-nummer") (hvis det faktisk er det, der er tale om).
Er det egentligt lovligt at afanonymisere data (barneleg for Watson), som man har modtaget anonymiserede? Det har jeg faktisk ikke spekuleret over før nu.
Det giver INGEN mening at tale om anonymitet, når der sker en konstant dataindsamling vedrørende en person på en sådan måde, at nye oplysninger kan sammenkædes med de allerede eksisterende personoplysninger.
Udover dette har Roskilde app'en adgang til oplysninger fra personens Facebook app, og du er ikke anonym på Facebook.
En af deres samarbejdspartnere skriverhttps://www.cbs.dk/pressen/nyheder/paa-roskilde-festival-forskningens-tegn-0
Fx projektet Geographies of Being, Sharing and Feeling, som er analyse af en kombination af gps-data, hvad gæster deler på sociale medier og en vurdering af, hvordan de føler imens.
Hvor du er, hvad du deler på sociale medier, og hvad du føler imens. Helt anonymt...
Det kan ganske enkelt ikke lade sig gøre. Der menes nok en eller anden form for post-anonymisering, hvor de på et tidspunkt ændrer nogle ID-værdier, så der ikke uden videre kan samkøres med nye oplysninger.
Det vil nu stadig være pseudonymt.
Anonymitet har faktisk en meget præcis definition i persondatalovgivningen, og især fra 25. maj 2018 skal man være varsom med at bruge dette ord.
Men hvis nogen ser at du står på GPS koordinat XYZ, kan alt hvad der er registreret om din pseudonyme identitet henføres til dig.
Og der skal ikke mere til, end at nogen har postet et billede med passende metadata (hvad faktisk er meget almindeligt), hvor du kan genkendes. Så jeg behøver ikke engang have været på stedet og set dig (og måske er du allerede blevet tagget af dine venner, så jeg behøver faktisk ikke engang selv kunne genkende dig).
Gustent.
Tak for svar, Jesper Lund
Ja, det anede mig .....Det giver INGEN mening at tale om anonymitet, når der sker en konstant dataindsamling vedrørende en person på en sådan måde, at nye oplysninger kan sammenkædes med de allerede eksisterende personoplysninger.
Fandt dette på projektets hjemmeside:" •Project #1: Geographies of Being, Sharing and Feeling (RF-Social) •Project #2: Roskilde Festival Time Use Analysis (RF-Time) •Project #3: Human Physical Mobility at Roskilde Festival (RF-Movement) •Project #4: Roskilde Festival User Cluster (RF-Clusters) •Project #5: Roskilde Festival Predictive Analytics (RF-Meyers-Predict) •Project #6: Volunteers profile and movements •Project #7: iPhone versus Android (use, movements and attitudes) "https://riotilroskilde.dk/
Hvor mange af disse mål kan man reelt nå, hvis ikke man i et eller andet omfang kan holde sammen på de enkelte datasæt og køre dem sammen med andre datasæt?
Som sagt fik jeg fornemmelsen af, at man i et eller andet omfang belægger sine ord i udsendelsen for at sløre, i hvilket omfang man faktisk kan samkøre data og afanonymisere dem. Hvis det er rigtigt, synes jeg godt nok, det er groft. Hvis man vil forske i denne type data, må man være ærlig om, hvad det indebærer - ikke kun "juridisk" ærlig - men ærlig på en måde, så menigmand (eller menig-"ung" i dette tilfælde) faktisk forstår, hvad man siger.
Fra artiklen ovenfor:
"Alle de data, som Henrik Hammer Eliassen og hans kolleger modtager, er anonymiserede af festivalen, også Facebook og GPS-data."</p>
<p>Vil det sige, at man indsamler data i ikke-"anonymiseret" form, for derefter at give dem videre i "anonymiseret" form? I så fald: Ligger data stadig i ikke-"anonymiseret" form hos Roskilde Festivalen til evig arv og eje?
For at svare kort:
Det giver INGEN mening at tale om anonymitet, når der sker en konstant dataindsamling vedrørende en person på en sådan måde, at nye oplysninger kan sammenkædes med de allerede eksisterende personoplysninger.
Det er simpelthen misbrug af ordet "anonymitet". I bedste fald vil disse oplysningerne være pseudonyme, dvs. at de ikke uden yderligere oplysninger direkte kan henføres til dig.
Men hvis nogen ser at du står på GPS koordinat XYZ, kan alt hvad der er registreret om din pseudonyme identitet henføres til dig.
Jeg har netop lyttet til Radio24syvs indslag om dette, og jeg må indrømme, at jeg ikke er overbevist. Jeg synes, at de personer, der interviewes om projektet, udtaler sig lidt tvetydigt.https://www.radio24syv.dk/programmer/aflyttet/17918965/hacker-eller-fejlfinderDet fremføres, at dataene ikke er personhenførbare, og at man ikke får telefonens id. Hvordan kan man så bruge lokalisationsdata til at følge folks bevægelser rundt på pladsen (som jeg forstår det), for det kræver vel, at man kan identificere de enkelte telefoner?
Direkte adspurgt svares der også noget med, at det ikke er en del af deres mandat at bruge identificerbare persondata - men hvis man fik tilladelse til det, så indrømmer man, at der er mange penge i det. Hvad betyder dette? Indhenter man faktisk disse data - men man bruger dem bare ikke, for det har man ikke tilladelse til?
Fra artiklen ovenfor:"Alle de data, som Henrik Hammer Eliassen og hans kolleger modtager, er anonymiserede af festivalen, også Facebook og GPS-data."
Vil det sige, at man indsamler data i ikke-"anonymiseret" form, for derefter at give dem videre i "anonymiseret" form? I så fald: Ligger data stadig i ikke-"anonymiseret" form hos Roskilde Festivalen til evig arv og eje?
Har det reelt betydning, om man har telefonens IMEI-nummer? Kan man ikke af-"anonymisere" ved samkøring med de opsamlede data fra de sociale medier, som indgår?
Jeg ved ikke, hvordan den slags fungerer, så dette er måske en vild tanke - men hvis man reelt giver tilladelse til, at ens færden og data på de sociale medier indsamles (jeg synes, det lyder sådan) - kan man så forestille sig, at også andet indhold på telefonen indsamles - eks. kontaktpersoner, opkaldslister etc.?
Jeg har ikke adgang til appen, så jeg ved ikke, præcist hvad det er, man giver tilladelse til. Men efter at have hørt udsendelsen sidder jeg tilbage med en fornemmelse af, at der er en masse , man gør sig umage for ikke at komme til at sige - at tingene bliver pakket lidt ind i det pæneste papir, man kan finde - og at man gør sig umage for ikke at komme til at sige "for meget".
https://www.nokia.com/en_int/phones/nokia-3310 så har man en tlf der rent faktisk er en tlf og ikke en mini pc der tilfældigvis kan ringe
Ellers er jeg enig i at det burde være muligt at downloade Roskilde app'en og få fordelene når man nu allerede har betalt indgang, uden at man skal tvinges til at bidrage med viden, anonymt eller ej - og første led i den kæde er i hvert fald IKKE anonymt
Men hvad skal være alternativet?
"Hvis du vil købe/leje/låne/bruge en vandcykel/bog/app/gryde, så må du overholde denne aftale" -- "Nej, jeg vil ikke overholde aftalen, men jeg vil gerne bruge gryden/vandcyklen alligevel!"
Det kan godt tænkes, at man kan give delvist tilsagn, og dermed opnå delvis brugsret og/eller funktionalitet (du må kun cykle 20m væk, og kun dreje til venstre", men det kan være vildt svært at få et produkt til at fungere/hænge sammen under sådanne restriktioner -- og det gør det næppe simplere at forstå aftalen.
Brugeraftale:
- krav A: giver adgang til J, ellers begrænsning S-U
- krav B: giver adgang til K og L, ellers begrænsning V
- krav C: giver adgang til M-R, ellers begrænsning X-Z
Hvilken kombination giver mening?
Det bliver der også - det hedder General Data Protection Regulation (EUs nye persondatalov) og træder i kraft 25. maj 2018.
Alt i alt lød det som om det er grebet ganske fornuftigt an.
Det må vi håbe. Det, som sker på Roskilde, skulle gerne blive på Roskilde. Selvom det selvfølgelig kunne være meget interessant at vide, hvem som sover med hvem - og hvor de mødte hinanden første gang. Festivallen kunne helt sikkert optimeres på det aspekt :-).
Så er anonymiseringen noget hjemmestrikket noget opfundet til lejligheden af Big Data folk, eller har der faktisk været rigtige sikkerhedsprofessionelle ind over?
Og hvis man virkelig tror på det, skulle man så ikke give data til folk, som faktisk forsker i anonymisering og datasikkerhed, og se, hvor meget de kan de-anonymisere - det ville der helt sikkert kunne komme noget god og samfundsnyttig viden ud af - og ikke kun til glæde for dem, som er på Roskilde i år.
Mine holdninger er selvfølgelig farvet af, at når ens udkomme og karriere afhænger af noget, så er det svært at være objektiv, selvom man har den bedste vilje. Mange af læserne her ved sikkert, hvor ringe udviklere som udgangspunkt er til test, og specielt når de er personligt involveret i produktet. Og jeg er sikker på, at det er på samme måde for statistikere og big data folk mht. datasikkerhed og anonymisering.
Hvis du downloader Roskilde Festival-appen, er det første du møder en privacy policy, hvor det eneste du kan gøre, for at komme videre, er at acceptere vilkårene. Accepterer du ikke disse, må du have fat i et gammeldags papirprogram, for appen kan du ikke bruge.
Jeg synes at en sådan tvang burde forbydes ved lov. Problematikken er her at Hr. og Fru Jensen ikke kan overskue, hvad de siger ja til.
Jeg er med på, at når noget er gratis, så er du varen....
Har prøvet at lege med sikkerheden på min Android telefon, simpelthen skære ind til benet for, hvad de enkelte Apps må/ikke må. Telefonen bliver helt ubrugelig...
Nogen vil så argumentere at jeg "bare" kan købe en anden telefon. Jeg prøvede det samme på min bedre halvdels iPhone. Det er fuldstændigt det samme. Jeg har med andre ord ingen valg end at lade systemerne "suge" oplysninger om mig til højre og venstre...
Ja, jeg kan så "bare" lade være med at bruge en telefon, vil nogen argumentere. Nej, det kan jeg ikke, får så kan man ikke fungere i det moderne samfund. Man bliver nærmest som en udstødt....
Jeg synes derfor der bør lovgives mod, hvilke ting man skal acceptere, hvis man vil bruge en App. Det vil gøre det mere sikkert for Hr. og Fru Jensen, som ikke på samme måde som mig, er klædt på til at forstå hvad og hvorledes....
Det er også omtalt i Aflyttet fra Radio247 i søndags.
Der er et glimrende interview i et af de seneste afsnit af podcasten Harddisken, som beskriver hele dette projekt i dybden, og blandt andet kommer ind på, at databehandlerne end ikke har adgang til telefonernes IMEI. Alt i alt lød det som om det er grebet ganske fornuftigt an.
Godt spørgsmål ... Spekulerer på hvordan anonymiserede GPS data ser ud ... Samt hvad der kan anonymiseres i Facebook data uden værdien går tabt. Men jeg håber da at app'en giver deltagerne "valuta for pengene" i forhold til det trykte program.