VisitDenmark vil samle lokationsdata fra turister i ‘put and take data lake’

21. september 2018 kl. 05:1229
VisitDenmark vil samle lokationsdata fra turister i ‘put and take data lake’
Illustration: Aros, Aarhus kunstmuseum.
VisitDenmark undersøger mulighederne for at etablere en fælles data lake for turismeerhvervet i Danmark. Her kan lokationsdata og metadata om booking-præferencer hjælpe til at målrette markedsføringen mod udenlandske turister.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Er der forskel på hvad en tysk og amerikansk turist gerne vil opleve dagen efter de har været i Legoland, og hvilke interesser har nordmænd der tager færgen til Frederikshavn oftest?

Det er nogen af de spørgsmål som VisitDenmark gerne vil bruge en stor data lake til at besvare. Data lake-projektet er stadig i opstartsfasen, og netop nu undersøger turistorganisationen hvilke datakilder der potentielt kan inkluderes.

Ideen til en data lake opstod, da VisitDenmarks adm. direktør Jan Olsen besøgte Google sidste og så hvordan kunstig intelligens kan bruges til at målrette services.

»Turisme-erhvervet er i forvejen blandt de mest digitaliserede brancher i Danmark, hvor det meste planlægning foregår online. Så der genereres store datamængder, men vi udnytter dem ikke smart nok. Ideen er at samle eksisterende data fra operatører, bookingsider, vores egne data og andre datakilder, og se om vi kan finde sammenhænge vi ikke kan se i dag. Målet er tilbyde endnu bedre produkter og mere målrettet markedsføring til udenlandske turister,« siger Jan Olsen, adm. direktør i VisitDenmark.

Artiklen fortsætter efter annoncen

At projektet har fået titlen 'Put and take data lake' skal mest forstås som en metafor for turistbranchens behov for at kunne hente data ud om udenlandske turisters præferencer og bevægelsesmønstre.

Fra varehus til sø

VisitDenmark arbejder allerede i dag med data, men det foregår efter helt anden arkitektur og i et andet tempo.

»Traditionelt arbejder vi med datavarehuse, hvor vi bruger historiske data til eksempelvis at generere viden om værdien af turismeerhvervet for politikerne. Det kan være med spørgeskema-undersøgelser eller data fra vores portal, der årligt har omkring 12 millioner besøgende. Men her bruger vi kun strukturerede data og analysen tager tid. Vi fremlægger fx først 2017-data i 2018,« siger Jan Olsen.

Ideen med en datalake er, at virksomheder kan dumpe data fra mange forskellige kilder, og formater uden at tage hensyn til en prædefineret datamodel. Det hele kastes råt ned i søen. Det står i modsætning til den mere konventionelle datavarehus-arkitektur.

Artiklen fortsætter efter annoncen

»Fordelen ved at bruge en datalake i stedet for et varehus er, at vi kan anvende ustrukturerede data, fx fra bookingsystemer hos hoteller og feriehusudlejere, og kombinere med data fra besøgende på VisitDanmarks sider,« siger Jan Olsen.

Lokationsdata fra hele landet

Han vil eksempelvis gerne samle data om turisters bevægelsesmønstre rundt mellem de forskellige turistattraktioner i Danmark. Det sker i dag på forsøgsbasis flere steder i landet.

I Horsens har turistorganisationen Kystlandet opsat 28 sensorer i Horsens midtby der registrerer wifi-signaler fra mobiltelefoner for at kortlægge bevægelsesmønstre mellem butikker og turistattraktioner.

VisitDjursland siden sommeren 2017 har indhentet den samme type data fra 26 sensorer fordelt på naturområder, attraktioner, feriehusudlejere og byområder, mens VisitAarhus har købt aggregeret lokationsdata fra TDCs mobilmaster, for at kortlægge 90.000 udenlandske turisters færden i det østjyske.

»Hvis vi kan samle eksempelvis lokationsdata fra hele landet, kan vi måske se nogle sammenhænge, som ikke har været tydelige tidligere, hvor den data kun er opsamlet regionalt,« siger Jan Olsen.

»Behøver ikke data på individ-niveau«

Selvom det endnu ikke er defineret hvilke datakilder der kan bruges i datasøen, så har VisitDenmark allerede taget et fravalg. Persondata.

»Vi er i den første fase af projektet, hvor vi undersøger hvilke typer data vi kan indhente. Næste fase bliver at undersøge, hvordan vi kan behandle de datakilder. Vi håber at kunne går fra fase et til to i løbet af i år. Processen har været sat lidt tilbage, blandt på grund af implementeringen af de nye persondataregler, « siger Jan Olsen.

Han fortæller at udgangspunktet er, at datasøen ikke skal indeholde persondata, men i stedet være aggregeret eller anonyme data om eksempelvis turisters færden.

Artiklen fortsætter efter annoncen

»Det er de store strukturer vi vil prøve at finde sammenhænge i, og vi behøver ikke data på individ-niveau, men vi vil eksempelvis gerne vide hvad nationalitet eksempelvis betyder for hvordan udenlandske turister bruger vores tilbud og services. Så jeg er ikke bekymret for at udenlandske turister bliver skræmt af eller har indvendinger mod vores dataindsamling,« siger Jan Olsen.

Datasøen er endnu kun på tegnebrættet og VisitDenmark har derfor endnu ikke taget stilling til hvilke tekniske krav de vil stille til eventuelle leverandører af en ‘put and take datalake’.

Ideen om en ‘put and take datalake’ så første gang dagens lys som en del af regeringens digitale vækststrategi, der blev lanceret tilbage i januar i. Her står der:

»For at fremme brugen af data i virksomhederne og mellem virksomhederne og offentlige aktører vil regeringen etablere et forsøg med en put & take data-lake i turismeerhvervet, der skal samle og tilgængeliggøre data for virksomheder og offentlige aktører.«

29 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
29
26. september 2018 kl. 09:01

Så jeg vil hellere sige, at man ikke kan gå ud fra, at folk ikke gør idiotiske ting.

Enig, Bjarne Nielsen. Folk er nok sjældent idioter, når de gør idiotiske ting. De kan være uvidende (det sker sikkert ofte)- eller evt. beregnende. Det sidste tror jeg ret ofte er tilfældet på dette område. De går så ud fra, at vi andre er idioter. Og det skal vi så helst blive ved med at være, for ellers falder hele datakorthuset sammen.

28
26. september 2018 kl. 08:57

Nej, men det var ikke diskussionen - det var, om man kan gå ud fra, at folk ikke er idioter. Det kan man ikke.

Lige præcis. Med det væsentlige forhold, at man ikke behøver at være idiot for at gøre idiotiske ting - de virkeligt tåbelige ting kommer ofte fra kloge folk.

F.eks. tror jeg ikke på at VisitDanmark som udgangspunkt er dumme, men deres ide om en "data-lake" er godt nok imho idiotisk.

Så jeg vil hellere sige, at man ikke kan gå ud fra, at folk ikke gør idiotiske ting.

27
26. september 2018 kl. 08:53

Ikke særligt vigtig, for man kan alligevel ikke stole på resultaterne af en sådan undersøgelse.

Det er imho en utrolig vigtig observation, for vi ser mange "undersøgelser", hvor man "tvinger" folk til at svare (bemærk anførselstegn, for ofte er det formelt set "frivilligt", men det er bare bureaukratisk besværligt at udnytte den lovede frihed).

Dels er der de situationer, hvor vi bliver lovet anonymitet, men hvor den er svær at tro på. Så svarer folk ikke, hvad de oprigtigt mener, men i stedet, hvad de tror vil være det svar, som er mest konformt. Og vi træner allerede vores børn til det i regi af Trivselsundersøgelse mv. Bare det efterfølgende at skulle diskutere undersøgelsens resultater, og hvad man kan gøre ved det, er nok til at flytte svaret i den retning i næste runde - så har man nemlig afsløret, hvad det rigtige svar er, hvis man vil have positiv feedback.

Jeg var for mange år siden involveret i en undersøgelse, hvor man ikke bare spurgte om X, men også hvor vigtigt X var for dem. Det gav det tydelige (og vel forventelige) resultat, at hvis folk ikke er interesserede, så kan man ikke bruge deres svar til ret meget - så hiver de bare en standardholdning ned af hylden. Det "glemmer" man at korrigere for i mange undersøgelser.

Og lige præcis om medarbejdertilfredsundersøgelser har jeg en anekdote:

Vi skulle svare, så vi var flere, som bare svarede "5 ud af 5" på alt, for at få det overstået. Det fik vi at vide var useriøst.

Så svarede vi ærligt, og det affødte straks et krisemøde, hvor lederne spurgte, hvad de skulle gøre for at få et bedre svar (bemærk, det havde intet at gøre med finde ud af årsagen til svarene, det var udelukkende et spørgsmål om at få andre svar ... man var endda åbenlyst ude med bestikkelse som f.eks. en ekstraordinær "fest").

Så svarede vi "4 ud af 5" på alle spørgsmål, og hørte ikke mere til den undersøgelser. Lederne havde fået nogle plausible resultater, som de kunne vise frem, og vi fik fred. Hmm, jeg tror faktisk aldrig at vi fik den lovede ekstra "fest", nu hvor jeg tænker over det.

Moralen: du skal ikke svare sandt, du skal svare sandsynligt.

26
26. september 2018 kl. 07:07

Man kan ikke lave en elektronisk medarbejderundersøgelse som er 100% anonym og samtidigt ikke er åben for snyd.

Så skal man ikke love anonymitet og gøre resultater op på afdelingsniveau. Og hvor vigtig er evt. snyd i denne sammenhæng? Ikke særligt vigtig, for man kan alligevel ikke stole på resultaterne af en sådan undersøgelse. Hvordan tror du det opleves at blive afkrævet svar på en sådan, og vide, at man kan identificeres så let som ingenting, når man samtidig er i konflikt med sin ledelse?

Det er jo trivselsundersøgelserne om igen. Skal det forstås sådan, at du faktisk mener, at det er ok at lyve om anonymitet?

Der er intet i det du har skrevet som siger at løftet om anonymitet er brudt.

Jo, for jeg var ikke anonym på nogen måde - uanset hvad der blev lovet. Ellers må du godt forklare, hvad du mener med "anonymitet"? At man har fjernet navnet? Det kan jo sættes på igen så let som ingenting.

Og blot fordi man kan finde eksempler på idioti, så er det ikke det samme som at man ikke kan finde fornuftige løsninger.

Nej, men det var ikke diskussionen - det var, om man kan gå ud fra, at folk ikke er idioter. Det kan man ikke.

25
26. september 2018 kl. 00:52

Jeg synes nu (sorry), at det er dig, der blander tingene sammen - spørgsmålet var, om man kan stole på, at dem, der designer og omgås sådanne dataopsamlinger, uden videre kan frikendes for at være idioter.

Man kan ikke lave en elektronisk medarbejderundersøgelse som er 100% anonym og samtidigt ikke er åben for snyd. Hvis en papir undersøgelse skal være både anonym og nogenlunde snydesikker, så kræves der et setup i stil med et valg.

Blot det at du taster et ID ind eller der er nummer på dit spørgeskema, etc. er nok til at modtageren kan identificere dig. Pointen er at dem der modtager dine svar har en interesse i at modtagerne af personaleundersøgelsen ikke kan identificere enkeltpersoner. For ellers kommer der ingen svar næste år.

Jeg ved ikke, hvad der er værst - men under alle omstændigheder viser det, at man ikke kan tage den slags løfter om anonymitet for gode varer.

Der er intet i det du har skrevet som siger at løftet om anonymitet er brudt.

Men det er en anden snak. Jeg ønskede bare at illustrere at overdreven tillid kunne være malplaceret.

Selvfølgeligt skal man ikke bare have tillid. Det var heller ikke det jeg skrev. Der skal også kontrolforanstaltninger til. Og blot fordi man kan finde eksempler på idioti, så er det ikke det samme som at man ikke kan finde fornuftige løsninger. Vi holdt ikke op med at bygge atlanterhavsdampere da Titanic sank, vi holdt ikke op med at bygge jetfly da de første faldt ned som fluer. Vi fiksede fejlene og fortsatte ...

23
25. september 2018 kl. 11:00

Tager jeg fejl, eller var der her tale om særdeles følsomme sundhedsdata, Bjarne Nielsen? Og tager jeg fejl i, at der faktisk var tale om udlevering til et privat firma?

Nu er det nogen tid siden, men så vidt jeg husker, at så var der tale om en meget detaljeret oversigt over diagnosekoder. Og ja, der var tale om en udlevering til et oversøisk privat firma, hvis salgsafdeling efter sigende skulle bruge det til at vurdere om der var volumen i det danske marked for en markedsføringskampagne.

De behøvede næppe data i nær den detaljeringsgrad. Og hvorfor skulle vi dog være interesseret i at hjælpe dem på den måde?

Men det er en anden snak. Jeg ønskede bare at illustrere at overdreven tillid kunne være malplaceret.

22
25. september 2018 kl. 10:44
21
25. september 2018 kl. 10:40

Så går jeg ud fra at du enten selv producerer eller kvalitetskontrollerer hver en bid mad du spiser, hver en bygning du går ind i, hvert et fly du flyver i, etc.

Du har selvfølgelig fuldkommen ret i, at tillid er en forudsætning i mange relationer, og at mangel på tillid giver det, som økonomerne kalder "friktion", hvilket er den direkte modsætning til "win-win" - der er kun tabere. Men tillid er ikke noget, som man kan forlange eller forudsætte, det er noget, som man skal gøre sig fortjent til.

Det er mit klare indtryk, at der er betydelig mere respekt for kvalitet og sikkerhed indenfor fly-branchen. Jeg kender til folk, som har været i "baglokalet" hos fødevareproducenter, som konsekvent undgår visse fødevarer, så der burde jeg måske nok være mere skeptisk. Og specielt italianske broer skal man vist passe på.

Til gengæld har jeg kigget en aktoversigt over skulderen, hvor man uden blusel sagde, at man selvfølgelig ikke kunne udlevere det rå datasæt, men at man i stedet havde "aggregeret" data ved, at slå alle rækker med 1 eller 2 i sammen til "<3". Jeg er målløs.

Og det er desværre reglen snarere end undtagelsen. Så jeg vil - med Brian Mikkelsens herostratisk berømte ord - fastholde, at det er fuld fart frem med hovedet næsten under armen. Mindre fart, mere hoved, tak. Meget mindre fart, meget mere omtanke, faktisk.

20
25. september 2018 kl. 09:35

Tak for svar, Michael Cederberg.

Jeg synes nu (sorry), at det er dig, der blander tingene sammen - spørgsmålet var, om man kan stole på, at dem, der designer og omgås sådanne dataopsamlinger, uden videre kan frikendes for at være idioter. Og der viser mit eksempel, at det kan de ikke. Uanset om min arbejdsgiver har fået oplysningerne, så er disse data nu opsamlet på identificerbart niveau, og "nogen" har adgang til dem. Så enten er der "nogen" i designfasen, som er idioter, fordi de ikke ved, hvad de har med at gøre, eller også er der "nogen", som ikke spiller med åbne kort, når de lover anonymitet.

Jeg ved ikke, hvad der er værst - men under alle omstændigheder viser det, at man ikke kan tage den slags løfter om anonymitet for gode varer. Man er nødt til at tænke selv og efterprøve påstanden om anonymitet - og hvis den ikke holder ved nærmere eftersyn, skal man sætte foden ned, hårdt og bestemt. Man skal ikke lade sig nøje med et løfte.

19
25. september 2018 kl. 09:24

Næh, desværre viser erfaringen lige det modsatte. Der er fuld fart på, selvom det sker på en idiotisk måde.</p>
<p>Og det synspunkt baserer jeg desværre på konkrete observationer.

Så går jeg ud fra at du enten selv producerer eller kvalitetskontrollerer hver en bid mad du spiser, hver en bygning du går ind i, hvert et fly du flyver i, etc. Alle de ting der kan slå dig ihjel. De fleste andre har tillid til de mennesker der står bag samt de kontrol funktioner der er tilknyttet.

Jeg må holde med Bjarne Nielsen her - det er farligt at gå ud fra, at dem, der konstruerer disse dataopsamlinger ikke er idioter. Hvor sjovt er det lige at skulle udfylde en sådan medarbejdertilfredshedsundersøgelse, hvor man som den eneste i min faggruppe i afdelingen skulle anføre sin stilling og afdeling - sådan som jeg har oplevet i Region Hovedstaden?</p>
<p>Man føler sig ikke vanvittigt anonym - på trods af løftet om, at undersøgelsen var anonym.

Du blander tingene sammen. Din historie handler om opsamling af data. Min historie (og historien om VisitDenmark) handler om udlevering af data.

Jeg skal ikke kunne sige om din chef får udleveret data på person-niveau - det er i givet fald et brud på den aftale I åbenbart har - men jeg tvivler. Det virker som om du er ansat i det offentlige. Hele tanken om at offentlige ledere generelt får udleveret den slags er usandsynlig - man kan ikke holde den slags hemmeligt. Og jeg tvivler på at netop din leder er udvalgt til at modtage special information.

17
24. september 2018 kl. 13:14

At stole på, at man "selvfølgelig tænker sig om", kan være modigt.

Hvis vi går ud fra at alle er idioter så går alting i stå.

Jeg har gennem årene set resultater af adskillige medarbejdertilfredshedsundersøgelser. Dem der laver dem ved godt at folk ofte ikke vil være ærlige hvis enkeltpersoner kan genkendes.

Jeg må holde med Bjarne Nielsen her - det er farligt at gå ud fra, at dem, der konstruerer disse dataopsamlinger ikke er idioter. Hvor sjovt er det lige at skulle udfylde en sådan medarbejdertilfredshedsundersøgelse, hvor man som den eneste i min faggruppe i afdelingen skulle anføre sin stilling og afdeling - sådan som jeg har oplevet i Region Hovedstaden?

Man føler sig ikke vanvittigt anonym - på trods af løftet om, at undersøgelsen var anonym.

16
24. september 2018 kl. 13:04

Og for første halvår var der præcist tre, som havde "<5", resten havde "ingen".</p>
<p>Det er den slags "aggregering", som vi i praksis er oppe imod, og derfor synes jeg, at det er farligt at være sige, at individuel information forsvinder, når man aggregerer. Det kommer desværre an på.</p>
<p>Eller sagt på en anden måde: At stole på, at man "selvfølgelig tænker sig om", kan være modigt.

Hvis vi går ud fra at alle er idioter så går alting i stå. Jeg vil ikke gå til en fumlefingeret læge, jeg vil ikke køre over en bro som en håbløs ingeniør har bygget, jeg vil ikke spise mad som en skødesløs kok har lavet, etc. Samfundet bygger på et vist niveau af tillid og kontrol.

Jeg har gennem årene set resultater af adskillige medarbejdertilfredshedsundersøgelser. Dem der laver dem ved godt at folk ofte ikke vil være ærlige hvis enkeltpersoner kan genkendes. Derfor får man fx. ikke noget data hvis en gruppe er mindre end fx. 6 personer.

Pointen er at det ikke er en svær disciplin. Man kan lave et lille kompendium med regler. Og når data først er aggregeret så kan man lægge resultaterne offentligt frem (der er ikke længere noget hemmeligt ved data). På den måde kan enhver med en lille statistiker i maven analysere tallene og se hvorvidt det rent faktisk er muligt at identificere enkelt personer i materialet. Og så kan man rette ind de steder hvor der er lavet fejl.

15
24. september 2018 kl. 10:52

Men hvis man fx. runder alle antal ned til nærmeste 5 eller 10, så bliver det meget svært at identificere individer.

Vanskeligere, ja. Umiddelbart er jeg usikker på, om ikke du vil kunne udlede noget udfra, hvordan afrundingen konkret falder på tværs af summeringer. Specielt, hvis du kan få lov at spørge på flere måder. Men lad det ligge.

Man skal selvfølgeligt tænke sig om når man gør det.

Ja, netop.

I det tilfælde, som jeg har i tankerne, havde man ikke bare været præcis for 5 eller derover, man havde havde været så "venlig" at skelne imellem, ingen og mindre end 5.

  1. halvår: <5
  2. halvår: 5 Hele året: 8

Og for første halvår var der præcist tre, som havde "<5", resten havde "ingen".

Det er den slags "aggregering", som vi i praksis er oppe imod, og derfor synes jeg, at det er farligt at være sige, at individuel information forsvinder, når man aggregerer. Det kommer desværre an på.

Eller sagt på en anden måde: At stole på, at man "selvfølgelig tænker sig om", kan være modigt.

14
24. september 2018 kl. 09:58

Det kommer godt nok an på, hvordan du gør det. Og hvor tit. Og på hvor mange dimensioner.</p>
<p>Jeg har et eksempel på et offentligt tilgængeligt datasæt over følsomme sundhedsoplysninger, hvor man havde aggregeret på en måde, så andre bagefter kunne regne tilbage til oplysninger om enkelte individer.

Man skal selvfølgeligt tænke sig om når man gør det. Men hvis man fx. runder alle antal ned til nærmeste 5 eller 10, så bliver det meget svært at identificere individer. Danmarks Statistik har års erfaring med den slags. Der er så nok nogen der vil være kede af netop det, men sådan er det jo ... pointen er at en enkelt observation fra eller til ingen forskel gør på statistikken.

12
24. september 2018 kl. 08:35

I mine øjne er der intet problem med at søen indeholder aggregeret data - den slags data kan ikke bruges til tracking af individer.

Det kommer godt nok an på, hvordan du gør det. Og hvor tit. Og på hvor mange dimensioner.

Jeg har et eksempel på et offentligt tilgængeligt datasæt over følsomme sundhedsoplysninger, hvor man havde aggregeret på en måde, så andre bagefter kunne regne tilbage til oplysninger om enkelte individer.

10
21. september 2018 kl. 13:38

Jeg forstår ikke hvorfor en data-lake foretrækkes frem for et struktureret data-warehouse? Skal data ikke behandles og struktureres for at kunne bruges til analyse under alle omstændigheder?

For at lave et struktureret data-warehouse, så skal alt data struktureres og alignes (schema on write) - det kan være et meget stort projekt. I et ustruktureret datawarehouse, da skal data først struktureres når nogen har brug for det (schema on read). Dvs. at det bliver meget billigt at indsamle data og noget dyrere at bruge data. Specielt bliver det noget dyrere hvis mange bruger det samme data og derfor "schemaficeres" mange gange.

"Han fortæller at udgangspunktet er, at datasøen ikke skal indeholde persondata, men i stedet være aggregeret eller anonyme data om eksempelvis turisters færden."

I mine øjne er der intet problem med at søen indeholder aggregeret data - den slags data kan ikke bruges til tracking af individer. Anonymiseret data ender i praksis med ikke at være anonymiseret hvis det skal sammenholdes med andet data.

9
21. september 2018 kl. 12:32

Det er da ulækkert at vi gør sådan noget mod de folk som besøger Danmark. Jeg ville synes det var rigtig klamt hvis nogen gjorde det ved mig.

7
21. september 2018 kl. 09:32

... hvordan anonymiserer man data fra en turist fra f. eks. Nordkorea, hvis man beholder nationaliteten?

Det bliver godt nok op ad bakke hele vejen. Og dit eksempel er endda i kategorien "den et-benede fra Samsø", som ofte ses i rollen som stråmand (sangen går åbenbart på, at når man alligevel ikke kan beskytte alle, så behøver man ikke gøre sig særligt umage, hvilket er forkert på flere måder).

Og i praksis skal der langt mindre til, hvilket gør at jeg efterlades med et indtryk af at man ikke har forstået problemet (eller ikke det mindste ikke har tænkt særligt længe eller grundigt over det).

Det efterhånden kanoniske eksempel er nu over 10 år gammelt og var da Netflix offentliggjorde et datasæt, som var anonymiseret ... og andre så viste, at personer kunne reidentificeres ved at krydse oplysninger med de offentlige IMDb data: se f.eks. https://arxiv.org/abs/cs/0610105.

Og har du først fat i tråden, så er det bare at hive til.

6
21. september 2018 kl. 09:11

Og hvis man læser artiklen, så lyder det jo faktisk ikke til "kun" at være lokalisationsdata - der nævnes også f. eks. nationaltiet.

Bjarne Nielsen, du plejer at være skrap til at gennemskue den slags - hvordan anonymiserer man data fra en turist fra f. eks. Nordkorea, hvis man beholder nationaliteten?

Og kan man samle så enorme datamængder i en "put and take"-mudderpøl (det er mit indtryk af den slags), og stadig holde rimeligt styr på persondataens flugt over plankeværket?

5
21. september 2018 kl. 09:06

Faktisk er der vel ikke nogen anden kategori af data, som afslører mere om, hvem vi i virkeligheden er.

3
21. september 2018 kl. 08:28

"Han fortæller at udgangspunktet er, at datasøen ikke skal indeholde persondata, men i stedet være aggregeret eller anonyme data om eksempelvis turisters færden."

Hvis de kan fingerprinte en person, således at denne kan trackes mellem forskellige lokationer, så er det personoplysninger.

"En personoplysning er enhver form for information, der kan henføres til en bestemt person, også selv om personen kun kan identificeres, hvis oplysningen kombineres med andre oplysninger"https://www.datatilsynet.dk/generelt-om-databeskyttelse/hvad-er-personoplysninger/

"Almindelige personoplysninger kan behandles uden samtykke, hvis det er nødvendigt af hensyn til:

Er erhvervets interesse i at tjene penge en "legitim interesse, som ikke overgås af den registreredes interesser eller rettigheder"?

2
21. september 2018 kl. 08:20

Alarm alarm..... Min indre bullshit-detektor går i overload...

"Processen har været sat lidt tilbage, blandt på grund af implementeringen af de nye persondataregler, « siger Jan Olsen. Han fortæller at udgangspunktet er, at datasøen ikke skal indeholde persondata, men i stedet være aggregeret eller anonyme data om eksempelvis turisters færden."

Hvordan hænger det sammen? Hvis man ikke vil tilrane sig "persondata", hvor kommer GDPR så overhovedet ind i billedet? og beskrivelsen af projektet gør det meget svært at tro på, at det ikke er persondata, man er interesseret i. Eller måske arbejder man med en særdeles bekvem definition af begrebet "anonymitet"? Eks.: "Vi har undtaget pasnummeret....".

Mon ikke det allervigtigste ord i ovenstående historie er ordet "udgangspunktet"? Hvor går man så derfra? Mon man overhovedet kan øjne udgangspunktet i det fjerne, når man på et eller andet tidspunkt har fået etableret sin "Put and take"-sø?

Og regeringen ved man som vanligt, hvor man har: På erhvervets side - mod bogernes ret til privatliv.

FORBRYDERE MOD MENNESKEHEDEN!!

1
21. september 2018 kl. 08:11

Spørgsmål til data-nørderne: Jeg forstår ikke hvorfor en data-lake foretrækkes frem for et struktureret data-warehouse? Skal data ikke behandles og struktureres for at kunne bruges til analyse under alle omstændigheder? Ved at lave en lake hvor " virksomheder kan dumpe data fra mange forskellige kilder, og formater uden at tage hensyn til en prædefineret datamodel" flytter man vel bare byrden med at forstå og organisere til brugeren af data frem for at den ligger ved leverandøren af warehouse-løsningen?