Er der forskel på hvad en tysk og amerikansk turist gerne vil opleve dagen efter de har været i Legoland, og hvilke interesser har nordmænd der tager færgen til Frederikshavn oftest?
Det er nogen af de spørgsmål som VisitDenmark gerne vil bruge en stor data lake til at besvare. Data lake-projektet er stadig i opstartsfasen, og netop nu undersøger turistorganisationen hvilke datakilder der potentielt kan inkluderes.
Ideen til en data lake opstod, da VisitDenmarks adm. direktør Jan Olsen besøgte Google sidste og så hvordan kunstig intelligens kan bruges til at målrette services.
»Turisme-erhvervet er i forvejen blandt de mest digitaliserede brancher i Danmark, hvor det meste planlægning foregår online. Så der genereres store datamængder, men vi udnytter dem ikke smart nok. Ideen er at samle eksisterende data fra operatører, bookingsider, vores egne data og andre datakilder, og se om vi kan finde sammenhænge vi ikke kan se i dag. Målet er tilbyde endnu bedre produkter og mere målrettet markedsføring til udenlandske turister,« siger Jan Olsen, adm. direktør i VisitDenmark.
At projektet har fået titlen 'Put and take data lake' skal mest forstås som en metafor for turistbranchens behov for at kunne hente data ud om udenlandske turisters præferencer og bevægelsesmønstre.
Fra varehus til sø
VisitDenmark arbejder allerede i dag med data, men det foregår efter helt anden arkitektur og i et andet tempo.
»Traditionelt arbejder vi med datavarehuse, hvor vi bruger historiske data til eksempelvis at generere viden om værdien af turismeerhvervet for politikerne. Det kan være med spørgeskema-undersøgelser eller data fra vores portal, der årligt har omkring 12 millioner besøgende. Men her bruger vi kun strukturerede data og analysen tager tid. Vi fremlægger fx først 2017-data i 2018,« siger Jan Olsen.
Ideen med en datalake er, at virksomheder kan dumpe data fra mange forskellige kilder, og formater uden at tage hensyn til en prædefineret datamodel. Det hele kastes råt ned i søen. Det står i modsætning til den mere konventionelle datavarehus-arkitektur.
»Fordelen ved at bruge en datalake i stedet for et varehus er, at vi kan anvende ustrukturerede data, fx fra bookingsystemer hos hoteller og feriehusudlejere, og kombinere med data fra besøgende på VisitDanmarks sider,« siger Jan Olsen.
Lokationsdata fra hele landet
Han vil eksempelvis gerne samle data om turisters bevægelsesmønstre rundt mellem de forskellige turistattraktioner i Danmark. Det sker i dag på forsøgsbasis flere steder i landet.
I Horsens har turistorganisationen Kystlandet opsat 28 sensorer i Horsens midtby der registrerer wifi-signaler fra mobiltelefoner for at kortlægge bevægelsesmønstre mellem butikker og turistattraktioner.
VisitDjursland siden sommeren 2017 har indhentet den samme type data fra 26 sensorer fordelt på naturområder, attraktioner, feriehusudlejere og byområder, mens VisitAarhus har købt aggregeret lokationsdata fra TDCs mobilmaster, for at kortlægge 90.000 udenlandske turisters færden i det østjyske.
»Hvis vi kan samle eksempelvis lokationsdata fra hele landet, kan vi måske se nogle sammenhænge, som ikke har været tydelige tidligere, hvor den data kun er opsamlet regionalt,« siger Jan Olsen.
»Behøver ikke data på individ-niveau«
Selvom det endnu ikke er defineret hvilke datakilder der kan bruges i datasøen, så har VisitDenmark allerede taget et fravalg. Persondata.
»Vi er i den første fase af projektet, hvor vi undersøger hvilke typer data vi kan indhente. Næste fase bliver at undersøge, hvordan vi kan behandle de datakilder. Vi håber at kunne går fra fase et til to i løbet af i år. Processen har været sat lidt tilbage, blandt på grund af implementeringen af de nye persondataregler, « siger Jan Olsen.
Han fortæller at udgangspunktet er, at datasøen ikke skal indeholde persondata, men i stedet være aggregeret eller anonyme data om eksempelvis turisters færden.
»Det er de store strukturer vi vil prøve at finde sammenhænge i, og vi behøver ikke data på individ-niveau, men vi vil eksempelvis gerne vide hvad nationalitet eksempelvis betyder for hvordan udenlandske turister bruger vores tilbud og services. Så jeg er ikke bekymret for at udenlandske turister bliver skræmt af eller har indvendinger mod vores dataindsamling,« siger Jan Olsen.
Datasøen er endnu kun på tegnebrættet og VisitDenmark har derfor endnu ikke taget stilling til hvilke tekniske krav de vil stille til eventuelle leverandører af en ‘put and take datalake’.
Ideen om en ‘put and take datalake’ så første gang dagens lys som en del af regeringens digitale vækststrategi, der blev lanceret tilbage i januar i. Her står der:
»For at fremme brugen af data i virksomhederne og mellem virksomhederne og offentlige aktører vil regeringen etablere et forsøg med en put & take data-lake i turismeerhvervet, der skal samle og tilgængeliggøre data for virksomheder og offentlige aktører.«

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.