»Når Big Data kender dig på det ubevidste plan, kan man også manipulere med din underbevidsthed«

Fænomenet Big Data giver helt nye muligheder for at trække informationer ud af data - men det rummer også en trussel mod vores identitet, lyder det fra ekspert.

Måske har du lagt mærke til, at en reklame dukker op i din browser for et produkt, du netop har kigget på i en onlinebutik, dog uden at købe det? Den form for målrettet markedsføring er mulig på grund af det dataspor, som vi efterlader, når vi surfer rundt på nettet. Men det er kun starten på en langt mere intensiv udnyttelse af de informationer, vi producerer i ufattelige mængder hver dag.

Det mener Patricia Florissi, der er teknisk salgsdirektør i datalagringsvirksomheden EMC. I branchen betegnes hun som 'Big Data-guru', og det var primært på grund af denne uofficielle titel, Ingeniøren mødte hende, da hun for nylig var i København for at tale på en konference om netop Big Data.

Hvad er definitionen på Big Data?

»Det er et sammenrend af ting, som foregår for øjeblikket. Det er ikke kun datastørrelsen. Det er ikke det, at det kommer fra forskellige kilder. Det er ikke det, at det kommer i realtid. Det er ikke det, at analysearbejdet på det er anderledes. Det er det hele på én gang,« forklarer Patricia Florissi.

Big Data kan i sagens natur være vanskeligt at arbejde med ved at anvende traditionelle værktøjer til databehandling. Eksempelvis kan data fra et Twitter-feed ikke uden videre sammenkøres med data fra Facebook, Google Maps eller Apples iTunes- tjeneste, da systemerne har forskellige datastrukturer. Men her kommer Big Data-værktøjer ind i billedet. De kan hjælpe med at finde mønstre og en rød tråd i datamængder, der ved første øjekast intet har med hinanden at gøre.

Et simpelt og ganske tænkt eksempel kunne være at sammenkøre data fra Facebook med data fra DMI og DR og på den baggrund konstatere, at aktiviteten på den sociale tjeneste falder (eller stiger) markant, når DR viser dramaserien 'Borgen', og temperaturen er under 10 grader udendørs. Og det kan en marketingafdeling måske bruge til at finde ud af, hvornår det bedst kan betale sig at kommunikere via Facebook.

Eksemplet er som skrevet ganske simpelt. Og man kunne måske godt have en forudgående mistanke om, at der netop er en sammenhæng mellem Facebook-aktivitet og populære tv-serier. Pointen med Big Data er blandt andet, at det også kan bruges til at finde sammenhænge i datamængder, hvor ingen havde den fjerneste idé om, at der faktisk er en sammenhæng.

At forme fremtiden

»Big Data kommer både til at påvirke fremtiden og gøre os i stand til at forme fremtiden,« forklarer Patricia Florissi:

»Det er en evolution af den analytiske proces. Indtil nu har vi anvendt standardrapportering. Vi kigger på, hvad der er sket. Og vi planlægger fremtiden ud fra, at den bliver en fortsættelse af fortiden. Den næste generation af analyseteknikker går ud på at forstå, hvorfor tingene er foregået, som de er. Så hvis vi har set en lineær udvikling i fortiden, er spørgsmålet: Hvad forårsagede den lineære udvikling? Det går altså ud på at forstå årsagen bag. Der er ikke tale om en fortsættelse af fortiden, men en afbrydelse. Det er det, vi kalder predictive analytics (forudsigende analysearbejde, red.),« siger hun.

Som et eksempel nævner Patricia Florissi en situation, hvor en kunde ønsker at købe et par støvler online. I den forbindelse forsøger kunden at få svar på en række spørgsmål: Hvad er leveringsomkostningerne, hvordan belaster produktet miljøet, er støvlerne produceret af kunstigt læder, er der brugt børnearbejde og så videre.

Når kunden klikker på køb-knappen, kan onlinebutikken som udgangspunkt kun se, at der er købt et par lysebrune støvler af kunstlæder på et givent tidspunkt, men ikke nødvendigvis, hvorfor kunden har købt netop disse støvler. Og det er her, Big Data kommer ind i billedet, forklarer Patricia Florissi.

For at få svar på sine spørgsmål inden købet kan det være, kunden har opsøgt en blog for at opklare et eller andet omkring produktionsforholdene for støvlerne eller forhørt sig via Twitter. Ved at sammenkøre og analysere data fra informationskanalerne - eventuelt ved at spore kundens færden med cookies eller andet - kan det lade sig gøre for onlinebutikken at danne sig et beslutningskort over, hvad der førte til købet. Og på den baggrund kan fremtidige besøg fra samme bruger individualiseres i langt højere grad.

»Så næste gang, du besøger min hjemmeside, kan jeg vise dig et banner, hvor der står: 'Bemærk: Ingen dyr har lidt overlast'. På den måde kan jeg øge min omsætning. Jeg gav dig ingen anledning til at besøge et andet websted, så jeg kan sælge mere, og jeg kan beholde dig som tilbagevendende kunde. Jeg har påvirket dine handlinger,« siger Patricia Florissi og fortsætter:

»Dét er Big Data. Nu har jeg metoderne til både at indsamle og behandle data. Big Data er ikke noget, der opstår af sig selv, det er et symbiotisk forhold mellem alt muligt.«

Obama brugte big data

Den form for analysearbejde kan også bruges i andre sammenhænge.

Patricia Florissi fortæller, hvordan arbejde med Big Data blandt andet spiller en rolle i videnskabelig sammenhæng i forbindelse med kortlægning af gener. Og under den seneste præsidentvalgkamp i USA blev Big Data anvendt i Barack Obamas kampagne til at nå bestemte målgrupper.

»Han brugte Big Data-analyseværktøjer til at finde ud af, i hvilke stater der var folk, som sandsynligvis ville stemme på ham, men som ikke have registreret sig som vælgere. Han fik disse folk til at registrere sig med en meget målrettet kampagne,« fortæller hun.

Hvor langt er vi i forhold til at udnytte Big Data?

»Jeg vil mene, vi står ved begyndelsen på en ny æra. Det er en rejse inden for evolution og oplysning på én gang. Mulighederne er her. Vores udfordring bliver at forvandle en destruktiv overflod (af data, red.) - hvor man drukner i for meget information - til en værdifuld vare, vi kun kan have for lidt af.«

Ser du slet ikke nogle farer forbundet med alt det her? F.eks. øget overvågning?

»Tab af privatliv er én ting. Jeg tror mere, det er de ting, du ikke er klar over, og som kommer til at påvirke dig, der er farlige. Ting, du ikke er bevidst om foregår.«

»Altså, at man kan forudsige, at når du køber bleer, køber du også mælk. Man kan bruge Big Data til at forudsige, at en kvinde er gravid, før hun selv er klar over det, fordi hun plejede at købe noget, som havde en bestemt lugt, men nu er holdt op med at købe det, fordi hun ikke længere kan udstå den lugt.«

»Når man via Big Data begynder at kende dig på det ubevidste plan, så kan man også manipulere med din underbevidsthed. Du taler om Big Brother og overvågning? Jeg tænker på tabet af identitet. Jeg synes, de vigtigste ting, menneskeheden besidder, er kreativitet, innovation og spontanitet. Og jeg frygter, at Big Data kommer til at fjerne noget af dette,« siger Patricia Florissi.

Blå bog

Patricia Florissi er Chief Technology Officer for Sales i EMC Corporation. Hun har en ph.d. i Computer Science fra Columbia University og er EMC Distinguished Engineer. Hun har også en MBA fra New York University Stern Business School. Og hun har desuden titler inden for computer science fra Universidade Federal de Pernambuco i Brasilien. Patricia Florissi har flere patenter og er blevet udgivet i tidsskrifter som Computer Networks og IEEE Proceedings.

Kilde: FYI Events

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (5)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Log ind eller Opret konto for at kommentere