Del persondata om stress, sygdom og færden på kryds og tværs: Ny teknologi baner vej
Kommuner vil gerne dele persondata og smart city-data, virksomheder vil gerne kunne vurdere kunde-persondata i en virksomhed inden et opkøb, og HR-folk vil gerne benchmarke sygefraværsdata på de ansatte med andre.
Sådanne projekter har tidtil været bremset af, at deling af persondata på tværs af organisationer ofte kræver samtykke fra personerne bag data - og det er besværligt.
Men et nyt europæisk teknologi-samarbejde, som Alexandra Instituttet deltager i, kan potentielt gøre det lettere at dele persondata uden at skulle indhente samtykke, fortæller Instituttet i en nyhed, som Version2 har modtaget.
Med den nye teknologi svarer det nemlig til at dele anonymiseret data, og dermed falder det juridisk ikke under GDPR, og man kan altså undgå nogle af de ting, der er besværlige i dag.
Sådan lyder det fra Mads Schaarup Andersen og Jonas Lindstrøm, begge fra Security Lab på Alexandra Instituttet.
De arbejder begge på SODA Scalable Oblivios Data Analytics, der er et europæisk teknologi-samarbejde, der skal gøre det nemmere at lave analyser på personfølsomme data.
»Vi har altid kunnet tilbyde den service, hvor man kan lave analyser på kombinerede data. Men den tidligere salgscase på den her teknologi har typisk været sygehuse eller organisationer, der ligger inde med personfølsomme data, som de gerne vil dele. Det er stadig relevant. Men GPDR har gjort teknologien endnu mere relevant, fordi så kommer lovgivningen og kræver noget, som den ikke har gjort før. Og så begynder virksomhederne at kigge efter tekniske løsninger på, hvordan de får løst det her. Så på den måde har lovgivningen skabt en businesscase på noget, som vi har arbejdet med i mange år,« forklarer Jonas Lindstrøm ifølge nyheden.
Konkret vil projektet forske i, hvordan man kan anvende følsomme data fra flere dataarkiver, uden at man går på kompromis med sikkerheden. I projektet arbejder man med Multiparty Computation, der gør det muligt at anvende data fra forskellige kilder på en sikker måde, dvs. at data forbliver krypterede, mens de behandles. Den anden er differential privacy, som giver sikkerhed for, at data er fuldstændig anonymiserede.Fakta om SODA-projektet:
Projektet er et samarbejde mellem teknologi-koncernen Philips Research, Technische Universiteit Eindhoven, Georg-August-Universität Göttingen, Aarhus Universitet og Alexandra Instituttet.
Gør det muligt at dele kundedatabaser
I projektet arbejder man med tre cases. Den første er et samarbejde med tyske Uniserv, der arbejder med scenarier, hvor en virksomhed vil købe en anden virksomheds kundedatabase eller f.eks. vil købe hele virksomheden, så de får adgang til kundedatabasen.
Den kan nogle gange være det mest interessante. Men som køber vil man gerne have en vurdering af, om det er en god kundedatabase, eller om den indeholder kunder, som man har i forvejen og dermed ikke kan bruge til noget.
Her kan man bruge den her teknologi, fordi den gør det muligt at sammenligne to databaser, uden at man nogensinde ser den anden. Det eneste, man får ud, er, hvor stor den er, og hvor mange personer man ikke havde i forvejen i sin egen database.
Maskinlæring træner HR-data
Den anden case er Collektive, der leverer infrastrukturen til modeller, der arbejder med HR-data om ansatte. Modellerne kan f.eks. bruges til at forudsige sygefravær og stress – og så kan virksomheder tage deres forholdsregler ud fra det.
Problemet er, at virksomheder typisk kun har data om deres egne ansatte. Det bedste i verden ville være, hvis de havde adgang til HR-data fra alle virksomheder i verden. Men det er selvfølgelig ikke muligt, da det er personfølsomme data.
Derfor bruger Collektive maskinlæring på en model, der bliver fodret med data, og som dermed gradvis bliver bedre i takt med, at den bliver trænet. Men i stedet for, at hver eneste virksomhed skal træne modellen ud fra deres egne data, så henter Collektive modellerne hjem og kombinerer dem, og dermed prøverde at lave en model, der er bedre end den enkelte.
»Pointen er, at Collektive ikke får noget data at se. De leverer bare infrastrukturen. Men virksomhederne får en model, der er bedre trænet, og som er mere brugbar til at forudsige sygefravær og stress,« forklarer Mads Schaarup Andersen.
Kan demokratisere kommunale data
Teknologien kan også være oplagt for mange af de kommuner, som vil etablere smart city-platforme eller dele offentlige data.
Nogle af de organisationer i Danmark, der ligger inde med rigtig meget interessant data, er offentlige myndigheder. De ligger ifølge Alexandra Insituttet typisk inde med nærmest al data om, hvad vi går og foretager os, og de har typisk meget bedre data end det, Google og Facebook opererer på. Men de har bare ikke haft mulighed for rigtig at udnytte det. Og de har med god grund siddet tungt på deres data.
Der har dog været en barriere i forhold til at anvende personførbare data. Man frygter for at bringe dem i spil, fordi man ikke ved, hvad konsekvenserne er. Men der er rigtig stort potentiale i bringe personførbare data i spil - hvis det kan gøres på en privacybeskyttende måde.
Med den nye teknologi slipper de for at lægge dataen fra sig.
»Der er en masse modvilje i dag mod at dele data på tværs af organisationer, fordi man er bange for at sidde med ansvaret for, at noget går galt. Men ved at bruge den her teknologi vil de kunne undgå det, for du kan give andre adgang til dine data, men de kommer aldrig til at se dine data,« forklarer Jonas Lindstrøm.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.