Så smart omgår Aarhus Universitet problemet med persondata i skyen

Illustration: leowolfert/Bigstock
På Aarhus Universitet har man fundet en simpel måde at omgå problemet med persondata i skyen på. Løsningen med pseudonymisering af navne kan på sigt udvides til andre universiteter.

Med et enkelt, teknisk kneb er man på Aarhus Universet sluppet fuldstændig uden om de problemer, der normalt melder sig, når offentlige myndigheder vil lægge persondata i skyen.

Det fortæller teknisk projektleder Søren Juhl, som har stået i spidsen for et pilotprojekt, hvor skriftlig eksamen på universitetet gøres digital og flyttes ud i Microsofts cloud-løsning Azure.

Den slags vil normalt bringe den danske persondatalov i kraft, fordi der er tale om personhenførbare oplysninger.

Men med en teknik kaldet pseudonymisering kan universitetet både sikre sig identiteten på studerende, der går til eksamen, og sørge for, at Microsoft ikke aner et klap om den.

»Vi bliver nødt til at kunne identificere de studerende, så vi ved, at det er de rigtige, der går til eksamen. Derfor laver vi et split, så det personhenførbare ligger lokalt, og det, der ikke er, ligger i skyen,« forklarer Søren Juhl.

Som tidligere beskrevet på Version2 er det ikke uden komplikationer for det offentlige at lægge personfølsomme data i skyen.

Mest omtalt er sagen om Odense Kommune, der gerne ville bruge Google Apps til at lægge skolernes elevplaner op i. Det projekt er midlertidigt indstillet, da Google ikke kan dokumentere tiltrækkelig præcist over for Datatilsynet, hvor i verden de personfølsomme data befinder sig.

Læs også: Odense opgiver Google Apps-planer efter mere end to års tovtrækkeri

20.000 studerende i fire timer to gange årligt = oplagt cloud-løsning

Tanken med at bruge Microsoft-løsningen er, at universitetet dermed ikke skal bruge penge på at dimensionere sit eget it-setup til at håndtere eksamen digitalt for 20.000-40.000 studerende årligt. En situation, der kun finder sted få gange om året. Der kan Microsofts datacentre i stedet få lov at komme på arbejde.

Løsningen er udviklet af konsulentfirmaet NetCompany, og den består af et webinterface, som de studerende logger ind i og uploader deres eksamensbesvarelse igennem.

På universitetets egne servere er de studerende dermed identificeret med navn og studienummer, som kobles sammen med eksamensbesvarelsen. Men i det øjeblik, besvarelsen sendes til Azure, fjernes identifikationen af den studerende.

»Der bliver genereret en security descriptor, som er den sikkerhedsnøgle, der kobler data i skyen med det, der ligger lokalt. Det er bare en lang sekvens af cifre, som ikke giver nogen mening isoleret. Det betyder, at hvis nogen skulle vise sig at kigge med på datastrømmen (til Microsoft Azure, red.), så ville de godt kunne læse opgavebesvarelsen, men ikke vide, hvem der havde afleveret den,« siger Søren Juhl til Version2.

Løsningen er indtil videre blevet testet under mindre eksamener med 20-30 studerende og under en større driftprøve med 80 studerende. Det er gået efter planen, siger projektlederen.

Nu er løsningen, som oprindeligt er søsat af Ministeriet for Forskning, Innovation og Videregående Uddannelser og Digitaliseringsstyrelsen, ved at blive evalueret. Planen er, at erfaringerne fra pilotprojektet skal kunne bruges på andre universiteter landet over.

Er det lykkedes jer at løse problemet med persondata og cloud helt i det konkrete tilfælde med skriftlig eksamen?

»I den her enkelte sag er problemet løst. Men det er også fordi, det er tale om et velafgrænset problem og mængde data, vi skal have pseudonymiseret. Det er klart, at hvis det handler om mere komplekse datasammenhænge, så kan opstå andre problemer,« siger Søren Juhl.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (6)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
#2 Claus BV Christensen

Inden man skyder "den nye løsning" ned, synes jeg det er værd at overveje om sikkerheden var større lokalt. Umiddelbart tror jeg det ikke, og netop i en sådan situation hvor der er tale om midlertidige datalagringer kan en cloud-løsning være det bedste valg. Der er som altid meget stor frygt - men meget lidt at være bange for reelt.

  • 1
  • 0
#3 Thomas Stidsen

Istedet for at annonymisere indholdet, hvorfor kryptere man så ikke bare hele indholdet ??? Det vil tage lidt tid, og man skal selvfølgeligt styre krypteringsnøglerne, men det skal man vel alligevel i denne løsning ...

Er problemet at Cloud leverandørerne data-miner de data som brugerne sender op i skyen ? Eller burde der være en klar bussiness case for en Cloud leverandør: Krypter alt stærkt i skyen, og dekrypter kun lokalt ...

  • 3
  • 0
#4 Thomas Watts

Det er et "simpelt" spørgsmål om den strenge fortolkning af persondataloven.

Der tages ikke hensyn til, om data er krypterede eller ej. Det handler alene om, hvorvidt data opbevares inden for landets grænser.

En pseudonymisering eller tilsvarende tager højde for dette, idet de reelt personfølsomme data (personidentifikation med CPR-nummer f.eks.) ligger fysisk i DK, og IKKE kan tilgås i den del der opbevares i cloud/udland. Man kunne kalde det "cloud 2-faktor data"... jeg forbereder straks et nyt felt på min bullshit bingo plade :)

Man bør imho OGSÅ sikre stærk kryptering af både data og transporten af disse ift. cloud løsninger. Hvis data er værdifulde, burde dette give sig selv.

Løsningen er noget, der før har været oppe at vende i offentligt regi, og er ikke et spørgsmål om at "omgå" lovgivning, som @Jesper Krogh siger - det er et spørgsmål om at skille personfølsomme data og ikke-personfølsomme fra hinanden, så man får det bedste af begge verdener; overholdelse af dansk lovgivning, høj sikkerhed, cloud benefits som nævnt her i artiklen. (...jeg er i øvrigt helt enig i Jespers betragtning omkring det problematiske i login og identifikation via dokumentindhold. Det håber jeg da, de har taget højde for i løsningen.)

  • 4
  • 1
#5 Daniel Gertsen

.. når de studerende skriver deres navn i webinterfacet eller direkte i dokumenterne?

Det de studerende skriver i webinterfacet, går jeg ud fra er blandt de data der opbevares lokalt.

Men ja, hvis de skriver personhenførbare oplysninger i selve dokumenterne, bliver det jo opbevaret i Azure.

Så jeg er enig. Det er en fin teknisk løsning, men den er nok mere et røgslør end en egentlig løsning på problemet.

  • 2
  • 0
#6 Lars Bækdal

Er måske lidt udenfor emnet, men et er at man via en teknikalitet "omgår" persondataloven,- men hvordan sikres det at de studerende kan aflevere deres opgaver rettidigt i eksamenssituationen? At lade azure/microsoft om skaleringen fritager vel ikke universitet for at sikre tilstrækkelig kapacitet internt og anonymiseringen må vel også kræve en hvis kapacitet? At et pilot projektet med 80 brugere er gået fint er vel ikke ensbetydende med at det vil gøre det med 20.000..

  • 0
  • 0
Log ind eller Opret konto for at kommentere