Når Undervisningsministeriet vil putte elevers cpr-numre i en database sammen med deres svar i en trivselsmåling, og når sundhedsmyndigheder vil identificere patientoplysninger på individniveau, så bunder det i gode intentioner om at udføre robust forskning.
Det er budskabet fra myndigheder og eksperter, som står bag indsamlingen af data.
I januar oplyste Undervisningsministeriet til Folkeskolen.dk, at ekspertgruppen bag trivselsmålingen anbefalede, at målingerne blev gennemført på individniveau, så besvarelserne kan samkøres i forskningsøjemed med andre data.

»Det sikrer muligheder for et solidt forskningsmæssigt grundlag for at udvikle evidensbaseret politik og praksis,« skrev ministeriet dengang i en mail til Folkeskolen.dk.
Det giver nemlig stor værdi, at elevernes svar er koblet til deres cpr-nummer, forklarer ekspertgruppens formand Simon Calmar Andersen, til Version2.
Han er professor på Trygfondens Børneforskningscenter på Aarhus Universitet.
»Forskningen er blevet meget bedre i kraft af de personhenførbare data. For eksempel: Indtil elevernes karakterer fra afgangsprøverne blev tilgængelig for forskningen, var der stort set ingen kvantitativ forskning i sammenhængen mellem, hvordan man indretter skolen, og hvordan det gik eleverne. Man havde intet forskningsmæssigt grundlag for at vurdere forskellige måder at bruge pengene på.«
En trivselsmåling uden cpr-numre er et langt dårligere redskab for at skabe forskning, som i sidste ende kommer børn og unge til gode, mener Simon Calmar Andersen.
På kommunalt plan er der også stor glæde ved de individualiserede data:
»Kommunerne ønsker at få adgang til data på cpr-niveau for at kunne foretage yderligere analyser af de fokusområder og udfordringer, som den enkelte kommune har. Det kan f.eks. være, at kommunerne vil analysere sammenhængen mellem elevens trivsel og øget fravær,« sagde daværende formand for KL's børne- og kulturudvalg, Anna Mee Allerslev (R), til Altinget i 2015.
Sundhed for hvilken pris?
Undervisningsområdet er ikke det eneste sted, hvor offentlige myndigheder har et godt øje til borgernes data.
På scenen i Musikhuset i Aarhus i marts måned står en forsker fra Herlev Hospital på en konference om offentlig it. Han fortæller om en fremtid, hvor den medicinske forskning kan tage kæmpe skridt fremad ved hjælp af store mængder patientdata og modeller til machine learning, ‘som kan downloades fra skyen – og de koster kun én dollar stykket’.
Men lyksagelighederne har en pris: Det kan blive en nødvendighed, at borgerne tvinges til at afgive deres data – med cpr-nummer. Ellers kan gevinsten ikke hives i land.
Tilsvarende ideer om individualiserede data kommer fra Søren Brunak, som er forskningsdirektør på Københavns Universitet og ekspert i udnyttelse af big data til medicinsk forskning.
På en anden konference - den nyligt afholdte Infosecurity i København - beretter han om en fremtid, hvor medicinsk behandling er individuel og kræver fuld adgang til patientens data. Han synes, forskerne skal holde op med at bruge ‘statistik-undskyldningen,’ for i fremtiden skal resultaterne sige noget om den enkelte.
Her er der slet ikke plads til anonymisering, hvis den vision skal gøres til virkelighed:

»Personlig medicin handler også om personlige data.«
Men der kan også være andre bevæggrunde end patienter, der stiller deres personhenførbare data til rådighed i egen interesse eller en større sags tjeneste.
»Når folk går ind ad døren på et amerikansk hospital, afskriver de ofte rettigheder til egne data. Så det, behandlingen koster på et amerikansk hospital, er også påvirket af, hvor billigt man kan gøre behandlingsvalg og procedurer. Det er en samlet pakke, hvor prisen er nedbragt ved at få billiggørelse og kvalitetsforbedring ud af data.«
Det kan tænkes at have betydning i et dansk sundhedsvæsen, der kan se meget anderledes ud i kommende år.
»I fremtiden vil den enkelte eksempelvis bruge sine patientdata mod forsikringsselskaber. Patienter kan komme med deres genom og bede om en billigere forsikring. Så får vi sundhedsforsikringer, som er differentieret prismæssigt, ligesom vi har bilforsikringer. Vi ved jo ikke, hvor grænsen går mellem det offentlige og det private sundhedsvæsen om 20 år. Bare fordi vi har et offentligt finansieret sundhedsvæsen, har vi jo ikke råd til alting,« lyder Søren Brunaks synspunkt.
Loven: Dataindsamling skal være proportional og minimal
Når det handler om lovgivning og jura, så gælder der en grundlæggende præmis om, at når stat, kommuner og andre offentlige myndigheder indsamler data, skal det være legitimt og proportionalt, og det skal det overvejes, om det samme formål kan opnås med et mindre indgribende middel.

»Spørgsmålet er så, om man kunne opfylde lovgivningens formål angående målingen uden brug af personnummeret,« har advokat og ekspert i persondata Catrine Søndergaard Byrne tidligere udtalt til Version2 i forbindelse med Undervisningsministeriets undersøgelse.
Catrine Søndergaard Byrne peger på, at man måske kunne benytte pseudonymisering i den skrappe udgave, hvor man ikke indsamler cpr-nummer, men i stedet benytter skole, klasse og køn til at identificere besvarelserne med.
Men det vil gå ud over forskningen, mener ekspertgruppens formand Simon Calmar Andersen.
»Elevernes resultater hænger i høj grad sammen med deres personlige baggrund. Hvis man ikke tager højde for det i analysen, kommer man nemt til at lave fejlagtige slutninger. Man kan ikke gøre det lige så præcist med aggregerede data. Kvalitetskriterierne for forskningen er, hvor præcist man kan identificere de effekter, man er på jagt efter. Man lavede slet ikke den forskning før i tiden, og kvalitet og præcision bliver meget større,« siger han til Version2.
Det kræver altså cpr-nummer at skabe den slags forskning.
Synspunktet imødegås dog af Niels Jakob Pasgaard, der er lektor på University College. Han siger:
»Jeg er ikke enig i, at forskningens præcision og kvalitet bliver meget større. Til gengæld er troen på, at præcision og kvalitet i forskningen er forøget, blevet meget større. En sådan naiv skråsikkerhed om, at der kan skabes global evidens for ‘hvad der virker’, er efterspurgt af det politiske niveau – men det vidner mest om manglende indblik i det pædagogiske felts kompleksitet.«
Hvor går grænsen?
Simon Calmar Andersen medgiver, at det er svært at trække en objektiv og principiel grænse mellem borgeres ret til privatliv og forskernes behov for data. Det er nemmere at vurdere i konkrete sager.
»I forhold til trivselsmålingerne er det min vurdering, at eleverne har en personlig interesse i, at der kommer fokus, ikke bare på faglige resultater, men også trivsel og personlig udvikling. For mig at se er der ikke en konflikt mellem forskernes og elevernes interesser.«

Det synspunkt er Niels Jakob Pasgaard stærkt uenig i:
»Det er svært for mig at se, at eleverne har interesse i den statistiske effektforskning, som bl.a. Trygfonden bedriver. Hvad hjælper det lille Anders, som har det dårligt i skolen, at en gruppe forskere har adgang til resultaterne af hans trivselsmåling og kan sammenligne den med lille Annes? Tror man, at man kan slutte fra et generelt niveau i en statistikbank, der beskriver de gennemsnitligt mest effektive metoder til øget trivsel for en gennemsnitlig elevgruppe, til den konkrete elev på en konkret skole et sted i Danmark? Det er mildt sagt naivt.«
Han kan heller ikke anerkende, at forskningen er blevet »meget bedre, i kraft af de personhenførbare data«:
»Simon Calmar Andersen viser, hvor smalt han opfatter skolen: som en form for virksomhed, der skal levere et bestemt udbytte – højere karakterer og gode trivselstal, og trivselstallene er jo i sig selv udtryk for en voldsom reduktion af, hvad trivsel er – så effektivt og billigt som muligt. Det er denne smalle skoleforståelse, Calmar Andersen forsker i. Derfor tror han, at hans forskning er bedre, end forskningen var førhen. Det er den efter min mening ikke: Den siger meget mindre om skole og pædagogik end andre former for forskning. Vi har her at gøre med en forskning, der kun fokuserer på det målbare, og som derfor reducerer dens genstandsfelt, skolen, til det målbare.«