Millioner af personhenførbare data er frit tilgængelige for sundhedsforskerne

27. juni 2019 kl. 05:1215
Millioner af personhenførbare data er frit tilgængelige for sundhedsforskerne
Illustration: Andrei_R, BigStock.
I 44 procent af alle forskningsprojekter fra 2018, hvor Sundhedsdatastyrelsen har udleveret registerdata, er der tale om personhenførbare oplysninger. Forskerne behøver ikke godkendelse fra en videnskabsetisk komité.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

Mange danskere tror, at deres sundhedsdata kun kan bruges til forskning, hvis de har givet tilladelse. Men det er ikke tilfældet.

Millionvis af personhenførbare data er til rådighed for forskerne, og de ‘rene’ databaserede forskningsprojekter med persondata skal ikke igennem en videnskabsetisk komité.

»Oprindeligt skulle registerdata-baseret forskning også godkendes af videnskabsetiske komiteer. Men man fandt ud af, at der sjældent var problemer med disse projekter og tog dem derfor ud af loven for en del år siden,« har Mette Hartlev, professor ved det juridiske fakultet og centerleder på Københavns Universitet og tillige formand for National Videnskabsetisk Komite, tidligere udtalt til Version2.

»Men det betyder ikke, at det er en åben ladeport, hvor forskerne selv kan sidde og kigge i databaserne. Ofte foregår det således, at forskerne bestiller et datasæt, og det genereres af for eksempel Danmarks Statistik, uden at forskeren selv har adgang til cpr-nummer eller lignende.«

Sundhedsregisterdata

Sundhedsregisterdata har en lang historie i Danmark.

Det danske Cancerregister blev oprettet allerede i 1942 af Kræftens Bekæmpelse med støtte fra Sundhedsstyrelsen og Den Almindelige Danske Lægeforening. Cancerregisteret blev 1. januar 1997 overflyttet fra Kræftens Bekæmpelse til Sundhedsstyrelsen.

Per 1. marts 2012 blev alle Sundhedsstyrelsens registre, bl.a. Cancerregisteret, flyttet til Sundhedsdatastyrelsen.

Indberetning skete på frivillig basis frem til marts 1987, hvorefter det blev obligatorisk.

Kilde: Sundhedsdatastyrelsen.

Et andet billede tegner sig dog ud fra de oplysninger, som Version2 har fremskaffet fra Sundhedsdatastyrelsen.

Artiklen fortsætter efter annoncen

I 2018 blev der således i 179 af 339 sager videregivet data til ‘forskermaskiner,’ hvilket vil sige, at data behandles i pseudonomiseret form, mens 150 sager blev til videregivet til databehandling hos den dataansvarlige, hvilket vil sige ikke-pseudonomiseret.

Det er altså i 44 procent af projekterne fra 2018, hvor der udleveres rå persondata til forskerne, som eksempelvis cpr-numre.

46.418 borgere med persondata i stikprøve

Antallet af borgere, der indgår i udtræk, både når det drejer sig om personhenførbare, pseudonomiserede eller anonyme data, kan variere meget.

»Spændvidden i de ansøgninger, vi behandler, er meget stor med hensyn til antal borgere i hvert udtræk. De mindste populationer er under 100 borgere og de største flere millioner. Det vigtige for os er her, at vi ikke udleverer flere data, end det er nødvendigt for at gennemføre projekterne, og at vi primært videregiver via forskermaskinen,« skriver Ib Roslund, som er presseansvarlig i Sundhedsdatastyrelsen, i en mail.

Artiklen fortsætter efter annoncen

Version2 har spurgt styrelsen, hvor mange borgere, der har indgået i udlevering af følsomme persondata i 2018, men sådanne opgørelser findes ikke.

Version2 har derfor bedt om aktindsigt i dette antal, men Sundhedsdatastyrelsen mener ikke, at det er muligt at efterkomme ønsket om en sådan datasammenstilling under offentlighedslovens betingelse om, at sammenstillingen kan foretages ‘ved få og enkle kommandoer.’

I stedet har Version2 fået en stikprøve på tre projekter.

Her er der udleveret følsomme personoplysninger på henholdsvis 27, 10.500 og 46.418 borgere, fra Dødsårsagsregisteret og Landspatientregisteret.

Cpr-numre kobler til blodprøver

Projektet, der benytter data fra 46.418 borgere, hedder ‘Can genetic markers predict the response of TNF inhibitor therapy?’

Projektets leder, klinisk professor Vibeke Andersen fra Syddansk Universitet (SDU), begrunder behovet for de personhenførbare oplysninger således:

»Vi skal have personhenførbare data, fordi vi skal koble data til blodprøver. Vi har blodprøver, som vi kan koble til cpr-numre, og så skal vi bruge registerdata på samme cpr-numre, for at finde personer, der har en bestemt diagnose, fordi vi skal finde kliniske oplysninger på disse patienter.«

Da projektet benytter blodprøver, udover registerdata, har det været igennem en videnskabsetisk komite.

Sundhedsdatastyrelsens direktør Lisbeth Nielsen oplyser, at det i et kommende it-system, CRM2, vil blive muligt at udtrække oplysninger om, hvor mange borgeres persondata, der udleveres.

Artiklen fortsætter efter annoncen

På spørgsmålet om det ikke ville være en god ide med transparens i forhold til hvilke projekter, borgernes data udleveres til, i stil med de muligheder, borgerne har på Sundhed.dk, svarer Lisbeth Nielsen:

»Der ligger i dag en liste på Forskerservice’s hjemmeside, hvor alle projekter, vi har leveret data til, fremgår. Men vi er meget gerne mere åbne: Der er mange andre aspekter end antal borgere – eksempelvis hvilke registre eller typer af informationer, der kan være interessante at formidle. Vi er enige i, at der plads til meget bedre formidling og er faktisk i gang med et projekt, hvor vi vil forbedre information og formidling af, hvordan vi indsamler og bruger sundhedsdata og stiller dem til rådighed.«

Version2 ser i en kommende artikel på, hvordan de følsomme registerdata håndteres på SDU og Region Syddanmark.

15 kommentarer.  Hop til debatten
Denne artikel er gratis...

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.

Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.

Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.

Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.

Fortsæt din læsning

Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
15
29. juni 2019 kl. 11:19

Her kan CPR nummer navendes, men det kunne lige så godt være en cryptohash værdi af CPR-nummeret, så længe den samme hash algoritme og setup er anvendet på datasættet.

Nope, nope, nope. Det må ikke være en nøgle der er algoritmisk afledt af CPR-nummeret.

CPR keyspace er så småt at det er trivielt at bruteforce. Jeg legede lidt med det for nogle år siden (mangler stadig at få smidt koden i GitHub) - det tager under et minut at bruteforce-finde CPR-nummer ud fra sha256 på en Ryzen 5 1600... Standard semi-optimeret C++ kode, uden brug af assembly eller GPU'er.

Hvis der ikke er per-CPR salt kan der genereres en database (det tog vist et par timer at generere en SQLite database med den CPU og SSD jeg havde for 6 år siden), og så er opslag nede hvor man tæller millisekunder i stedet for sekunder.

Og det er hvad jeg har lavet med en smule hyggekode på mid-end consumer hardware...

 1. D:\src\tools\perf\build\Win32\Debug>timemem d:\src\test\CprFun\bin\multibrute-x86-Release\multibrute.exe 12 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e
 2. argv[0]=timemem
 3. argv[1]=d:\src\test\CprFun\bin\multibrute-x86-Release\multibrute.exe
 4. argv[2]=12
 5. argv[3]=7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e
 6. CmdLine=timemem d:\src\test\CprFun\bin\multibrute-x86-Release\multibrute.exe 12 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e
 7. Invoked=d:\src\test\CprFun\bin\multibrute-x86-Release\multibrute.exe 12 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e
 8. Thread Thread 1: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 83334-166668Thread 2: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 166668-250002
 9. Thread 5: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 416670-500004
 10. Worker threads launched, waiting for completion - this may take a while!
 11. Thread 4: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 333336-416670
 12. 0: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 0-83334
 13. Thread 11: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 916674-1000000
 14. Thread 7: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 583338-666672
 15. Thread 3: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 250002-333336
 16.  
 17. Thread 8: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 666672-750006
 18. Thread 6: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 500004-583338
 19. Thread 9: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 750006-833340
 20. Thread 10: scanning for hash 7c1bb9f1d19393fdbcb04537a679d661180f31166b8ecb21135711c84883914e, range 833340-916674
 21. Thread 4: exhausted keyspace slice
 22. Thread 5: exhausted keyspace slice
 23. Thread 10: exhausted keyspace slice
 24. Thread 9: exhausted keyspace slice
 25. Thread 3: exhausted keyspace slice
 26. Thread 6: exhausted keyspace slice
 27. Thread 11: got a match! CPR == 3112999999
 28. Thread 7: exhausted keyspace slice
 29. Thread 8: exhausted keyspace slice
 30. Thread 1: exhausted keyspace slice
 31. Thread 2: exhausted keyspace slice
 32. Thread 0: exhausted keyspace slice
 33. Thread 11: exhausted keyspace slice
 34. Exit code : 0
 35. Elapsed time : 37.79
 36. Kernel time : 0.41 (1.1%)
 37. User time : 433.06 (1145.8%)
 38. page fault # : 1291
 39. Working set : 4740 KB
 40. Paged pool : 39 KB
 41. Non-paged pool : 9 KB
 42. Page file size : 2180 KB

14
27. juni 2019 kl. 16:06

Klavs, det er oplagt, at jo mere overordnede data er, når det bliver leveret, jo færre problemer vil der være.

Det er ikke en silver-bullet, for der er stadig udfordringer; anonymisering er yderst vanskeligt, især overfor aktører, som må spørge flere gange, og måske endda med små finurlige forskellige i spørgsmålene.

Men det er bedre end at have individdata med cpr-nummer tilknytning svømmende rundt.

Hvis man så endda kan etablere et revisionsspor, så man i tilfælde af problemer, kan gå tilbage og se, hvad der tidligere er foregået, så begynder det at ligne noget.

Det bliver mere besværligt; det vil give mere arbejde, som ikke kan udføres af forskerne selv, og det vil give længere turn-around-tid for forskerne. Men spørgsmålet er, om ikke vi som samfund skal træde til, og i det mindste holde forskerne skadesløse for den tid, der ikke er deres egen - for forskning er til vores fælles bedste; det er jo vores fremtid, som vi taler om!

Og selvom det bliver mere besværligt, så bør man overveje om ikke det er bedre end at blive mødt af generelt stigende mistillid efterhånden som tingenes tilstand ikke længere kan holdes hemmeligt?

Jeg synes, at forskning er for vigtigt til ikke at blive taget langt mere alvorligt.

13
27. juni 2019 kl. 15:47

Det er rigtig, rigtig godt, Version 2.

Version2 har spurgt styrelsen, hvor mange borgere, der har indgået i udlevering af personfølsomme data i 2018, men sådanne opgørelser findes ikke.

Jeg synes, det er problematisk, at Sundhedsdatastyrelsen ikke registrerer fyldestgørende. Det burde de gøre. I og med at styrelsen beskæftiger sig med udlevering af borgernes personoplysninger. I vidt omfang også personhenførbart, til mange forskellige modtagere.

Den oversigtsliste over hvilke projekter, styrelsen har udleveret data til, på årsbasis (Excel-ark, via linket i artiklen) anfører hvilke registre/databaser, der er trukket oplysninger fra. Samt til hvilke projekter.https://sundhedsdatastyrelsen.dk/da/forskerservice/om-forskerservice

Det burde ikke være noget problem, for Sundhedsdatastyrelsen, at tilføje 2 ekstra kolonner: 1 med population (antal personer, der deltager) 1 med årrække (årstal til årstal, der er trukket data fra)

Som minimum. Det er oplysninger styrelsen ligger inde med. (I og med at de har modtaget ansøgninger indeholdende disse. De har behandlet ansøgningerne, truffet afgørelse samt efterfølgende udleveret data i givent omgang. Selvfølgelig har de oplysningerne).

Sundhedsdatastyrelsen har blot undladt at medtage disse relevante oplysninger i deres oversigt. Andet kan jeg ikke udlede. Der er truffet et valg.

Det bør også være muligt at søge på tværs og udtrække liste over, hvilke projekter den enkelte borgers oplysninger er udleveret til og i hvilken form. I en evt. opgradering af IT-systemerne. Dette bør kunne dokumenteres.

De foreliggende oplysninger er overhovedet ikke tilstrækkelige. Jeg kunne være tilbøjelig til at kalde det skin-journalisering.

Der er i hvert fald truffet et aktivt valg om, hvad der skal være tilgængeligt for offentligheden. Og i denne opgørelse tæller ikke det reelle omfang af udleveringen af borgernes personoplysninger. Det synes jeg er problematisk.

12
27. juni 2019 kl. 13:13

Såvidt jeg ved, så laver de fleste forskere "diverse programmer i python eller lign." - der udtrækker den viden de forsøger at "uddrage fra data" - og hvis nu man istedet, sørgede for at sådanne scripts kunne indleveres (og andre forskere kunne se hvilke scripts/funktionre der allerede var) - så kunne disse scripts bare "bestilles som adhoc kørsler" - via et API f.ex. - så det kan gøres straks.. og så får forskerne hvad de har behov for (og ofte uden selv at skulle skrive de scripts til at tærks igennem data) - og behøver aldrig nogensinde se datasættene bag - fordi de scripts ligger hos dansk statistik (som har folk der rent faktisk også har forstand på statistik og IMHO ville være gode kandidater, til at "optimere/sikre" den kode der hiver statistik ud af data.. ?

Stadig masser (og nu nemmere) forskning, baseret på statistisk evidens (som svjv. er det man bruger data til) - og 0 udlevering af data ?

Data forbliver hos dansk statistik (hvor det allerede er idag) - og så kunne man måske lige "optimere" deres IT ressourcer, så sikkerheden blev forbedret der.. ?

11
27. juni 2019 kl. 13:07
10
27. juni 2019 kl. 12:58

Det er korrekt, at der ikke er brug for andet end en stabil nøgle, som man bruges på tværs af data fra forskellige kilder, som f.eks. journalsystem, eller kommunens eller skolen registreringer om en person, så det kan krydses op imod offentlige registre om f.eks. socialgruppe eller bopæl, etnicitet eller familierelationer.

Kan alle disse kilder leveres af en leverandør, som f.eks. Sundhedsdatastyrelsen, så vil man kunne identificere individerne med pseudonym (og det skal så ikke være en kryptografisk hash udelukkende over cpr.nr. af tekniske årsager - hvis der bruges en form for nøgle til hash-funktionen, så skal den holdes hemmelig, og må ikke genbruges).

Når man så netop ikke kan nøjes med pseudonymisering, men derimod insisterer på cpr.nummer, så må det være fordi at pseudonymisering ikke er en mulighed. Sikkert fordi, at man selv er nødt til at linke registeringer på individniveau på tværs af datakilder (1).

Udfordringen er så, at cpr.nummer i Danmark er en stabil (i hele individdets levetid), global (i Danmark) unik identifikator, så kan bruges til at linke med, også hvis man i fremtiden får adgang til nye datakilder, eller måske på anden vis senere erhverver yderligere viden om individet.

Og hvis data med en stabil, global unik identifikator som cpr.nummer formår at undslippe, så er ånden ude af flasken, og nu kan alle med egne registreringer med samme identifikator selv sammenstille data i al hemmelighed. Din arbejdsgiver skal jo have dit cpr.nummer for at indberette lønindkomst, og har dermed nøglen til at forstå de undslupne data.

Ad (1): Det er svjv. muligt for forskere at levere deres egne data, og få dem sammenkørt med andre data og derefter pseudonymiseret, men det hjælper ligefedt, hvis de pseudonymiserede data efterfølgende kan tilgås på individniveau og et eller flere individer af særlig interesse kan identificeres udfra andre af de leverede data.

9
27. juni 2019 kl. 12:06

Man undres om disse forskere egentlig modtage noget hjælp til at forstå hvordan data hænger sammen. De siger alle de absolut har behov for CPR nummeret, men i egentlig har de bare behov for en unik nøgle der kobler relevant data på den samme person sammen. Her kan CPR nummer navendes, men det kunne lige så godt være en cryptohash værdi af CPR-nummeret, så længe den samme hash algoritme og setup er anvendet på datasættet.

8
27. juni 2019 kl. 11:56

Tak for svar, Camille Bang. Ja, det er jo mennesker, vi har med at gøre - og det er menneskeligt at sladre i et eller andet omfang. Derfor skal vi have andre foranstaltninger på plads end bare at forlade os på forskeres og personales personlige moral og etik. Og i det lys er det endnu mere rimeligt, at borgerne må have lov til at beskytte deres privatsfære...

7
27. juni 2019 kl. 11:50

Anne-Marie Krogsbøll Vedrørende professor emeritus og tidligere overlæge Gunnar Lose udtalelse. Det er ikke kun i kendte mennesker, der bliver sladret om. Det er også fx arbejdskollegaer og andre. Tidligere kunne en ansat fx få abort på et andet sygehus, men efter Sundhedsplatformen er oplysninger let tilgængelige.

5
27. juni 2019 kl. 08:44

Ja....

https://politiken.dk/indland/art7266472/%C2%BBJeg-ved-at-der-er-nogle-der-logger-ind-og-kigger-p%C3%A5-operationsprogrammet-for-at-finde-kendte-mennesker%C2%AB​ Desværre bag betalingsmur - men:

Den tidligere patient ønskede at få slettet et journalnotat, som beskrev, at hun var seksuelt aktiv. Et familiemedlem havde på den ene eller anden måde set informationerne i hendes journal, hvilket havde givet anledning til store problemer hjemme i familien. Historien bliver fortalt af professor emeritus og tidligere overlæge Gunnar Lose, som for nylig er gået på pension fra sit job på Herlev Hospital. Han mener, at det er et dagligt problem på hospitalerne, at informationer om patienter spredes på en uhensigtsmæssig måde. Og med it-systemet Sundhedsplatformen er det i hans optik kun blevet nemmere at tilgå patienternes dybt personlige oplysninger. »Nu er alle data kommet ind i én database. Man bliver præsenteret for et langt større spektrum af sygdomme kombineret med et cpr-nummer«, siger Gunnar Lose og fortsætter: »Jeg ville kunne se, hvem der fik abort på Rigshospitalet, og hvem der skulle opereres og have fjernet deres livmoder på et andet hospital«, siger han. Og det er i hans optik et problem, da der, som han formulerer det, godt kan være »meget snageri på et hospital«. »Sladderen går altid på et sygehus. Jeg ved, at der er nogle, der logger ind og kigger på operationsprogrammet for at finde kendte mennesker«, siger Gunnar Lose."

4
27. juni 2019 kl. 08:33

Første forsvarslinje er typisk pseudonymisering, forskermaskiner og videnskabsetiske kommiteer ... som problematiceret i artiklen her.

Næste forsvarlinje plejer så at være, at forskerne er en særlig slags mennesker, der sidder i et forskningstårn, og slet ikke interesserer sig for andre mennesker ... og derfor kan betros stærkt personfølsomme oplysninger, fordi de kun kigger efter det, som objektiv vedrører deres forskning.

Men lad os lige sammenligne med andre, som er betroet adgang til personoplysninger:

https://www.version2.dk/artikel/tyndbenet-kontrol-med-snageopslag-paa-patientdata-region-h-1088348

Tja, sundhedsfaglige er åbenbart helt almindelige mennesker, og ikke højtsvævende og virkelighedsfjerne åndsvæsener som forskerne.

https://www.hrw.org/news/2019/06/20/us-police-found-violate-fellow-officers-privacy

Og politibetjente er også almindelige mennesker; i hvertfald i udlandet.

Som ovenstående artikel siger:

“The Minnesota case shows that without strong protections, police officers may abuse their data access – even by invading the privacy of their fellow officers, particularly women,” said Sarah St.Vincent, US surveillance and law enforcement researcher at Human Rights Watch, who observed the trial.

Det er ikke kun "fellow officers". Det er også ex-kærester og det, som jeg har set beskrevet som "romantiske interesser". Og familie og naboer. At jeg så nemt kunne finde en så ny sag indikerer omfanget af problemet.

Og mon ikke forskere er som folk er flest? Eller i det mindste ligesom sundhedsfaglige og politibetjente, som vi i forvejen betror at håndtere følsomme oplysninger i fortrolighed. Tilid er godt, men kontrol er nødvendigt.

3
27. juni 2019 kl. 08:26

Er det mon muligt at få oplyst et overslag over, hvor mange forskere, sagsbehandlere, embedsmænd osv., som - bare på et år - får adgang til vore data? Hvor mange projekter udleverer man data til (ad alle kanaler - genomcentret, SSI, lokale databaser osv. ), og hvor mange forskere er der i gennemsnit pr. projekt?

I nogle projekter fremgår det af de efterfølgende forskningsartikler, at der er er flere hundrede medforfattere - i mange lande. Ikke alle har nødvendigsvis adgang til alle data - men har man overhovedet noget styr på det? Fører man regnskaber/lister over, hvilke personer, der har fået adgang til hvilke data - bare for det tilfælde, at man får brug for at opspore evt. læk?

Hvor mange forskere indenfor sundhedsforskning - offentlig og privat - har vi herhjemme?

oså på dette område forlader man sig på aftaler - der er mig bekendt ingen egentlig kontrol med, hvad forskerne gør med data: Om de har styr på datasikkerhed etc.

Det er jo ikke kun et spørgsmål om, hvor mange borgeres data, de har adgang til, men også hvor mange personer, der så faktisk har adgang til borgernes (eller dele af bogernes) privatliv. Det er ikke nok at se på det enkelte projekt, som kan se ufarligt ud. Hvis tilladelserne spredes ud med rund hånd, så ender det jo med, at mange tusinde forskere og andre (eks. it-folk på projekterne) faktisk kan kigge os over skulderen ind i stuen. Ikke rart.

2
27. juni 2019 kl. 07:37

Jeg er for længst holdt op med at stole på hvad, offentligt ansatte og forskere siger. Så intet overrasker længere :-(

"Vi har styr på sikkerheden!" = "Vi kan stave til det og har skrevet et memo om det".

1
27. juni 2019 kl. 07:13

.. tak for den.

Det er jo grotesk. Vi skal ustandseligt høre på påstande om, at vore data - i hvert fald som udgangspunkt - er anonymiserede, når der forskes. Det bruger man til at berolige befolkningen med. Men hvad er åbenbart realiteterne?Det er altså i 44 procent af projekterne fra 2018, hvor der udleveres rå personhenførbare data til forskerne, som eksempelvis cpr-numre."

Og de ca. 56 % resterende er "pseudonymiserede" (hvordan?) - hvilket, vi jo alle ved, er stort set det samme som ikke-anonymiserede i denne sammenhæng, hvor samkøring jo nok er mere reglen end undtagelsen. Og hvordan med blodprøver? Er de "pseudonymiserede"? For der fremgår navn og cpr jo typisk på glasset.

Så konklussionen må vel være, at i praksis foregår forskning stort set ikke-anonymiseret. Og borgerne aner det typisk ikke, og kan ikke få oplyst, hvilke projekter deres data er indgået i.

Og det med godkendelsen er stort set en by i Rusland i praksis - der er flere huller end barrierer. Jeg kan tilføje, at Videnskabsetiske kommiteer - så vidt jeg har kunnet få oplyst - ikke beskæftiger sig meget med etiske aspekter af projekterne, men blot med om love og regler formelt set er overholdt. Formål indgår ikke.

Jeg undersøgte for et par år siden, hvor mange projekter, der afvises i Region Hovedstadens komité. Kan ikke lige finde svaret - men jeg husker, at jeg blev rystet over, hvor få projekter, der afvises. Og årsagen til afvisninger var mørklagt.

Nu er disse godkendelser vist nok lagt ud under regionerne selv - de selv samme regioner, som ofte har store økonomiske og andre interesser i disse projekter. Så kan man selv tænke over, hvad det mon gør ved nidkærheden ift. at vurdere projekterne? Så i praksis er kontrollen med, hvad vore data anvendes til, stort set ikke eksisterende. I videnskabens navn.

Forslag til uddybende opfølgning:

 • Kan vi få oplyst, hvilket projekt som har fået udleveret en gruppe på under 100?
 • Var disse data "pseudonymiserede"?
 • Foretages der genetiske analyse på blod- og vævsprøver uden borgerens viden og samtykke?
 • Er billedet det samme, uanset om det er offentligt ansatte forskere, der får data/biomateriale, eller private firmaer - eller offentligt/private samarbejder med store kommercielle interesser ("konsortier")?
 • Hvilken opfølgende kontrol er der med, hvad der efterfølgende sker med data?
 • Hvordan er fordelingen mellem de forskellige typer forskning (privat, offentlig, offentlig/privat), som data udleveres til?

Vi tudes ørerne fulde om, at de fleste gerne vil dele deres data med forskere. Ofte er det manipulerede og ikke særligt retvisende statistikker. Så sent som i dag har Politiken et læserbrev fra en borger, der er bekymret over sin mistede ret til privatliv ifb. med vore sundhedsdata. Og mit spørgsmål til de manipulerende politikere, embedsmænd, lobbyister og forskere: Det er muligt, at et flertal (som typisk ikke er inde i, hvordan deres data reelt udnyttes) har det helt fint med, at deres data bruges på denne løsslupne måde - men hvad med det garanteret efterhånden ret store mindretal (jeg gætter på omkring 20%, men tallet er sådan set principielt ligegyldigt), som bliver voldsomt utilpasse ved at være reducerede til databacongrise, som faktisk værdsætter deres menneskeret til selv at bestemme, hvem de vil lukke ind i deres privatliv, og som oplever udviklingen som en sliske ind i et Huxley'sk og Orwellsk "Fagre Nye 1984"- helvede - dvs. altså ligefrem en trussel mod demokrati og frihed?

Hvad med os?