IBM bruger uvidende menneskers ansigter til at udvikle ansigtsgenkendelse

Illustration: artoleshko/Bigstock
Det amerikanske virksomhed IBM bruger billeder fra Flickr til at træne deres algoritmer i ansigtsgenkendelse, men det har personerne på billederne ikke givet lov til.

IBM har fodret algoritmer til ansigtsgenkendelse med næsten en million Flickr-billeder uden at spørge personerne på billederne om lov. Det afslører NBC i en lang udredning.

IBM har indsamlet billederne fra et større datasæt på 99,2 millioner billeder, som er delt under en Creative Commons-licens, hvilket normalt giver rettigheder til, at billederne kan blive brugt frit.

Men det er ikke sikkert, at rettighederne går så vidt som til, at personerne på billederne skal finde sig i, at deres ansigter bliver brugt til at udvikle ansigtskendelsesalgoritmer.

Den ansvarlige for AI-forskning hos IBM, John Smith, siger til NBC, at enhver har lov til at bede om at få en specifik URL fjernet fra datasættet.

Men det kræver, at fotografen bag det specifikke billede sender linket til billedet, og det kan blive svært, fordi IBM ikke har offentliggjort listen over, hvilke billeder der indgår i datasættet.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (6)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Anne-Marie Krogsbøll

I Danmark skal vi bestemt ikke føle os bedre end andre på det punkt. DTU forsker målrettet i denne retning - f.eks. med brug af fotos fra 40 000 linkedIn-profiler:
http://orbit.dtu.dk/ws/files/89834062/phd319_Fagertun_J.pdf

Denne forskning indgår i følge henvisninger i ph.d-en i et forskningsprojekt i samarbejde med Lundbeck med det formål at kunne diagsnosticere psykiske sygdomme lettere.

We thank the participants in the Danish Blood Donor Study, in particular Henrik
Ullum. This project was sponsored by a grant to Thomas Werge from The
Danish National Advanced Technology foundation (Jnr. 001-2009-2) and Lundbeck
Foundation (R34 A3243) and by grants to Thomas Hansen from the Danish
Main Capital Research Foundation of Health."

Dette er anført to gange. Jeg har forsøgt at forklaringer på og aktindsigter i dette samarbejde, men afvises med, at det er skrivefejl i ph.d-en.

Kan man virkeligt tro på, at der flere gange i en ph.d helt fejlagtigt 2 gange sendes tak til specifik funding - og at det så er skrivefejl? For mig lyder det meget mærkeligt. Og selv om Thomas Werge er anført som medvejleder og medforfatter på ph.d-en, så afviser han i mail til mig, at han har haft noget særligt med den at gøre.

Mine spørgsmål til lovligheden af at anvende disse linkedIn-fotos uden tilladelse blev affejet af DTU med, at det var før GDPR, og at man i øvrigt ikke havde brugt alle disse billeder, selv om det fremgår af ph.d-en - eller noget i den stil. Orker ikke lige at finde det, men det var i hvert fald tydeligt, at det ikke var noget, man havde overvejet.

Jeg er aktuelt gået i stå med at få oprullet den sag, for der er mange benspænd - men det forekommer mig særdeles skummelt, og når kræfterne kommer igen, forsøger jeg igen.

DTU forsker i øvrigt målrettet på at sætte Danmark på landkort indenfor dette område:
https://www.dtu.dk/english/News/2014/04/Danish-research-leads-facial-ana...

Jeg frygter, hvad der i øvrigt kunne gemme sig af potentielt ulovlig anvendelse af andre menneskers ansigter i laboratorierne på DTU.

  • 5
  • 2
René Nielsen

Mine spørgsmål til lovligheden af at anvende disse linkedIn-fotos uden tilladelse blev affejet af DTU med, at det var før GDPR


Nu vil jeg ikke kloge mig på denne sag, men GDPR blev som bekendt vedtaget i 2012, trådte i kraft i 2016 og bøderne blev i 2018 harmoniseret i EU.

Nu kan det være svært at opklare fordi DTU vil næppe udleverer billederne, men det er DTU som skal bevise at de har lov til at bruge billederne i den kontekt. Allerede dengang skulle man have samtykke.

Skulle det komme til en retssag, så tror jeg ikke at samtykke kan anses for givet da diagsnosticering af psykiske sygdomme næppe kan forgå uden adgang til medicinske data.

Og helt ærligt - hvem vil dog oplyse om psykiske sygdomme på sin profil.

Jeg kan ikke forstille mig at et socialt medie eller andre slipper afsted med at kalde et upload af profilbillede for en uindskrænket tilladelse til at samkører data og herunder særligt beskyttede sundhedsdata.

Og siden det skete i 2013 - hvorfra kommer mon disse sundhedsdata og hvordan er de blevet normaliseret? Jeg mener at du skal jo have et CPR nummer eller ligende for at kunne fremfinde de sundhedsdata med psykiske sygdomme.

Hvordan vil du optræne et program til analyse af billeder til at opdage psykiske sygdomme, hvis ikke du har en "facitliste"?

Problemet er jo at folk risikerer at blive genkendt i det offentlige rum som psykiske patienter - derfor kan jeg ikke se at er lovligt uden at folk har givet speficikt samtykke til billedbehandlingen.

  • 4
  • 0
Anne-Marie Krogsbøll

René Nielsen:
Som jeg har forstået det, skulle linkedIn-fotosene anvendes til "træning" af algoritmen, og suppleres med billeder optaget med samtykke til forskning via Det Danske Bloddonor Studie DBDS, hvorfra diagnoser og personidentificerbare data kunne hentes på billederne optaget med samtykke. Desuden samkøring med genetiske undersøgelser (deCode Gentics) og data fra psykiatriske databaser. Jeg mener ikke, at man i denne omgang ville køre diagnoser på linkedIn-billederne - de var bare træningsmateriale (det er forklaret lidt nærmere i ph.d-en). Om man også ud fra navne kan have hentet diagnoser på dem, ved jeg ikke. Men fremtidsperspektiverne er ikke rare.

Det er som sagt meget uklart, præcist hvordan det hænger sammen - og de involverede har ikke lyst til at afdække de nærmere forhold - og det, der oplyses i ph.d-en er åbenbart ikke troværdigt, hvilket i mine øjne er meget bekymrende. For enten er denne godkendte ph.d ikke troværdig, eller også er der nogen, der lyver for mig. Ikke godt, for det tyder jo på, at man har noget at skjule.

  • 1
  • 2
Søren Walther

Jeg syntes der mangler noget forklaring af hvordan de små 100 millioner mennesker er blevet klacificeret som uvidende.

Det kan ikke være så simpelt som en undersættelse af unknowing(ly)?

/Søren

  • 3
  • 0
Log ind eller Opret konto for at kommentere