Offentlige AI-projekter snubler i GDPR og dårlig datakvalitet

29. april 2021 kl. 03:458
Offentlige AI-projekter snubler i GDPR og dårlig datakvalitet
Illustration: Bigstock/AndreyPopov.
Tre udfordringer stikker hovedet frem i de offentlige pilotprojekter med kunstig intelligens. Det er: Juridiske uklarheder, ustrukturerede data, og systemer, som ikke er designet til at håndtere dataudtræk.
Artiklen er ældre end 30 dage
Manglende links i teksten kan sandsynligvis findes i bunden af artiklen.

En række såkaldte signaturprojekter skal få gang i udviklingen af AI i den offentlige sektor. Hvor 33 procent af myndighederne i dag anvender machine learning og AI, forventer 91 procent at tage teknologierne i brug i 2023, fremgår det af rapporten IT I Praksis.

Formålet er klart: Kunstig intelligens kan bidrage til at effektivisere den offentlige sektor yderligere. Projekterne afvikles inden for sundheds-, social- og beskæftigelsesområdet samt området for tværgående sagsbehandling.

Log ind og læs videre
Du kan læse indholdet og deltage i debatten ved at logge ind eller oprette dig som ny bruger, helt gratis.
8 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
7
30. april 2021 kl. 00:55

Når man nærlæser rapporten, grænser de såkaldte udfordringer jo til det absurde:

Københavns Kommune: Vores ustrukturerede data kan ikke bruges til ML. Det kom helt bag på os.

Norddjurs Kommune: Vi hyrede en inkompetent rådgiver ind og vedkommende tolkede loven forkert. GDPR er så besværligt

Region Syddanmark: Vi brugte 6 måneder på at lave en risikovurdering.

Ebjerg Kommune: Vi kunne ikke blive enige om, hvem der skulle lave risikovurderingen, så vi brugte 6 måneder på den. GDPR er så besværligt.

Rigshospitalet: Vores ældgamle systemer var ikke bygget til at understøtte massive datatræk. Det kom helt bag på os.

Som fagperson får man indtryk af, at projekterne har lidt alvorlige kompetencemangler inden for projektledelse, jura og IT.

Som skatteyder kan man kun undre sig over, hvorfor beslutningstagere i det offentlige skyder store pengesummer ind i projekter, som på forhånd er dødsdømt grundet manglende kompetencer.

6
29. april 2021 kl. 21:02

Artiklen beskriver i mine øjne meget godt hvordan AI er som kejserens nye klæder.

Hvis de problemer som beskrives i artiklen er korrekte og AI ikke kan løse det uden at man hugger en hæl og klipper en tå, så er AI jo ikke noget som helst værd.

AI bør jo netop kunne håndtere de problemer som nævnes, for det er jo kunstig intelligens( eller måske er det bare en algoritme som reelt set er lineær).

Måske skulle det offentlige måske heller erkende at det skal holde op med at tro på alt den hype og salgsgas omkring ITs, AIs og alt det andets lyksaligheder kan løse alt og istedet erkende at mennesket stadig er IT overlegent.

Det som skræmmer mig mest er at det offentlige synes at glemme at GDPR, forvaltningslovgivning, grundlov er det vigtigste og at det offentlige skal tjene borgerne.

Det offentlige skal ikke finde på alle mulige grunde til at hugge hæle og klippe tæer for at få et itsystem til at fungere. Og det er det som jeg synes denne artikel desværre beskriver. Man kan jo også nævne Ejendomsvurderingssystemet, EFI og dets afløser med mere.

Det skal lave ITsystemer, som overholder de regler og love, som gør at vi borgere kan stole på det offentlige og sikrer at vores rettigheder overholdes.

5
29. april 2021 kl. 16:24

Det ser ud som om der er tale om laveste intelligens som ekspert systemer og ja der er det en god ide, at datakvaliteten er OK. Eksemplet med fordeling af post - det er ikke et AI projekt men et simpelt fordelingsprojekt - men man mener måske at maskinen skal kunne efteligne mit gamle landpostbud - han vidst at når brevet var med 'lange Jørgen' var det til mig - men det har ingen relevans i da hvor der ikke er en fast post der kan udlede en historik. Så klages der over GDPR problemer - ja hvis det er problemet er der næppe grundlag for et AI projekt og slet ikke et AGI projekt (Artificial General Intelligense).

4
29. april 2021 kl. 13:16

At fremstille problemer med maskinlæring som forårsaget af manglende datakvalitet er blot én måde at fremstille det.

Lang tids praksis demonstrerer, at foreliggende data vidtgående har en kvalitet, så de rationelt kan behandles med human intelligens. Det er det, data er opsamlet til. Det er den kvalitet, man har anset for tilfredsstillende med de givne virkemidler.

At maskinlæring stiller voldsomme krav til data-kvalitet og -volumen er mindst lige så meget en mangel ved den eksisterende maskinlæring, der - fortsat - er human intelligens underlegen.

Vejen fremad må være brolagt ikke blot med bedre datakvalitet, men i høj grad også med bedre maskinlæring - maskinlæring, som formår at godtgøre sig den slags data, som faktisk eksisterer.

3
29. april 2021 kl. 11:06

"Der er også i projekterne generel uklarhed og manglende overblik over efterlevelse af GDPR: Hvilke regler der gælder for kunstig intelligens - herunder samtykke, oplysningspligt, anonymisering af personoplysninger og andre forhold."

Man har ikke taget sig sammen til at afdække reglerne for hvordan forskellig data skal klassificeres og håndteres efter GDPR.

Nu viser det sig sørme at disse regler også gælder når man arbejder med AI.

Klynk-klynk.

2
29. april 2021 kl. 08:20

Først piver man over, at data indsamlet til et formål, ikke må bruges til andre og urelaterede formål. Det fikses med en snuptag, med ladeport store undtagelser, så princippet ender med at blive indholdsløs skåltale, som bruges til at lægge røgslør og skabe falsk tillid (for åbenbart kan vi ikke tiltros at vide, hvad der sker med vores data ... undskyld, nej, selvfølgelig ikke "vores" data, for data om os er selvfølgelig ikke vores, når de indsamles af andre ... og i det mindste så at orientere os, ja, det vil være "unødigt byrdefuldt" og "skabe bias", mmm, mmm).

Så piver man over, at data indsamlet til et formål ikke kan bruges til andre og urelaterede formål, fordi at data indsamlet til et formål sjovt nok retter sig imod dette formål. Man efterlades med det indtryk, at nogen har den opfattelse, at de efterfølgende og urelaterede formål i virkeligheden er de egentlige formål, og det oprindelige formål må rette ind og vige for "væsentlige samfundsinteresser". Alt andet ville være urimeligt.

Ja, for teleselskabernes mastedatabaser er jo ikke sat i verden for at teleselskaberne kan finde deres master igen, når de skal vedligeholdes eller ændringer i nettet skal planlægges. Nej da, de skal være konsistente på tværs af udbydere og opdaterede i realtid, så politiet kan få folk dømt alene fordi at de går rundt med en mobiltelefon. Alt andet ville være urimeligt, og nu må teleselskaberne udvise et minimum af samfundssind, og få det plads.

Og det er indlysende urimeligt, at en forsker må bruges måneder af kostbart forskningstid til at detajllæse hobevis af patientjournaler for at efterjustere registeringer, så det kan bruges til andet og urelateret formål end det oprindelige (jeg har tidligere omtalt dette med henvisning til en artikel i Weekendavisen). Og bare for en god ordens skyld, det urimelige består selvfølgelig ikke i, at det groft bryder fortroligheden imellem behandler og patient, eller at man har egne forventninger til andres arbejdsredskaber, nej da, det urimelige består da i, at forskerne skal spilde deres kostbare tid på finde deres egne data til deres egne formål, istedet for at andre allerede havde 2nd guessed deres behov og lavet arbejdet for dem i deres arbejdstid. For en forsker arbejde er jo per definition af "væsentlig samfundsinteresse", så selvfølgelig må landet læger og sygeplejesker tage sig sammen og få gjort deres arbejde ordentligt i stedet for at bruge tid sammen med patienter. Nu må vi lige have prioriteterne i orden; patienterne har fået deres behandling gratis betalt, så krav og forventninger om at de er fokus, og sygehusvæsenet er til for deres skyld, er både utaknemmelige og urimelige. "Væsentlige samfundsinteresser" står jo på spil i offentlig/private samarbejder på internationalt plan, så stop det klynk.

Hvilken arrogance. Hvis bare den overdrevne og malplacerede tillid til, hvad data kan og hvilken kvalitet den har, især når det er indsamlet af andre og til andre formål, kun ramte de hovmodige, så var det nok til at leve med - men vi bliver ramt to gange af den boomerang: på vej ud ved at data bruges til alt andet end det tiltænkte, og på vej tilbage ved, at resultaterne er ubrugelige ... og vi kommer oveni til at betale for det.

PS: Spor af sarkasme kan forekomme

1
29. april 2021 kl. 05:12

Man kan (friteks eller ej) ikke regne at oplysninger i dansk offentlige sundhedsdatabaser er korrekte. Som tidligere nævnt, er det min erfaring, at disse "data" ofte bygger på skøn og tilretning af patientens egne oplysninger. Decimal-tegn og lign. volder en del besvær.

Blodtype f.eks. skal altid verifices gennem såkaldt "forlighedstest" inden eventuel transfusion.

Da jeg kun har set mine egne sundhedsdata er der nærmest tale om anekdotisk evidens, men...