Regeringen nedsatte for kort tid siden en ny ekspertgruppe i dataetik, der skal udtænke nationale retningslinjer for dataetik. Jeg har æren af at være udpeget til at sidde som fast medlem af gruppen og efter at nu indledende at have været en del af processen, fyldes jeg allerede med optimisme og ambitioner.
Dataetik i den danske model
En stor udfordring for Danmark er, at mens at vi her i landet har høje ambitioner for hvordan der arbejdes med data på en etisk forsvarligt måde, er der andre lande og organisationer, som ikke nødvendigvis har den samme balancering mellem etikken og det mere ensidige og direkte sigte på at lave som omfangsrige og effektive løsninger som muligt.
Kort sagt kan det ved første øjekast se ud som om det kan blive svært for os at konkurrere med deres løsninger, og samtidig hæve os over det dataetiske niveau vi kan se i dag – også ifm. indførelsen af GDPR, som også kan ses som en grundlinje vi gerne skulle hæve os over - ud fra devisen at selv om noget er lovligt er det ikke nødvendigvis etisk.
Danmark har tidligere udmærket sig ved CSR, som blev et nationalt kendetegn der har styrket vores nationale profil. Ambitionen er derfor nu at gøre det samme ift. dataetik, og i ekspertgruppen er der kreative kræfter og ambitioner bag denne tilgang.
En håndbog for praktikere
En af de ideer jeg selv arbejder med, er konceptet om en form for håndbog i hvordan man kan agere etisk når man arbejder med data i komplekse scenarier inden for områder som data science/Machine Learning/Kunstig Intelligens. Kort sagt går ideen på at lave et værktøj der er med til bottom-up at sikre at dem der sidder i virksomhederne og organisationerne og implementerer løsningerne, får en praktisk og meget konkret tilgang til at agere dataetisk, så løsningerne bliver udformet ud fra dataetiske principper indefra og ud. Indtil videre er de foreløbige emner jeg overvejer 'gennemsigtighed af modellen' og 'Bias i Feature Engineering'.
Bias i Feature Engineering
Jeg har selv stået bag flere succesfulde, prisvindende AI-drevne løsninger, og det har givet mig en klar opfattelse af at for hver succesfuld applikation af AI vi ser i dag, har overvægten af arbejdet været på den domænespecifikke ’feature engineering’ hvor man tager al den viden man allerede har og lægger ind i den transformation af data der skal sikre at AI/ML-modellen kan arbejde med disse - og uden at skulle lære noget vi allerede ved!
Det betyder at dette er også er en proces der er særligt sårbar for udviklerens egne partiske antagelser, fordomme, bias – kært barn har mange navne. Hvis der var retningslinjer på det praktiske niveau omkring hvordan man bedst kan undgå dette – særligt rettet mod den proces som Feature Engineering stiller udviklerne over for, kunne det være et værktøj der virkelig kunne hæve det dataetiske niveau.
Transparens/gennemsigtighed
På samme måde er det også muligt at lave et langt bedre informeret valg af AI/ML-model ud fra retningslinjer for forskellige domæners behov for transparens, sammen med en god oversigt over hvilke modeller der kan tilbyde hvilke niveauer af gennemsigtighed. Kunstige Neurale Netværk tilbyder ikke nogen særlig klar forklaring af hvordan den er nået frem til den interne vægtning, der gør at den gennem funktionsapproksimering kan generalisere på sine træningsdata, men alternative modeller såsom Random Forest gør dette bedre.
Et vigtigt skridt på vejen
Der er meget arbejde foran tilblivelsen af sådan en håndbog, lige som det er en krævende proces for ekspertgruppen at nå frem til de endelige anbefalinger, men udsigterne for en positionering af Danmark som det næste dataetiske fyrtårn er opstemmende. Der er meget vi kan gøre bedre, og jeg siger bestemt ikke at retningslinjerne er den fulde løsning på alle de dataetiske udfordringer vi står med nu og foran os, men det er et godt udgangspunkt og en god måde at sætte dagsordenen på tapetet, og oplyse den rette sti fremad for os, som en nation der både nu og i fremtiden kommer til at have data som vores vigtigste råstof.
Læs mere om den nye ekspertgruppe i dataetik her: http://dataetikdk.dk/
