Ny forskning: Beslutningsstøttende AI i brystkræftscreening øger træfsikkerheden


Et nyt tysk forskningsstudie peger på, at der opdages flere tilfælde af brystkræft, når radiologer og AI understøtter hinanden.
- emailE-mail
- linkKopier link

- Sortér efter chevron_right
- Trådet debat
Bland nu ikke tingene sammen. Artiklen handler IKKE om screening eller ej. Den handler om eventuelle meritter ved brug af AI.
Artiklen, og efter følgende Torben Mogensen fremhæver TO forhold ved kombineret radiolog og AI:
- 30% produktivitetsforbedring hos de (knappe) radiologer
- En ikke triviel forbedret detektion (TMs kommentar).
Derfor må AI anvendelsen fremmes - med mindre gældende lov om diagnostisering (screening) ændres.
Artiklen handler om AI brugt ved screening:
Forskningsstudiet er, ifølge MIT Technology Review, det første fagfællebedømte studie, der »direkte sammenligner en AI's performance i forbindelse med screening for brystkræft,
I mine øjne vil det være uetisk at tage i brug på basis af de to ting, du nævner, i det de to ting ikke siger noget om forbedret samlet overlevelse. Tvært imod er der en risiko for, at man ved at finde to procent flere i et tidligt stadie, øger risikoen for, at det ikke vil øge, men reducere den samlede overlevelse på langt sigt.
Jeg mener derfor, at man er nødt til at gøre disse projekter færdige, inden man kan sige noget om, om det er en god idé at inddrage AI i screeningen.
Og som jeg nævner, så står der ikke noget om, hvordan behandlingsresultaterne og overlevelsen er på længere sigt i de to forsøg. Der står kun, at man ved en kombination af AI og speciallæge finder omkring 2 % flere tilfælde. Og der er - så vidt jeg ved - ikke enighed om, om det nødvendigvis er en god ting. Måske havde man levet længe og lykkeligt med en lille knude, i stedet for at skulle bruge år af sit liv på meget belastende behandling.
Den slags bør man også undersøge i seriøs forskning.
Om AI så måske kan øge præcisionen af diagnosen, hvis der i forvejen er mistanke om brystkræft - ja, det ved jeg ikke.
En stigning fra 87,2% til 89,8% i træfsikkerhed lyder måske ikke af så meget, men hvis man vender det om, så er der med den gamle model 12,8% chance for ikke at opdage faktisk kræft, hvor der med den nye kun er 10,2% chance for ikke at opdage det. Det betyder, at 20% færre kræfttilfælde forbliver uopdagede. Bare at sige "en forbedring på 2,6%" er ikke specielt informativt.
Alle medicinske forsøg har et element af etik og moral, hvilket kan medføre at et forsøg opgives, HVIS der viser sig store positive virkninger (det er uetisk og umoralsk IKKE at lade positive virkninger komme alle til gode), ELLER et forsøg opgives, HVIS der er (store) negative virkninger.
Det danske forsøg er planlagt til to år + tid til evaluering; skal vi sige yderligere ialt to år fra nu.
HVIS radiologernes kapacitet øges med 30% OG når der er mange uacceptabelt forsinkede undersøgelser, er det så ETISK FORSVARLIGT ikke STRAKS at udbrede systemet UAFHÆNGIGT af forsøget (som bør fortsætte) ?
30% er så signifikant, at vi vel ikke kan vente 2+ år på en langhåret rapport ?
HVIS radiologernes kapacitet øges med 30% OG når der er mange uacceptabelt forsinkede undersøgelser, er det så ETISK FORSVARLIGT ikke STRAKS at udbrede systemet UAFHÆNGIGT af forsøget (som bør fortsætte) ?
Hvis man ikke ved endnu, om den besparelse til gengæld koster mange uopdagede kræfttilfælde, så vil det være uetisk at tage det i brug nu. Det fremgår ikke.
Og så er der jo også det aspekt, at der er en ongoing diskussion om, om det faktisk øger overlevelsen at screene, så alle tilfælde findes. Der er dem, som mener, at man kan leve mange år med milde tilfælde, og ende med at dø af noget andet, og at det derfor ikke nødvendigvis forlænger levetiden at operere og behandle alle tilfælde, da operation og behandling også indebærer risici.
Så forskningsprojekter bør også se på den samlede overlevelse på længere sigt, ikke kun brystkræft-overlevelsen, inden man kan afgøre, om AI-doktorer er et fremskridt.
"Ved den første fremgangsmåde analyserede og klassificerede modellen selv alle røntgenbillederne. Her viste det sig dog, at AI-modellens træfsikkerhed er dårligere end når en radiolog selv forestår undersøgelser for brystkræft."
Det er jo vigtigt at få slået fast.
"De første resultater fra det danske forsøg peger på at introduktionen af en beslutningsstøttende AI-model, vil kunne skære ca. 30 procent af den tid som radiologerne bruger på at vurdere røntgenbilleder fra brystkræftscreening."
Hvordan med præcisionen i det danske forsøg? Fandt man også der flere tilfælde? Eller færre? Eller sparede man bare tid og penge?
Og hvem står for algoritmen? IBM's Doctor Watson (som vi hørte om for nogle år siden)? For i så fald løber man vel ind i et GDPR-problem? (ud over, at den gode doktor ikke dengang var særligt god til at diagnosticere - måske har han været på efteruddannelse?)