AI kan reparere og gøre slørede billeder skarpe

Uden at benytte andre billeder som inspiration kan et helisk neuralt netværk gøre billeder bedre.
Et dybt helisk neuralt netværk kan gøre uskarpe billeder skarpe udelukkende ved at bruge information fra selve billedet. Effekten er dog mindre synlig her på grund af Version2's CMS-system. Illustration: Dmitry Ulyanov

Det er fup og fidus, men det virker: Kunstig intelligens kan genskabe billedinformation, så resultatet til forveksling ligner originalen.

Teknologien har været fremme i et stykke tid, men nu har tre russiske forskere skabt en algoritme, der siger spar to i forhold til tidligere forsøg. Det er de såkaldte 'dybe heliske neurale netværk' (deep convolutional neural networks, CNN) som er velegnede til opgaver af denne type. Det skriver Bleeping Computer.

Deep Image Prior, som algoritmen er navngivet, adskiller sig fra andre tilsvarende algoritmer ved at benytte billedets egen information til reparationsopgaverne i stedet for at bygge på et træningssæt med andre billeder til udbedring af fejl og mangler.

Det kan blandt andet benyttes til at gøre slørede billeder skarpe, til at fjerne støj af forskellig art og til at tilføje manglende dele af et billede.

Algoritmen EnhanceNet-PAT kan skabe et billede (nr. 3 fra venstre) ud fra en sløret original (nr. 1), så det til forveksling ligner originalen (th). Illustration: Mehdi S. M. Sajjadi

Koden bag er skrevet i Python og kan hentes hos Github.

Deep Image Prior er ikke den eneste nye algoritme, der kan genskabe informationer i billeder, så det næppe er til at se. En anden ny algoritme, EnhanceNet-PAT, benytter i modsætning til Deep Image Prior et testsæt til at gætte på den manglende information. Teknologien kan blandt andet anvendes til at skabe billeder med højere opløsning end originalen.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (7)
Torben Mogensen Blogger

Selv om billede 3 virker skarpere end billede 2, så er de fine detaljer markant anderledes end i originalbilledet, så det giver et falsk indtryk af kvalitet. Så jeg foretrækker faktisk billede 2.

Men uanset metode, så er det problematisk at bruge algoritmisk slørede (f.eks. med bikubisk interpolation) billeder som testdata. Kendskab til algoritmen for sløring kan give resultater, der er bedre end for optisk uskarpe billeder. En bedre test vill f.eks. være, hvis algoritmen prøvede at gøre bladene i forgrund og baggrund af originalbilledet skarpe -- uden at det gik ud over kvaliteten af hovedmotivet.

Troels Bjerre Lund

Det er kun journalister, der oversætter fagtermer til dansk. Jeg ville forsvare den praksis, hvis det oversatte udtryk gav mening for lægmand, for oversættelsen er i hvert fald ikke til ære for fagpersonerne. Der er dog ikke noget "helisk" over et convolutional neural network; det er hverken en helix, og har heller intet med solen at gøre.

Tidligere i år kaldte i det for et falsionsnetværk (https://www.version2.dk/artikel/ansigtsgenkendelsessoftware-gaar-skridte...). Det giver faktisk mening; dog kun for den brøkdel af befolkningen der ved hvad det fysisk betyder at false noget og samtidig har nok matematik i bagagen til at kunne koble det sammen med den matematiske operation foldning. Dermed er vi nærmere en insiderjoke end en god oversættelse.

Det fundamentale spørgsmål er: Bliver lægmand klogere af at journalisten leger tegn og gæt? Er det bedre at skrive "Til det bruges der et højt origaminetværk (deep convolutional neural network)" end at skrive "Til det bruges der et deep convolutional neural network". Hvis I virkelig ville hjælpe læseren, så ville I skrive "Til det bruges der et convolutional neural network (https://en.wikipedia.org/wiki/Convolutional_neural_network)".

Steen Iversen

Engelske fagudtryk gør det nemmere at Google videre selv i alt fald :)

Ja, metoden skaber skarpe billeder, men ikke billeder tro mod originalen. I eksempler med ansigter kommer personerne til at se ret anderledes ud, formentlig iblandet træk fra ansigter i trænings billederne. Det er jo nok lidt problematisk...

Leif Neland

(eller alle de andre steder, der laves krimi-TV)

Vi har jo tit med hovedrysten set at der hives ansigter og nummerplader ud af slørede fotos med en simpel "enhance image" ordre.

Det kunne være interessant at se denne algoritme sluppet løs på slørede nummerplader. Mon ikke den kan gætte forkert en del gange?

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 2017

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017