Nvidia-AI genererer troværdige billeder af opdigtede mennesker

Foto: Nvidia
Ved at fodre en AI med 30.000 billeder af kendisser, er den i stand til at generere troværdige billeder af, hvordan den mener, mennesker ser ud. Og den gør det godt.

Nvidia har udviklet en algoritme, som er i stand til at skabe billeder af mennesker udelukkende baseret på en viden om, hvordan mennesker generelt ser ud.

Det skriver Quartz.

Nvidia GAN, som systemet hedder, er egentlig i sig selv simpelt. Man viser to AI's omkring 30.000 billeder af kendte mennesker ansigter og fortæller, at det er sådan, mennesker ser ud. Derefter bliver den ene AI sat til at skabe troværdige billeder af mennesker, mens den anden hele tiden fortæller, hvorvidt billedet faktisk er troværdigt. Her fortsætter animeringen frem til, at der er bygget et troværdigt billede, og de to AI's går videre til næste design.

Antallet er nøglen

Faktisk formår AI'en at skabe billeder, som for det meste ikke falder i 'the uncanny valley', eller som ser særligt unaturlige ud. Og her er nøglen antallet. I 2012 viste en undersøgelse, at mængden af data, som man sender gennem et neuralt netværk, er alfa og omega i forhold til succesen af den opgave, netværket skal udføre.

Og i dette tilfælde fodrede Nvidia som sagt AI'en med 30.000 billeder af, hvordan kendte mennesker så ud, og det er derfra, at præcisionen kommer. Dette skal naturligvis lægges til erfaringerne, som AI'en løbende drager.

Ifølge Quartz er systemet allerede ved at gøre sit indtog i modeverdenen, hvor den grundet den høje grad af realisme kan øjnes at erstatte modefotograferne.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (6)
Lars Christensen

Jeg går ud fra at formålet med at skrive en historie der involvere ovenikøbet 2 maskiner med kunstig intelligens (AI'er), er at visualisere tilstedeværelsen af kunstig intelligens.

At kopiere og udforme fotos, således at de ligner mennesker er ikke kunstig intelligens. Det er maximalt en kombination af photoshop og billedgenkendelse.

Det ville være rigtig rart om V2 som professionelt medie, fik defineret hvad kunstig intelligens indebærer og at alt andet blev sorteret fra, fordi det kun er salgssnak.

David Konrad

Det handler om en helt ny metode for machine learning, der er meget mere effektiv end eksisterende teknologier, og som end ikke fjernt kan sammenlignes med "photoshop og billedgenkendelse". Humlen er jo, at al computergenereret grafik i bedste fald ser computergenereret ud, i værste fald giver myrekryb eller en følelse af at se ind i et parallelunivers. Det er ikke lykkedes nogen før at skabe troværdig grafik på den måde, uden menneskelig tilretning og bedømmelse. Brugen af et tovejs "kontradiktorisk" netværk rækker langt videre end simple headshots, der blot er proof of concept, og umiddelbart kan bruges i t.ex spilindustrien.

Det er særligt interessant fordi Nvidia samtidig er førende indenfor forskning af selvkørende biler mm. Deres biler har tilsvarende lært sig at køre uden der er givet een eneste menneskelig instruktion. Nvidias problem er at de ikke kan redegøre for hvorfor bilen f.eks kører til højre og ikke til venstre, de kan ikke sende en manual til myndighederne der forklarer at når der sker X gør bil handling Y.

Vi mennesker kan fint bruge 100% computergenereret grafik der 99.99% ligner virkeligheden, eller et fotografi, men t.ex en selvkørende bil har også brug for pålidelig måde at tolke omverdenen på, f.eks om et skilt faktisk er et skilt, og ikke et billede af et skilt, eller bare 99% ligner et skilt.

David Konrad

@Lars Christensen - det er nu ikke udtryk for noget fordækt, det skyldes at man (for tiden) ikke rigtig har nogen måde at læse AI'er over skulderen på. Det er en sort boks hvor hvert lag er "indlært" med vægte, der påvirker næste lag, der påvirker næste lag osv osv. Du kan konstatere at dit trænede netværk får et input og giver et tilfredsstillende output, men i modsætning til programmer og algoritmer kan du ikke redegøre for "programmets" virkemåde. Du kan ikke fastslå at i function x på linie 4566 i modul y vil din bil (eller hvad det nu er, det her eksploderer snart) ud fra de og de variable blive sendt til højre, og aldrig nogen sinde til venstre. Og det er jo et problem, når det handler om mennesker, sikkerhed og den slags - i hvert fald ift vores gængse måde at validere og godkende maskiner og programmer på. Det bliver der nok lavet om på :)

Der er en glimrende artikel om emnet her The Dark Secret at the Heart of AI

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 10:31

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017