Mand med laptop får neuralt netværk til at gætte, hvad den forbløffede fyr spiser

En amerikansk tech-kunstner har gennemført et eksperiment, hvor han fik et neuralt netværk afviklet på en Macbook Pro til at beskrive et live feed af Amsterdams gader gennem et webcam.

Det virker næsten som en baby, der er ved at lære, hvordan verden ser ud.

Forskellen er, at der ikke er tale om et menneske i kød og blod, men om en laptop med et webcam og open source-programmet NeuralTalk2 installeret.

I en video går kunsteren Kyle McDonald rundt i Amsterdams gader, som han filmer direkte på sin laptop, som omgående beskriver det, som den ‘ser’.

‘A man is walking down the street with a suitcase’, skriver programmet i videoen, som kan ses i bunden af artiklen. Der er ganske vist tale om en pose og ikke en kuffert i optagelserne, så programmet rammer ikke altid hovedet på sømmet. Nogle gange skyder det helt forbi.

Men i flere tilfælde gætter det faktisk helt rigtigt på, hvad der bliver filmet. Eksempelvis rammer det helt plet, da kunstneren går forbi en ung mand, der er i færd med at spise en hotdog.

‘A man is eating a hotdog in a crowd’, skriver programmet prompte.

Læs også: Maskinlæring er en forlængelse af hjernen

Programmet NeuralTalk er lavet af den amerikanske ph.d.-studerende fra Stanford University Andrej Karpathy, som også arbejder med kunstig intelligens for Google på selskabets hemmelighedsfulde DeepMind-projekt.

Det er baseret på machine learning-systemet Torch, som også Facebook bruger, og som er blevet oplært til at kunne genkende tilbagevendende mønstre i billeder og beskrive dem med ord.

På Github kan man se et eksempel, hvor programmet endda er i stand til at genkende og beskrive ‘en kage med et stykke skåret ud’.

Læs også: Intelligent software kan overgå mennesket i at knuse data - men være svær at kontrollere

Kyle McDonald har brugt en særlig udgave af NeuralTalk2, der er blevet optimeret til et webcam. Det mest imponerende er nok, at al processeringen foregår lokalt på computeren, der er en Macbook Pro med grafikkortet Nvidia 750M med kun 2 GB hukommelse på grafikprocessoren.

Det er uden tvivl kun et spørgsmål om tid, før opfindelsen bliver brugt til mere end blot at gå ned ad gaden og filme forbipasserende med hotdogs for sjov. Det kræver ikke meget fantasi at forestille sig, hvordan teknologien kan bruges til hurtigt at lave tekstsøgninger på indholdet i tusindvis af timer af optagelser fra eksempelvis overvågningskameraer.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (5)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Kim Olsen

Det yder godt , problemet er bare at politiet nok alligevel ikke har tid til at komme og hjælpe, de har travlt med at finde fartsyndere der kører for hurtigt på ufarlige steder hvor man kunstigt har sat hastighedsgrænsen ned.
Jeg fik stjålet mit mobilkamera lige neden for et overvågningskamera. De gad ikke engang at kigge på videoen, endsige eftersøge de 2 tyve der var sammen om at stjæle det.
Så vi skal nok også have en robot til hjælp her.

Ditlev Petersen

Det næste trin bliver vel clairvoyante computere. Det skulle ikke være så svært igen. Hvis et indlæg har ca. 200 kommentarer, er det drejet over på muslim-bashing. Hvis det har mellem 100 og 200 kommentarer, så har Trine Bramsen udtalt sig. Sådan noget kan en robot (virtuel eller i plast og metal) hurtigt lære. Så naturligvis kan den også forudse, hvad folk vil gøre.
Faktisk har man for nogen år siden haft en computer til at studere videooptagelser fra togstationer. Det er muligt at udpege selvmordere lang tid i forvejen. Det var så ikke real-time, så der var intet at gøre på det tidspunkt. Men der er givet andre "interessante" personer, der opfører sig specielt. Tilsyneladende går jeg mærkeligt, når jeg har lavet fis med en eller anden.
Minority Report - uden svage led.

Log ind eller Opret konto for at kommentere