Googles neurale netværk kan spotte, hvor dine fotos er taget

Machine learning gør computeren i stand til at genkende, hvor i verden tilfældige foto er taget

Hvis du får stukket et foto af Eiffeltårnet eller Sagrada Familia i hånden, ville du næppe have problemer med at geografisk at placere dem i henholdsvis Paris og Barcelona. Det bliver straks sværere, hvis der er tale om et bjergtagende landskab eller et lille hyggelig gadebillede uden specifikke kendetegn.

Alligevel er mennesker overraskede gode til at placere sådanne foto geografisk på baggrund af erfaring og evnen til at aflæse andre elementer i billederne.

Det skriver MIT Technology Review, der kan fortælle, at forskere ved Google har valgt at tage denne udfordring op, og har trænet det neurale netværk PlaNet til netop at kunne geografisk placere foto på baggrund af visuelle markører som byggestil, skilte, planteliv med videre.

Computeren langt bedre til at genkende foto end mennesker

PlaNet deler således hele kloden ind i 26.000 felter af varierende størrelser afhængig af antallet af foto, der er taget de enkelte steder. Således er storbyer inddelt i et mere finmasket net end for eksempel den russiske tundra. Dette system er så koblet sammen med en database med 126 millioner geotaggede foto.

For at teste systemet fodrede forskerne fra Google det med 2,3 millioner tilfældigt udvalgte foto fra webtjenesten Flickr. Heraf kunne PlaNet lokalisere 3,6 procent af billederne helt ned på gadeplan, og i yderligere 10,1 procent af tilfældene kunne systemet udpege, hvilken by billedet stammede fra. 28,4 procent blev indsnævret til land mens 48 procent kunne placeres på kontinentniveau.

PlaNet fik også mulighed for at konkurrere mod 10 menneskelige globetrottere i onlinespillet Geoguessr, der handler om at gætte, hvor tilfældige Google Streeet View billeder er taget. Computeren vandt 28 ud af 50 runder og havde en gennemsnitlig fejlmargen på 1131,7 kilometer – de menneskelige modstandere havde en fejlmargen på 2320,75 kilometer.

”Vi tror at PlaNet har en fordel frem for mennesker, fordi den har set langt flere steder end et menneske nogensinde kan besøge og har lært sig subtile detaljer i landskaberne som selv meget berejste mennesker vil have svært ved at skelne,” fortæller Tobias Weyand fra Google til MIT Technology Review.

Nok så imponerende er det, at systemet, ifølge Tobias Weyand, ikke optager mere end 377 MB hukommelse, og derfor ville kunne integreres i for eksempel en smartphone. Det kunne på længere sigt resultere i foto applikationer, der er i stand til at geotagge foto uden brug af GPS.

Kommentarer (0)

Log ind eller opret en konto for at skrive kommentarer

JobfinderJob i it-branchen