Version2 vs. ITU's StarCraft AI: Deep learning giver en helt anden spiloplevelse

Foto: Niels Justesen
Version2 har testet danskudviklet StarCraft AI, der er bygget på et neuralt netværk. Den er tydeligvis mere menneskelig og mere alsidig end normale AI's. Men der mangler stadig lidt.

ITU's neurale netværk er absolut udfordrende, og der er det tydeligt, at dens valg afspejler rigtige spilleres, men også, at den stadig mangler lidt finjustering.

Version2 var i sidste uge ude at sparke dæk på ITU's nye StarCraft-AI. Skrivende journalist har tilfældigvis brugte mange timer på at mestre slagene i Korprulu-sektoren og blev endda Grand Master (top 200 i Europa) i StarCraft II, så den kunstige intelligens skulle naturligvis udfordres.

Selvom den tabte, skal den have mange rosende ord med på vejen.

AI'en forsøger at bygge som mennesker, men pga. de indbyggede sandsynligheder i det neurale netværk, er der alligevel forskel på, hvad den gør - og hvad dygtige spillere ville gøre. Dertil kommer en begrænsning i, at StarCraft er så kompliceret og forskelligt, at det neurale netværk i øjeblikket kun fokuserer på et enkelt af spillets i alt ni mulige match-ups (Protoss mod Terran).

Siden koden kigger på, hvad professionelle spillere gør (og de gør mange forskellige ting), så efterligner den ofte nogle mønstre, der kan være svære at forklare udefra.

»Det neurale netværk er trænet til at generalisere mellem situationer, den ikke har set før, og nogle gange er de nye situationer så unikke, at den har svært ved det. Som resultat tager den en underlig og unormal beslutning,« forklarer Niels Justesen, hvis ph.d.-projekt omhandler den omtalte AI.

Siden AI'en indtil videre kun har analyseret replays og ikke haft mulighed for at forbedre sig selv gennem tusinder – eller millioner af spil, så vil mange af de synlige fejl højst sandsynligt blive fixet.

Til StarCraft nørderne

Jeg spillede mod AI'en et spil, hvor den forsøgte at rushe mig med zealots, der er den første kamptrop, protoss kan bygge. Den lod (heldigvis for mig) ikke umiddelbart til at have en fornuftig transition til at gå late game.

Den forsøgte med en expansion, men AI'en var på det tidspunkt bagud i både økonomi og tech, og det lykkedes mig at slå den med en kombination af marines, medics, vultures og siege tanks.

Det var oprigtigt en anden oplevelse at spille mod en AI, der via deep learning spiller på et grundlag af menneskelige beslutninger fremfor en bot, der udelukkende er styret af regler. Besøget gav anledning til flere spil, der viste AI'ens alsidighed.

Jeg overværede et spil, hvor AI'en hurtigt byggede to gateways og et robotics facility, hvor den vandt med en hær af dragoons, der fik støtte af en reaver.

Læs også: ITU-forsker inviterer til Kulturnatten: Kom og spil StarCraft mod neuralt netværk

I videoen, der optræder i artiklen om AI'en, forsøger den at lave et dark templar build, der med lethed slår Blizzards egen indbyggede AI.

Fælles for alle tre spil var, at AI'en valgte vidt forskellige build orders, der dog alle er rigtige - og de bliver alle brugt af professionelle spillere.

Derfor laver AI'en fejl

Sandsynligheden for at bygge en given enhed eller bygning i starten af et spil StarCraft. Foto: Niels Justesen

Det neurale netværk styrer AI'ens build order - altså, hvilke ting den bygger hvornår. Det gør den med kendskab til, hvordan og hvornår ægte spillere har truffet beslutninger.

Når AI'en spiller protoss kigger den simpelthen på, hvad en menneskelig spiller ville gøre i samme situation. Så i starten af spillet er der typisk næsten 100 pct. sandsynlighed for at bygge en probe.

Som spillet skrider frem bygger man forskellige ting, og AI'en forholder sig som udgangspunkt til, hvad andre har bygget i lignende situationer, hvilket fint genspejler mennesker, men giver anledning til et par småfejl.

I StarCraft er der ting, du typisk bygger gennem hele spillet. Som protoss er det typisk probes og pylons, og siden dygtige spillere laver dem løbende - er der konstant en mulighed for, at AI'en beslutter, at det er tid til at bygge flere probes eller flere pylons, hvilket kan føre til at den laver alt for mange.

Samtidigt kan man også i StarCraft lave en række opgraderinger, der kun skal laves en enkelt gang i løbet af et spil, hvilket kan betyde, at AI'ens sandsynlighed for at lave netop den opgradering sjældent bliver høj nok til, at den faktisk prioriterer at lave den.

Taber stadig til erfarne spillere

Niels Justesen påpegede selv, at han forventer, at AI'en på nuværende tidspunkt vil kunne slå nye spillere - og også spillere, der er rustne, mens garvede spillere stadig burde kunne slå den.

Den vurdering virker ret præcis, men ambitionen er, at AI'en skal blive bedre endnu. Maskinen bør i længden blive god nok til, at den vil kunne emulere de bedste spilleres stil, og det vil det neurale netværk først lære, når den får mulighed for at træne mod sig selv en masse gange.

Der er altså plads til forbedringer endnu, men selv i AI'ens nuværende tilstand er min umiddelbare vurdering, at den lever fint op til ambitionen om at gengive en menneskelig spiller - dog lidt svækket af de manglende (men planlagte) iterationer af spil mod sig selv.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Følg forløbet
Kommentarer (3)
Jakob Uffelmann

Kunne desværre ikke deltage op kulturnatten, men kunne godt tænke mig at prøve det. Var engang danmarks mester i Brood war, men har ikke rørt det siden 2004'ish (heller ikke remastred) - har dog spillet SC2. Mon man kan komme forbi ITU en dag og prøve? :)

Er også specielt interesseret i transitions og hvordan AI'en short-term reagerer på ting som min buildorder, faints, fake drops og den slags. Specielt når zerg kommer ind i ligningen, åbner der sig ufattelig mange muligheder.

Jakob Uffelmann

Og hvordan AI'en reagerer på building placement :) Det har altid været et weakspot for AIs. Vil den stoppe et zealot rush hvis man laver wall-off? Eller et choke af bygninger på den lige vej.

Super sjovt hvor det her fører hen. SC er så ufattelig kompliceret i forhold til så mange andre spil, så det er mega spændenden.

Jørgen Pallesen

De fleste spil har lineær logik der bare kræver rå regnekraft, og således relativt simple algoritmer.

RTS med base bygning er i en helt anden boldgade da RTS byder på dynamiske strategier hvor der på højt skal improviseres og prioriteres, 2 ting der kræver høj abstrakt intelligens, fordi der ikke er noget definitivt resultat modsat TBS (turbaserede spil)

Log ind eller Opret konto for at kommentere
Pressemeddelelser

Welcome to the Cloud Integration Enablement Day (Bring your own laptop)

On this track, we will give you the chance to become a "Cloud First" data integration specialist.
15. nov 10:31

Silicom i Søborg har fået stærk vind i sejlene…

Silicom Denmark arbejder med cutting-edge teknologier og er helt fremme hvad angår FPGA teknologien, som har eksisteret i over 20 år.
22. sep 2017

Conference: How AI and Machine Learning can accelerate your business growth

Can Artificial Intelligence (AI) and Machine Learning bring actual value to your business? Will it supercharge growth? How do other businesses leverage AI and Machine Learning?
13. sep 2017