AI slår 5 pokermestre i Texas hold’em
Texas hold’em med 6 spillere er den nyeste tilføjelse til listen af spil, som computere er bedre til end de bedste mennesker. Den kunstige intelligens Pluribus har således vundet over fem professionelle pokerspillere i samme spil.
Det skriver onlinemediet Techcrunch.
Pluribus er udviklet i samarbejde mellem forskere fra Carnegie Mellon University og Facebook.
Monte Carlo er stadig sagen
Ligesom Googles Go-AI AlphaZero og mange andre moderne spil-AI's baserer Pluribus sine evner på en kombination af Monte Carlo simulation og er blevet trænet ved at spille mod sig selv om og om igen.
Monte Carlo er en metode, hvor en kunstig intelligens, der skal tænke flere træk frem, prioriterer træk, der ser lovende ud på baggrund af nogle bestemte regler, såkaldte expert policies.
På den måde slipper den kunstige intelligens for at skulle kigge alle træk igennem, og kan blot kigge igennem de mest sandsynlige udfald, på en måde der kan sammenlignes med, hvordan mennesker tænker flere træk frem.
Monte Carlo reducerer den såkaldte branching faktor - antallet af mulige træk i hvert led - og gør derfor den enorme mængde udregninger, en AI skal foretage, markant mindre.
I forskningsartiklen om Pluribus beskriver forskerne, hvordan de har gjort brug af Monte Carlo counterfactual regret minimization (MCCFR).
Med MCCFR simulerer Pluribus en hånd, inklusive den forventede strategi fra modstanderens side, og undersøger hvor meget bedre, den kunne have klaret sig, med en anden strategi. Derefter undersøger den det samme spørgsmål for den følgende hånd, og så videre.
God indtjening
På deres AI blog skriver Facebook, at i den kunstige intelligens kunne vinde over topprofessionelle spillere både ved borde med 1 AI og 5 mennesker, og borde med 5 AIs (der spiller mod hinanden) og ét menneske.
Hvis en chip var $1 værd, ville Pluribus have vundet i gennemsnit $5 per hånd, og ville tjene omkring $1.000 i timen (ca. 6.600 kroner) mod de professionelle spillere.
Kompliceret med mange spillere
Kunstig intelligens har allerede vist sig at kunne vinde over et menneske en mod en, når der kun er to spillere med. Men tilføjelsen af mange spillere, gør udfordringen markant højere.
Ifølge Facebook har Pluribus’ pokerevne betydning ud over gambling. Det er nemlig et udtryk for, at kunstig intelligens kan håndtere komplicerede situationer med adskillige aktører og skjult information.

...men det er dyrt at lave god journalistik. Derfor beder vi dig overveje at tegne abonnement på Version2.
Digitaliseringen buldrer derudaf, og it-folkene tegner fremtidens Danmark. Derfor er det vigtigere end nogensinde med et kvalificeret bud på, hvordan it bedst kan være med til at udvikle det danske samfund og erhvervsliv.
Og der har aldrig været mere akut brug for en kritisk vagthund, der råber op, når der tages forkerte it-beslutninger.
Den rolle har Version2 indtaget siden 2006 - og det bliver vi ved med.