AI slår 5 pokermestre i Texas hold’em

Illustration: maxxyustas, BigStock
En kunstig intelligens har vist sig i stand til konsekvent at vinde penge i et spil med fem professionelle pokerspillere.

Texas hold’em med 6 spillere er den nyeste tilføjelse til listen af spil, som computere er bedre til end de bedste mennesker. Den kunstige intelligens Pluribus har således vundet over fem professionelle pokerspillere i samme spil.

Det skriver onlinemediet Techcrunch.

Pluribus er udviklet i samarbejde mellem forskere fra Carnegie Mellon University og Facebook.

Monte Carlo er stadig sagen

Ligesom Googles Go-AI AlphaZero og mange andre moderne spil-AI's baserer Pluribus sine evner på en kombination af Monte Carlo simulation og er blevet trænet ved at spille mod sig selv om og om igen.

Monte Carlo er en metode, hvor en kunstig intelligens, der skal tænke flere træk frem, prioriterer træk, der ser lovende ud på baggrund af nogle bestemte regler, såkaldte expert policies.

På den måde slipper den kunstige intelligens for at skulle kigge alle træk igennem, og kan blot kigge igennem de mest sandsynlige udfald, på en måde der kan sammenlignes med, hvordan mennesker tænker flere træk frem.

Monte Carlo reducerer den såkaldte branching faktor - antallet af mulige træk i hvert led - og gør derfor den enorme mængde udregninger, en AI skal foretage, markant mindre.

I forskningsartiklen om Pluribus beskriver forskerne, hvordan de har gjort brug af Monte Carlo counterfactual regret minimization (MCCFR).

Med MCCFR simulerer Pluribus en hånd, inklusive den forventede strategi fra modstanderens side, og undersøger hvor meget bedre, den kunne have klaret sig, med en anden strategi. Derefter undersøger den det samme spørgsmål for den følgende hånd, og så videre.

Læs også: Google kombinerede neurale netværk for at vinde 4-1 i brætspillet Go

God indtjening

På deres AI blog skriver Facebook, at i den kunstige intelligens kunne vinde over topprofessionelle spillere både ved borde med 1 AI og 5 mennesker, og borde med 5 AIs (der spiller mod hinanden) og ét menneske.

Hvis en chip var $1 værd, ville Pluribus have vundet i gennemsnit $5 per hånd, og ville tjene omkring $1.000 i timen (ca. 6.600 kroner) mod de professionelle spillere.

Kompliceret med mange spillere

Kunstig intelligens har allerede vist sig at kunne vinde over et menneske en mod en, når der kun er to spillere med. Men tilføjelsen af mange spillere, gør udfordringen markant højere.

Ifølge Facebook har Pluribus’ pokerevne betydning ud over gambling. Det er nemlig et udtryk for, at kunstig intelligens kan håndtere komplicerede situationer med adskillige aktører og skjult information.

Tips og korrekturforslag til denne historie sendes til tip@version2.dk
Kommentarer (3)
sortSortér kommentarer
  • Ældste først
  • Nyeste først
  • Bedste først
Jørgen Pallesen

Har spillet mange computerspil over årene, burde snart være en mulighed for at få en AI til at lære os at spille spil optimalt, der er mange nybegyndere derude der godt kunne trænge til at lære at spille ordenligt.

Måske det kunne give afkast til andre steder i livet, at optimere arbejdsgang, at gøre hverdagen lettere.

Log ind eller Opret konto for at kommentere