https://frosthead.com

Тази AI игра на покер знае кога да ги задържите и кога да ги сгънете

Компютърна програма, наречена Pluribus, победи професионалисти в покера в серия от шест играчи без ограничения Texas Hold'em игри, достигайки крайъгълен камък в изследванията за изкуствен интелект. Това е първият бот, който победи хората в сложна мултиплейър конкуренция.

Както изследователи от AI лабораторията на Фейсбук и университета Карнеги Мелън отчитат в сп. Science, Плурибус излезе победител в двубоите, доминирани от хора и алгоритми. Първоначално Мерит Кенеди пише за NPR, пет версии на бота, изправени срещу един професионален покер играч; в следващия кръг от експерименти, един бот игра срещу пет човека. В блог във Facebook, AI печели средно около $ 5 на ръка или $ 1000 на час, когато играе срещу петима човешки опоненти. Този процент се счита за „решаващ марж на победа“ сред покер професионалистите.

В разговор с Кенеди, четирикратният шампион на World Poker Tour Дарън Елиас обяснява, че той е помогнал да тренира Pluribus, като се състезава срещу четири маси на съперници на бота и предупреждава учените, когато AI направи грешка. Скоро ботът „се подобряваше много бързо, [преминавайки] от посредствен играч в основата на покер играч на световно ниво в рамките на дни и седмици.“ Опитът, според Елиас, беше „доста страшен.“

Според Джеймс Винсент от Verge, Pluribus - изненадващо евтин AI, обучен с ресурси за облачни изчисления на стойност по-малко от $ 150 - допълнително усвои покер стратегията, като играе срещу копия на себе си и се учи чрез опит и грешки. Както отбелязва Дженифър Оуеле за Ars Technica, ботът бързо осъзна, че най-добрият му начин на действие е комбинация от геймплей и непредвидими ходове.

Повечето човешки професионалисти избягват „донк залагания“, което намира играч, който завършва един рунд с обаждане и започва следващия с залог, но Плурибус с готовност възприема непопулярната стратегия. В същото време, съобщава Ouellette, AI също предлага необичайни размери на залозите и показва по-добра рандомизация от противниците.

„Основната му сила е способността му да използва смесени стратегии“, каза Елиас, според изявление на CMU. „Това е същото, което хората се опитват да направят. Въпрос на екзекуция е за хората - да правят това по напълно случаен начин и да го правят последователно. Повечето хора просто не могат. "

Pluribus не е първият AI играещ покер, който побеждава човешките професионалисти. През 2017 г. създателите на бота, Ноам Браун и Туомас Сандхолм, разработиха по-ранна итерация на програмата, наречена Libratus. Този AI решително побеждава четири покер професионалисти в 120 000 ръце на двама играчи Texas Hold'em, но както обяснява публикацията в блога във Facebook, беше ограничен от факта, че се сблъсква само с един опонент наведнъж.

Според Will Knight на MIT Technology Review, покерът представлява предизвикателство за AI, тъй като включва множество играчи и множество скрита информация. Сравнително, игри като шах и Go включват само двама участници, а позициите на играчите са видими за всички.

За да преодолеят тези препятствия, Браун и Сандхолм създадоха алгоритъм, проектиран да предвижда следващите два или три хода на противника, а не да преценява стъпките им до края на играта. Въпреки че тази стратегия може да изглежда да даде приоритет на краткосрочната печалба пред дългосрочните печалби, Верджънс Винсент пише, че „краткотрайната настойчивост наистина е всичко, от което се нуждаете“.

Движейки се напред, мултиплейър програми като Pluribus могат да бъдат използвани за проектиране на лекарства, способни да се борят с антибиотични резистентни бактерии, както и да подобрят киберсигурността и военните роботизирани системи. Като Отбелязва Ouellette от Ars Technica, други потенциални приложения включват надзор на многостранни преговори, ценообразуване на продукти и стратегии за наддаване на аукциона за мозъчна атака.

Засега, казва Браун на Knight, алгоритъмът ще остане до голяма степен под опасност - главно за да защити онлайн покер индустрията от претърпяване на опустошителни финансови загуби.

Изследователят заключава: „Това може да бъде много опасно за покер общността.“

Тази AI игра на покер знае кога да ги задържите и кога да ги сгънете