https://frosthead.com

AI се учи на работа в екип чрез доминиране в мултиплейър видео игри

Компютрите доминират хората в игри един на един като шах от десетилетия, но получаването на изкуствен интелект (AI) за сътрудничество със съотборниците е малко по-сложно. Сега изследователите от проекта DeepMind на Google научиха играчите на AI да работят заедно в екипи както с хора, така и с други компютри, за да се състезават във видео играта Quake III Arena от 1999 г.

Ед Гент от Science съобщава, че когато AI има само един опонент, той обикновено се справя доста добре, тъй като само предвижда възможните ходове на един ум. Но работата в екип е съвсем различен въпрос, тъй като включва действия, в които компютрите не са традиционно добри, като например прогнозиране как ще се държи група съотборници. За да направи AI наистина полезен, той трябва да се научи как да си сътрудничи с други интелегенции.

Екипът на Google DeepMind обяснява в публикация в блога:

„Милиарди хора обитават планетата, всеки със свои индивидуални цели и действия, но все още са способни да се съберат чрез екипи, организации и общества във впечатляващи прояви на колективна интелигентност. Това е настройка, която наричаме мултиагентно обучение: много отделни агенти трябва да действат независимо, но въпреки това да се научат да взаимодействат и да си сътрудничат с други агенти. Това е изключително труден проблем - защото с агентите за съвместно адаптиране светът непрекъснато се променя. "

Мултиплейър, видео игри от първо лице, в които екипи от играчи обикалят около виртуални светове, обикновено стреляйки с пушки или гранатомети един на друг, е идеалното място за AI да научи тънкостите на екипната работа. Всеки играч трябва да действа индивидуално и да прави избор, който е от полза за отбора като цяло.

За проучването екипът тренира AI да играе за улавяне на знамето на платформата Quake III Arena . Правилата са доста прости: Два отбора се изправят на бойно поле, подобно на лабиринт. Целта е да уловите колкото се може повече от виртуалните флагове на другите отбори, като същевременно защитават своите собствени, и който и да е отбор заснема най-много флагове за пет минути печалби. На практика обаче нещата могат да се усложнят много бързо.

Екипът на DeepMind създаде 30 алгоритми на невронни мрежи и ги накара да се бият помежду си на поредица от произволно генерирани карти на играта. Ботовете вкараха точки, като улавяха знамена и забиваха други играчи, пращайки ги обратно в зона за възстановяване, където героят им се рестартира. В началото действията на ботовете изглеждаха случайни. Въпреки това, колкото повече играеха, толкова по-добри ставаха. Всички невронни мрежи, които постоянно губиха, бяха елиминирани и бяха заменени от модифицирани версии за спечелване на AI В края на 450 000 игри, екипът увенча една невронна мрежа - наречена For Win (FTW) - като шампион.

Групата DeepMind изигра алгоритъма на FTW срещу онова огледало ботове, на които липсват умения за AI обучение, а след това и срещу човешки екипи. FTW смаза всички състезатели.

След това групата проведе турнир, в който 40 играчи на хора бяха съчетани на случаен принцип както съотборници, така и противници на бота. Според публикацията в блога, човешките играчи установяват, че ботовете са по-съвместни от техните съотборници в реалния живот. Човешките играчи, сдвоени с агентите на FTW, успяха да победят кибер воините в около 5 процента от мачовете.

Както научиха, ботовете откриха някои стратегии, отдавна приети от човешките играчи, като например да се мотаят в близост до точка на възстановяване на знамето, за да я хванат, когато се появи отново. Екипите на FTW също откриха грешка, която можеха да експлоатират: ако застрелят собствения си съотборник отзад, това им даде скоростно увеличение, нещо, което използваха в своя полза.

„Това, което беше невероятно по време на развитието на този проект, беше появата на някои от тези поведения на високо ниво“, казва изследователят на DeepMind и водещ автор Макс Джадерберг пред Gent. „Това са неща, с които можем да се свържем като човешки играчи.“

Една от основните причини ботовете да са по-добри от играчите на хора е, че те са бързи и точни стрелци, което ги прави по-бързи при равенството от техните човешки опоненти. Но това не беше единственият фактор за техния успех. Според блога, когато изследователите построили за четвърт секунда забавено време за реакция в роботите-стрелци, най-добрите хора все още можеха да ги победят само около 21 процента от времето.

След това първоначално проучване, FTW и неговите потомци бяха отприщи на пълното бойно поле Quake III Arena и показаха, че могат да овладеят още по-сложен свят с повече възможности и нюанс. Те също така са създали бот, който се отличава с ултра сложната космическа игра на стратегия Starcraft II.

Но изследването не се състои само в създаването на по-добри алгоритми за видеоигри. Научаването за работа в екип може в крайна сметка да помогне на AI да работи в автопарки на самоуправляващи се автомобили или може би някой ден да се превърне в роботизирани асистенти, които помагат да се предвидят нуждите на хирурзите, съобщава Science 's Gent.

Не всички обаче смятат, че аркадните звездни ботове представляват истинска екипна работа. Изследователят на AI Марк Ридл от Georgia Tech казва на New York Times, че ботовете са толкова добри в играта, защото всеки от тях разбира в дълбочина стратегиите. Но това не е задължително сътрудничество, тъй като на екипите на ИИ липсва един основен елемент от човешката работа в екип: комуникация и умишлено сътрудничество.

И, разбира се, им липсва и другият отличителен белег на съвместното преживяване на видеоигри: боклук, който говори на другия екип.

AI се учи на работа в екип чрез доминиране в мултиплейър видео игри