https://frosthead.com

Най-новият AI учи сам да играеш без помощ от човека

Миналата година програма за изкуствен интелект, наречена AlphaGo, създадена от екипа на DeepMind на Google, победи човешки шампион в Go, древна китайска стратегическа игра, която в много отношения е по-сложна от шахмата. Както Емили Матчар съобщи за Smithsonian.com по онова време, това беше изумително постижение, тъй като още през 1997 г. някои хора прогнозираха, че ще отнеме 100 години, за да може компютърът да победи човек в Go.

Докато подвигът е впечатляващ, AlphaGo се научи да играе играта, като анализира предишни игри, играни от хората. Но както съобщава Мерит Кенеди от NPR, нова версия на изкуствения интелект, наречена AlphaGo Zero, измисли как да овладее играта самостоятелно, без човешки принос или манипулация - напредък, който има големи последици за бъдещото развитие на ИИ.

Според прессъобщение на DeepMind, предишните версии на AlphaGo са се научили да играят играта, като са изучавали мачове между професионални и силни любителски играчи, усвоявайки правилата на играта и успешните стратегии на игра. AlphaGo Zero обаче не гледа нито една игра, играна от хората. Вместо това му бяха дадени правилата на играта и след това се играе срещу себе си, използвайки усилване за обучение, за да се научи на правилни и грешни ходове и дългосрочни стратегии. Докато AI играеше играта, тя актуализира своята разширена невронна мрежа, за да прогнозира по-добре ходовете на противника си.

Изследователите наблюдавали как ИИ овладява играта в реално време. След три дни успя да победи предишна версия, наречена AlphaGo Lee, която победи корейския Go Master Lee Lee Sedol в 4 от 5 мача през 2016 г. След 21 дни тя победи AlphaGo Master, версията, която победи 60 топ играчи Go онлайн и Най-добрият играч в света Ke Jie по-рано тази година. Последната версия надхвърли AlphaGo Master 100 игри до 0. След 40 дни тя достигна нива на игра, които никой не е виждал преди. Изследването се появява в списание Nature.

„За кратко време AlphaGo Zero е разбрал всички знания за Go, които са били натрупани от хората в продължение на хиляди години игра“, казва водещият изследовател Дейвид Силвър от DeepMind на Google във видеоклип в Youtube. „Понякога всъщност е избрано да надхвърли това и да открие нещо, което хората дори не са открили в този период от време и е открил нови части от знанието, които са творчески и нови по много начини.“

Както съобщава Agence France-Presse, AlphaGo Zero достигна това ниво на майсторство много по-ефективно от своите предшественици. Докато предишната итерация имаше 48 единици за обработка на данни и играеше 30 милиона тренировъчни игри в продължение на няколко месеца, Zero имаше само 4 обработващи единици и изигра 4.9 милиона тренировъчни игри за три дни. "Хората са склонни да приемат, че машинното обучение е свързано с големи данни и огромни изчисления, но всъщност това, което видяхме при AlphaGo Zero, е, че алгоритмите имат значение много повече", казва Силвър пред AFP.

Но изследването е повече от просто овладяване на настолна игра. Както съобщава Иън Сампъл от The Guardian, този тип табула раса или празен лист, ученето може да доведе до ново поколение изкуствен интелект с общо предназначение, който може да помогне за решаване на проблеми в полета, които могат да бъдат симулирани в компютър, например състав на наркотици, сгъване на протеини или физика на частиците. Изграждайки знанията си отначало без човешки предубеждения или ограничения, алгоритмите биха могли да вървят в посоки, които хората все още не са мислили да търсят.

Докато много хора от AI общността гледат AlphaGo Zero като голямо постижение, Гари Маркъс, преподавател по психология в Нюйоркския университет, който е специализиран в изкуствения интелект, казва на Кенеди на NPR, че той не смята, че алгоритъмът е наистина tabula rasa, тъй като преди това знанията на човека са минали в изграждането на алгоритъма. Той също така не смята, че tabula rasa AI е толкова важен, колкото изглежда. „[В] биологията, действителният човешки мозък не е табула раса… Не виждам основната теоретична причина защо да го правите, защо трябва да изоставите много знания, които имаме за света“, казва той.

Въпреки това, бързото овладяване на играта на Alpha Go е впечатляващо - и малко плашещо.

Най-новият AI учи сам да играеш без помощ от човека