https://frosthead.com

Тестът на Тюринг измерва нещо, но това не е „интелигентност“

Алън Тюринг, един от бащите на компютърната епоха, беше изключително умен човек. Толкова умен, всъщност, че разбра, че терминът „машинен интелект“ е почти безсмислен. По-добре, аргументира се той, за да говори за това, което всъщност може да направи една машина: Може ли да говори? Може ли да задържи разговор? Поне това е нещо, което можем да опитаме да изучим. В крайна сметка Тюринг предложи това, което стана известно като „тестът на Тюринг“: Ако съдия не може да каже кое от двете скрити образувания е човек и кое е изкуствено, машината е „преминала“ теста - точно това се казва, че се е случило миналата събота в Лондон.

Свързано съдържание

  • Силиконовата долина дължи успеха си на този гений на техниката, за който никога не сте чували
  • 60-годишната прогноза на Алън Тюринг за моделите в природата се оказа вярна

„Гордеем се с това, че заявяваме, че тестът на Алън Тюринг е преминал за първи път“, каза един от организаторите Кевин Уоруик от Университета в Рединг. Печелившият чат върви с името „Eugene Goostman”, компютърна програма, подражаваща на личността на 13-годишно украинско момче. „Юджийн“ успя да убеди 33 процента от съдиите, че е човек на съботното събитие, проведено в офисите на Кралското общество в Лондон по случай 60-ата годишнина от смъртта на Тюринг. (Хомосексуалист Тюринг е осъден за груба неприличност през 1952 г. и му е наредено да се подложи на хормонално „лечение“ като част от споразумение за признаване на правно основание. Две години по-късно той умира от отравяне с цианид при очевидно самоубийство.)

Но дума за предпазливост е наред. „Интелигентността“ винаги е била хлъзгава тема, и по-специално тестът на Тюринг отдавна е изпълнен с противоречия. Тюринг описа как ще работи в книга от 1950 г., озаглавена „Компютърни машини и интелигентност“. Той взе идеята от традиционната викторианска игра за салони, където се опитвате да разберете дали човекът, скрит зад завесата, е мъж или жена, просто като задавате въпроси. (Отговорите на въпросите трябваше да бъдат записани, защото гласът щеше да се предаде.) Ето как ще работи версията на Тюринг: Бихте имали съдия, седнал пред две завеси, без да знаете какво има зад тях, Зад едната завеса е човек; зад другия е компютър. Съдията може да задава въпроси на някое от двете скрити образувания. Въз основа на отговорите съдията се опитва да установи дали скритото образувание е човек или машина. (Тюринг предвиждаше разговора да бъде опосредстван от телетипни машини; днес можем да използваме всякакъв вид електронен, базиран на текст интерфейс, като вида, използван в интернет чат стаи или за незабавни съобщения.)

Тюринг спекулира, че до 2000 г. „средният разпитващ няма да има повече от 70 процента шанс да направи правилната идентификация“ - тоест компютърните програми биха стиснали съдиите 30% от времето след пет минути разпит. Важни са петте минути. Тюринг не говори за ограничение във времето като неразделна част от теста и може да се твърди, че за да може една машина наистина да премине теста, тя трябва да може да се справи с каквото и да е количество въпроси. Вероятно петминутните критерии са били произволно, но необходимо ограничение. 2000 година дойде и си отиде, като чатботите постигнаха само спиране на напредъка. (В по-трезв момент, в отговор на въпрос на интервюиращ BBC от 1952 г., Тюринг каза, че ще изминат 100 години, преди машина да премине теста.)

През 2012 г. бях съдия в „Тестов маратон на Тюринг“ - най-големият набор от тестове на Тюринг, провеждан наведнъж; тя се проведе в парк Блечли в Англия, мястото на жизненоважната работа на Тюринг по разрушаването на кода през последните години на Втората световна война. (Той беше организиран от същия екип, който провеждаше съботното събитие, и по-ранна версия на Евгений също беше победител през това време.) Настройката за съботното събитие беше същата като през 2012 г.: Съдиите въвеждаха въпросите си в компютър, след това изчакаха отговорите да се появят на техните екрани; чатовете, заедно със „скритите хора“, бяха в друга стая, извън полезрението.

Първото нещо, от което станах хиперсъзнателен, е, че когато сте съдия по тест на Тюринг, пет минути минават доста бързо. И колкото по-кратък е разговорът, толкова по-голямо е предимството на компютъра; колкото по-дълъг е разпитът, толкова по-голяма е вероятността компютърът да се раздаде. Обичам да наричам това ефект на манекена: Изпращали ли сте някога манекен в универсален магазин, ако приемете, че току-що сте се натъкнали на живо човешко същество? Ако срещата трае само частица от секундата, а вие сте обърнати към другия път, може да си представите, че току-що сте се изправили срещу човек. Колкото по-дълга е срещата, толкова по-очевидна е манекенността на манекена.

Същото е и с чатботите. Размяната на здрасти не разкрива нищо - но колкото по-нататък попаднете в нея, толкова повече проблеми възникват. Според мен чатботите изглеждат склонни да променят темата без причина. Често те не могат да отговорят на прости въпроси. С риск да звучат неясно, те просто не звучат човешки . В един от разговорите си през 2012 г. въведох обикновена шега - и субектът, с който разговарях, веднага промени темата на хамбургери. (Наскоро компютърният учен Скот Арънсън имаше подобно преживяване, когато разговаря с Евгений през уебсайта на бота. Арънсън попита Юджин колко крака има камила; той отговори: „Нещо между 2 и 4. Може би, три ?:-))“ По-късно, когато Ааронсън попита колко крака има мравка, Юджийн закашля същият отговор, тройно усмихнат и всичко това.)

Обърнете внимание също, че Евгений не подражава на възрастен англоезичен възрастен; тя се преструва на млад и донякъде прелестен украински тийнейджър, разговарящ на сравнително добър (но далеч не перфектен) английски. Както Владимир Веселов, един от разработчиците на програмата, каза за Mashable.com : „Прекарахме много време в разработването на персонаж с правдоподобна личност.“ Въпреки че Евгений ще ангажира всеки по всяка тема, неговата възраст „прави напълно разумно, че той не "Не знам всичко." Юджийн не излиза веднага и не обявява възрастта и националността си; но той ще го разкрие, ако бъде попитан - и крайният резултат може да е известна степен на снизходителност от съдиите, особено по отношение на английската граматика и употребата на думи. (Предполагам, че повечето съдии в събота бяха местни английски, но не знам това със сигурност.) Масите вероятно биха се обърнали, ако Евгений някога ще срещне роден украински говорител като съдия.

Борбата за изграждане на говореща машина подчертава колко сложен е езикът. Това не е просто въпрос на говорене - трябва да говорите за нещо, а това, което казвате, трябва да има смисъл - и то трябва да има смисъл в контекста на това, което току-що е казал другият човек . За нас е лесно; за компютрите, не толкова. И така чатботите разчитат на разнообразие от трикове: запаметяване на мегабайти от реакции в консерви или търкане в Интернет за диалог, който може да приближи разговора, в който се намират в момента. С други думи, това, което на машината липсва интелигентност, може да може да компенсира в суровата изчислителна мощност. Ето защо Google или Siri (личният асистент на iPhone) може да ни се стори толкова умен: Siri може да няма „ум“, но има достъп до такава огромна база данни с информация, може да действа така, сякаш го прави. Именно същият вид брутален подход позволи на Watson на IBM да спечели в Jeopardy! през 2011.

Всичко това повдига решаващ въпрос: Какво точно измерва тестът на Тюринг? Някои критици предполагат, че това е по-скоро хитрост, а не интелигентност. Психологът от NYU Гари Маркъс, пише в NewYorker.com, казва, че Юджийн успява „като извърши серия от„ плейсове “, предназначени да маскират ограниченията на програмата.“ Стивън Харнад, психолог и компютърен специалист от университета в Квебек в Монреал, беше още повече скептично, казвайки на The Guardian, че е "пълна глупост" да се твърди, че Юджин е преминал теста на Тюринг. (За негова заслуга, Тюринг беше добре запознат с този проблем; той нарече идеята си „играта за имитация“ и говори за интелигентността само пестеливо.) Още по-неудобно е, че компютърът, за разлика от човека, е принуден да заблуждава. "Тестът на Тюринг наистина е тест за успешен лъжец", каза ми Пат Хейс, компютърният специалист в Института за човешко и машинно познание в Пенсакола, Флорида, след маратона на Тюринг през 2012 г. „Ако имахте нещо, което наистина би могло да подмине играта на имитацията на Тюринг, това би било много успешна„ човешка мимика “.“

И „човекът“ е другият ключов момент: Не е ли възможно в света да има други видове интелигентност, извън вида, който се вижда от нашия вид? Наистина интелигентната машина би имала безброй практически приложения, но защо да се фокусираме върху създаването на повече „хора“? В края на краищата вече имаме достатъчно хора. Както лингвистът Ноам Хомски посочи, когато се стремим да изградим машина, която се движи под вода, не е необходимо тя да „плува“ - и подводницата не е по-малко постижение за неспособността си да направи гръб.

Да, Юджийн е впечатляващ, поне при малки изблици. И въпреки това, дори и най-добрите чатботи се спъват на въпроси, с които дете на половината от възрастта на Евгений може да се справи лесно. Може би не е изненадващо, че повечето изследователи на ИИ прекарват малко време вманиачено върху теста на Тюринг. Машинната интелигентност всъщност се движи напред и то доста бързо. Софтуерът за превод с глас в текст, който беше доста жалък само преди няколко години, бързо се подобрява, както и програмите за езиков превод. Amazon често има доста добра представа какво искате да купите, дори преди да го направите. И самоуправляващият се автомобил на Google щеше да е просто фантазия преди десетилетие. Но разговорът, докато продължаваме да откриваме отново, е наистина труден и няма вероятност да е границата, в която AI свети най-ярко. Засега, ако търсите някой, с когото да разговаряте, препоръчвам истински човек.

Дан Фолк е научен журналист със седалище в Торонто.

Тестът на Тюринг измерва нещо, но това не е „интелигентност“