https://frosthead.com

Разговор с машини

Софтуерът за разпознаване на глас, който повечето от нас вероятно биха се съгласили, е доста готино нещо. Но разговорите с машините се разделят - било то смартфон, телевизионен екран или табло - добре, не чак толкова. Питате съвет за устройство? Риекс на маниер. Изричане на всяка дума, за да можете да бъдете разбрани? Колко готино можеш да бъдеш наистина?

Но Apple, вярна на формата, пое тази глава, като нае три икони на готини, за да участва в последната си рекламна кампания за Siri, гласът на iPhone 4S. Има Zooey Deschanel (Adorable Cool) и John Malkovich (Cerebral Cool) и Samuel L. Jackson (Ultimate Cool), и всички се занимават с игра на думи с телефон, изглежда като спорт на боговете.

Въпреки това критиците изтъкват, че в реалния живот Сири не е толкова отзивчива, нито всезнаеща, както е изобразена в рекламите. Вие също съм сигурен, че сте шокирани да чуете това. Други виждат цялото нещо като узряло за пародия - вижте братът на Zooey Jooey, който прави забавна или Die версия на дъждовния ден на Zooey и Siri заедно.

Без значение. Siri се превърна в водеща певица в хор на роботите, гласът "You Got Mail" от ново поколение.

Модно е в някои кръгове да се предполага, че Сири не е Стив Джобс достойно, че ако беше още жив, Джобс щеше да го извади от пазара или, най-малкото, никога не би одобрил такава високопрофилна реклама кампания за толкова недостатъчен продукт.

Но както каза наследникът на Джобс Тим Кук по-рано тази седмица, собствениците на iPhone 4S харесват Siri. Според проучване, публикувано през март, почти 90 процента казват, че го използват поне веднъж месечно. И имайте предвид, че Siri, един от малкото продукти на Apple, за които се казва, че са в бета версия, когато е пусната, няма да празнува първия си рожден ден до октомври. Тя все още учи език и, което е още по-важно, само започва да използва потенциала на изкуствения интелект.

Сири вероятно ще бъде централно място на Apple TV, като се очаква да дебютира през декември. Но шансовете са, че мястото, където разговорите с машините ще преминат основно, е в нашите автомобили.

Карай, каза тя

Разбира се, това вече се случва, но все пак трябва да преминете към разговор на робот, ако искате да бъдете разбрани. И дори тогава няма гаранция. Това ще започне да се променя това лято, когато някои нови модели ще бъдат оборудвани с нещо, наречено Dragon Drive!

Това е изобретението на Nuance Communications, компания, базирана в Масачузетс, която се превръща в мощна компания в бизнеса за разпознаване на глас. (Широко се смята, че се крият мозъците зад Siri.) Нюансът и разпознаването на гласа в колите направиха голям скок напред миналата седмица, когато фирмата обяви, че Dragon Drive! ще може да се докосне до облака.

Това означава, че системата ще увеличи драматично своята компютърна мощност и памет. А това означава, че гласът в таблото ви за управление ще стане по-подобен на Siri и ще ви позволи всъщност да разговаряте с него. Няма повече едносрични викове. Идва денят, когато небрежно ще споменете, че се чувствате като някои Allman Brothers и секунди по-късно „Whipping Post“ ще дойде да изпомпва през високоговорителите.

Ключът е доколко сме способни да научим машинен контекст и прагматика - как езикът се използва в социални ситуации. И това е труден бизнес. За начало дори най-сложното устройство за разпознаване на глас трябва да изчака човек да завърши да говори, за да може да анализира и интерпретира цялото изречение. Тогава има „теорията на ума“, способността да разберем, че другите хора могат да имат различни вярвания и намерения от нашите собствени. Доколкото знаем, само хората могат да направят това.

Скорошно проучване на двама психолози от Станфорд може да ви даде представа за това какво е свързано с помощта на интуицията за машини. Изследователите Майкъл Франк и Ной Гудман създадоха онлайн експеримент, в който участниците бяха помолени да разгледат набор от обекти и след това да изберат кой от тях е посочен като конкретна дума. Например, една група участници видяха син квадрат, син кръг и червен квадрат. Въпросът за тази група беше: Представете си, че говорите с някого и искате да се обърнете към средния обект. Коя дума бихте използвали „син“ или „кръг“?

Другата група беше попитана: Представете си, че някой ви говори и използва думата „синьо“, за да се отнася до един от тези обекти. За кой обект говорят?

Отговорите помогнаха на изследователите да получат по-ясна представа за това как слушателят разбира говорещия и как ораторът решава какво да каже. От това те разработиха вида математически модел, който може да разшири и усъвършенства мисловния процес на компютъра.

Каза Франк: „Ще отнеме години работа, но мечтата е на компютър, който наистина мисли за това какво искате и какво искате да кажете, а не само това, което сте казали.“

Начин на реч

Ето някои по-скорошни развития в разпознаването на глас:

  • Siri мълчи: IBM е склонна да се притеснява от корпоративните тайни от излизането си, така че сега забранява на служителите си да използват обществени сайтове за трансфер на файлове, като Dropbox. Но също така има забрана за използването на Siri в офиса, защото служителите по сигурността се притесняват, че някой, докато разговаря с телефона им, може да разкрие чувствителна информация, която се озовава на сървърите на Apple.
  • Вземете това, Apple !: Samsung стартира новия си смартфон Galaxy X III в Лондон тази седмица и макар големият му сензорен екран да получава много внимание, той разполага и с нов софтуер за разпознаване на глас и лице.
  • Правете това, което казвам, а не това, което правя: И Samsung не спира до там. Наскоро тя подаде заявка за патент за робот, който разбира човешката реч. Роботът ще може да коригира своите способности за слушане, така че да отчита околния шум, който може да прекъсне или наруши командите, които му се дават. Освен това ще може да разпознае кой говори с него, дори ако фоновият шум е много силен.

Инфографски бонус: Смятате, че колата ви е компютъризирана сега. Изчакайте, докато е напълно включен в интернет. Вземете преценката какво може да направи свързаната кола.

Разговор с машини