https://frosthead.com

Целуване на езикови бариери довиждане

Дълго време универсалният преводач е мания за поп културата. Star Trek го представя като ръчна машина, наподобяваща микрофон, който може да преведе повечето езици веднага . Ръководството за стопаджията към Галактиката може да се похвали с риба Вабел, същество, което, когато се забие в ухото на някой, предлага незабавен превод на всеки език в галактиката.

Така че не трябва да е изненада, че съвременните хора се опитват да създадат устройство, което работи също толкова добре. Съществуват десетки приложения за смартфони за превод, но повечето превеждат думи на проста, едно към едно; потребител пише или говори дума и приложението отскача обратно с превод. Сега целта и истинската парична криза са инженерите и предприемачите да дадат възможност на двама души да разговарят на различни езици, докато малко устройство изплюва преводи в реално време.

Съществуващи приложения за превод

При пътуване до Гърция англоезичният Андрю Лодър се разболя.

„Отидох в аптеката и те не можаха да разберат нито един английски, така че нямах лекарства“, казва Лаудър, изпълнителен директор на Vocre Translate. Етикетите на наркотиците бяха доста буквално гръцки за него. Езиковите бариери са често срещани за пътуващите по света. В чужда държава малките транзакции като закупуване на лекарства или получаване на указания - друга трудност, с която се сблъсква Лаудер - стават херкулесови задачи.

Когато се върна в щата, Лодър създаде Vocre Translate, приложение за превод на глас и текст. Тя започна като приложение за текст в текст (наречено MyLangauge), след което първоначално се трансформира в модел на реч в текст, който подобно на други приложения, включително SayHi Translate, използва традиционен модел, в който една дума се превежда директно на друга дума. Кажете „Здравей“, а смартфонът или таблетът се чука автоматично обратно „Hola“. „Сбогом“ става „Sayonara“. И така нататък, много като текстов преводач.

За да създадат простия аудио превод, създателите на тези приложения се нуждаят от данни. Vocre изтегли информацията си от записи и документи в публичното пространство, като стари филми или публични изслушвания. "По принцип молехме услуга за транскрипция на гласова поща, за да ни позволи да използваме техния облак за разпознаване на речта", казва изпълнителният директор на SayHi Лий Босие.

След като инженерите разполагаха с аудио и текстови данни, те сдвоиха аудио и текст, дума по дума. Софтуерът за разпознаване на глас разпознава „сирене“ и го преобразува в текст. Това се преобразува на френски и приложението намира френското произношение за „fromage“.

Това каза, че ако потребителят бурно нарече нещо „нахално“, преводачът също не работи, тъй като говоримият език не е почти толкова статичен, колкото писменият език. Каданс, жаргон, флексия, произношение, диалект и разговорен поток могат да променят значението

С времето обаче Лодър искаше по-разговорно устройство. В имейл той казва: „Въз основа на данните ни за употреба открихме, че хората говорят много различно от начина, по който пишат. Говорената дума е много по-спонтанна и много по-малко формална и буквална. ”Затова той използва статистически машинен превод, подход, използван и от Google, който използва данни за намиране на често срещано използване на думи, прехвърляйки традиционния модел за превод от дума на дума. По принцип Vocre се учи, както се използва. „Тя се учи въз основа на всеки разговор, всяка фраза, която минава през него. Това е нещо, което с времето става по-умно ”, казва Лаудър.

Все пак в момента и двете приложения отнемат няколко секунди за превод, но без съмнение са ефективни, особено в съгласие с езика на тялото, за транзакционни разговори като поръчка на храна. В края на краищата хората от години поръчват храна на неезични езици и винаги успяват да се хранят. Но те не са успели да водят задълбочени и сложни разговори.

С Vocre и SayHi разговорите могат да се разминават, но това не е същото като чат на родния ви език. Google възнамерява да промени това изцяло.

Подходът на Google (статистически машинен превод)

Когато изучаваме нов език в училище, започваме с отделни термини за лексика. Но езикът е по-течен - думите се нуждаят от контекст.

„Подходът [Google] възприема е по-общ подход“, казва Джош Естел, софтуерен инженер за Google Translate. „Вместо да се опитваме да кодираме всички тези правила, ние се опитваме да научим правилата, като разгледаме данните.“

Технологичната компания избягва метода „дума в дума“ един към един и вместо това използва статистически машинен превод, като не гледа какво означават думите, а как се моделира езикът, който научава чрез данни . И така, тя цели към гората, а не към дърветата. Английски пример: ние знаем определенията на думите „разрушавам“ и „нагоре“. Но фразата „разбивам“ не е буквалната комбинация от двете думи.

Статистическият машинен превод изисква данни. Планини от него. За да работи методът, се нуждае не само от факта, че „изход“ е френски за сирене, но и 100 примера както за „произход“, така и за сирене, използвани в действителните изречения.

Естел казва, че ако говорител на английски има две менюта, идентични освен за факта, че едната е отпечатана на английски, а една на китайски, „вероятно можете да разберете какво е китайският символ за„ супа “.“ Контекстът е крал. Но за да създадете този контекст, се нуждаете от достъп до милиони менюта и всеки друг документ, който можете да си представите.

Което точно е Google. Без уеб гигантът, който да събере купища данни, реална Babel риба не би могла да съществува. Тя обхожда мрежата и събира всичко - текст и аудио. След това той подава тези данни в алгоритми, които сравняват всичко с всичко останало. Тези сравнения помагат да стигнем до основата на това как езикът естествено работи.

„Едно нещо, което изненадва хората, когато говорим за„ Преводач “е, че екипът ни няма лингвисти, казва Естел. „Стартирахме 71 езика и бих казал, че нашият екип не знае как да говори по-голямата част от тях. Човешкият преводач няма да може да научи всички тези условия и неща толкова бързо, колкото нашите [данни] могат да научат от мрежата. "

Какъв е смисълът?

Подобно на Google, Facebook вижда ползи. Обмислете превода на собствения сайт на социалните медии.

„Мисията на Facebook е да свързва целия свят и една от бариерите за свързване на света не е, че всеки говори един и същ език“, казва Том Стоки, директор по инженерство във Facebook. „От страна на превода, мисля, че наистина амбициозната визия за бъдещето е, ако можете да използвате Facebook на родния си език и да взаимодействате с всеки друг език.“

През изминалия август Facebook придоби Jibbigo, приложение за превод от реч в реч, което е достъпно за устройства с Android и iOS.

Потребителите на Facebook във Facebook ще отбележат, че в социалния сайт вече има част от превода. Ако някога сте имали испанска публикация на страницата си на английски език, веднага сте получили възможността да я преведете на родния си език.

Но Стоки вижда гласовия компонент като потенциален смяна на играта. Възходът на смартфони и таблети приветства непрекъснато свързан свят, а възходът на софтуера за разпознаване на реч приканва нови средства за уеб взаимодействие. Stocky предвижда бъдеще, в което потребителите могат просто да говорят команда на своите смартфони и да си взаимодействат с други потребители, езикови разлики настрана.

„Няма въпрос, който да се случи в крайна сметка, защото единствените ограничения са силата на езиковия двигател и разбира се времето за обработка и мощността на процесора“, казва той.

Лора Мърфи, професор в катедрата за глобални здравни системи и развитие в университета в Тулан и призната скептична технология, поставя под въпрос стойността на универсален преводач и не се нуждае от владеене на повече от един език.

Според нея устройството може да бъде до известна степен полезно за пътувания, бизнес и международни отношения, но не и новаторско. На определено ниво вече имаме преводачи (хора) и повечето, които работят в чуждите отношения, знаят подходящите езици. Устройството, смята Мърфи, може да има отрицателни последици.

„Мисля, че това може да направи хората мързеливи“, казва Мърфи. Превеждането на езици може да бъде психически предизвикателство, като принудите мозъка - особено този, който знае повече от два езика - да работи по различен начин, но въпреки това упражнението е полезно. Мозъкът се дърпа от място на езикова съпричастност, до което дори най-добрият преводач на глас не би могъл да достигне.

Въпреки че тази универсална комуникация може да бъде положителна, признава Мърфи, „тя може да доведе до това хората да мислят, че общуват, когато не са.” Културата не винаги е напълно въплътена в езика (вземете например сарказъм), а комуникацията не е винаги за предаваната информация.

Кога можем да очакваме да видим тази технология?

„През 2005 г. ни отне 40 часа, за да преведем 1000 изречения“, казва Естел от Google. „Днес ние превеждаме равностойността на 1000 изречения на всеки 10 милисекунди.“

Както Ричард Андерсън известен казва в сериала „Шест милиона долара “ от 1970 г. „Ние имаме технологията.“ Сега става въпрос само за изчакване за събиране и анализ на данни. Колко време ще отнеме остава неизвестно, според Естел. Но предпазливите оценки поставят такова устройство в нашите ръце в рамките на десетилетие.

Докато създателите на приложения като Bossier или гигантски компании като Google и Facebook не искат да създават свои собствени версии на Библейската вавилонска кула, тя наистина иска да сложи край на бабуването. Той предвижда свят, в който всички общуваме, за медицината, за политиката, за идеите.

И този свят може да не е далеч.

Бележка на редактора: Актуализирахме тази история на 4 април 2014 г., за да опишем точно технологията Vocre Translate.

Целуване на езикови бариери довиждане