https://frosthead.com

Как GPS се научава да говори вашия език

Карън Якобсен, австралийска певица и гласова актриса, получи концерта през 2000 г., скоро след пристигането си в Ню Йорк. Продуцентите - корпоративни типове - я изпращаха в звукозаписно студио в продължение на три седмици, където тя прекарваше четири часа на ден, казвайки неща от рода на „на следващата пресечка, завийте наляво“ и „преизчисляване“. В крайна сметка това не беше нейният глас това беше напрегнато. "Казах" приблизително "приблизително 186 пъти", спомня си Якобсен. "Подобни неща могат да ви накарат да останете луксозни."

Свързано съдържание

  • От Птолемей до GPS, кратката история на картите

Две години по-късно тя получи телефонно обаждане от приятел. - Карън - изпъшка приятелят й. „Купих на съпруга си едно от онези нови неща с GPS и го поставихме на австралийския глас. Това сте вие! ”Така Якобсен разбра, че гласът й дава указания на 400 милиона души по целия свят.

Нейната работа подчертава хибрида от кръв и технологии, който навлиза в сега повсеместните гласове, които ни казват къде да се обърнем: Повече от милиард души разчитат на Google Maps всеки месец, а 80 процента активират гласовата опция.

В първите дни на синтеза на глас - помислете за роботизираните звуци на Speak & Spell от края на 70-те години - алгоритъм, преобразуващ текст в монотонен поток. След това, с увеличаване на базите данни, можете да запишете гласов актьор като Jacobsen, произнасящ корпус от срички и думи, кои алгоритми биха се комбинирали и променяли според основните правила. Съвсем наскоро софтуерните кодери във фирми като Nuance, която проектира навигационни интерфейси за автомобили, разработиха трети подход - прилагайки задълбочено обучение към синтеза на речта. Той смесва записани думи и синтезирани фрагменти, разчитайки на изкуствения интелект, за да направи произношението още по-човешко. „Звучат необичайно естествено“, казва главният директор на технологията на Nuance Влад Сейноха.

Разбира се, езиковите измислици остават предизвикателство за гласовите системи. „Мислете„ bough “срещу„ купено “или„ read “срещу„ read “, казва говорител на Google. „Но се надяваме, че потребителят винаги може да отгатне какво имаме предвид.“ Сега, когато AI учи системите за автомобилни навици да говорят по-интелигентно, след това ще търси в онлайн света и ще разбере къде искате да отидете, дори преди да го направите.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Абонирайте се за списание Smithsonian сега само за 12 долара

Тази статия е селекция от броя на юли / август на списание Smithsonian

Купува
Как GPS се научава да говори вашия език