https://frosthead.com

Невролозите са превърнали мозъчните вълни в словесна реч

Същата технология, която захранва вашия чат мобилен асистент, може един ден да даде глас на тези, които са загубили способността да говорят. Както докладва Renae Reints за Fortune, невролозите от Колумбийския университет наскоро направиха голям напредък към тази футуристична цел, като успешно превеждаха мозъчните вълни в разбираема реч за първи път.

Изследването на екипа, публикувано в „ Научни доклади“, включва донякъде нетрадиционен подход. Вместо директно да проследяват мислите, за да произвеждат реч, изследователите са записали неврологични модели, генерирани от тестови субекти, които слушат другите да говорят. Тези мозъчни вълни се подаваха във вокодер - алгоритъм за изкуствен интелект, който синтезира речта, и след това се превръщат в разбираема, макар и роботизирана звукова реч, отразяваща фразите, чути от участниците.

„Гласовете ни помагат да ни свържат с нашите приятели, семейство и света около нас, поради което загубата на силата на гласа поради нараняване или болест е толкова пагубна“, казва авторът на изследването Нима Месгарани, инженер в програмата за невробиология на Колумбия, казва в декларация. „С днешното проучване имаме потенциален начин да възстановим тази сила. Показахме, че с правилната технология мислите на тези хора могат да бъдат декодирани и разбрани от всеки слушател. "

Според Джордж Дворски на Gizmodo си струва да се отбележи, че учените все още не са измислили как да преведат директно вътрешните мисли, известни също като въображаема реч, в думи. В този идеален сценарий, хората, използващи речеви технологии, просто ще предвидят това, което искат да кажат, след което да изчакат изкуствена гласова система, която да вербализира тези мисли.

Покойният британски физик Стивън Хокинг използва рудиментарна версия на технологията за синтез на реч, за да общува с другите. Както Нина Годлевски пише за Newsweek, Хокинг е диагностициран с амиотрофична латерална склероза (ALS) на 21 години. Болестта на моторния неврон в крайна сметка претендира за говорните му способности, принуждавайки го да използва ръчен клик, за да задейства речта.

Когато Хокинг загуби употребата на ръцете си, той премина към система, основана на движенията на лицето; Освен това Дворски на Gizmodo обяснява, че ученият е използвал бузов превключвател, свързан с очилата си, за да избира думи, изречени от синтезатор на глас.

Една усъвършенствана итерация на тази технология ще пропусне средния човек, което ще позволи на потребителите да произвеждат реч без помощта на компютър или система, чувствителна към движението.

Сравнително, отбелязва Ейвъри Томпсън за Popular Mechanics, изследването на екипа на Колумбия се фокусира върху превода на „изслушана реч.“ Изследователите наели петима пациенти с епилепсия, подложени на операция на мозъка, и ги помолили да слушат редица изговорени думи - например запис на някой броене от нула до девет - докато е свързан към устройства за невронно наблюдение.

Мозъчните вълни, уловени от тези инструменти, бяха пуснати във вокодера, който синтезираше реч с помощта на невронна мрежа, обучена по думите на Кристин Хаузър на футуризма, за да "изчисти" изхода и да направи звуците разбираеми.

След това учените помоли 11 други участници да слушат речта с активиран AI. Значително е, че съавторът на изследването Месгарани посочва в изявлението на Колумбия, тези хора са били в състояние да „разберат и повторят“ звуците около 75 процента от времето - „далеч и по-далеч“ от скоростите, наблюдавани при предишни експерименти. (Можете да прецените записите за себе си тук.)

В интервю с Дворски на Gizmodo, Месгарани казва, че той и колегите му се надяват да синтезират по-сложни фрази в близко бъдеще. Изследователите също искат да записват мозъчни сигнали, генерирани от тестови субекти, които мислят или си представят акта на говорене, а не просто да слушат другите да говорят. Накрая, добавя Месгарани в изявлението, екипът има за цел един ден да превърне технологията в имплант, способен да превежда мислите на потребителя директно в думи.

Потенциалните ограничения на новото изследване включват неговия малък размер на извадката и според неврологът от университета в Нюкасъл Андрю Джексън, който не е участвал в изследването, фактът, че невронните мрежи ще трябва да бъдат въведени за огромен брой мозъчни сигнали от всеки нов участник за да се синтезира реч отвъд числата нула до девет.

„Ще бъде интересно в бъдеще да видим колко добре декодерите, обучени за един човек, се обобщават на други индивиди“, казва Джексън пред Gizmodo . „Това е малко като системи за ранно разпознаване на речта, които трябваше да бъдат индивидуално обучени от потребителя, за разлика от съвременните технологии като Siri и Alexa, които могат да имат смисъл от нечий глас, като отново използват невронни мрежи. Само времето ще покаже дали тези технологии могат един ден да направят същото за мозъчните сигнали. “

Невролозите са превърнали мозъчните вълни в словесна реч