https://frosthead.com

Могат ли компютрите да дешифрират език на 5000 години?

Цивилизацията на Инд, която процъфтява през голяма част от третото хилядолетие пр. Н. Е., Беше най-обширното общество на своето време. На височината си тя обхващаше площ от повече от половин милион квадратни мили, съсредоточена върху днешната граница между Индия и Пакистан. Останките от Инд са открити на север от Хималаите и на юг до Мумбай. Това беше най-ранната известна градска култура на субконтинента и се похвали с два големи града, един в Харапа и един в Мохенджо-даро. Но въпреки размерите и дълголетието си и въпреки близо век археологически проучвания, много за Инд остава забулено в мистерия.

Това, което малко знаем, е дошло от археологически разкопки, започнали през 20-те години и продължават и до днес. През десетилетията археолозите са открили много артефакти, включително печати, амулети и малки плочи. Много от тези артефакти носят изглеждащи екземпляри - гравирани фигури, наподобяващи, наред с други неща, крилати подкови, шпайлирани колела и изправени риби. Какво точно могат да означават тези символи, остава една от най-известните неразгадани гатанки в науката на древните цивилизации.

Имаше и други трудни кодове, които да пробият в историята. Стъпканите египтолози хванаха късметлийска почивка с откриването на прочутия камък Розета през 1799 г., който съдържаше текст както на египетски, така и на гръцки. Изучаването на йероглифите на маите отлага, докато руският лингвист на име Юрий Кнорозов не използва умело съвременния говорещ маите през 50-те години. Но няма камък на Розета на Инд и учените не знаят кои, ако има такива, може да произхождат от тези, които говорят хората от Инд.

Преди около 22 години в Хайдерабад, Индия, ученик в осми клас на име Раджеш Рао обърна страницата на учебник по история и за първи път научи за тази завладяваща цивилизация и нейния мистериозен сценарий. В следващите години училището и професията на Рао го отвеждат в различна посока - той се занимава с компютърни науки, които днес преподава в Университета във Вашингтон в Сиатъл, но внимателно следи стипендиите на Инд, като държи раздели на десетките неуспешни опити за осмисляне на сценария. Дори докато изучаваше изкуствения интелект и роботиката, Рао събра малка библиотека от книги и монографии по сценария на Инд, около 30 от тях. На една близка рафта с книги той пазеше и заветния учебник по история за осми клас, който го запозна с Инд.

„Беше просто невероятно да видя броя на различните идеи, които хората предложиха“, казва той. Някои учени твърдяха, че писането е нещо като шумерска писменост; други, разположени в семейството на дравидиан; други смятат, че това е свързано с език на Великденския остров. Рао оцени, че това е „вероятно един от най-предизвикателните проблеми по отношение на древната история“.

Тъй като опит след опит не успя да дешифрира сценария, някои експерти започнаха да губят надежда, че той може да бъде декодиран. През 2004 г. трима учени твърдят в спорна книга, че символите на Инд изобщо нямат езиково съдържание. Вместо това символите може да са малко повече от пиктограми, представляващи политически или религиозни личности. Авторите стигнаха дотам, че предполагат, че Инд изобщо не е грамотна цивилизация. За някои в тази област целият стремеж да се опита да се намери език зад тези офорти на Инд започна да прилича на упражнение в безполезност.

Няколко години по-късно Рао влезе в битката. Дотогава хората, изучаващи сценария, бяха археолози, историци, лингвисти или криптолози. Но Рао реши да разкрие тайните на сценария за Инд с помощта на инструмента, който той най-добре познава - компютърните науки.

Очарован от цивилизацията на Инд от осми клас, Раджеш Рао използва информатиката и концепция, наречена "условна ентропия", за да помогне за декодиране на скрипта на Инд. (С любезното съдействие на Дейвид Закс) През десетилетията археолозите са открили много артефакти от цивилизацията на Инд, включително печати, амулети и малки плочи. (Робърт Хардинг / Робърт Хардинг Световни образи / Корбис) Рао и неговите сътрудници публикуваха своите открития в списание Science през май. Те не дешифрираха езика, но техните открития изостриха разбирането за него. (Робърт Хардинг / Робърт Хардинг Световни образи / Корбис) Рао и неговите колеги сега разглеждат по-дълги низове от герои, отколкото са анализирали в научния документ. Намирането на модели от своя страна би помогнало да се определи кои езикови семейства могат да принадлежат скриптът. (С любезното съдействие на Дейвид Закс)

В един летен ден в Сиатъл Рао ме посрещна в кабинета си, за да ми покаже как той и колегите му подхождат към проблема. Той изложи колекция от реплики на впечатления от глинен печат, които археолозите са намерили от обекти на Инд. Те са малки - като малки квадратни шоколадови бонбони - и повечето от тях имат изображение на животно под поредица от символи на Инд. Повечето образци на сценария на Инд са миниатюри като тези, носещи само няколко знака; не са открити грандиозни монолити. Учените не са сигурни във функцията на малките печати, каза ми Рао, но една теория е, че те може да са били използвани за удостоверяване на качеството на търгуваните стоки. Друг предполага, че тюлените може би са били начин да се гарантира, че търговците плащат данъци при влизане или излизане от град - сред руините на портални къщи са открити много тюлени, които биха могли да функционират като древни пътни кабини.

Рао и колегите му не се стремяха да вършат чудеса - знаеха, че нямат достатъчно информация, за да дешифрират древния скрипт, - но предположиха, че с помощта на изчислителни методи могат поне да започнат да установяват какъв вид писане на Инд скриптът беше: кодира ли език или не? Те направиха това, използвайки концепция, наречена „условна ентропия“.

Въпреки налагащото име, условната ентропия е доста проста концепция: тя е мярка за количеството на случайността в една последователност. Помислете за нашата азбука. Ако трябваше да вземеш плочки Scrabble и да ги хвърлиш във въздуха, може би ще намериш някое старо писмо, което да се появи след друго. Но в действителните английски думи някои букви са по-склонни да се появяват след други. Въпросът на английски език почти винаги е последван от u . A t може да бъде последвано от r или e, но е по-малко вероятно да бъде последвано от n или b .

Рао и неговите сътрудници - международна група, включваща компютърни учени, астрофизици и математик - използваха компютърна програма за измерване на условната ентропия на сценария Инд. Тогава те измерват условната ентропия на други видове системи - естествени езици (шумерски, тамилски, санскритски и английски), изкуствен език (компютърният език за програмиране Fortran) и нелингвистични системи (човешки ДНК последователности, бактериални протеинови последователности и др. два изкуствени набора от данни, представляващи високи и ниски крайности на условната ентропия). Когато сравниха количеството на случайността в скрипта на Инд с това на другите системи, те откриха, че той най-много прилича на процентите, открити в естествените езици. Те публикуват своите открития през май в списание Science .

Ако изглежда като език и действа като език, вероятно това е език, предполага техният документ. Констатациите не дешифрират скрипта, разбира се, но те изострят нашето разбиране за него и дават успокоение на онези археолози, които са работили под предположението, че Индският скрипт кодира езика.

След публикуването на вестника, Рао получи изненада. Въпросът към кое езиково семейство принадлежи сценарият, оказва се, е чувствителен: поради възрастта и значението на цивилизацията на Инд много съвременни групи в Индия биха искали да я твърдят като пряк прародител. Например, индийците на юг, които говорят тамил, биха предпочели да научат, че писмеността на Инд е един вид протодравидий, тъй като Тамил е произлязъл от протодравидиан. Говорителите на хинди на север предпочитат да са стара форма на санскрит, прародител на хинди. Документът на Рао не прави заключение към кое езиково семейство принадлежи скриптът, макар да отбелязва, че условната ентропия е подобна на старата тамилска - причинявайки някои критици накратко „да ни обвиняват, че сме дравидийски националисти“, казва Рао. "Избухливостта на обвиненията и атаките беше напълно неочаквана."

Рао понякога се облекчава при завръщането си в не толкова свирепо оспорвания свят на невронауката и роботиката. Но призивът на сценария за Инд остава примамлив и „това, което преди беше хоби, сега монополизира повече от една трета от времето ми“, казва той. Рао и неговите колеги сега разглеждат по-дълги низове от герои, отколкото са анализирали в научния документ. „Ако има модели - казва Рао, - можем да измислим граматически правила. Това от своя страна би ограничило какви видове езикови семейства ”може да принадлежи на скрипта.

Той се надява, че бъдещите му констатации ще говорят сами за себе си, подбуждайки по-малко ярост от противниците, вкореняващи се за един регион на Индия срещу друг. От своя страна, когато Рао говори за това какво означава за него сценарият на Инд, той е склонен да говори по отношение на Индия като цяло. „Наследството на Индия би било значително обогатено, ако успяхме да разберем цивилизацията на Инд“, казва той. Рао и неговите сътрудници работят върху него, един ред изходен код в даден момент.

Могат ли компютрите да дешифрират език на 5000 години?