https://frosthead.com

Изследването на изкуствения интелект на човешкия геном открива неизвестен човешки прародител

Могат ли умовете на машините да ни научат на нещо ново за това какво означава да си човек? Когато става въпрос за сложната история за сложния произход и еволюция на нашия вид, изглежда, че те могат.

Скорошно проучване използва технология за машинно обучение за анализ на осем водещи модела на човешки произход и еволюция, а програмата идентифицира доказателства в човешкия геном на „призрачна популация“ на човешки предци. Анализът предполага, че неизвестна досега и отдавна изчезнала група хоминини се намеси с Homo sapiens в Азия и Океания някъде по дългия криволичещ път на човешката еволюционна история, оставяйки след себе си само фрагментирани следи в съвременната човешка ДНК.

Изследването, публикувано в Nature Communications, е един от първите примери за това как машинното обучение може да помогне да се разкрият улики за собствения ни произход. Преглеждайки огромно количество геномни данни, оставени във фосилизирани кости, и сравнявайки ги с ДНК при съвременните хора, учените могат да започнат да попълват някои от пропуските в еволюционната история на нашия вид.

В този случай резултатите изглежда съвпадат с теориите на палеоантропологията, които са разработени от изследване на фосили на човешки предци, открити в земята. Новите данни предполагат, че мистериозният хоминин вероятно е произлязъл от примес на неандерталци и денизованци (които бяха идентифицирани само като уникален вид на родословното дърво на човека през 2010 г.). Такъв вид в нашето еволюционно минало би приличал много на вкаменелостта на 90 000-годишно тийнейджърка от Денисова пещера на Сибир. Останките й бяха описани миналото лято като единственият известен пример за хибрид от първо поколение между двата вида, с неандерталска майка и баща Денисован.

„Очакваме точно такъв тип индивид да открием в произхода на това население, но това не трябва да е само един индивид, а цяло население“, казва съавторът на изследването Яуме Бертранпетит, еволюционен биолог в университета в Помпеу Фабра в Барселона.

Разпространение на род Homo Способността на ранните хора да се адаптират към променящите се условия в крайна сметка даде възможност на най-ранните видове Homo да се променят, оцелеят и да започнат да се разпространяват от Африка до Евразия преди 1, 85 милиона години. (Изображение предоставено от Антон, Потс и Айело (2014), Science 345 (6192))

Предишни изследвания на човешкия геном разкриха, че след като съвременните хора напуснаха Африка, може би преди 180 000 години, впоследствие те се намесиха с видове като неандерталци и денизованци, които съжителстваха с ранните съвременни хора, преди да изчезнат. Но преначертаването на родословното ни дърво за включване на тези разминаващи се клони беше трудно. Доказателствата за „призрачните“ видове могат да бъдат оскъдни и съществуват много конкуриращи се теории, които да обяснят кога, къде и колко често Homo sapiens може да се е намесил с други видове.

Следи от тези древни междувидови връзки, наречени интрогресии, могат да бъдат идентифицирани като места на разминаване в човешкия геном. Учените наблюдават повече разделяне между две хромозоми, отколкото бихте очаквали, ако и двете хромозоми произхождат от един и същи човешки вид. Когато през 2010 г. учените секвенирали неандерталския геном, те разбрали, че някои от тези различия представляват фракции от нашия геном, идващи от неандерталците. Проучванията също така разкриват, че някои живи хора могат да проследят до 5 процента от своето потекло до Денисовановци.

„И така, ние решихме, че ще се опитаме да намерим тези места с висока дивергенция в генома, да видим кои са неандерталци и кои са Денисован, и тогава да видим дали те обясняват цялата картина“, казва Бертранпетит. "Както се случва, ако извадите неандерталската и денисованската част, в генома все още има нещо, което е много различно."

Идентифицирането и анализирането на множеството различни места в целия геном и изчисляването на безброй генетични комбинации, които биха могли да ги произведат, е твърде голяма работа, за да могат хората да се справят самостоятелно - но това е задача, която може да бъде пригодена за алгоритмите за задълбочено обучение.

Дълбокото обучение е вид изкуствен интелект, при който алгоритмите са проектирани да работят като изкуствена невронна мрежа или програма, която може да обработва информация по същия начин, както би направил мозъкът на бозайниците. Тези системи за машинно обучение могат да откриват модели и да отчитат предишната информация, за да „учат“, което им позволява да изпълняват нови задачи или да търсят нова информация след анализ на огромни количества данни. (Често срещан пример е AlphaZero на Google DeepMind, който може да се научи да овладява настолни игри.)

„Дълбокото обучение приляга на по-сложно оформено нещо към набор от точки в по-голямо пространство“, казва Джошуа Шрайбер, експерт по еволюционна геномия от университета в Темпъл. „Вместо да поставяте линия между Y и X, вие прилягате на едно малко място в набор от точки в много по-голямо, хилядно измерение. Дълбокото обучение казва: „Не знам каква точно форма трябва да отговаря на тези точки, но нека видим какво ще се случи“.

В този случай машините бяха настроени да работят с анализ на човешкия геном и да прогнозират човешката демография, като симулират как нашата ДНК може да се е развила в продължение на много хиляди възможни сценарии на древна еволюция. Програмата отчита структурата и еволюцията на ДНК, както и моделите на миграция и кръстосване на хора, за да се опитаме да вместим някои от парчетата заедно в невероятно сложен пъзел.

Изследователите обучиха компютъра да анализира осем различни модела на най-правдоподобните теории за ранна човешка еволюция в Евразия. Моделите са дошли от предишни проучвания, които се опитват да измислят сценарий, който да доведе до настоящата картина на човешкия геном, включително неговите известни неандерталски и денисовански компоненти.

„Може да има и други модели, разбира се, но тези модели са тези, които други хора предлагат в научната литература“, казва Бертранпетит. Всеки модел започва с възприетото събитие извън Африка, след което представя различен набор от най-вероятните разцепления между човешки родове, включително различни взаимосвързаности както с известни видове, така и с възможни видове „призрак“.

Човешко семейно дърво Хората или Homo sapiens са произлезли от сложно дърво на изправени ходещи предци, включително видове от родовете Ardipithecus, Australopithecus и Paranthropus . (Програма за човешки произход на Smithsonian)

„С всеки от тези осем модела ние изчисляваме за седмици изчисления колко добре са в състояние да достигнат до действителния, настоящ генетичен състав на хората“, казва Бертранпетит. "Всеки път, когато правим симулация, това е симулация на възможен път на човешката еволюция. Ние провеждаме тези симулации хиляди пъти и алгоритмите за задълбочено обучение са в състояние да разпознаят кой от моделите най-добре отговаря на данните."

Заключението на машината? Видът на предците присъства в нашата родова линия, която тепърва ще идентифицираме. „Досега единствените модели, които тествахме, наистина са подкрепени от данните, са тези, които имат тази интрогресия на призрачна популация“, казва Бертранпетит.

Интригуващото проучване и други подобни могат да помогнат за пречертаването на картата как хората са мигрирали и еволюирали, въпреки че изглежда е все по-сложен древен свят в Евразия и Океания.

„Това със сигурност е интересно и съвместимо с възникващата картина на сложна ретикулирана филогения в човешката еволюция“, казва по имейл Ийн Матисън, генетик от населението на Университета на Пенсилвания. „Дори не съм сигурен, че има смисъл да говоря за„ събития на интрогресия “, когато това изглежда е норма.“ Всъщност, тъй като бяха тествани само осем модела и много други биха били възможни, Матисън добавя, че новите открития са „ със сигурност правдоподобен сценарий, но реалността вероятно е още по-сложна. "

Тъй като на място се правят нови открития на изкопаеми, актуализираните модели вече могат да бъдат тествани срещу човешкия геном с помощта на тези видове програми. Шрайбер казва, че силата на дълбокото учене за изучаване на човешки произход се крие именно в способността му да анализира сложни модели.

„Ако искате да направите изключително подробен модел, защото сте антрополог и искате да знаете дали тази интрогресия се е случила преди 80 000 години или преди 40 000 години, това е силата на задълбочения подход на обучение като този.“

Сложни, каквито са, междубранствата на древна Евразия все още са само една част от нашата човешка история. Бертранпетит вярва, че бъдещият напредък в задълбоченото обучение може да помогне за разкриването на други нови глави.

"Този метод на анализ ще има всякакви нови резултати", казва той. „Сигурен съм, че хората, работещи в Африка, ще намерят изчезнали групи, които все още не са признати. Без съмнение Африка ще ни покаже изненадващи неща в бъдеще. "

Изследването на изкуствения интелект на човешкия геном открива неизвестен човешки прародител