https://frosthead.com

Това може да бъде най-голямото семейно дърво в света

Повишаването на ДНК тестване чрез услуги като 23andme показва, че има голям пазар за семейната история.

Сега учените са надградили върху тези данни, като публикуват това, което смятат, че е най-голямата генеалогична база данни в света, с родословно дърво, което свързва 13 милиона души и се простира повече от пет века.

Както Джоселин Кайзер съобщава за сп. Science, Янив Ерлих, изчислителен генетик от Колумбийския университет, измисли проекта преди седем години, след като получи имейл от близък братовчед през Geni.com, един от многото сайтове, където търсят семейни връзки.

С подкрепата на главния технологичен директор на Gemi.com Ерлих изтегли публичните профили на сайта - десетки милиони от тях. Въпреки че не предлагаше данни за ДНК, информацията включваше име, пол, дата и място на раждане, дата на смъртта и близки.

Природата писа за проекта на Ерлих в ранните си етапи още през 2013 г., а миналата година Сара Джан от Атлантика съобщи, че изследователите са пуснали предпечат на масивното дърво. Сега, пише Kaiser, екипът на Erlich публикува проучване за тяхната работа в списанието Science. Използвайки данните, те завършиха с 5, 3 милиона дървета, най-голямото от които свързва около 13 милиона роднини, предимно от европейски произход.

От стартирането на проекта Ерлих се превърна в главен научен директор на MyHeritage, компания за генеалогия и тестване на ДНК, която е собственик на Geni.com. Миналия петък той направи Reddit Ask Me Anything за своите констатации, като коригира погрешните разбирания и обясни методологията, стояща зад проекта. Той отбеляза също, че най-интересната част от преживяването за него е да разбере как да преведе всички налични данни в нещо лично.

В интервю за Никол Уецман от National Geographic Ерлих казва, че измислянето как да се работи с тези данни е било и най-предизвикателната част от проекта. „Геномните набори от данни имат специфични инструменти, структури от данни, методи, но ние не разполагахме с нищо за това. Измисляхме колелото, докато отидохме “, казва той.

В крайна сметка изследователите използвали теорията на математическите графики, за да организират и проверят информацията, съобщава Laura Geggel за Live Science . Те също сравниха профилите с около 80 000 публично достъпни свидетелства за смърт от Вермонт за период от 25 години, за да гарантират, че не са само богати профили, качени в Geni.com.

След това екипът решил каква информация искат да търсят, за да тестват базата данни, пише Wetsman.

Те започнаха да гледат модели и откриха колебания в продължителността на живота, нещо, което бяха предвидили. Например, те видяха спад на младите мъже по време на Гражданската война и Първите и световните войни и нарастването на оцеляването в детството през 1900-те години. Те също успяха да проследят миграцията, като пристигането на Mayflower през 1620 г. в сегашния Масачузетс, последвано от увеличаване на ражданията в тази област.

Изследователите откриха също, че дълголетието има повече общо с околната среда и поведението, отколкото с генетиката; всъщност данните, разкрити гени, са само 16 процента отговорни за продължителността на живота. Паола Себастиани, професор по биостатистика в Университетското училище за обществено здраве в Бостънския университет, обаче предупреждава да прави заключения около тези данни в интервю с Wetsman. "Има много объркване относно определенията за дълголетие", казва тя.

Генетикът Питър Вишер от Университета на Куинсланд в Бризбейн, Австралия, казва на Кайзер, че данните, които екипът на Ерлих е изпълнил, имат потенциал да дадат представа за генетичната роля на заболяванията, ако данните са свързани със здравна информация.

Изследователският екип вече е започнал да комбинира дървото с информация от DNA.Land, която струпва ДНК данни, което може да означава, че скоро може да се появи още по-голямо дърво. Изследователите прогнозират, че ако базата данни може да върне 65 поколения, те ще могат да завършат дървото.

Това може да бъде най-голямото семейно дърво в света