Генетическая генеалогия

Генетическая генеалогия

О том, что такое генетическая генеалогия и ее возможностях рассказывает 

Александр Ракитько


-
руководитель отдела анализа статистических данных Genotek

       

Здравствуйте друзья, меня зовут Александр Ракитько́, французская фамилия. Я занимаюсь статистикой в компании Genotek. Genotek делает ДНК-тесты, самые разные в том числе, тесты на происхождение. И сегодня я поговорю про то, что наиболее, наверное, интересно – это поиск родственников, в аспекте сегодняшнего форума.

Но сперва я хочу отметить прекрасную организацию, и очень рад тому, что организаторы пригласили. Это очень круто! Я первый раз на ГЕНТЕХе, мне всё очень нравится.

 

Чтобы начать говорить про поиск родственников, хотелось бы напомнить чуть-чуть школьной генетики. Кто помнит, сколько хромосом у человека? У здорового человека обычно есть 22 так называемые аутосомы: половые хромосомы и так называемая митохондриальная ДНК. Y-хромосома  определяет пол человека, у мужчин есть, у женщин ее нет. Соответственно, она всегда передается только от отца сыну. Митохондриальная ДНК всегда передается от матери детям. Анализируя мутации Y-хромосом и митохондриальной ДНК, мы имеем некоторую возможность отслеживать пути миграции по отцовской и материнской линии. Об этом мы поговорим попозже, а сейчас сфокусируемся на первых двадцати двух парах хромосом. На них много-много маркеров. Вообще весь геном – это три миллиарда букв в двух копиях. Обычные современные технологии исследуют порядка 500-600 тысяч маркеров на аутосомах. Это позволяет считать риски заболеваний, находить наследственные мутации, искать родственников и определять этнический состав.

Что же генетическая генеалогия считает главным в поиске по ДНК?

Какая идея заложена в основании всех алгоритмов поиска родственников на основании ДНК-тестов? Предположим, два человека прошли ДНК-тесты, неважно где, их геном расшифровали, 600 000 точек. Они примерно равномерно разбросаны по всем хромосомам. Мы знаем, что половина хромосом досталась нам от мамы, половина досталась от папы. Есть такой процесс, вы, может быть, помните слово кроссинговер. Это означает ,что перед тем, как передать хромосомы ребенку, у мамы, например, этих хромосомы как-то обмениваются сегментом.

 

Вот у нас была некоторая бабушка, у которой были коричневые и бежевые хромосомы.  И она передала своему ребёнку какую-то их комбинацию. И затем эти комбинации идут дальше по ее потомкам. В итоге оказывается, что среди раскраски хромосом ныне живущих двух людей можно найти общий сегмент. Так называемый IBD-сегмент, который достался им от общего предка.

Но каков алгоритм поиска родственников в такой области, как генетическая генеалогия?

То есть алгоритм поиска родственника примерно следующий. Это на словах очень просто. Нашли общие сегменты, измерили их длину, сколько их и предсказали, когда был общий предок. На деле все гораздо сложнее. Но вот это основная идея. Здесь начинается машинное обучение, статистика, всякая жуть.

Какой результат человек получает, когда он проходит ДНК-тест на поиск родственников? Он получает такой список родственников с указанием предполагаемой степени родства и возможность написать письмо, связаться с родственником.

Это, кстати, очень тонкий вопрос, который надо обсуждать. Можно ли разрешать всем писать или человек должен сам решать, хочет, чтобы ему написали дети, о которых он не знает, или не хочет, здесь какого-то единого верного мнения пока что нету и консенсуса, в общем, тоже. Мы придерживаемся политики, что каждый сам решает, хочет он участвовать в поиске родственников или не хочет . Да, хороший вопрос, кстати, можно ли построить с помощью ДНК-тестов, анализируя геномы своих близких родственников, дерево? Можно. В качестве примера можно привести дерево клиентов,  многие члены семьи которых сдали ДНК-тест. Вам это может показаться смешным, но дерево нарисовать на два три поколения вверх – это очень легко.

Но что еще важно?

Но надо понимать что мы не имеем ни имен, ни фамилий. Даже даты рождения мы не имеем, пол мы можем определить. И восстановить структуру дерева не та- то просто. Это было бы проще, если бы у нас никогда не было, например, неполнородных браков. Что значит «неполнородных»? Я имею в виду, когда у нас, например, у двух детей один общий отец, но разные матери. Это сразу взрывает количество возможных генетических деревьев, и выбрать правильное становится уже сложно. Это другая, более сложная ситуация, когда у нас один папа и три разных мамы было.

Вопрос, который возникает дальше: «А насколько далеко назад в поколениях я могу найти родственников? И вообще какая точность?».

Можно проводить эксперименты, что мы активно делаем. Стимулировать родословную и пытаться оценивать у них генетические сходства. И оказывается, что на малых степенях родства все работает очень точно. Точность 98-99%. Как только мы переходим уже к троюродным-четвероюродным братьям, то начинаются всякие погрешности. Все потому что на самом деле общая ДНК, которая досталась им, ее не так много. Однозначно сказать, в каком поколении был общий предок, сложно.

Поэтому обычно сообщают интервал, например, четвертое-шестое поколение. Мы взяли какое-то количество тысяч наших клиентов, изобразили их точками, просто каждую точку, и точку соединили линией, если они являются родственником до 10-го поколения. У нас получилась такая картинка. Что мы здесь видим? Мы видим клубок в самом центре и какие-то точки по краям. Это просто люди, у которых пока не нашлось ни одного родственника. 95 % людей в этом кубке, в этом котле. Соответственно, каждая линия означает, что они родственники.

Генетическая генеалогия и этничность

Мы пошли дальше, и мы решили украсить людей по их этничности, предсказанной по генетике. Этничность не определяется генетикой, но есть сильная сцепленность. Мы как-то можем предсказывать с какой-то точностью. Например, вот здесь получилась восточно-азиатская семья китайцев, вот они друг другу родственники, они все оранжевые. Синие – это восточные европейцы, их подавляющее большинство среди наших клиентов.

Если всматриваться то можно увидеть такой фиолетовый клубок в клубке. Как вы думаете, кто это? Правильно, это евреи. Как можно догадаться об этом? По статистике, два случайных еврея ашкенази имеют столько же общей ДНК, сколько имели бы пятиюродные братья европейцы. Это обусловлено тем что 700 лет назад евреи прошли через так называемые бутылочное горлышко. Их популяция с двадцати трех тысяч сократилась. Есть 350 человек примерно плюс-минус, которые 700 лет назад жили и сейчас являются предками всех ныне живущих евреев ашкенази, которых десять миллионов по всему миру.

Соответственно, у них генетическое разнообразие существенно меньше, чем в каких-то других более смешанных популяциях. Это не так хорошо, на самом деле. Потому что из-за отсутствия такого генетического разнообразия, из-за того, что большинство браков  осуществляется между как раз-таки евреев ашкенази, нету межэтнических браков, у них есть наследственные заболевания, которые чаще встречаются или встречаются только среди евреев ашкенази. Это такой насущный и важный вопрос, который генетика тоже старается решать.

Компании по генетической генеалогии

Вопрос: «Допустим, я сделал тест в какой-то из компаний. Могу ли я поискать родственников не только внутри этой компании, но и в каких-то базах?».

Нету такой базы  родственников нашей планеты Земля. У каждой компании своя какая-то база, но компания допускает возможность, чтобы вы могли, например, сдать тест в Genotek, выгрузить свои исходные данные, расшифрованный геном, загрузить в MyHeritage и поискать родственников там, и работает обратная схема.

Теперь вернемся как раз-таки к гаплогруппам, митохондриальной ДНК, Y-хромосоме.

Этнический состав – это история, когда мы пытаемся окрасить ваш геном в этносы, ныне живущие на планете Земля, в геномы современных людей. Можно привести в пример результат конкретного человека. Он оказался на 15% евреем, на 40% из восточной  Европы и южного Кавказа. По всей видимости, от бабушки ему досталось 15% евреев. Это плюс-минус соответствует тому, что у него была чистокровная бабушка еврейка. Как это работает, я готов обсуждать уже где-нибудь в кулуарах. Потому-что все-таки это уход в сторону, так же как уход в сторону гаплогруппы. Мы, анализируя древние геномы и геномы современных людей, можем узнать, что мутации на Y-хромосомах и митохондриальной ДНК возникали примерно 7 - 12 тысяч лет назад в таком-то месте Земли.

Проанализировав ваши мутации, мы можем отмотать всю историю назад на 140 тысяч лет. Тогда все наши предки жили в Африке и назывались Y-хромосомный Адам и митохондриальная Ева. Можем также давать какие-то разукраски по тому, где сейчас обитают люди с такими же группами, как ваша.

Зачем еще нужны ДНК-тесты?

Анализ 650 тысяч маркеров весьма полный. Эти данные можно использовать не только для генеалогии, но и для других важных аспектов нашей жизни. Например, носительство наследственных заболеваний. Это история про то, когда есть два родителя, у них условно один из двух генов в геноме, сломан. Они являются носителями мутации, которая относится к какому-то заболеванию, которое никак не проявляется. С вероятностью 25 % в такой паре рождается больной ребенок, потому что оба родителя случайно передали ему именно сломанный ген. Например, если возвращаться к евреям ашкенази, 3% евреев ашкенази являются носителями болезни Тэя Сакса. Это заболевание нервной системы.  При таком ребенок рождается, первые месяцы живет так, как все, без каких-то симптомов. Потом у него возникают проблемы с реакцией, его разбивает паралич, и он не доживает никогда до пяти лет. Никто не хотел бы родить такого ребенка.

Есть также риски мультифакторных заболеваний. Генетика дает существенный вклад в такие болезни, как онкологические заболевания, заболевания сердечно-сосудистой системы. Соответственно, этот вклад можно в некоторой мере оценивать. Если еще сюда приплюсовывать образ жизни, то получается прямо такая прогностическая хорошая модель, которую можно использовать для того, чтобы выбирать те заболевания, которые стоит профилактировать. Профилактировать одновременно все невозможно. Но если знать свои предрасположенности, то можно составлять check-up по себе и проходить именно его.

Что еще дает генетическая генеалогия?

Очень важный пункт – эффективность лекарств. Уже во многих лекарственных инструкциях прямо написано: перед тем как назначить дозу варфарина, нужно пройти генетическое тестирование. Перед тем как принимать определенные антидепрессанты, нужно выяснить, как они у вас усваиваются в плане генетики, как работают ваши цитохоромы, будут ли эти лекарства эффективны, будут ли они с правильной скоростью выводиться из организма.

Особенности организма. Здесь я подразумеваю что усвояемость витаминов, непереносимость определенных продуктов (лактозы, кофеина),  тоже обуславливаются генетикой. И такое новое перспективное направление – это спортивная генетика, отбор в олимпийский сборной и так далее. Это пока что такие качели: одна статья выходит, говорит, что это все работает, это классно, это надо уже внедрять; потом выходит статья, которая ее опровергает и наоборот.

Какие задачи ставит генетическая генеалогия?

В завершение, я хотел бы сказать, что, на мой взгляд, нам нужно. В генетике есть база данных с огромным количеством евреев ашкенази. Почти вся Исландия отгенотипирована. Почти у всех жителей Исландии есть генетические геномы, расшифрованы генетические паспорта. Стремится к тому, чтобы оцифовать полностью свое население Эстония . В плане генетики популяционной  Россия – это просто белое пятно, которое очень мало кто изучает.  Научному сообществу доступны какие-то десятки несчастных геномов русских людей для анализа. Это печально, и нужно восполнять. Мы стараемся это делать, мы не только занимаемся бизнесом. Мы занимаемся, в первую очередь, наукой, и мы открыты к любым каким-то коллаборациям, в том числе и в плане генеалогии. Популяционная генетика, поиск родственников – это все очень интересно.

 

Генетика – это не самостоятельная наука, она всегда идет в паре с кем-то. Если мы говорим про этнический состав, про поиск родственников, генетика идет за руку с генеалогией и генеалогами. Потому что нужны данные о том, кто эти люди, где они жили, какого они происхождения. Про болезни то же самое – нам нужно описание от медиков, например, какими болезнями эти люди болеют. Консорциум – это классная штука, и по здоровью они уже появляются. Мы вошли в консорциум по психиатрической генетике, по генетике психиатрических заболеваний. По генеалогии я такого консорциума не знаю. Возможно, он есть, но я искал, я не нашел.

 

Сильно упрощает взаимодействие, когда можно прийти, сесть за круглый стол и обсудить вопросы генетики и генеалогии с разными специалистами широкого круга. И мы очень долго пытаемся безуспешно найти человека, который мог бы просто клиента, который прошел генетический тест, проконсультировать по результатам. Рассказать, что такое гаплогруппа, как понимать процент в этническом составе и почему у меня столько родственников. Таких людей не нашлось пока что, это тоже проблема, и надо как-то таких экспертов тоже готовить, я считаю. Большое спасибо вам за внимание, я буду рад ответить на все ваши вопросы!

Генеалогический форум - генетическая генеалогия

Будем рады встретиться на ГЕНТЕХе в 2020 году, чтобы рассказать еще больше о генеалогических исследованиях!