Семейная история мирового масштаба

Семейная история мирового масштаба

Лекция о том, как сеть MyHeritage объединила все имеющиеся данные в единую экосистему и вывела генеалогию на новый технологический уровень рассказывает

Андрей Овруцкий

- Руководитель отдела дизайна пользовательских интерфейсов MyHeritage

Я свое выступление хотел бы начать с небольшой истории.

Рига, 1946 год.

Город возвращается к жизни после Второй мировой войны. В этом городе также Семен и Ася пытаются наладить свою жизнь. Война защитила их, но уничтожила семьи обоих. Семен потерял жену и троих детей, а Ася потеряла мужа и двоих детей. Но у них в январе 1947 года рождается сын Лев. На этом их горести не заканчиваются: через несколько недель после родов Ася умирает из-за осложнений. Отец заново женится. В общем-то Лев живет с приемной матерью, даже не зная об этом. Отец ему рассказывает реальную историю, когда ему исполняется 16 лет, и Лев понимает, что он не знает свою реальную историю, половина семейного древа  от него скрыта.

Он носит эту историю в себе, и уже во взрослом возрасте рассказывает своей дочери Жанне. Та, в отличие от него, решает все-таки докопаться до истины. Она регистрируется на сайте мэрии и создает своё генеалогическое древо. Через некоторое время она получает письмо о том, что у нее есть совпадения. И через некоторое время после переписки с человеком, который был совпадением, она выясняет, что тот, кто написал, - это двоюродный брат его ее отца. Таким образом, она узнает действительно вторую линию – ту часть, которую отец не знал о себе. Кроме этого еще выясняется, что у его матери, у бабушки Жанны, довольно большая ветвь родственников. О них вообще из семьи Льва никто не знал до этого. Счастливым завершением этой истории становится то, что Жанна собирает всех родственников, которые живут уже в разных странах, вместе. И на этой встрече ее отец впервые вживую встречает своего двоюродного брата.

Я Андрей Овруцкий, и я работаю в MyHeritage. Эту историю я рассказал потому, что у меня точно так же, как у Жанны есть вопросы. Я не знаю, кто мой дед. Есть мое древо. Есть я. А еще в древе есть человек, которого я пока не нашел. И в MyHeritage я работаю не только потому, что это хорошая компания, а потому что я хочу, чтобы наш продукт был самым лучшим.

Что же такое MyHeritage?

MyHeritage – это компания единомышленников и людей, которые любят заниматься генеалогией и стараются сделать этот продукт лучше всех. И в принципе мы довольно часто встречаемся с такими историями, которую я рассказал. Это реальная история, история реальных людей. Мы всегда стараемся им помочь. Например, мы запустили проект, позволяющий приемным детям по всему миру найти своих биологических родителей. Мы уже раздали 5 тысяч тестов ДНК бесплатно, и сейчас готовится второй раунд этого проекта.

Каждый год мы собираем команду из наших работников и отправляем экспедицию в разные уголки мира. Они изучают историю и сохраняют генетическую историю о разных племенах, которые могут  исчезнуть. Мы уже побывали в Намибии, в Папуа-Новой Гвинее, в Сибири, в Ненецком автономном округе. В течение 16  дней мы создавали и комментировали биологические древа более трех тысяч ненцев.

На данный момент готовится четвертая экспедиция, но  это капля в море, если посмотреть на всю ферму в целом. По некоторым из наших цифр у нас зарегистрировано 102 миллиона пользователей по всему миру, создано 40 миллионов геологических древ. В этих древах находится три миллиарда персон. В наших базах данных зарегистрировано 9 миллиардов архивных записей, мы уже сделали два с половиной миллиона тестов ДНК. Наши пользователи ежедневно получают десятки миллионов совпадений, генетических и биологических, по всему миру.

Но давайте вернемся обратно к нашему продукту. Мы стараемся создавать новые инструменты и улучшать старые из тех, которые у нас есть. Что касается самой генеалогии древа, то у нас был долгое время был только вид в виде древа. Мы недавно добавили в виде родословной и ближайшее время будет улучшать виды и функциональность списка. Также за последний год мы добавили 523 миллиона архивных записей. Мы  работаем с архивами на территории бывшего Советского Союза. Здесь идет довольно сложная работа . Я надеюсь, что в следующем году смогу представить какую-нибудь из коллекций, которая больше актуальна пользователям в России.

Создана коллекция выпускных альбомов, которая будет интересна не только профессионалам. В ней  много людей, которые известны всем. Есть например, выпускной альбом Билла Клинтона 63-го года, альбом Стива Джобса 72-го года, Чака Норриса 58 года. Кроме того, можно найти Джулию Робертс, Натали Портман, Шерон Стоун.

Каков интерфейс проекта MyHeritage?

Кроме работы с коллекциями, самими архивами мы также работаем над улучшением интерфейса. В ближайшее время будет изменен интерфейс показа результатов поиска и каждой отдельной коллекции. Мы сделали уже 2 млн тестов. Мы поддерживаем форматы ведущих фирм. Только сейчас разговаривали, общались с представителем Genotek. Может быть, в дальнейшем тоже попытаемся поработать с ними. Посмотрим, как получится.

Мы заново разработали всю технологию работы с ДНК. Создали новые страницы обзора ДНК, в которой можно увидеть этническое происхождение, совпадения ДНК и другую информацию. Улучшили поиск по данным в совпадении ДНК, добавили новые категории для поиска, чтобы было удобно, потому что большие объемы. Некоторые получают 1000 совпадений. В самой странице «Совпадение», появились новые функции, такие как фамилия предков, общая фамилия предков, общие места проживания между двумя людьми. Также появилась возможность делать обзор хромосом с очень мощной функциональностью между несколькими, двумя людьми и более, добавлять и изучать хромосомы на более высоком уровне.

Все эти инструменты мы объединили в единую область, которую можно посмотреть, взять каждую в отдельности и поработать. Когда мы все это собрали, мы подумали: у нас большое количество информации, архивов, инструментов. А как мы можем сделать переход на новый уровень в изучении генеалогии?

И тогда у нас появилась идея создать проект «Теория большого древа».

Представьте себе, что вы создаете свое генетическое древо. Мы обзвонили всех родственников, обошли все архивы и изучили все фотографии, письма. И даже сделали анализ ДНК. И вот у вас появилось совпадение по ДНК. Появляется описание этого человека: «Двоюродная родственница с разницей в два поколения». Никому это ни о чем не говорит. Но как узнать точно, где находится этот человек?

Давайте представим, что у нас есть очень большое виртуальное древо, в котором есть все живущие, не живущие люди. На одном месте находитесь вы, а где-то находится ваш родственник. Для того, чтобы найти связь между вами, нам нужно подняться вверх до общего предка, а потом опуститься к тому человеку, с которым у вас есть совпадения. Проблема единственная в том, что такого древа не существует. Но зато у нас есть, благодаря нашим древам, архивам, работе с партнерами, много маленьких древ. И мы их соединили вместе.

Мы создаем между двумя людьми путем совпадений, которые есть между этими древами путь. Мы можем прийти по пути от одного к другому. В упрощенной форме древа можно подняться  вверх к общим предкам и потом спуститься вниз. Но чтобы показать людям, как мы пришли к этому результату, мы добавили интерфейс расширенный. В нем можно увидеть полностью все источники, места перехода от одного источника к другому. По совпадению переходим к другому древу, от него можем перейти, в данном случае, на сайт нашего партнера.

Что еще может быть?

Точно так же может быть архив, перепись населения или свидетельство о рождении, и другие документы, в которых указаны несколько родственников. И вот мы переходим по нашим предкам дальше, чтобы двигаться в сторону нашего совпадения. В какой-то момент у нас  заканчивается цепочка, мы дальше не можем спускаться. Тогда мы переходим на сайт, на древо другого человека, который его создал. Таким образом, приходим к его, к нашему совпадению и объединяем двоих людей.

 

Таким образом, MyHeritage попыталась объединить всю собранную информацию: техническую, технологическую, архивные древа и все, что у нас есть, для того, чтобы сделать новый скачок в области генеалогии на благо нашим пользователям.

Ну и последнее, что я хотел сказать, – это то, что у нас в сентябре с 6 по 8 сентября пройдет конференция в Амстердаме. Так что если вдруг кто-то как то случайно окажется там,  то добро пожаловать, мы все будем там. Всем спасибо!

Ну а еще будем рады встретить вас на ГЕНТЕХе в 2020 году, чтобы рассказать еще о семейной истории!