Изменчивость генофонда в пространстве и времени: синтез данных о геногеографии митохондриальной днк и y-хромосомы
На правах рукописи
БАЛАНОВСКИЙ Олег Павлович ИЗМЕНЧИВОСТЬ ГЕНОФОНДА В ПРОСТРАНСТВЕ И ВРЕМЕНИ:
СИНТЕЗ ДАННЫХ О ГЕНОГЕОГРАФИИ МИТОХОНДРИАЛЬНОЙ ДНК И Y-ХРОМОСОМЫ 03.02.07 – генетика 03.01.03 – молекулярная биология
АВТОРЕФЕРАТ
диссертации на соискание ученой степени доктора биологических наук
Москва – 2012
Работа выполнена в Федеральном государственном бюджетном учреждении «Медико-генетический научный центр» Российской академии медицинских наук.
Научные консультанты:
доктор биологических наук, академик Эстонской АН Виллемс Рихард Лео-Энделевич;
доктор биологических наук, член-корреспондент РАН Янковский Николай Казимирович.
Официальные оппоненты:
Степанов Вадим Анатольевич, доктор биологических наук, профессор Федеральное государственное бюджетное учреждение «Научно-исследовательский институт медицинской генетики» Сибирского отделения Российской академии медицинских наук, заместитель директора по научным вопросам;
Спицын Виктор Алексеевич, доктор биологических наук, профессор Федеральное государственное бюджетное учреждение «Медико-генетический научный центр» Российской академии медицинских наук, заведующий лабораторией экологической генетики;
Захаров-Гезехус Илья Артемьевич, доктор биологических наук, профессор, член корреспондент Российской академии наук Федеральное государственное бюджетное учреждение науки Институт общей генетики им. Н.И. Вавилова Российской академии наук, советник РАН.
Ведущая организация:
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный университет имени М.В. Ломоносова», биологический факультет, кафедра генетики.
Защита состоится «_» _ 2012 г. в _ часов на заседании Диссертационного ученого совета Д 001.016.01 при Федеральном государственном бюджетном учреждении «Медико генетический научный центр» Российской академии медицинских наук (115478, Москва, ул.
Москворечье, д.1).
С диссертацией можно ознакомиться в библиотеке Федерального государственного бюджетного учреждения «Медико-генетический научный центр» Российской академии медицинских наук по адресу: 115478, Москва, ул. Москворечье, д.1.
Автореферат разослан «»_ 2012 г.
Учёный секретарь диссертационного совета Д 001.016. по защите докторских и кандидатских диссертаций, доктор медицинских наук, профессор Зинченко Рена Абульфазовна
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Генетическое изучение популяций человека на протяжении десятилетий привлекает внимание многих исследователей, среди которых виднейшие представители отечественной и мировой биологии: А.С. Серебровский, Н.К.
Кольцов, В.В. Бунак, Г.Ф. Дебец, Ю.П. Алтухов, Ю.Г. Рычков, L.L. Cavalli-Sforza, W.
Bodmer, а также представители смежных дисциплин – археологии, лингвистики, прикладной математики, палеогеографии. В последние двадцать лет популяционная генетика переживает новый подъем, связанный с использованием нерекомбинирующих систем: митохондриальной ДНК (мтДНК) и Y-хромосомы. Ярко выраженная межпопуляционная вариабельность этих маркеров, высокая скорость накопления мутаций, возможность проследить их постепенное «наслоение», не разбиваемое рекомбинационными событиями – все это сделало мтДНК и Y-хромосому эффективными инструментами для прослеживания древних миграций человечества, изучения генофонда современных популяций и факторов их микроэволюции.
Эти нерекомбинирующие генетические системы используются преимущественно для реконструкции истории популяций, тогда как аутосомные маркеры чаще исследуются в связи с задачами геномной медицины (Пузырев и др., 2000, 2004;
Спицын и др., 2000, 2006;
Степанов, 2003;
Янковский и др., 2005;
Марусин и др., 2006, 2007;
Воевода и др., 2006;
Borinskaya et al., 2009;
Stepanov et al., 2010a;
Боровкова и др., 2010;
Баранов, 2011) и ДНК-идентификации (Степанов и др., 2003а,б;
Шорохова и др., 2005;
Verbenko et al., 2006;
Деренко и др., 2007;
Zhivotovsky et al., 2007, 2009a,b;
Stepanov et al., 2010b). В самые последние годы набирает силу и анализ панелей из сотен тысяч SNP маркеров (главным образом, аутосомных). Достигая точного определения генетического сходства популяций, такой анализ из-за высокой стоимости генотипирования проводится лишь для немногих популяций и небольших (10-20 человек) выборок, что может смещать оценки. Изучение же мтДНК и Y-хромосомы проводится на обширных выборках десятками известных лабораторий для почти всех народов мира со всех континентов.
Особенно подробно изучен генофонд Европы, ставший для европейской науки полигоном для проверки генетических концепций и методов. Вопрос о палеолитическом или неолитическом времени формирования основных черт европейского генофонда является, пожалуй, наиболее широко обсуждаемым вопросом в популяционной генетике человека. Об этом свидетельствует число статей на эту тему (в т.ч. в журналах Nature и Science) и авторитет их авторов (Ammerman, Cavalli-Sforza, 1987;
Cavalli-Sforza et al., 1994;
Richards et al., 1996;
Richards et al., 2000;
Semino et al., 2000;
Barbujani, Bertorelle, 2002;
Chikhi et al., 2002;
Haak et al., 2005;
Bramanti et al., 2009 и т.д.). Однако работы, обобщающие изменчивость мтДНК и Y-хромосомы в Европе, последний раз проводились десятилетие назад (Richards et al., 2000;
Rosser et al., 2000;
Semino et al., 2000;
Richards et al., 2002), когда впервые появилась возможность получить целостное представление о генофонде Европы по однородительским ДНК маркерам. Подавляющее большинство последовавших крупных работ и по мтДНК (Helgason et al., 2001, 2003;
Meinila et al., 2001;
Malyarchuk et al., 2002, 2003, 2004, 2006, 2008;
2011;
Бермишева и др., 2002;
Orekhov et al., 1999;
Pfeiffer et al., 1999;
Pereira et al., 2004;
Tambets et al., 2004;
Goodacre et al., 2005;
Falchi et al., 2006;
Grzybowski et al., 2007;
Lappalainen et al., 2008;
Alvarez-Iglesias et al., 2009;
Santos et al., 2009;
Garcia et al., 2010;
Karachanak et al., 2011) и по Y-хромосоме (Behar et al., 2003;
Харьков и др., 2004, 2005;
Cinnioglu et al., 2003;
Di Giacomo et al., 2003;
Brion et al., 2005;
Flores et al., 2003, 2004;
Tambets et al., 2004;
Alonso et al., 2005;
Gonсalves et al., 2005;
Kayser et al., 2005;
Pericic et al., 2005;
Capelli et al., 2006, 2007;
Lappalainen et al., 2006, 2008;
Adams et al., 2008;
Balanovsky et al., 2008, 2011;
Battaglia et al., 2008;
Fechner et al., 2008;
Varzari et al., 2009;
King et al., 2011;
Yunusbaev et al., 2011;
многие другие работы) ставило задачей изучение отдельных регионов Европы.
Ряд работ был посвящен также отдельным гаплогруппам (Di Giacomo et al., 2004;
Cruciani et al., 2007, 2010;
Myres et al., 2010;
Underhill et al., 2010;
Mendez et al., 2011;
Onofri et al., 2008;
Derenko et al., 2006, 2007, 2010;
Rootsi et al., 2007;
Tofanelli et al., и другие работы). Но обобщающий анализ в масштабе всей Европы после работ года не проводился.
О популяциях Северной Азии также накоплены подробные данные и по маркерам Y-хромосомы (Karafet et al., 1997, 2001;
Степанов, Пузырев, 2000а,б,в;
Степанов и др., 2001;
Lell et al., 2002;
Пузырев и др., 2003;
Tambets et al., 2004;
Харьков и др., 2005, 2007а,б, 2008, 2009, 2011;
Stepanov, Kharkov, 2006;
Derenko et al., 2006;
Lessig et al., 2008;
Dulik et al., 2011), и по мтДНК (Schurr et al., 1999;
Derenko et al., 2000, 2001, 2003, 2007;
Деренко и др., 2002, 2004;
Pakendorf et al., 2003, 2005;
Fedorova et al., 2003;
Zakharov et al., 2004;
Tajima et al., 2004;
Бермишева и др., 2005;
Starikovskaya et al., 2005;
Zlojutro et al., 2006;
Volodko et al., 2008;
Gokcumen et al., 2008;
Rubicz et al., 2010). Эти данные и опыт их обобщения (Степанов, 2002;
Степанов и др., 2006;
Derenko et al., 2006;
Деренко, 2009;
Харьков, 2012) позволяют изучить взаимодействие европейского и азиатского генофондов, а обширные данные по другим регионам мира делают возможным анализ и в глобальном масштабе. Поэтому представляется своевременным и актуальным данное исследование, в котором сделана попытка на современном этапе изучения генофонда собрать воедино, проанализировать и подытожить как многочисленные собственные данные, так и составленные под руководством автора базы данных, включающие опубликованные данные не только о генофондах народов Европы и Азии, но и о мировой изменчивости мтДНК и Y-хромосомы.
Создание таких баз данных актуально и само по себе: их отсутствие чрезвычайно затрудняет сравнительный анализ генофондов. Поэтому созданные базы данных заслужили признание научного сообщества (Behar et al., 2007, 2009;
Quintano-Murci et al., 2008, 2010;
Haak et al., 2010;
Haber et al., 2011) и позволили провести анализ в географическом масштабе не только Европы, но и Евразии.
Учитывая сложность реконструкции древних миграций по данным о современных популяциях, большое значение приобретает анализ ДНК палеоантропологического материала из археологических раскопок: исследование палео ДНК позволяет проследить изменчивость генофонда не только в пространстве, но и во времени. Поэтому актуален анализ древней ДНК, который реализован в данной работе для пяти временных срезов (на протяжении 7000 лет): эпох мезолита, неолита, раннего металла, античности и Нового времени. Генетические исследования приобретают все большее значение для смежных наук о человеке - не только физической антропологии и археологии, но и лингвистики. Поэтому актуален параллельный анализ лингвистических и генетических данных, выполненный для двух наиболее крупных лингвистических семей Европы индоевропейской и северокавказской. И, несомненно, особую актуальность для российской науки имеет исследование русского генофонда, восточнославянских и северокавказских народов, составившее основной каркас работы.
Цель исследования. Изучить пространственную изменчивость и этапы формирования генофондов на примере народонаселения Европы, проанализировать геногеографические закономерности в масштабе Евразии и сравнить роль географического соседства и лингвистического родства в структурировании генофондов, основываясь на данных о Y-хромосоме и митохондриальной ДНК.
Задачи исследования.
1. Создать унифицированные базы данных по изменчивости Y-хромосомы и митохондриальной ДНК в народонаселении мира, объединяющие результаты собственных исследований с литературными данными.
2. Изучить пространственную изменчивость Y-хромосомы и митохондриальной ДНК на трех иерархических уровнях: в популяциях восточных славян, Европы, Евразии.
3. Провести картографический анализ митохондриального генофонда Европы и выявить факторы, определяющие пространственную изменчивость внутрипопуляционного разнообразия.
4. Определить соотношение межпопуляционной изменчивости у европейских народов, говорящих на языках различных лингвистических групп.
5. Создать картографический атлас распространения гаплогрупп Y-хромосомы и митохондриальной ДНК в населении Евразии;
выявить объективное деление на региональные генофонды;
определить степень влияния центральноазиатских популяций на генофонд восточных славян и Европы в целом.
6. На примере подразделенного генофонда народов Кавказа реконструировать древо родства популяций по SNP-гаплогруппам и по STR-гаплотипам Y-хромосомы и сопоставить генетические, лингвистические и исторические датировки разделения родственных народов.
7. Оценить роль лингвистического и географического фактора в структурировании генофонда Европы по Y-хромосоме (на примере северокавказской семьи) и по митохондриальной ДНК (на примере индоевропейской языковой семьи).
8. Исследовать изменчивость европейского генофонда во времени с использованием данных по древней ДНК эпох мезолита, неолита, раннего металла, античности и Нового времени.
Научная новизна.
Впервые созданы обширные базы данных по изменчивости Y-хромосомы (более 112 тысяч образцов) и мтДНК (более 132 тысяч образцов) в коренных популяциях мира.
Впервые по маркерам Y-хромосомы выявлена структурированность европейских популяций по этническому признаку: формирование четких «этнических облаков».
Впервые выявлена ведущая роль лингвистического фактора в структурировании митохондриального генофонда Европы: кластеризация по лингвистическим группам.
Впервые показано, что финно-угорские популяции представляют основную часть межпопуляционного разнообразия Европы, в то время как их внутрипопуляционное разнообразие минимально;
выдвинута гипотеза о роли дрейфа генов в формировании такого соотношения внутри- и межпопуляционного разнообразия.
Впервые обнаружен широтный тренд убывания к северу гаплотипического разнообразия мтДНК населения Европы и его связь с грузом наследственной патологии.
Впервые созданы атласы изменчивости генофонда Евразии по широкому спектру гаплогрупп Y-хромосомы и мтДНК, благодаря которым выявлены основные генетические границы в ареале Евразии.
Впервые показана двусоставность русского генофонда по маркерам Y-хромосомы, формирующая широтный тренд и связываемая с восточнославянским и палеоевропейским компонентами, на основе которых сформировался русский генофонд.
Впервые по маркерам Y-хромосомы и мтДНК доказана незначительность влияния миграций из Центральной Азии на генофонд славян и других народов Европы.
Впервые выявлен параллелизм в генетическом и лингвистическом разнообразии на Кавказе и близость генетических и лингвистических датировок популяционных событий.
Такой анализ впервые основан на количественных лингвистических расстояниях.
Впервые по данным о древней ДНК показано ближневосточное происхождение первого неолитического населения Европы.
Впервые по генетическим данным подтверждена значительная доля монголоидного (или «уралоидного») компонента в генофонде севера Восточной Европы эпохи мезолита.
Впервые доказано отсутствие преемственности между населением эпохи раннего металла и современным коренным населением Кольского полуострова.
Практическая значимость.
Полученные результаты расширяют и систематизируют знания о генофонде восточных славян, народов Северного Кавказа, Сибири и Евразии в целом. Для медико генетических исследований имеют значение обнаруженные тренды в гаплотипической изменчивости мтДНК, поскольку зоны низкого разнообразия скоррелированы с отягощенностью аутосомно-рецессивной патологией. Выявленные генетические границы в генофонде Евразии также позволяют прогнозировать пределы распространения редких наследственных нозологий. Данные о генотипах индивидуальных образцов позволяют оптимизировать формирование контрольной выборки, идентичной выборке пациентов.
Для судебно-медицинской экспертизы полученные обширные данные об изменчивости мтДНК и Y-хромосомы важны для создания референсных баз данных и установления вероятного региона происхождения неизвестного лица по образцу ДНК.
Данное исследование интенсифицировало сотрудничество российских генетиков с российскими и зарубежными лингвистами (Balanovsky et al., 2011), археологами (Haak et al., 2010), палеоклиматологами (Балановский, 2008), палеоантропологами (Der Sarkisyan, in preparation), представителями других гуманитарных и естественных наук. Результаты использовались в лекциях студентам, аспирантам, учителям, школьникам, многократно описывались на телевидении, радио и в печати для популяризации научных знаний.
Результаты исследования используются в работе российских и зарубежных организаций: ФГБУ «Медико-генетический научный центр» РАМН, ФГБУН Институт общей генетики им. Н.И. Вавилова РАН, ФГБУН Институт молекулярной биологии РАН, ФГБУН Институт географии РАН, Институт антропологии МГУ им. М.В. Ломоносова, Институт языкознания РАН, Российский государственный гуманитарный университет, Адыгейский, Белгородский, Забайкальский, Казанский, Кемеровский, Мордовский, Харьковский, Забайкальский государственные университеты, Следственный комитет РФ, Российский центр судебно-медицинской экспертизы Минздрава РФ, Эстонский биоцентр, Национальное географическое общество США, Институт Пастера (Франция), Австралийский центр древней ДНК, Центр здравоохранения Рамбам (Израиль), Ливанский Американский университет, Университет Мадурая (Индия), Университет Помпея Фабра (Испания), Евразийский национальный университет им. Л.Н. Гумилева (Казахстан), НИИ молекулярной биологии и медицины при Минздраве Киргизии, Институт молекулярной биологии Национальной академии наук Армении, Центр судебной экспертизы Министерства юстиции Казахстана, Институт искусствоведения, этнографии и фольклора НАН Беларуси, Монгольская академия медицинских наук.
Основные положения, выносимые на защиту.
1. Изменчивость Y-хромосомы в европейских популяциях в высокой степени структурирована, причем не только по географическому, но и по этническому принципу: популяции одного народа, во-первых, обладают значительным сходством друг с другом и, во-вторых, отдалены от генофондов других народов. Важны нарушения этой закономерности: исключение из первого правила - выраженное различие между северными и южными русскими популяциями, исключение из второго правила - значительное «перекрывание» славянских генофондов.
2. В генофонде народонаселения Восточной Европы по маркерам и Y-хромосомы, и митохондриальной ДНК не обнаруживается сколь либо существенное влияние миграций центральноазиатских кочевников, о чем свидетельствуют картографические атласы, основанные на созданных обширных базах данных по распространению гаплогрупп Y-хромосомы и митохондриальной ДНК у народов мира.
3. Для изменчивости митохондриальной ДНК в населении Европы характерны три закономерности. Во-первых, уменьшение внутрипопуляционного разнообразия к северу, что объясняется усилением дрейфа генов в северных популяциях вследствие снижения продуктивности территорий и падения плотности населения. Во-вторых, те же факторы стали причиной повышения межпопуляционного разнообразия мтДНК у финно-угорских популяций северо-востока Европы. В-третьих, наряду с этими географическими закономерностями, имеется связь структуры митохондриального генофонда с лингвистической классификацией: генофонды популяций кластеризуются в соответствии с их лингвистической принадлежностью.
4. Параллелизм между генетической и лингвистической структурой народонаселения ярко проявляется в четко подразделенных популяциях коренных народов Северного Кавказа. Каждой лингвистической ветви соответствует своя доминирующая гаплогруппа Y-хромосомы, а многие кластеры гаплотипов в пределах гаплогрупп высоко (в среднем 95%) специфичны для отдельных народов. Генетические датировки возраста кластеров хорошо согласуются с лингвистическими датировками разделения соответствующих языков и с историческими данными.
5. Созданные картографические атласы, основанные на совокупности собственных результатов и разработанных автором баз данных, объективно описывают изменчивость Y-хромосомы и митохондриальной ДНК в Евразии. Выявлена основная генетическая граница, разделяющая Евразию на западный и восточный субгенофонды:
граница начинается на Кавказе, проходит через южный Урал, северный Казахстан, Южную Сибирь и далее следует вдоль Енисея по Средней Сибири.
6. О ближневосточном происхождении первых неолитических популяций Европы (культура линейно-ленточной керамики) свидетельствует сравнение данных по древней ДНК с созданной базой данных о современном генофонде. В предшествовавший период мезолита восточноевропейское население (данные по Южному Оленьему острову) обладало большим, чем сейчас, сходством с населением Западной Сибири;
часть последующих миграций из Сибири угасла, не оставив следов в современном генофонде (данные по Большому Оленьему острову).
Апробация работы.
Основные результаты были доложены на International Congress of the European Anthropological association “Anthropology and Society” (Чехия, 2003);
Третьих Антропологических чтениях памяти академика В.П. Алексеева "Экология и демография человека в прошлом и настоящем" (Москва, 2004);
Второй международной (совместно с посольством Великобритании) школе-семинаре "Проблемы генетической безопасности:
научные инновации и их интерпретация" (Москва, 2004);
III Съезде Вавиловского общества генетиков и селекционеров (Москва, 2004);
семинаре группы член-корр. РАН С.А. Старостина в Российском государственном гуманитарном университете (Москва, 2004);
семинаре отдела эволюционной биологии Эстонского биоцентра (Эстония, 2005);
конференции "Актуальные вопросы сравнительно-исторического языкознания и дальнее родство языков" (Москва, 2006);
конференции "Путь на север: инициальное заселение человеком Арктики и Субарктики" (Москва, 2007);
5th ISABS Conference in Forensic Genetics and Molecular Anthropology (Хорватия, 2007);
семинаре экспертов-биологов ЭКЦ МВД, ГУВД, УВД субъектов РФ "Использование современных технологий и оборудования при производстве экспертиз тканей и выделений человека" (Красноярск, 2008);
Всероссийской конференции "Адаптация как фактор формирования антропологического своеобразия древнего и современного населения Евразии" памяти акад. Т.И. Алексеевой (Москва, 2008);
V Съезде Вавиловского общества генетиков и селекционеров (Москва, 2009);
Международной конференции "Человек: его биологическая и социальная история" (Москва, 2009);
конференции молодых ученых ФГБУ «МГНЦ» РАМН (Москва, 2009);
3rd workshop "Foundations of Europe - Prehistoric roots of Europe" (Испания, 2009);
VI Съезде Российского общества медицинских генетиков (Ростов-на-Дону, 2010);
Всероссийской научной школе для молодежи "Горизонты нанобиотехнологии" (Звенигород, 2009);
VIII Курчатовской молодежной научной школе (Москва, 2010);
5й научной школе молодых ученых по экологической генетике "Экологическая генетика человека" (С-Петербург, 2010);
XVII Савёловских чтениях "Генеалогия и генетика" (Москва, 2010);
семинаре Государственного Дарвиновского музея "Эволюция человека сегодня";
Международной конференции «Проблемы популяционной и общей генетики» (Москва, 2011);
на шести ежегодных международных конференциях The Genographic Project (США, 2005;
ЮАР, 2006;
Китай, 2007;
Эстония, 2008;
Австралия, 2010;
США, 2011).
Личный вклад автора. Автор участвовал в планировании и проведении экспедиций по обследованию населения Восточной Европы, Кавказа, Южной Сибири, Казахстана, Киргизии, Монголии, Таджикистана, руководил шестью экспедиционными грантами РФФИ, лично генотипировал маркеры мтДНК и Y-хромосомы в восточнославянских популяциях, руководил генотипированием Y-хромосомы в населении Кавказа, Сибири, Центральной Азии, руководил созданием баз данных и программного обеспечения геногеографического анализа, лично разрабатывал технологии картографического анализа генофонда и создавал картографические атласы изменчивости мтДНК и Y-хромосомы, лично проводил весь статистический, картографический, филогенетический анализ, выполнил интерпретацию и описание результатов, руководил кандидатскими диссертациями, в исследованиях древней ДНК участвовал в экспериментальной работе, выполнил статистический анализ и интерпретацию результатов. Большинство публикаций, приведенных в списке работ по теме диссертации, написаны лично автором. Суммарно личный вклад автора составляет более 80%.
Публикации: Основные результаты исследования опубликованы в 37 научных работах, в том числе 29 статей в ведущих рецензируемых научных журналах, рекомендованных ВАК РФ для защиты диссертаций, а также в монографии.
Внедрение результатов работы. Результаты диссертационного исследования внедрены в научно-педагогическую практику Биологического факультета Московского государственного университета им. М.В. Ломоносова (Москва, Ленинские горы, д.1, стр.
12), Харьковского национального университета им. В.Н. Каразина (г. Харьков, пл.
Свободы, 4), ФГБОУ ВПО «Кемеровский государственный университет» (г. Кемерово, ул. Красная, д.6), ФГБОУ ВПО «Адыгейский государственный университет» (г. Майкоп, ул. Первомайская, д. 208), ФГБОУ ВПО «Амурский гуманитарно-педагогический государственный университет» (г. Комсомольск-на-Амуре, ул. Кирова, д.17, корп. 2).
Структура и объем работы. Работа изложена на 357 страницах и содержит 6 глав, введение, выводы, список литературы (348 источников, из них 215 зарубежных). Работа иллюстрирована 30 таблицами и 99 рисунками (включая карты).
МАТЕРИАЛЫ И МЕТОДЫ Материалом исследования послужили многочисленные собственные данные по изменчивости Y-хромосомы (табл. 1), мтДНК (табл. 2) и созданные под руководством автора базы данных на основе опубликованных источников (табл. 3). Информация по древней ДНК получена совместно с Австралийским центром древней ДНК (табл. 4).
СОБСТВЕННЫЕ ДАННЫЕ. Перечень популяций, по которым получены собственные данные, представлен в таблицах 1 и 2. Биологический материал (образцы венозной крови) собран в ходе многолетних экспедиций (1998-2010 гг.), проведенных под руководством Е.В. Балановской и автора данной работы коллективом лаборатории популяционной генетики человека ФГБУ «МГНЦ» РАМН в сотрудничестве с Адыгейским, Белгородским, Кемеровским государственными университетами, научными учреждениями Армении, Белоруссии, Казахстана, Киргизии, Монголии, Таджикистана и Украины в рамках грантов РФФИ, РГНФ и международного проекта Genographic. Во всех экспедициях обследовались только индивиды, которые согласно родословным на протяжении трех поколений (пробанд, его родители и бабушки-дедушки) принадлежали данной популяции (в пределах административных границ данного и соседних районов) и данной этнической группе. Родственники до третьей степени родства тщательно исключались. Все обследованные дали письменное информированное согласие под контролем Этической комиссии ФГБУ «МГНЦ» РАМН.
По Y-хромосоме изучены популяции русские (N=1353), кавказские (N=1695), Сибири и Центральной Азии (N=1241);
выборка превысила 4000 образцов (табл. 1).
По митохондриальной ДНК охарактеризованы русские, украинские, белорусские и северокавказские популяции, суммарно более 3000 образцов (табл. 2).
Древняя ДНК эпох мезолита, неолита, раннего металла, античности и Нового времени из разных регионов Европы (табл. 3) генотипирована по маркерам мтДНК в Австралийском центре древней ДНК, в том числе при участии автора.
БАЗЫ ДАННЫХ. Вторая часть материалов – базы данных по мтДНК (MURKA) и по Y-хромосоме (Y-base) о населении мира на основе опубликованных источников, созданные под руководством автора.
В течение последних 20 лет сошла целая лавина статей, несущих сведения по изменчивости мтДНК в популяциях мира. Наша база данных («MURKA: база данных по митохондриальной ДНК и интегрированное программное обеспечение», основные составители: О.П. Балановский, В.В. Запорожченко, А.С. Пшеничнов) росла также лавинообразно. В 2004 году в базе имелась информация о 33 000 образцов мтДНК;
в 2007 году – 62 000;
в 2008 году – 95 000;
в 2010 году – 135 000. На текущий момент база содержит информацию о 206 000 образцах. Из них 8 870 - полные мтДНК геномы, 15 - данные по отдельным гаплогруппам, 50 000 – данные общественных участников проекта «Генография» (нет привязки к конкретным популяциям) и 132 600 образцов – обычные популяционные данные о коренном населении, которые и использовались в исследовании. Важной чертой базы является подробная характеристика популяций.
Таблица 1. Популяции, изученные по маркерам Y-хромосомы Популяция* Народ Географическая локализация Долгота Широта N Пинега русские Архангельская обл., Пинежский р-н 114 46.53 63. Мезень русские Архангельская обл., Лешуконский р-н 54 45.74 64. Красноборск русские Архангельская обл., Красноборский и Ленский р-ны 91 45.94 61. Вологда русские Вологодская обл, разные р-ны 121 39.9 59. Кашин русские Тверская обл., Кашинский р-н 73 37.61 57. Порхов русские Псковская обл., Порховский р-н 57 29.56 57. Остров русские Псковская обл., Островский р-н 75 28.32 57. Смоленск русские Смоленская обл., Рославльский р-н 107 32.88 53. Кострома (Унжа) русские Костромская обл., Мантуровский и Межевской р-ны 52 44.77 58. Русские Белгород русские Белгородская обл., Яковлевский, Красненский, Прохоровский р-ны 143 36.48 50. Ливны русские Орловская обл., Ливненский р-н 110 37.59 52. Пристень русские Курская обл., Пристенский р-н 45 36.71 51. Репьевка русские Воронежская обл., Репьевский р-н 96 38.65 51. Кубанские казаки русские Адыгея, Майкопский р-н 90 40.17 44. Терские казаки русские Кабардино-Балкария, Майский, Прохладненский р-ны 125 44.0 43. Шапсуги шапсуги Краснодарский край, Туапсинский, Лазаревский р-ны 100 39.1 44. Абхазы абхазы Абхазия, разные р-ны 58 41.10 43. Черкесы черкесы Карачаево-Черкесия, Хабезский, Прикубанский р-ны 142 41.7 43. Осетины осетины Северная Осетия, Дигорский, Ирафский, Алагирский, Правобережный, Пригородный р-ны;
Южная Осетия. 359 44.0 42. Ингуши ингуши Ингушетия, Малгобекский р-н 143 45.0 43. Чеченцы чеченцы Ингушетия, Малгобекский р-н;
Чечня, Ачхой-Мартановский р-н;
Дагестан, Казбековский, Хасавюртовский, Новолакский р-ны 330 46.0 43. Аварцы аварцы Дагестан, Унцукульский, Гунибский р-ны 115 46.9 42. Даргинцы даргинцы Дагестан, Акушинский, Дахадаевский р-ны 101 47.2 42. Кубачинцы кубачинцы Дагестан, Дахадаевский р-н 65 47.6 42. Кайтагцы кайтагцы Дагестан, Кайтагский р-н 33 47.63 42. Лезгины лезгины Дагестан, Ахтынский р-н 81 47.70 41. Армяне армяне Краснодарский край и Адыгея, разные р-ны 115 40.1 44. Армяне-амшены армяне Краснодарский край (мигранты из Турции) 53 - Кумандинцы, северные Алтайский край, Солтонский р-н челканцы, тубалары алтайцы Алтай, Турочакский и Чойский р-ны 202 52.2 87. Алтай-кижи, южные Алтай, Онгудайский, Улаганский, Кош-Агачский, теленгиты алтайцы Чойский, Турочакский р-ны 207 50.03 88. шорцы Кемеровская обл., Таштагольский р-н Шорцы (горные и Хакасия, Таштыпский р-н абаканские) 139 52.75 Хакасия, Аскизский, Бейский, Орджоникидзевский, Качинцы, сагайцы, хакасы Таштыпский, Ширинский р-ны койбалы, кызыльцы 185 53 Казахи Алтая казахи Казахстан, Восточно-Казахстанская обл., Катон Карагайский р-н. 122 49.16 85. Киргизы северные киргизы Киргизия, Нарынский, Таласский р-ны 140 41.42 Киргизы Памира киргизы Таджикистан,, Мургабский р-н 106 38.15 73. Монголы Алтая монголы Монголия, аймаки Байан-Улгий, Ховд, Гоби-Алтай 140 48 Суммарно 20 этносов 6 стран, 39 областей, 81 район 4289 - Примечание: * дано условное название популяции, далее использованное в таблицах и тексте.
Таблица 2. Популяции, изученные по маркерам митохондриальной ДНК N Долгота Широта Популяция* Народ Географическая локализация Пинега русские Архангельская обл., Пинежский р-н 144 46.53 63. Смоленск русские Смоленская обл., Рославльский р-н 147 32.88 53. Кострома (Унжа) русские Костромская обл., Мантуровский р-н 79 44.77 58. Белгород русские Белгородская обл., три р-на 148 36.48 50. Боровский русские Калужская, Боровский р-н 70 36.5 Барятинский русские Калужская обл., Барятинский р-н 75 34.53 Болховский русские Орловская обл., Болховский р-н 76 36 53. Черемисиновский русские Курская обл., Черемисиновский р-н 62 37.25 51. Михайловский русские Рязанская обл., Михайловский р-н 82 39 54. Спасск-Рязанский русские Рязанская обл., Спасск-Рязанский р-н 86 40.53 54. Петровский русские Тамбовская обл., Петровский р-н 76 40.25 52. Кубанские казаки русские Адыгея, Майкопский р-н 132 40.17 44. Терские казаки русские Кабардино-Балкария, два р-на 124 44.0 43. Столин белорусы Брестская обл., Столинский р-н 89 26.77 51. Светлогорск белорусы Гомельская обл., Светлогорский р-н 71 29.72 52. Витебск белорусы Витебская обл. 100 29 Брест белорусы Брестcкая обл. 104 24 Гомель белорусы Гомельская обл. 121 30 Украинцы Белгород украинцы Белгородская обл., два р-на 95 35.75 50. Черкассы украинцы Черкасская обл. 179 32.07 49. Хмельницкая украинцы Хмельницкая обл., Старо-Конст. р-н 179 27.3 49. Украинцы западные украинцы Львовская и Ивано-Франковская обл. 157 24 49. Лезгины лезгины Дагестан, Ахтынский р-н 69 47.70 41. Кайтагцы кайтагцы Дагестан, Кайтагский р-н 32 47.63 42. Кубачинцы кубачинцы Дагестан, Дахадаевский р-н 55 47.6 42. Аварцы аварцы Дагестан, Унцукульский, Гунибский 81 46.9 42. Даргинцы даргинцы Дагестан, Акушинский, Дахадаевский 95 47.2 42. Чеченцы чеченцы Чечня, Дагестан, Ингушетия 239 46.0 43. Осетины осетины Северная Осетия, пять р-нов 267 44.0 42. Суммарно 10 этносов 23 области, 40 районов 3234 - Примечание: * дано условное название популяции, далее использованное в таблицах и тексте.
Таблица 3. Созданные базы данных по Y-хромосоме и мтДНК База данных Число Число Число Размещение Число образцов образцов популяций источников в зарубежных аналогах Y-хромосома 112 400 2 474 238 www.genofond.ru 97 Y-base www.yhrd.org мтДНК Локальная сеть 132 600 2 101 497 17 ЛПГЧ ФГБУ MURKA www.empop.org «МГНЦ» РАМН Для каждой популяции указывается название, объем выборки, административная принадлежность (страна, провинция), этническая и лингвистическая принадлежность, географические координаты, ссылки на источник данных и т.д. База содержит как частоты гаплогрупп, так и сиквенсы (ГВС1, ГВС2 или же полные сиквенсы мтДНК) с указанием начальной и конечной позиции секвенирования. Ряд характеристик БД в сравнении с ведущими зарубежными аналогами приведен в табл. 3.
Массовое изучение изменчивости Y-хромосомы началось позже, чем мтДНК, но благодаря большей межпопуляционной изменчивости Y-хромосома привлекает еще большее внимание исследователей (табл. 3). В базе данных «Y-base: изменчивость Y хромосомы у народов мира» (основные составители: О.П. Балановский, А.С.
Пшеничнов, Р.С. Сычев) большое внимание уделено формализованному описанию популяций для обеспечения эффективного поиска. Главной проблемой при создании БД были различия в наборах SNP-маркеров, используемых разными авторами и большое число SNP-маркеров, определяющих более 400 гаплогрупп. Эта проблема решена путем реализации триады: 1) формализация представления исходных данных (дефенирующий SNP-маркер, а не часто меняющееся название гаплогруппы);
2) создание формализованного дерева гаплогрупп Y-хромосомы;
3) программная реализация алгоритма, определяющего для каждого образца четкий «статус» каждой гаплогруппы – либо принадлежность к гаплогруппе, либо исключение из гаплогруппы, либо невозможность определения гаплогруппы по опубликованным экспериментальным данным. При усреднении этих данных по всем образцам, входящим в популяционную выборку, для каждой популяции автоматически вычислялась, соответственно, либо частота гаплогруппы, либо проставлялась нулевая частота гаплогруппы, либо указывалось, что частота данной гаплогруппы в популяции неизвестна.
Созданные базы данных превосходят зарубежные аналоги как подробностью описания популяций, так и объемом данных (табл. 3). Базы данных не только послужили одним из столпов, на которых выстроено данное исследование, но уже используются для решения широкого круга научных и практических задач. Например, с их помощью верифицирован алгоритм автоматического определения гаплогрупп (Behar et al., 2007), реконструированы асимметричные потоки генов в популяцию цветного населения ЮАР (Quintana-Murci et al., 2008), выявлено древнее родство африканских пигмеев и бантуязычных народов (Quintana-Murci et al., 2010), изучена ассоциация сердечно сосудистой патологии с гаплогруппами мтДНК (Haber et al., 2011).
Таблица 4. Изученные популяции древней ДНК Эпоха Популяция Датировка Локализация N Южный Олений остров мезолит 7.5 тыс. лет назад Карелия Деренбург неолит 7.0 – 7.5 тыс. лет назад Германия эпоха раннего Мурманская Большой Олений остров 3.5 тыс. лет назад металла обл.
2.5 тыс. лет назад Скифы Дона античное время Ростовская обл. (VI-III вв. до н.э.) 0.2 тыс. лет назад Мурманская Чальмны-Варрэ (саамы) Новое время (XVIII век н.э.) обл.
МЕТОДЫ ГЕНОТИПИРОВАНИЯ Выделение ДНК из образцов венозной крови проводилось фенол-хлороформным методом. Концентрация ДНК определялась спектрофотометрически и/или в ходе ПЦР в реальном времени с помощью набора Quantifiler Human DNA Kit (Applied Biosystems).
Генотипирование Y-хромосомы проведено с использованием 40 SNP маркеров. В перечне рядом с каждой гаплогруппой представлен детерминирующий ее SNP маркер:
E(M96), E1b1b1(M35), F(M89), G1(M285), G(M201), G2a(P15), G2a1(P16), G2a1a(P18), G2a3b1(P303), G2a3a(M406), I(M170), I1(M253), I2a(P37.2), J(M304), J1(M267), J1e(P58), J2(M172), J2a4b(M67), J2b(M12), J2a4a(M47), J2a4b1(M92), K(M9), L(M20), L1(M27), L2(M317), L3(M357), N1(LLY22), N1c1(M178), O(M175), O3(M122), P(M45), Q(M70), R(M207), R1(M173), R1a(SRY1532.2), R1a1a(M198), R1a1a7(M458), R1b(M343), R1b1b2(M269), T(M70). Генотипирование русских популяций проведено для части маркеров методом ПЦР-ПДРФ, а для остальных - секвенированием, как описано в (Balanovsky et al., 2008). Генотипирование кавказских и сибирских популяций проведено методом TaqMan на приборе ABI 7900 (Applied Biosystems) как описано в (Balanovsky et al., 2011). Анализ 17 STR локусов Y-хромосомы (DYS389I, DYS389II, DYS390, DYS456, DYS19, DYS385a, DYS385b, DYS458, DYS437, DYS438, DYS448, GATA_H4, DYS391, DYS392, DYS393, DYS439, DYS635) проведен на секвенаторе Applied Biosystems 3130xl набором Y-filer (Applied Biosystems). Анализ русских популяций проведен на базе Эстонского биоцентра, а кавказских и сибирских – на базе ЛПГЧ ФГБУ «МГНЦ» РАМН.
Генотипирование мтДНК включило секвенирование ГВС1 (позиции 16024-16400) и ПДРФ-анализ (или TaqMan анализ) мутаций в кодирующем регионе, определяющих гаплогруппы H, V, HV, U, U4, K, R, T, J, J1, N, N1b, W, X, I, M, A, C, Z, D, D5.
Секвенирование проводилось на капиллярных секвенаторах ABI 377, ABI 3130xl, Megabaсe 2000 с использованием секвенирующих наборов DYEnamic™ ET terminator или BigDye Terminator v3.1. Анализ украинских, белорусских и части русских популяций выполнен на базе Эстонского биоцентра, а южных русских групп и северокавказских популяций – на базе ЛПГЧ ФГБУ «МГНЦ» РАМН.
МЕТОДЫ АНАЛИЗА ДАННЫХ Статистический анализ полиморфизма Y-хромосомы и мтДНК выполнен на двух уровнях организации вариантов ДНК - гаплогрупп и гаплотипов. На уровне частот гаплогрупп с помощью программы DJ genetic (Balanovsky et al., 2008) рассчитаны генетические расстояния (Nei, 1975). Матрицы расстояний были визуализированы методами многомерного шкалирования и кластерного анализа в программе Statistica 6. (StatSoft. Inc, 2001). С помощью той же программы проведен и анализ главных компонент. Генетическая гетерогенность этносов и лингвистических групп (различия по частотам гаплогрупп между локальными популяциями в пределах этносов или между этносами в пределах лингвистических групп) рассчитывалась как средние генетические расстояния между популяциями, методом GST (Nei, 1975) с помощью оригинальной программы и методом AMOVA с помощью программы Arlequin 3.11 (Schneider и др., 2000). Сравнительный анализ эффективности географической и лингвистической классификаций популяций для определения сходства их генофондов также проведен методом AMOVA. В той же программе (Arlequin 3.11) выполнен тест Мантеля для оценки общих и частных коэффициентов корреляций между матрицами генетических, географических и лингвистических расстояний. Необходимые для последних двух видов анализа географические расстояния рассчитаны по географическим координатам популяций (табл. 1, 2) в программе DistGeo (www.genofond.ru). Матрицы лингвистических расстояний между языками (для индоевропейской и северокавказской лингвистических семей), полученные по стословному списку М. Сводеша (Swadesh, 1955) с исключением заимствованных слов по методу С.А. Старостина (Старостин, 1989), были любезно предоставлены член-корр. РАН А.В. Дыбо и проф. О.А. Мудраком.
Анализ на уровне гаплотипов состоял в расчете гаплотипического разнообразия мтДНК (с использованием MS Excel 7.0) и в построении филогенетических сетей по STR-гаплотипам Y-хромосомы. Сети построены в программе Network 4.1.1.2 (Fluxus Technology Ltd., www.fluxus-engineering.com) на основе алгоритма reduced median и отредактированы в Network Publisher (Fluxus Engineering, Clare, U.K.). Возраст кластеров гаплотипов определялся с помощью показателя, как описано в (Forster et al., 1996;
Saillard et al., 2000). Для датировок возраста кластеров использовались две скорости мутирования STR маркеров: «эволюционная» скорость (Zhivotovsky et al., 2004) и «генеалогическая» скорость, полученная при прямых сравнениях пар отец-сын (Gusmao et al., 2005;
Snchez-Diz et al., 2008;
Ge et al., 2009).
Картографический анализ проведен с помощью программы GeneGeo, разрабатываемой в течение ряда лет под руководством автора. Построены геногеографические карты пяти видов: 1) карты распространения отдельных гаплогрупп Y-хромосомы и мтДНК;
2) суммарные карты распространения гаплогрупп;
3) карты гаплотипического разнообразия;
4) карты генетических расстояний;
5) карты генетических границ (карты межпопуляционной изменчивости). Все карты созданы методом средневзвешенной интерполяции со степенью весовой функции, равной 3.
Выявление генетических границ на географической карте проводилось также и другим методом, с помощью программы Barrier 2.2 (Manni and Guerard, 2004).
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 1. ИЗМЕНЧИВОСТЬ Y-ХРОМОСОМЫ В ЕВРОПЕ РАСПРОСТРАНЕНИЕ ГАПЛОГРУПП Y-ХРОМОСОМЫ. Собственные данные по частотам гаплогрупп Y-хромосомы в русских популяциях (Balanovsky et al., 2008) приведены в табл. 5, по кавказским популяциям (Balanovsky et al., 2011) – в табл. 6, по сибирским и центрально-азиатским популяциям (Балаганская и др., 2011) – в табл. 7. На территории Европы суммарно изучено 35 популяций (N=3048 человек). По этим данным охарактеризованы два модельных объекта - генофонд русского народа (крупнейший народ Европы по численности и занимаемому ареалу) и народов Северного Кавказа.
Данные по другим народам Европы взяты из созданной базы данных Y-base. Суммарно проанализированы данные о 585 популяциях Европы (N=38 000 образцов). Отметим, что предыдущее исследование, преследовавшее ту же цель (Rosser et al., 2000), проводилось более 10 лет назад по суммарной выборке, в десять раз меньшей (N=3616).
Созданы подробные карты распространения каждой гаплогруппы Y-хромосомы.
Обнаружены четкие тренды изменчивости: гаплогруппа R1a доминирует у балто славянских популяций Восточной Европы, N1c на северо-востоке Европы, N1b на северном Урале, I1 на севере Европы, I2a на Балканах, R1b почти во всей Западной Европе. В статье большого коллектива с участием автора (Myres et al., 2010) гаплогруппа R1b-М269 была дополнительно подразделена на ряд субгаплогрупп, многие из которых специфичны для той или иной территории. Ряд гаплогрупп (G2, J2, J1, E-M35) преобладает на Ближнем Востоке и Анатолии, но они также нередки и в соседних регионах Южной Европы. Таким образом, основной чертой структурированности европейского генофонда по Y-хромосоме оказывается четкое выделение географических зон, в каждой из которых преобладает своя гаплогруппа. Столь четкую структуру генофонда Европы - «принцип паззлов» - иллюстрирует рис. 1.
Рис.1. Структура генофонда Европы по Y-хромосоме: «принцип паззлов».
Выделены территории, где частота гаплогруппы составляет более трети генофонда (35%). Этот ареал показан своим цветом для каждой гаплогруппы. В каждой географической части Европы доминирует одна гаплогруппа, редко встречающаяся в остальных частях.
ИЗМЕНЧИВОСТЬ НА РАЗНЫХ УРОВНЯХ ПОПУЛЯЦИОННОЙ ИЕРАРХИИ.
Обнаружение четких географических закономерностей, с одной стороны, развивает тенденции, показанные ранее (Rosser et al., 2000). С другой стороны, основной вывод этих авторов состоял в том, что географическое соседство, а не лингвистическое родство задает структуру генофонда. Результаты же нашего исследования, подтверждая важность географического фактора, указывают, что доминирует структурированность по лингвистическому принципу. Это следует из результатов многомерного шкалирования (рис. 2). В этот вид анализа включены те народы, для которых имелись данные по четырем или более региональным популяциям с объемом выборки не менее 70 человек.
В данном случае этнический фактор совпадает с лингвистическим, поскольку этническая принадлежность популяции определялась по языку. График показывает, что во всех случаях популяции, относящиеся к одному народу, кластеризуются совместно, образуя «этнические облака», почти не перекрывающиеся друг с другом (рис. 2).
Два исключения касаются славянских групп. Во-первых, северные русские популяции не присоединяются к южным, а образуют отдельный кластер. Во-вторых, популяции поляков, южных русских и украинцев формируют не три отдельных, а одно единое «этническое облако», демонстрируя общность генофонда. Таким образом, славяноязычные популяции, занимающие половину территории Европы, оказываются генетически не различными (как должно бы быть в случае доминирования в структуре генофонда географического фактора), а сходными, в согласии с лингвистическими данными о близком родстве восточнославянских и западнославянских языков.
Таблица 5. Частоты (в процентах) гаплогрупп Y-хромосомы в русских популяциях E-М78 E-М123 F*1 G1*2 G2а I* K*3 N* Т Популяция C I2а2а J1 Q R1b1a1 R1b1a2 R N I1 I2a1 J2 N1b N1c R1a M130 M78 M123 M89 M285 P15 M170 M253 P37 M223 M267 M172 M9 M70 M231 P43 M242 SRY1532 M73 M269 M TAT Мезень 54 0 0 1.9 0 0 0 0 0 0 0 0 0 0 0 0 0 0 7.4 46.3 44.4 Пинега 114 0 0 0 0 0 0 0.9 4.4 0 0.9 0 0 0 0.9 0 0 0 15.8 23.7 39.5 Красноборск 91 0 0 1.1 0 2.2 3.3 12.1 9.9 0 0 0 0 0 0 0 0 5.5 3.3 36.3 19.8 6. Вологда 121 0 0 0 1.7 0.8 0 11.6 8.3 1.7 0 0 0 0 1.7 0 0.8 0.8 3.3 35.5 33.1 0. северные 380 0 0 0.8 0.4 0.8 0.8 6.2 0.4 0.2 0 0 0 0.7 0 0.2 5.7 1.6 7.5 35.5 34.2 5. русские Унжа 52 0 0 1.9 0 0 0 3.8 3.8 3.8 0 0 0 0 1.9 5.8 11.5 11.5 0 13.5 32.7 9. Кашин 73 0 0 1.4 0 0 0 4.1 0 4.1 0 0 0 1.4 0 4.1 2.7 8.2 0 11 56.2 6. Порхов 57 0 1.8 0 0 0 1.8 0 0 0 3.5 0 1.8 1.8 0 0 1.8 3.5 10.5 15.8 52.6 5. Остров 75 0 0 0 0 0 1.3 0 1.3 1.3 0 0 0 0 0 4 6.7 9.3 0 28 45.3 2. Рославль 107 0.9 0 0.9 0 0 0 0 0 2.8 1.9 2.8 0 0.9 0 0 7.5 1.9 10.3 13.1 45.8 11. центральные 364 0.2 0.4 0.8 0 0 0.6 5.3 1.6 1 2.4 1.1 0.6 0.4 0.5 0.3 0.4 4.6 10 16.3 46.5 7. русские Ливны 110 0 0 0 0 0 0 0.9 0 0.9 0 2.7 0 0.9 0 0.9 8.2 13.6 0.9 4.5 62.7 3. Пристень 45 0 0 0 0 0 0 0 0 2.2 0 2.2 0 0 0 2.2 4.4 17.8 0 13.3 55.6 2. Репьевка 96 0 0 1 0 2.1 1 0 2.1 0 0 0 0 0 1 3.1 16.7 1 0 6.3 59.4 5. Белгород 143 0.7 0 0 0 0.7 0 0.7 0 4.2 0.7 1.4 0 0 0 0.7 3.5 12.6 0.7 11.9 59.4 2. Кубанские 90 0 0 0 0 1.1 1.1 4.4 16.5 2.2 0 0 1.1 0 1.1 0 3.3 4.4 1.1 6.6 47.3 8. казаки Терские 125 0 0 0 0 19.2 0 0 3.2 5.6 4.0 0.8 0 0.8 0 2.4 5.4 7.6 0 6.4 38.4 5. казаки южные 609 0.1 1.75 0 0.166 0 3.9 1.3 4.8 14.2 0.6 0.9 3.0 0.8 1.4 0 0.5 0 0. 0.5 8.2 53.8 3. русские Примечания:
К гаплогруппе F* относятся образцы с мутацией, выявляемой маркером М89, и с предковыми вариантами M9, M201, M170, 12f2.
К гаплогруппе G1* относятся образцы с мутацией, выявляемой маркером M285, и с предковым вариантом P20.
К гаплогруппе K* относятся образцы с мутацией, выявляемой маркером M9, и с предковыми вариантами M70, 92R7, M231.
К гаплогруппе N* относятся образцы с мутацией, выявляемой маркером M231, и с предковыми вариантами TAT, P43, M128.
Таблица 6. Частоты (в процентах) гаплогрупп Y-хромосомы в популяциях Кавказа ШАПСУГИ 100 1 0 0 0 1 0 86 0 0 0 0 6 0 0 0 0 2 0 0 0 0 0 0 0 0 1 3 0 АБХАЗЫ 58 2 0 12 0 24 0 21 0 0 0 0 5 0 0 7 2 0 0 3 0 0 0 0 2 0 0 10 0 ЧЕРКЕСЫ 142 1 0 9.2 0 1 0 30 1 0 1 5 12 1 1.4 6 2 0 1 0 0 1 2 0 1 1 6.3 13 2 ОСЕТИНЫ 359 0 0 64 3 0 0 3 0 0 0 2 7 0 0 10 0 0 0 1 0 0 0 0 0 2 0 1 1 ИНГУШИ 143 0 0 1 0 0 0 0 1 0 0 3 1 0 0 87 0 0 0 0 3 0 0 0 0 0 0 4 0 ЧЕЧЕНЦЫ 330 0 0 3 0 0 0 2 0 0 0 21 1 0 0 55 0 0 0 0 7 0 0 0 0 3 0 4 0 АВАРЦЫ 115 0 0 1 0 0 1 9 1 1 1 58 5 0 0 1 0 0 0 3 0 2 0 0 0 1 0 2 0 ДАРГИНЦЫ 101 0 0 0 0 1 0 1 0 0 1 69 0 0 0 1 0 0 0 0 0 0 0 3 0 0 0 22 0 КУБАЧИНЦЫ 65 0 0 0 0 0 0 0 0 2 0 99 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 КАЙТАГЦЫ 33 0 0 0 0 0 0 0 0 0 0 85 3 0 0 0 0 0 0 0 0 0 0 0 0 3 0 3 0 ЛЕЗГИНЫ 81 1 0 1 0 12 0 0 0 0 0 44 3 0 0 0 0 0 0 1 0 0 1 0 3 0 0 4 0 G2a3b E1b1b R1b1b R1a1a* R1a1a J2a4b G2a3a G2a1a J2a4b* G2a J2a4a G2a* N1с J2b N1* R1b I2a J1e G J1* J2* L O L L* I* L T Q Таблица 7. Частоты (в процентах) гаплогрупп Y-хромосомы в популяциях Сибири и Центральной Азии С D E G H I J L N1b N1c O Q R1a R1b1b1 R1b1b2 T Другие N M130 M174 M96 M201 M69 M170 M304 M20 P43 M178 M175 M242 M198 M73 M269 M АЛТАЙЦЫ СЕВЕРНЫЕ 202 0 0 0 0 0 2 1 0 9 2 0 26 30 18 0 0 АЛТАЙЦЫ ЮЖНЫЕ 207 12 10 0 0 0 1 3 1 5 5 6 5 51 0 1 1 ШОРЦЫ 139 0 0 1 0 1 0 0 0 3 31 1 0 57 7 0 0 ХАКАСЫ 185 0 0 0 0 0 0 0 0 40 18 0 16 26 2 0 0 КАЗАХИ 122 34 1 0 24 0 0 3 0 1 4 22 2 7 1 0 0 КИРГИЗЫ 246 33 0 1 1 0 0 1 1 12 1 4 1 42 3 0 0 Рис.2. Генетические взаимоотношения европейских популяций по Y-хромосоме.
Популяции, относящиеся к одному народу, показаны однотипными значками одного цвета.
Поскольку этнический фактор оказался столь существенным для структурирования европейского генофонда, был проведен анализ межпопуляционной изменчивости на двух уровнях популяционной иерархии: а) внутриэтническом (различия популяций в пределах одного народа, т.е. оценка гетерогенности этнического генофонда);
б) межэтническом (различия между усредненными этническими частотами гаплогрупп разных народов Европы). Таблица 8 показывает, что в пределах Европы наибольшая гетерогенность характерна для финнов, хорватов, русских и итальянцев;
шведы и немцы демонстрируют умеренную гетерогенность;
другие народы (греки, турки, поляки, белорусы, украинцы) характеризуются сниженной в масштабе Европы гетерогенностью. В среднем, гетерогенность типичного европейского народа составляет 0.03 (GST=0.029, FST=0.027).
Таким образом, по гаплогруппам Y-хромосомы для населения Европы различия между популяциями одного этноса значительно меньше, чем различия этносов между собой (межэтнический уровень GST=0.15, FST=0.17). Общая величина межпопуляционных различий по Y-хромосоме (суммарно внутриэтнический и межэтнический уровни) составляет для Европы около 0.19. Это является дополнительным подтверждением резко выраженных различий внутри Европы по Y-хромосоме (что видно и на рис. 1, 2), поскольку по другим генетическим системам межпопуляционная изменчивость Европы на порядок ниже:
GST=0.02 (Балановская, Балановский, 2007).
Аналогичный анализ этнической гетерогенности проведен для народов Южной Сибири и Центральной Азии (табл. 8). Суммарные межпопуляционные различия в этом регионе (0.20) оказались практически такими же, как и для популяций Европы (0.19). Но, в отличие от Европы, основная часть изменчивости приходится на изменчивость внутри этнотерриториальных объединений (0.15), а на различия между ними остается только 0.06.
Такой результат объясняется тем, что этнотерриториальные объединения, выделяемые традиционно (хакасы, алтайцы), включают ряд малых народностей, генофонды которых значительно различаются между собой (Балаганская и др., 2011).
Таблица 8. Закономерности изменчивости Y-хромосомы на внутриэтническом и межэтническом уровнях популяционной иерархии Средние GST AMOVA генетические NPOP N NHG (GST*102) (FST*102) расстояния ЕВРОПА Финны 5 107 6 0.13 8.2 8. Хорваты 5 100 8 0.18 8 7. Русские 10 123 8 0.14 5.2 4. Итальянцы 5 105 8 0.13 3.9 5. Шведы 4 76 12 0.13 2.7 1. Немцы 11 110 9 0.07 2.1 1. Греки 4 91 8 0.10 1.4 1. Турки 5 87 26(8) 0.17 (0.04) 1.3(0.8) 1. Поляки 8 114 7 0.02 1.1 0. Украинцы 4 102 10 0.02 0.9 0. Межэтнический уровень 10 6 14.9 16. Внутриэтнический уровень 6 6 2.9 2. Внутрипопуляционный уровень 61 6 82.2 80. СИБИРЬ И ЦЕНТРАЛЬНАЯ АЗИЯ Северные алтайцы 3 67 30 0.80 15.1 20. Южные алтайцы 2 104 30 0.07 3.9 3. Шорцы 2 70 30 0.09 4.9 4. Хакасы 4 62 30 0.85 18.2 30. Киргизы 2 123 30 0.15 2.9 5. Межэтнический уровень 5 30 5, Внутриэтнический уровень 3 30 14, Внутрипопуляционный уровень 13 30 79, Примечания: NPOP – число региональных популяций, изученных для данного народа;
N – средний размер выборки региональных популяций;
NHG – число основных гаплогрупп, включенных в анализ. Приведены значения гетерогенности, рассчитанные тремя разными методами. Различия в гетерогенности турок объясняются высоким филогенетическим разрешением, с которым изучены эти популяции (26 гаплогрупп).
Если эти гаплогруппы объединить в 8 (до уровня, на котором изучены другие народы), то средние расстояния падают с 0,17 to 0,04, однако показатель GST более стабилен, снижаясь с 1,3 до 0.8.
2. ИЗМЕНЧИВОСТЬ МИТОХОНДРИАЛЬНОЙ ДНК В ЕВРОПЕ Изменчивость мтДНК изучена в 22 популяциях русских, украинцев и белорусов, охватывающих все части обширного ареала восточных славян (собственные данные, табл.
2). Частоты гаплогрупп приведены в таблице 9. Данные представлены также на нашем сайте www.genofond.ru и в работе (Балановский и др., 2009, 2011).
Использование нашей базы данных MURKA расширяет число доступных для анализа популяций (табл. 3). Такое обилие данных позволило провести строгий отбор популяций по следующим критериям: а) объем выборки не менее 70 (меньшие выборки были исключены или объединены);
б) надежное определение гаплогрупп (подтвержденных ПДРФ-анализом или однозначно прогнозируемых по ГВС1);
в) наличие четкой географической привязки в описании выборки. Был также проведен и строгий отбор гаплогрупп: в анализ включены только гаплогруппы, средняя частота которых в Европе не менее 1% (критерий полиморфизма).
Таблица 9. Частоты гаплогрупп мтДНК у восточнославянских популяций гаплогруппа северные русские южные русские казаки белорусы украинцы A 0.002 0.000 0.000 0.000 0. B 0.000 0.000 0.000 0.000 0. C 0.006 0.008 0.015 0.006 0. D 0.017 0.009 0.008 0.003 0. F 0.000 0.003 0.000 0.003 0. G 0.000 0.003 0.000 0.009 0. Z 0.006 0.009 0.000 0.000 0. L 0.000 0.000 0.000 0.000 0. M1 0.003 0.005 0.000 0.000 0. preHV 0.000 0.000 0.000 0.006 0. H 0.470 0.389 0.394 0.389 0. HV 0.008 0.005 0.015 0.015 0. I 0.000 0.017 0.038 0.020 0. J 0.063 0.078 0.106 0.087 0. T* 0.006 0.008 0.000 0.005 0. T1 0.030 0.023 0.053 0.027 0. T2 0.066 0.086 0.061 0.049 0. N1a 0.000 0.003 0.000 0.000 0. N1b 0.000 0.007 0.000 0.014 0. R* 0.021 0.010 0.008 0.010 0. U1a 0.000 0.008 0.000 0.000 0. U1b 0.000 0.000 0.023 0.000 0. U2 0.016 0.024 0.015 0.024 0. U3 0.000 0.021 0.023 0.020 0. U4 0.045 0.042 0.023 0.030 0. U5a 0.038 0.070 0.053 0.067 0. U5b 0.035 0.017 0.030 0.024 0. U6 0.000 0.000 0.000 0.000 0. U7 0.008 0.002 0.008 0.011 0. U8 0.011 0.005 0.000 0.008 0. K 0.077 0.036 0.068 0.021 0. V 0.019 0.060 0.015 0.062 0. W 0.023 0.023 0.008 0.038 0. X 0.003 0.009 0.023 0.003 0. прочие 0.028 0.020 0.015 0.052 0. Перечисленным критериям удовлетворяли 118 популяций (средний объем выборки N=200, суммарно 23500 образцов) и 35 гаплогрупп (табл. 8).
КЛАСТЕРИЗАЦИЯ ПОПУЛЯЦИЙ ПО ЧАСТОТАМ ГАПЛОГРУПП. При анализе методом многомерного шкалирования (рис. 3А) четко выделились четыре кластера. Первый кластер включил только саамов, что не удивительно, учитывая их генетическое своеобразие (Cavalli-Sforza et al., 1994;
Tambets et al., 2004). Второй кластер включил те популяции восточных рубежей Европы, у которых повышена частота восточно-евразийских гаплогрупп.
Третий кластер включил популяции Передней Азии и Кавказа. Все остальные популяции с основной территории Европы (от Волги до Пиренейского полуострова) вошли в четвертый «паневропейский» кластер, небольшие размеры которого на графике свидетельствуют о низкой межпопуляционной изменчивости. Эти результаты подтверждают гомогенность генофонда Европы (Simoni et al., 2000), но указывают на своеобразие генофондов Приуралья и Передней Азии.
При отдельном анализе только тех популяций, которые вошли в «паневропейский» кластер (рис. 3Б), обнаружилась обособленность популяций северо-востока Европы (главным образом, финно-угорских). Однако подавляющее большинство популяций по прежнему группировалось в единый гомогенный кластер, который можно назвать «узко европейским» (рис. 3Б).
Наличие обширной базы данных позволило провести отдельный анализ и этого кластера.
В результате (рис. 3В) такого «рассмотрения под большим увеличением» в пределах «узко европейского» кластера выявился целый ряд кластеров второго порядка. Популяции, говорящие на языках одной лингвистической группы, расположились в генетическом пространстве рядом друг с другом. Так, популяции германской, славянской, романской и балтской языковых групп формируют каждая отдельную группу и в генетическом пространстве. Учитывая, что население Шотландии лишь исторически недавно сменило язык, их генетическое сходство с ирландцами обрисовывает общность митохондриального генофонда и кельтской группы (рис. 3В).
В обнаруженной закономерности генофонда Европы (популяции одной языковой группы характеризуются сходными митохондриальными генофондами) отмечаются два исключения: румыны и аромуны (лингвистически принадлежат к романской группе, но генетически обособлены), а также эстонцы и венгры (лингвистически финно-угорская группа, но генетически примыкают к «славянскому» кластеру).
РОЛЬ ЛИНГВИСТИЧЕСКОГО И ГЕОГРАФИЧЕСКОГО ФАКТОРОВ. Значимость географического и лингвистического факторов оценивалась во многих работах (Rosser et al., 2000;
Nasidze et al., 2004;
Кутуев, 2010;
Спицын и др., 2009). Впервые обнаруженная значимость лингвистической принадлежности популяций для структурирования митохондриального генофонда Европы подтверждена и другим методом: проведен анализ связи генетических, географических и лингвистических расстояний между популяциями Европы (тест Мантеля, табл. 10). Выявлен примерно одинаковый уровень корреляции генетических расстояний и с географическими, и с лингвистическими расстояниями.
Таблица 10. Связь лингвистики, географии и генетики в генофонде индоевропейских и северокавказских народов Европы Корреляция между мтДНК, Y-хромосома, параметрами индоевропейские народы северокавказкие народы Генетика и лингвистика* 0.31 0.64*** Генетика и география* 0.37 0.60*** Генетика и лингвистика 0.19 0. (без влияния географии)** Генетика и география 0.29 0. (без влияния лингвистики)** Обозначения: *коэффициент парной корреляции;
**частной корреляции;
***достоверность p0.01.
ИЗМЕНЧИВОСТЬ В ПРЕДЕЛАХ ЛИНГВИСТИЧЕСКИХ ГРУПП. Для уточнения выявленной связи генетических кластеров популяций с лингвистическими группами была рассчитана межпопуляционная изменчивость (гетерогенность) в пределах каждой из лингвистических групп Европы (табл. 11, рис. 4). Оказалось, что митохондриальные генофонды всех лингвистических групп индоевропейской семьи характеризуются умеренной гетерогенностью (от 0.01 до 0.04), тогда как гетерогенность финно-угорской группы уральской языковой семьи значительно выше (0.42 до коррекции, 0.07 после исключения саамов и удмуртов). Это согласуется с обособленностью генофонда финно-угорских популяций и их дисперсным расположением на графике многомерного шкалирования (рис.
3Б). Значительная гетерогенность тюркских народов Европы (0.24) может быть вызвана предполагаемой для многих из них (турки, чуваши и др.) сменой автохтонного языка на тюркский без значительных изменений генофонда.
Рис.4. Сравнение лингвистических групп Европы по гетерогенности их генофонда.
Таблица 11. Гетерогенность генофондов лингвистических групп Европы по мтДНК Лингвистическая Число Средние Расстояния Исключенные обособленные группа популяций генетические после популяции расстояния коррекции* Германская 14 0.013 0. Кельтская 7 0.039 0. Хорваты о-ва Крк, белорусы Бобруйска Славянская 27 0.042 0. Кантабрия Романская 27 0.048 0. Тюркская 5 0.240 0. Саамы, удмурты Финно-угорская 9 0.420 0. *В некоторых случаях одна-две обособленные популяции (например, островные популяции хорватов) за счет больших генетических расстояний до остальных популяций завышали уровень гетерогенности всей группы. Поэтому при коррекции исключались из расчета те популяции, среднее расстояние до которых более чем в 2 раза превосходило средний уровень для данной языковой группы.
ГАПЛОТИПИЧЕСКОЕ РАЗНООБРАЗИЕ мтДНК. Все выше описанные виды анализа проведены по частотам гаплогрупп. Для увеличения разрешающей способности проведен также анализ и по отдельным гаплотипам. Уровень гаплотипического разнообразия рассчитан для 51 восточноевропейских популяций как по собственным данным (табл. 2), так и по созданной базе данных (табл. 3). Столь представительный анализ гаплотипического разнообразия мтДНК выполнен впервые в мире.
Картографирование этого показателя демонстрирует закономерное убывание к северу:
от 0.99 у популяций Причерноморья до 0.95 и ниже на берегах Северного Ледовитого океана (рис. 5). Снижение внутрипопуляционного разнообразия является индикатором действия дрейфа генов, особенно сильного в небольших по размеру и изолированных популяциях севера Европы. Эту зону (рис. 5) населяют в основном финно-угорские народы, межпопуляционное разнообразие которых велико (табл. 11, рис. 4). Итак, низкое внутрипопуляционное и высокое межпопуляционное разнообразие оказываются двумя сторонами одной медали, обусловленными действием дрейфа генов (эффект Валунда) в подразделенном финно-угорском генофонде.
Северные области способны поддерживать меньшую численность населения, к тому же северные популяции более изолированы за счет меньшей проходимости территории. Такая эколого-географическая трактовка подтверждается корреляцией карты разнообразия (рис. 5) с картой плотности населения, которая также снижается к северу.
Рис.5. Карта гаплотипического разнообразия мтДНК в Восточной Европе.
Можно предположить причинно-следственную цепь взаимосвязанных изменений от юга к северу сразу нескольких параметров: географической широты (возрастает), продуктивности среды (убывает), плотности населения (убывает), эффективного размера популяции (убывает), изоляции субпопуляций (возрастает), дрейфа генов (возрастает), гаплотипического разнообразия мтДНК (убывает).
Согласно теории популяционной генетики интенсивный дрейф генов должен приводить к возрастанию случайного инбридинга, а, следовательно, и генетического груза популяции.
И действительно, выявлена достоверная корреляция (r=0.4) между гаплотипическим разнообразием мтДНК и отягощенностью популяций аутосомно-рецессивной наследственной патологией (Балановский и др., 2011). Это подтверждает роль дрейфа генов как ключевого фактора в формировании северных генофондов.
3. ОСОБЕННОСТИ ГЕНОФОНДА ВОСТОЧНЫХ СЛАВЯН Структура генофонда изучена как на уровне Европы и Евразии в целом, так и на более низких иерархических уровнях. В качестве такого модельного объекта выбраны восточные славяне (наиболее многочисленная группа населения России и сопредельных стран Европы), а среди восточных славян особое внимание уделено русскому этносу.
МИТОХОНДРИАЛЬНЫЙ ГЕНОФОНД ВОСТОЧНЫХ СЛАВЯН. Исследованию изменчивости мтДНК у восточных славян в их историческом ареале посвящен ряд работ (Orekhov et al., 1999;
Malyarchuk et al., 2001., 2002., 2004;
Belyaeva et al., 2003;
Kornienko et al., 2004;
Grechanina et al., 2006;
Grzybowski et al., 2007;
Балановский и др, 2010;
Morozova et al., 2011), различавшихся подходами к формированию выборок. Поскольку для близкородственных генофондов этот вопрос особенно важен, то в анализ включены главным образом собственные данные. Результаты анализа частот гаплогрупп у восточнославянских популяций (N=2 396 образцов) и окружающих их неславянских народов представлены на рис. 6. Во избежание перегрузки графика, на нем оставлены лишь популяции (от Балканского полуострова до Урала), имеющие непосредственное отношение к этногенезу восточной ветви славян. Выявленная структура генофонда сводится к трем кластерам. В «приуральский» кластер вошли восточные финно-угорские (марийцы, коми) и тюркские народы (татары, чуваши). В «восточно-европейский» кластер вошли западные и восточные славяне, балты, а также балканские народы. В «северо-европейский» кластер вошли западные финно-угорские народы и северные русские популяции.
Таким образом, выявляется генетически гомогенная балто-славянская общность, к которой тяготеют также и балканские популяции («восточно-европейский» кластер). От этой общности отличаются финно-угорские и тюркские народы Восточной Европы, генофонд которых, в свою очередь, подразделяется на западную и восточную части (кластеры 1 и 3).
Такая картина могла сформироваться в ходе славянской колонизации Восточно-Европейской равнины (Происхождение и этническая история русского народа, 1965;
Алексеева, 1973;
Дерябин, 1999): двигающееся с запада славянское население несло с собой «восточно европейский» митохондриальный генофонд, который замещал ранее существовавший на этих территориях автохтонный «приуральский» генофонд, разделяя оставшиеся не ассимилированными группы на западную и восточную части.
Рис.6. Структура митохондриального генофонда восточных славян и их соседей.
ГЕНОФОНД ВОСТОЧНЫХ СЛАВЯН ПО Y-ХРОМОСОМЕ. Анализ Y-хромосомы обрисовал в целом аналогичную картину: восточнославянские популяции оказываются сходными между собой и с западнославянскими популяциями, при этом прослеживается своеобразие северных русских популяций (Balanovsky et al., 2008).
Различия в результатах, полученных по мтДНК и Y-хромосоме, невелики и связаны главным образом с тем, что мтДНК в целом более гомогенна в Европе и поэтому в меньшей степени, чем Y-хромосома, выявляет различия между генофондами. Например, по мтДНК южные славяне присоединяются к остальной славянской общности, хотя в генетическом пространстве располагаются на ее окраине (рис. 6). Но результаты по Y-хромосоме (разрешающая способность которой выше) уточняют картину: четко видно, что южные славяне отделены от восточных и западных славян (Balanovsky et al., 2008).
Ряд закономерностей выявлен для генофондов украинцев и белорусов. Литературные данные об этих популяциях (Rosser et al., 2000;
Semino et al., 2000;
Behar et al., 2003;
Харьков и др., 2004, 2005;
Battaglia et al., 2008) получены по трудно сопоставимым панелям SNP маркеров, поэтому мы опирались главным образом на собственные данные. Для украинцев показано сходство с более северными группами (Польши, Белоруссии и юга России) и некоторое своеобразие западных украинцев. Обнаружена гомогенность генофонда белорусов, сквозь которую все же пробиваются слабые различия между северными и южными группами (Балановский, Тегако, 2008).
СТРУКТУРА РУССКОГО ГЕНОФОНДА. Более высокая разрешающая способность Y хромосомы по сравнению с мтДНК обнаруживается и при анализе русского генофонда. По мтДНК его структура выявляется лишь на уровне тенденций: в изменении частот некоторых гаплогрупп с юга на север, в отличии окраинных популяций казаков и поморов (Балановский и др., 2009). Близкие результаты получены и другими авторами (Malyarchuk et al., 2002, 2004;
Morozova et al., 2011). При анализе же Y-хромосомы изменчивость большинства гаплогрупп близка к клинальной, что подтверждено анализом автокорреляций (Balanovsky et al., 2008).
Информативность Y-хромосомы проявляется и при многомерном анализе: центральные и южные популяции оказываются генетически сходными, а северные популяции своеобразными (рис. 7).
Кардинальные различия северных и южных русских проявляются и при анализе карт главных компонент изменчивости различных признаков: гаплогрупп Y-хромосомы и классических маркеров (Balanovsky et al., 2008), фамилий (Балановский и др., 2001), антропологических признаков (Балановская, Балановский, 2007). Взаимное подтверждение результатов по четырем системам признаков (принцип «полисистемного подхода») не оставляет сомнений в реальности обнаруженной закономерности широтной изменчивости русского генофонда.
Первая причина высокой межпопуляционной изменчивости на Русском Севере сниженная плотность населения и меньший эффективный размер популяций (Ревазов и др., 1979;
Медико-генетическое описание населения Адыгеи, 1997). Поэтому дрейф генов в северных русских популяциях действует сильнее. Тем самым снова обнаруживается параллелизм с изменчивостью мтДНК (с описанным выше широтным трендом гаплотипического разнообразия и связанных с ним параметров). Но отличия северных русских популяций вызваны не только действием дрейфа генов: в этом случае северные русские группы разместились бы случайным образом вокруг южных, без систематического сдвига в одну сторону. Поэтому второй причиной могут быть особенности происхождения северных русских. Это побудило нас провести специальное исследование генофонда Русского Севера (Балановская и др., 2011).
Рис. 7. Структура русского генофонда по Y-хромосоме (многомерное шкалирование) Выделение кластеров подтверждено анализом AMOVA: при выделении групп, показанных овалами, изменчивость между группами (5.8%) оказывается в 6 раз выше, чем внутри групп (1.5%).
Рис.8. Карта генетических расстояний от северных русских популяций (мтДНК) Обозначения: зеленые тона – популяции, генетически близкие к генофонду северных русских;
красные тона – популяции, генетически далекие от генофонда северных русских.
ПРОИСХОЖДЕНИЕ СЕВЕРНЫХ РУССКИХ ПОПУЛЯЦИЙ. Анализ популяций Русского Севера проведен по совокупности данных о полиморфизме Y-хромосомы, мтДНК, аутосомных маркеров и фамилий.
По данным о Y-хромосоме северные русские вошли в обширный «северный» кластер вместе с популяциями балтов (латышей и литовцев), финноязычных народов (коми, финнов, эстонцев, карелов), а также германоязычных шведов. Сходство Русского Севера с географически отдаленными балтами более выражено, чем с финно-уграми. Этот пестрый в лингвистическом отношении (славяне, балты, финно-угры, германцы), но географически единый (от Балтики до Печоры) континуум популяций мог сформироваться еще до выделения балто-славянских и финских лингвистических групп.
По митохондриальной ДНК Русский Север обнаруживает близость с еще более отдаленными популяциями Европы (рис. 8). Русский Север оказался генетически близким к норвежцам, немцам, полякам, литовцам и т.д., и при этом генетически отличным от финноязычных популяций. Анализ аутосомного маркера CCR5del32, изменчивость которого активно изучалась многими российскими коллективами (Libert et al., 1998;
Сломинский и др., 1997;
Limborska et a., 2002;
Кожекбаева и др., 2004) дал сходные результаты (Балановская и др. 2011).
В целом, обнаруженное сходство северных русских с популяциями Северной и Центральной Европы позволяет выдвинуть гипотезу о сохранении на этих территориях древнего генофонда Европы, восходящего, возможно, еще к эпохе мезолита. Этот палеоевропейский генофонд унаследован как северными древнерусскими популяциями, так и частью финноязычных племен, расселившихся здесь до славянской колонизации, а также балтоязычными и германоязычными популяциями. Тем самым роль финно-угорского субстрата при подробном изучении оказывается не столь однозначной, а сама проблема уходит в большую древность, чем эпоха славянской экспансии.
4. КОЭВОЛЮЦИЯ ГЕНОФОНДОВ и ЯЗЫКОВ Анализ взаимосвязи генетической, географической и лингвистической изменчивости популяций проведен на примере Кавказа. Попытки решить эту проблему традиционны для популяционной генетики человека (Cavalli-Sforza et al., 1994;
Rosser et al., 2000;
Рычков, Ящук, 1980, 1983, 1985). Но в большинстве регионов мира сложные паттерны миграций, ассимиляций, смены языка усложняют реконструкцию популяционных процессов. Такую реконструкцию легче осуществить на Кавказе, где горный рельеф препятствовал интенсивному смешению популяций и внешним миграциям. Это создавало условия как для постепенного формирования лингвистического разнообразия путем дифференциации из единого праязыка северокавказской семьи, так и для формирования четкой популяционной структуры генофонда. Эта четкость наглядно проявилась при рассмотрении спектров гаплогрупп в кавказских популяциях (рис. 9).
Налицо тройное соответствие: четыре группы популяций, разделяемые основными генетическими границами, принадлежат четырем различным лингвистическим группам и характеризуются преобладанием одной из четырех различных гаплогрупп (рис. 9). Впервые показанное существование этих четырех лингвистико-географических регионов Кавказа (Дибирова и др., 2010;
Balanovsky et al., 2011) ставит нас перед вопросом: какой из факторов – географический или лингвистический – являлся определяющим при формировании такой генетической структуры? Для объективного количественного ответа был проведен анализ тремя методами.
Во-первых (табл. 10), рассчитаны корреляции между матрицами генетических, географических и лингвистических расстояний (аналогично описанному выше анализу генофонда Европы по мтДНК). Связь генетических расстояний с лингвистическими (r=0.64) оказалась несколько выше, чем с географическими (r=0.60), эта тенденция сохраняется и после вычета тесной (r=0.78) связи между лингвистикой и географией.
Во-вторых, эффективность лингвистической классификации в объяснении структуры кавказского генофонда подтверждена методом AMOVA. При географической группировке популяций различия между группами охватили только 15% межпопуляционной изменчивости, тогда как при лингвистической группировке - почти в два раза больше (27%).
Этот метод позволил включить в анализ не только народы северокавказской семьи, но и осетин, говорящих на языке индоевропейской семьи.
В-третьих, кластерный анализ показал, что генетическая дендрограмма северокавказских популяций является почти точным отражением лингвистической классификации северокавказских языков (рис. 10).
Такое четкое соответствие генетической и лингвистической реконструкций не было выявлено ранее ни в одном из регионов мира. В ранних работах и на Кавказе не удавалось выявить достоверные корреляции - по всей видимости, из-за недостаточного уровня филогенетического разрешения (Nasidze et al., 2004). В более поздних работах также делался вывод о примате географии над лингвистикой на Кавказе (Кутуев, 2010;
Yunusbaev et al., 2011). Недооценка лингвистического фактора в этом случае могла быть вызвана применением «пошаговых» лингвистических расстояний, а не точных количественных показателей сходства языков, как в нашем исследовании.
Рис.9. Структура генофонда Кавказа: лингвистико-географические регионы Каждая изученная популяция показана круговой диаграммой, размер секторов разного цвета отражает частоту соответствующей гаплогруппы Y-хромосомы согласно легенде. Белые пунктирные линии обозначают объективные генетические границы, полученные с помощью программы Barrier 2.2 (толщина линии - значимость границы). Цветным фоном показаны ареалы лингвистических групп.
Ри с. 10. Сравнение генетической кластеризации и лингвистической классификации.
Убедившись, что все три метода указывают на ведущую роль лингвистического фактора в структурировании кавказского генофонда на уровне гаплогрупп Y-хромосомы, рассмотрим изменчивость на уровне STR-гаплотипов. Например, на филогенетической сети гаплогруппы G2a1a-P18 (рис. 11а) четко выделяется кластер, характерный для осетин иронцев, и кластер, характерный для осетин-дигорцев. Генетические датировки обоих кластеров близки (1400 лет при использовании «генеалогической» скорости мутирования).
Эти генетические данные свидетельствуют, что разделение осетинской прапопуляции на субэтносы иронцев и дигорцев произошло не позднее чем 1400 лет назад: если бы разделение произошло позже этой даты возникновения кластеров, то в обоих кластерах поровну встречались бы и иронцы, и дигорцы. По лингвистическим датировкам разделение иронского и дигорского диалектов произошло 1300 лет назад. По данным историков разделение на иронцев и дигорцев произошло тоже не позднее 1300 лет назад. Таким образом, обнаружено хорошее совпадение генетических, лингвистических и исторических датировок.
Аналогичные филогенетические сети созданы еще для 10 гаплогрупп (Balanovsky et al., 2011). Все они демонстрируют важную особенность изменчивости Y-хромосомы на Кавказе: существование четких кластеров гаплотипов, многие из которых приурочены к одним популяциям и отсутствуют в других. Обилие таких популяционно-специфичных кластеров (их обнаружено несколько десятков) позволяет впервые совместить генетическую и лингвистическую реконструкции микроэволюции населения Кавказа. На рис. 12 приведено лингвистическое древо, иллюстрирующее постепенное разделение северокавказского праязыка на отдельные языки. На ветви этого лингвистического дерева наложены генетические кластеры гаплотипов, специфичные для соответствующих ветвей (популяций и их групп). Можно видеть параллелизм лингвистической и генетической эволюции. Отметим, что использование «генеалогической» скорости мутирования STR маркеров Y-хромосомы дает лучшее согласие с лингвистическими датировками, чем применение «эволюционной» скорости.
Это позволяет сделать вывод, что структура генофонда Кавказа развивалась параллельно с формированием многообразия северокавказских языков. Связующим звеном между генетической и лингвистической эволюцией служили демографические события в истории популяций - подразделение на дочерние группы. Горный рельеф способствовал изолированности дочерних групп, в которых возникали специфичные для них гаплотипы.
Когда дочерняя популяция, в свою очередь, делилась, то генофонды всех «внучатых» групп наследовали характерный кластер гаплотипов. Новые же возникающие гаплотипы оказывались специфичны уже для этих популяций третьего порядка. Те же самые демографические события, которые приводили к изоляции популяций, способствовали формированию большого числа иерархически родственных языков. Тем самым одни и те же события в демографической истории популяций оставляли свои следы в двух независимых регистрирующих системах: в генофонде и в языке.
Рис. 11А. Филогенетическая сеть гаплогруппы G2a1a-P18 на Кавказе Рис. 11Б. Филогенетическая сеть гаплогруппы R1a1a-М у народов Алтая, Центральной Азии и Индии.
.
Рис. 12. Комбинированная схема микроэволюции популяций Кавказа Серым цветом показано лингвистическое древо родства северокавказских языков;
датировка ветвлений дана на шкале времени слева. На верхнюю часть этого лингвистического древа цветными линиями нанесены кластеры STR-гаплотипов Y-хромосомы, специфичные для народов, говорящих на соответствующих языках.