авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 |

Изучение структуры генофонда населения центральной россии (по данным антропонимики)

-- [ Страница 1 ] --

На правах рукописи

Сорокина Инна Николаевна ИЗУЧЕНИЕ СТРУКТУРЫ ГЕНОФОНДА НАСЕЛЕНИЯ ЦЕНТРАЛЬНОЙ РОССИИ (ПО ДАННЫМ АНТРОПОНИМИКИ) 03.02.07 - генетика

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора биологических наук

Москва – 2010 2

Работа выполнена на кафедре медико-биологических дисциплин медицинского факультета Государственного образовательного учреждения высшего профессионального образования «Белгородский государственный университет»

Научный консультант:

доктор медицинских наук, профессор Чурносов Михаил Иванович

Официальные оппоненты:

доктор биологических наук, профессор Спицын Виктор Алексеевич доктор биологических наук, профессор Жукова Ольга Владимировна доктор медицинских наук, профессор Щипков Валерий Петрович Государственное учреждение Ведущее учреждение:о «Научно исследовательский институт медицинской генетики Томского научного центра Сибирского отделения РАМН»

Защита состоится « » 2010 года в часов на заседании Диссертационного совета Д при Государственном 212.203. образовательном учреждении высшего профессионального образования «Российский университет дружбы народов» по адресу: 117198, г. Москва, ул.

Миклухо-Маклая, д.8.

С диссертацией можно ознакомиться в научной библиотеке Государственного образовательного учреждения высшего профессионального образования «Российский университет дружбы народов» по адресу: 117198, г. Москва, ул. Миклухо-Маклая, д.6.

Автореферат разослан « 2010 года »

Ученый секретарь диссертационного совета кандидат биологических наук, доцент О.Б. Гигани

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы Изучение структуры генофонда различных групп народонаселения, решение вопросов микроэволюции популяций человека, их происхождения, родства, исторического развития и взаимодействия со средой является одной из важнейших задач современной антропогенетики [Рычков Ю.Г., 2000;

Гинтер Е.К., 2003;

Алтухов Ю.П., 2003].

Русские - самый большой по численности народ нашей страны. Тем не менее, как отмечает Спицын В.А и др. (2001), популяционно-генетические сведения о русском народе до сих пор остаются весьма фрагментарными, не систематизированными и разбросанными по различным литературным источникам. По мнению коллектива авторов «Генофонд и геногеография народонаселения. Т.1. Генофонд населения России и сопредельных стран» (2000) генофонд русского народа из-за обширности ареала, сложности этнической истории, интенсивных изменений в структуре населения, миграции сельского населения в города и ряда других причин остается плохо исследованным и наиболее трудным для изучения. О многих его особенностях можно скорее догадываться по свойствам генофондов окружающих народов, а не судить, опираясь на результаты прямого изучения, которое нельзя не признать неотъемлемой задачей в генетике народонаселения нашей страны.

При популяционно-генетических исследованиях применяются различные маркеры: физиологические, иммуно-биохимические, ДНК маркеры, квазигенетические. Использование фамилий в качестве аналога генетических маркеров (квазигенетический маркер) имеет ряд преимуществ, недоступных всем другим маркерам [Ельчинова Г.И. и др., 1996, 2004;

Балановская Е.В. и др., 2007]. Во-первых, фамилии селективно нейтральны по отношению к природной среде и, следовательно, корректно оценивают дифференциацию генофонда. Во-вторых, по фамилиям можно изучить всю популяцию целиком, а не только маленькую выборку из нее, что делает выборки репрезентативными, а полученные результаты достоверными.

В-третьих, фамилии могут использоваться для “разведочного анализа генофонда при планировании генетических исследований”, то есть вначале изучается структура генофонда всех подразделений популяции по данным о фамилиях, выявляются основные закономерности изменчивости генофонда, основные «кластеры» элементарных популяций, и уже по этим данным планируется изучение генетических маркеров в избранных подразделениях тотальной популяции. Следует отметить, что изучая фамилии, можно составить надежный прогноз изменчивости генофонда по генетическим маркерам: межпопуляционная изменчивость по фамилиям и генетическим маркерам одинакова [Балановская Е.В. и др., 2007].

С использованием данных антропонимики к настоящему времени изучена генетическая структура целого ряда популяций как зарубежных:

итальянских [Barrai I. et all, 1999;

Biondi G. et all, 1990, 2001;

Branco C.C. et all, 2003], испанских [Barrai I. et all, 2000, 2002;

Rodriguer-Larralde A. et all, 2003], американских [Barrai I. et all, 2001, 2007], китайских [Yuan Y.D. et all, 2000], японских [Imaizumi Y. et all, 1997], австрийских [Barrai I. et all, 2000], немецких [Rodriguer-Larralde A. et all, 1998] и др. [Barrai I. et all, 2000, 2002;

Legay J.M. et all, 2003], так и популяций на пространстве бывшего СССР:

русских [Ревазов А.А. и др., 1984, 1986, 1988;

Гинтер Е.К. и др., 1992, 1993, 1994, 2004;

Ельчинова Г.И. и др., 1991, 1992, 2001, 2002, 2004, 2005, 2006;

Иванов В.П. и др., 1998;

Зинченко Р.А. и др., 2000, 2004;

Балановский О.П. и др., 2000, 2001;

Балановская Е.В. и др., 2005], адыгских [Ельчинова Г.И. и др., 1995;

Балановская Е.В. и др., 2000;

Почешхова Э.А. и др., 2002, 2008], марийских [Ельчинова Г.И. и др., 1995, 1996, 1997;

Гинтер Е.К. и др., 1999] и других [Парадеева Г.М. и др., 1987;

Петрин А.Н., 1989, 1992;

Пузырев В.П., 1991;

Дьяченко Е.П. и др., 1993;

Кучер А.Н. и др., 1999, 2000, 2002, 2004, 2007;

Ельчинова Г.И. и др., 2001, 2002, 2006;

Зинченко Р.А. и др., 2007]. При этом, несмотря на обширный фактический материал по квазигенетическим маркерам до настоящего времени остается неясным вопрос размеров территорий и популяций, для которых использование фамилий дает адекватные результаты при оценке генетических соотношений между популяциями: ряд исследователей считает, что при использовании фамилий как генетических маркеров не имеет смысла рассматривать генетическую структуру одновременно более чем 2-3 районов [Ельчинова и др., 1991;

2001], тогда как в других работах фамилии используются для сравнительного описания генетических характеристик географически удаленных друг от друга популяций [Barrai I. et all, 2000, 2002;

Rodriguer-Larralde A. et all, 2000, 2003, 2004;

Zei G.et all, 2003;

Scapoli C. et all. 2007, Балановская Е.В. и др., 2007]. Наряду с этим некоторые исследователи изучают не все фамилии в популяции (их число может достигать до нескольких тысяч или даже десятков тысяч), а лишь какую-то их часть, определив при этом достаточный уровень отбора частых фамилий с помощью определенного критерия:

“частотный” [Ельчинова Г.И. и др., 1991];

“территориальный” [Бужилова А.П., 1999];

“демографический” [Балановская Е.В. и др., 2007]. Однако, при работе с частыми фамилиями остается неясным насколько полученные на основе разных разновидностей частых фамилий популяционно-генетические результаты соотносятся между собой и насколько репрезентативно они характеризуют истинный “генетический ландшафт” населения.

Есть и еще один важный аспект данной работы - она впервые рассматривает возможность использования телефонных справочников с целью получения информации о фамилиях для популяционно-генетического анализа населения России. Обычно, в популяционно-генетических работах отечественных ученых, источником информации о фамилиях среди населения служат списки избирателей [Гинтер Е.К. и др., 1993, 1994, 2003;

Ельчинова Г.И. и др., 2001, 2004;

Иванов В.П., и др., 1998;

Зинченко Р.А. и др., 2004;

Балановская Е.В. и др., 2005, 2006, 2007]. Однако, получить эти данные в избирательных комиссиях в силу объективных и субъективных причин достаточно сложно. В тоже время в зарубежных исследованиях базой данных о фамилиях являются телефонные справочники [Barrai I. et all, 2000, 2002;

Branco C.C. et all, 2003;

Rodriguer-Larralde A. et all., 2003, 2007].

Предприняв изучение генетической структуры населения Центральной России мы впервые решили выяснить, можно ли использовать фамилии телефонных абонентов для корректной оценки уровня инбридинга и описания “генетического ландшафта” населения Центральной России ?

Работа выполнена в рамках Федеральной целевой программы “Научные и научно-педагогические кадры инновационной России” (гос.

контракт №02.740.11.0496 “Генетические факторы мультифакториальных заболеваний человека”).

Цель исследования Изучить структуру генофонда населения Центральной России по данным антропонимики и разработать новые подходы в использовании фамилий для популяционно-генетического анализа.

Задачи исследования 1. Изучить популяционно-генетическую структуру населения Центральной России на уровне элементарной популяции.

2. Определить факторы изменчивости внутренней подразделенности элементарных популяций Центральной России.

3. Оценить “фамильные портреты” популяций с различным уровнем генетической дифференциации.

4. Рассмотреть эффективность использования средних частот наиболее распространенных фамилий для оценки уровня случайного инбридинга.

5. Провести моделирование “генетического ландшафта” элементарных популяций.

6. Установить характер изменчивости структуры генофонда населения Центральной России.

7. Определить возможности использования различных критериев отбора частых фамилий при анализе популяционно-генетической структуры населения.

8. Исследовать репрезентативность оценок уровня случайного инбридинга и факторов его определяющих, полученных на основе фамилий телефонных абонентов.

9. Оценить эффективность применения фамилий телефонных абонентов для выявления генетических соотношений между элементарными популяциями.

Научная новизна исследования Впервые изучена структура генофонда населения Центральной России по данным антропонимики на разных уровнях популяционной системы:

районный (элементарная популяция), областной и региональный. Получены данные о распределении 60 тыс. фамилий в 30 районах 7 областей Центральной России с численностью населения 1,4 млн. человек.

Определены “фамильные портреты” популяций с различной степенью внутренней подразделенности. Оценен уровень случайного инбридинга среди населения Центральной России и установлены факторы его популяционной динамики. Впервые показана эффективность использования средних частот двадцати наиболее распространенных фамилий для ориентировочной оценки уровня случайного инбридинга среди населения и прогнозирования его значения в конкретной элементарной популяции.

Впервые на основе частот всех фамилий с использованием методов многомерной статистики (кластерный анализ, построение эквидистантных фигур, факторный анализ, многомерное шкалирование), проведено моделирование “генетического ландшафта” множества элементарных популяций Центральной России. Выявлена упорядоченная система группировки районов одной области в четыре кластера и четко выраженная широтная изменчивость генофонда населения Центральной России.

Впервые дана оценка информативности различных критериев отбора частых фамилий, используемых в отечественной популяционной генетике (“частотный”, “территориальный”, “демографический”) при популяционно генетическом изучении населения Центральной России. Впервые определен универсальный критерий отбора распространенных фамилий, обеспечивающий корректную характеристику уровня инбридинга и генетических соотношений среди населения Центральной России.

Впервые использован новый источник получения информации о фамилиях населения – списки телефонных абонентов (получены данные о тыс. фамилий среди 187 тыс. телефонных абонентов) в популяционно генетическом анализе населения Центральной России. Показана эффективность применения фамилий телефонных абонентов для определения уровня случайного инбридинга, выявления факторов его популяционной динамики и описания “генетического ландшафта” населения.

Научно-практическая значимость исследования Созданная база данных о генофонде населения Центральной России послужит основой для медико-генетического и эколого-генетического мониторинга населения Центральной России. Установленный универсальный критерий отбора частых фамилий – “демографический”, с включением в анализ фамилий, встречающихся в элементарной популяции у 4 и более человек, может быть эффективно использован другими коллективами исследователей при популяционно-генетическом изучении населения Центральной России. Разработанная регрессионная модель позволяет прогнозировать с высокой степенью точности уровень случайного инбридинга среди населения Центральной России на основе данных о средних частотах двадцати наиболее распространенных фамилий.

Полученные данные о влиянии миграционного притока на уровень случайного инбридинга среди населения Центральной России могут быть использованы при разработке организационных рекомендаций по привлечению мигрантов в районы с высоким уровнем инбридинга с целью его снижения. Телефонные справочники могут применяться в качестве репрезентативного источника информации о фамилиях населения при популяционно-генетических исследованиях.

Результаты исследования могут представлять интерес для этнографов, антропологов, демографов, лингвистов, а также послужат важным дополнением в исследованиях по истории формирования населения Центральной России. Собранный материал и полученные результаты создают базу для дальнейшего изучения роли популяционно-генетических факторов в распространенности наследственно-детерминированной патологии и могут послужить основой для планирования генетико эпидемиологического обследования населения Центральной России.

Полученные результаты используются в работе ГУ Медико-генетический научный центр РАМН, ГОУ ВПО Курский государственный медицинский университет, ГОУ ВПО Белгородский государственный университет.

Положения, выносимые на защиту 1. Частоты фамилий эффективно описывают структуру генофонда населения Центральной России. Популяционная изменчивость уровня случайного инбридинга в районах Центральной России значительна и определяется численностью, иммиграционной активностью, степенью урбанизации элементарных популяций.

2. Спектр и частоты фамилий в элементарных популяциях Центральной России варьируют и существенно отличаются в районах с высоким и низким уровнем генетической дифференциации.

3. Средние частоты двадцати наиболее частых фамилий позволяют как ориентировочно оценивать уровень внутренней подразделенности элементарных популяций Центральной России, так и прогнозировать его значение в конкретной элементарной популяции.

4. “Фамильные портреты” элементарных популяций и географические расстояния определяют “генетический ландшафт” населения Центральной России.

5. Широтная изменчивость по оси “юг - север” является главной в структуре генофонда населения Центральной России. Частоты фамилий эффективно оценивают генетические соотношения многочисленных элементарных популяций, географически неравномерно расположенных на большой по площади территории Центральной России.

6. “Демографический” (фамилия встречается в элементарной популяции у 4 и более человек) и “территориальный” (фамилия встречается в 5 и более элементарных популяциях) критерии отбора частых фамилий эффективны при популяционно-генетическом исследовании крупной подразделенной областной популяции юга Центральной России. При изучении структуры генофонда территориально удаленных элементарных популяций Центральной России эффективны “демографический” (фамилия встречается в элементарной популяции у 9 и более человек) и “частотный” (фамилия встречается в элементарной популяции с частотой 0,02% и выше) критерии отбора частых фамилий.

7. Частые фамилии, встречающиеся в элементарной популяции у 4 и более человек, репрезентативно описывают уровень подразделенности и “генетический ландшафт” населения Центральной России.

8. Фамилии телефонных абонентов корректно оценивают уровень случайного инбридинга среди населения Центральной России и выявляют значимое влияние на него численности населения, миграционного притока, географических расстояний и степени урбанизации популяции.

9. Генетические соотношения между элементарными популяциями Центральной России, установленные на основе фамилий телефонных абонентов, в целом соответствуют “генетическому ландшафту”, полученному по частотам всех фамилий всех избирателей.

Апробация работы Основные результаты диссертации доложены и обсуждены на:

Годичной научной конференции сотрудников Белгородского госуниверситета (Белгород, 2005, 2006, 2007, 2008, 2009, 2010), Пятом съезде Российского общества медицинских генетиков (Уфа, 2005), Российской научной конференции с международным участием «Медико–биологические аспекты мультифакториальной патологии» (Курск, 2006), 71-й научной конференции КГМУ и сессии Центрально-Черноземного научного центра РАМН (Курск, 2006), Международной конференции «Генетика в России и мире», посвященной 40-летию Института общей генетики им. Н.И. Вавилова РАН Международной научно-практической (Москва, 2006), IX экологической конференции «Современные проблемы популяционной экологии» (Белгород, 2006), 72-й итоговой межвузовской конференции студентов и молодых ученых «Mолодежная наука и современность» (Курск, 2007), VII Конгрессе этнографов и антропологов России (Cаранск, 2007), Всероссийской конференции молодых ученых-медиков (Воронеж, 2008), Третьих Антропологических чтениях к 75-летию со дня рождения акад. В. П.

Алексеева «Человек в культурной и природной среде» (Москва, 2007), III международной Пироговской научной медицинской конференции (Москва, 2008), II международной научной конференции молодых ученых–медиков (Курск, 2008), 73-й итоговой межвузовской конференции студентов и молодых ученых «Молодежная наука: от фундаментальной идеи до инновационных проектов» (Курск, 2008), IX окружной конференции молодых ученых «Наука и инновации ХХI века» (Сургут, 2009), 63-й итоговой конференции молодых ученых Ростовского государственного медицинского университета с международным участием, посвященной 70 летию СНО (Ростов-на-Дону, 2009), 43-й Всероссийской научной конференции с международным участием студентов и молодых ученых «Актуальные проблемы теоретической, экспериментальной, клинической медицины и фармации» (Тюмень, 2009), IV Международной Пироговской научной медицинской конференции (Москва, 2009), V съезде Вавиловского общества генетиков и селекционеров (Москва, 2009), 105-th Annual Meeting «Anatomische gesellschaft» (Hamburg, 2010), Шестом съезде Российского общества медицинских генетиков (Ростов-на-Дону, 2010).

Публикации. По материалам диссертации опубликовано 33 печатные работы, в том числе 18 в рецензируемых журналах, рекомендованных ВАК Минобрнауки России для публикации результатов докторских диссертаций на соискание ученой степени доктора биологических наук.

Структура и объем диссертации Диссертация изложена на 330 (424) страницах и состоит из введения, обзора литературы, описания материалов и методов исследования, результатов исследования, заключения, выводов, списка литературы, содержащего 404 источника, из которых 137 - иностранные, а также приложений. Работа иллюстрирована 27 таблицами и 54 рисунками.

МАТЕРИАЛЫ И МЕТОДЫ Согласно цели и задачам исследования изучена структура генофонда населения Центральной России с использованием квазигенетических маркеров: проанализировано распределение фамилий среди 1064987 человек в 30 районах 7 областей Центральной России общей численностью 1млн.

388,4 тыс. человек.

При выполнении настоящего исследования проведена оценка размера элементарной популяции. Для этого был рассчитан индекс эндогамии.

Материалом для исследования индекса эндогамии послужили 2015 записей актов о заключении браков архива ЗАГС 4 районов Белгородской, Курской и Воронежской областей. На основании мест рождения супругов определяли индекс эндогамии как долю мужей и жен, родившихся в данной популяции, в соответствии с L.L. Cavalli-Sforsa и W.F. Bodmer [1971]. Оценка уровня эндогамии производилась в соответствии с «административным рангом» популяций: на уровне сельского совета, на уровне района, на уровне области.

Элементарной считали популяцию, в которой заключается не менее 50% эндогамных браков [Наследственные болезни…, 2002].

Нами рассмотрена популяционная система населения Центральной России на различных иерархических уровнях: 1) уровень элементарной популяции (район);

2) областной уровень – множество рядом расположенных элементарных популяций одной области (20 районов Белгородской области);

3) региональный уровень: а) территориально удаленные элементарные популяции многочисленного региона Российской Федерации – Центральной России (10 районов 6 областей - Курская, Воронежская, Орловская, Рязанская, Калужская и Тамбовская области, среднее расстояние между изученными элементарными популяциями равно 144 км);

б) географически неравномерно расположенные на большой по площади территории Центральной России (287,3 тыс. км2) множество элементарных популяций (30 районов 7 областей Центральной России).

Территориальное расположение изученных популяций представлено на рис.

1.

Рис.1. Территориальное расположение исследуемых районов Центральной России (отмечены районы, в которых производилось исследование).

Для получения материалов о фамилиях населения использовались два источника информации (табл.1):

1) хорошо зарекомендовавшие себя в популяционно-генетических исследованиях отечественных ученых [Гинтер Е.К. и др., 1993, 1994, 2003;

Ельчинова Г.И. и др., 2001, 2004;

Иванов В.П., и др., 1998;

Зинченко Р.А. и др., 2004;

Балановская Е.В. и др., 2005, 2006, 2007] списки избирателей. Нами была собрана база данных о 59995 фамилий среди 1064987 человек, т.е. все фамилии среди всего населения старше 18 лет в 30 районах 7 областей Центральной России;

2) абсолютно не изученные в российской популяционной генетике, но, в то же время, эффективно применяемые в работах зарубежных исследователей [Barrai I. et all, 2000, 2002;

Branco C.C. et all, 2003;

Legay J.M.

et all, 2003] списки телефонных абонентов. Мы сформировали базу данных о 28980 фамилиях среди 186654 телефонных абонентов, в тех же элементарных популяциях Центральной России.

В каждой популяции рассчитывалась частота каждой фамилий - как отношение числа носителей данной фамилии в изучаемой популяции к общему числу жителей старше 18 лет в данной популяции. Частота фамилий телефонных абонентов рассчитывалась через отношение числа носителей Таблица Характеристика количества исследованных фамилий и численности изученного населения Центральной России Уровень организации популяции областной региональный щбщий объем списки избирателей 48902 фамилий 21556 фамилий 59955 фамилий 822316 человек 242671 человек 1064987 человек списки телефонных абонентов 25367 фамилий 7569 фамилий 28980 фамилий 159842 человек 26812 человек 186654 человек данной фамилии в изучаемой популяции к общему числу телефонных абонентов в этой популяции.

На основе распределения частот фамилий был проведен подсчет ряда популяционно-генетических показателей: индекс миграций (v), показатель разнообразия фамилий (), энтропия распределения фамилий (H), избыточность распределения фамилий (R), случайная компонента инбридинга (fr) [Barrai I. et all, 1992;

Старцева Е.А. и др., 1994].

Случайный инбридинг по частотам фамилий оценивался с помощью коэффициента изонимии fr, предложенного Grow и Mange [1965]. Расчет производился по формуле:

fr( j) = I / где I – ожидаемая частота изонимных (однофамильных) браков в j-ой популяции, т.е. I=Pi2, где Pi – частота i-той фамилии в j-той субпопуляции [Grow J.F., Mange A.P., 1965], а коэффициент учитывает передачу фамилий лишь по мужской линии. Случайный инбридинг fr (соответствует FST Райта) оценивает ожидаемую частоту однофамильных браков в предположении полной панмиксии (элементарная популяция без ассортативности браков).

Следует отметить, что данная величина fr(район) отражает случайный инбридинг в каждой отдельной элементарной популяции (район) не являясь характеристикой тотальной популяции (область). При этом величина инбридинга в элементарной популяции (район) уже содержит в себе вклады всех более высоких уровней популяционной системы (область и т.д.).

Поэтому для реальной оценки fr* мы вычитали из валовой (прямой) районной оценки fr(район) ту величину изменчивости, которая привносится областным уровнем иерархии fr(область): fr*(район-область) = fr(район) – fr(область), где fr(район) – это уровень инбридинга на уровне элементарной популяции (район), а fr(область) – случайный инбридинг в области в целом [Балановская Е.В. и др., 2000].

В работе изучалось распределение среди населения, как всех фамилий, так и частых фамилий (ЧФ). Для выделения ЧФ использовались все известные в отечественной популяционной генетике критерии отбора частых фамилий: “демографический” [Балановская Е.В. и др., 2007], “территориальный” [Бужилова А.П., 1999], “частотный” [Ельчинова Г.И. и др., 1991].

С целью изучения роли географических расстояний в формировании подразделенности генетической структуры населения Центральной России проводился корреляционный анализ (рассчитывался ранговый коэффициент корреляции Спирмена) матриц генетических расстояний и географических расстояний. Для этого с использованием карты Белгородской области (масштаб 1:400000) и карты Центральной России (все регионы России выпуск в WRU – 03/05) были рассчитаны географические расстояния между исследованными элементарными популяциями.

Генетические расстояния между Статистический анализ.

популяциями были рассчитаны с помощью программы DJ genetic (версия 0,03 beta), разработанной Ю.А. Серегиным и Е.В. Балановской в ГУ МГНЦ РАМН. При расчете расстояний использовали метод сравнения популяций по частотам аллелей полиморфных маркеров по M. Nei [Животовский Л.А., 1983, 1991]. Аналогами аллелей являлись фамилии (квазигенетический маркер). Генетические взаимоотношения между популяциями выявляли с помощью трех подходов: кластерного анализа (методом Уорда) с получением эквидистантных фигур, многомерного шкалирования (достоверность результатов оценивалась по величине стресса, коэффициенту алиенации и кривой Шепарда) и факторного анализа по методу главных компонент [Ким Дж.О. и др., 1989;

Дерябин В.Е., 1998, 2001]. Результаты признавались надежными, если они подтверждались всеми видами статистического анализа.

Анализ взаимосвязей между популяционно-генетическим показателями проводился с использованием непараметрического коэффициента ранговой корреляции Спирмена () [Лакин Г.Ф., 1999].

Статистическая обработка данных проводилась на персональном компьютере с использованием программных пакетов Statistica 6.0. и Ms.

Excel.

РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ 1. Популяционно-генетические характеристики населения Центральной России С использованием фамилий избирателей описана структура генофонда населения 30 районов 7 областей Центральной России (табл. 2).

Анализ показателей внутренней подразделенности элементарных популяций Центральной России, рассчитанных по фамилиям избирателей, выявил их выраженную территориальную вариабельность как на уровне всего региона 0,00002fr*0,00092 (эта изменчивость является ожидаемой в связи со значительной территориальной удаленностью рассматриваемых районов друг от друга, различиями в истории формирования населения этих районов и др. [Шмелев Ю.Н., 1995;

Загоровский В.П., 1998;

Земля Михайловская, 2000;

Белгородоведение….., 2002]), так и на уровне одной Таблица Характеристика распределения фамилий, уровня подразделенности (fr*), разнообразия фамилий (a), энтропии (H), избыточности распределения фамилий (R) и индекса миграций (v) в районных популяциях Центральной России старше 18 лет Количество Количество населения fr * а Район фамилий H R v Областной уровень (Белгородская область) Алексеевский 50858 5401 0,00028 65,36 10,67 31,74 0, Борисовский 19366 3500 0,00022 134,42 10,56 25,88 0, Валуйский 56461 7628 0,00015 122,78 11,22 28,92 0, Вейделевский 19324 2825 0,00033 81,02 10,15 28,69 0, Волоконовский 28230 3704 0,00024 91,81 10,49 29,03 0, Грайворонский 20606 3388 0,00029 100,50 10,37 27,66 0, Губкинский 87926 9999 0,00019 90,23 11,29 31,29 0, Ивнянский 18802 2749 0,00048 60,95 9,91 30,23 0, Корочанский 30125 4388 0,00022 106,20 10,60 28,73 0, Красненский 12737 1272 0,00125 18,23 8,51 37,57 0, Красногвардейский 35027 3562 0,00025 68,32 10,28 31,87 0, Краснояружский 11589 2064 0,00052 70,38 9,77 27,61 0, Новооскольский 38108 5507 0,00019 116,36 10,90 28,36 0, Прохоровский 22878 3531 0,00039 75,02 10,20 29,57 0, Ракитянский 26744 3687 0,00029 82,91 10,32 29,80 0, Ровенской 18507 2311 0,00062 42,45 9,64 32,03 0, Старооскольский 187229 22247 0,00007 151,03 12,23 30,16 0, Чернянский 25871 3987 0,00025 105,15 10,58 27,82 0, Шебекинский 73120 9424 0,00016 109,25 11,37 29,62 0, Яковлевский 38862 6684 0,00009 200,08 11,34 25,63 0, В среднем на областном 42163 5643 0,00031 102,6 10,59 29,4 0, уровне Региональный уровень (Центральная Россия) Барятинский район, 5100 1451 0,00027 190,65 9,86 19,93 0, Калужская область Боровский район, 41886 9089 0,00002 359,25 11,99 21,91 0, Калужская область Михайловский район, 29425 4485 0,00011 150,09 10,91 26,55 0, Рязанская область Спасский район, 26741 4470 0,00007 199,51 11,06 24,76 0, Рязанская область Болховский район, 15748 2475 0,00025 101,38 10,16 27,13 0, Орловская область Ливенский район, 67158 6248 0,00030 52,39 10,47 34,72 0, Орловская область Петровский район, 16802 2227 0,00041 60,89 9,80 30,15 0, Тамбовская область Черемисиновский район, 9266 1311 0,00092 33,74 8,99 31,78 0, Курская область Пристенский район 16198 2227 0,00062 45,70 9,49 32,10 0, Курская область Репьевский район, 14347 457** 0,00063 ** ** ** ** Воронежская область** В среднем на региональном 24267 3776 0,00036 132,6 10,30 27,67 0, уровне ** – проанализированы только частые фамилии (число носителей которых в изучаемой популяции было более 4).

области 0,00007fr*0,00125, причем размах изменчивости показателя инбридинга на областном уровне полностью сопоставим с аналогичными данными на региональном уровне (табл. 2).

Среди факторов, определяющих различия в уровне инбридинга населения, как на областном, так и на региональном уровне организации популяции важное значение имеют численность населения, количество фамилий в элементарной популяции, ее степень урбанизации и миграционная активность. Популяции, имеющие в своем составе урбанизированную зону (город), имеют значительно более низкий уровень подразделенности (fr* в среднем 0,00033 на областном уровне и 0,00015 на региональном уровне) по сравнению с сельским населением (fr* равно 0,00048 и 0,00060, соответственно). Различия в уровне подразделенности городского и сельского населения продемонстрированы и другими исследователями для Ростовской [Амелина С.С., 2006], Костромской [Ельчинова Г.И., 2001], Кировской [Ельчинова Г.И., 2001] областей и др. популяций России [Ельчинова Г.И. и др., 1995;

Балановская Е.В. и др., 2000;

Почешхова Э.А. и др., 2002, 2008]. Следует отметить и более высокую численность населения, количество фамилий в популяциях с урбанизированной зоной (табл. 3).

Значимое влияние на уровень инбридинга среди населения оказывает миграционный приток населения. За последние десять лет (с 1990 по 2000 г.) иммиграционный приток в Белгородскую область в среднем составил 33, чел. на 1000 жителей при вариабельности по районам от 13, (Красногвардейский район) до 56,5 (Белгородский район). Миграции осуществляются как в города (63 % от всех мигрантов), так и в сельскую местность (37% от всех мигрантов), однако разные районы Белгородской области испытывают различную миграционную нагрузку. Увеличение притока мигрантов в сельские районы Белгородской области приводит к снижению уровня подразделенности (=-0,73±0,15, р0,01) и избыточности Таблица Характеристика распределения численности населения, количества фамилий и уровня подразделенности (fr*) в зависимости от степени урбанизации районных популяций Центральной России Областной уровень Региональный уровень (Белгородская область) (Центральная Россия) Показатели Популяции с Популяции с Сельские Сельские урбанизированной урбанизированной популяции популяции зоной (город) зоной (город) Средняя численность 39458 25349 36192 населения Среднее количество 6081 3496 5353 фамилий fr* 0,00033 0,00048 0,00015 0, распределения фамилий (=-0,49±0,19, р0,05). Значимая роль миграций в формировании популяционной структуры отмечена Г.И. Ельчиновой [2001] для популяций Краснодарского края, Кировской, Костромской областей, республики Адыгея.

Выявленные с помощью показателя генетической дифференциации fr территориальные особенности популяционно-генетической структуры населения Центральной России подтверждаются также и при использовании других популяционно-генетических характеристик, определенных по частотам фамилий: показателя разнообразия фамилий (а) и энтропии (Н).

Коэффициенты корреляции между случайным инбридингом fr, c одной стороны, и показателями разнообразия фамилий (а) и энтропии (Н), c другой, составили =-0,90±0,09 (р0,001) и -0,96±0,06 (р0,001) на областном уровне и =-0,93±0,08 (р0,01) и -0,95±0,07 (р0,001) на региональном уровне, соответственно. Следует отметить, что уровень изменчивости показателей разнообразия фамилий (18,23а359,25) и энтропии (8,51Н11,99) в элементарных популяциях Центральной России сопоставим с аналогичными данными, полученными в популяциях Костромской и Кировской областях (13,1а174,2;

5,0Н8,9) [Зинченко Р.А. и др., 2004].

2. Анализ “фамильного портрета” населения Центральной России При проведении анализа «фамильных портретов» элементарных популяций Центральной России установлено, что, во-первых, наиболее распространенными фамилиями Центральной России являются фамилии Кузнецов (0,53%), Новиков (0,42%), Иванов (0,42%), Попов (0,41%), Зайцев (0,41%). Выявлена преимущественная распространенность определенных фамилий на отдельных территориях Центральной России (Кузнецовы чаще встречаются на севере Центральной России, Поповы на юге, Ивановы и Новиковы – на северо-западе), что соответствует закономерностям изменчивости данных фамилий в русском генофонде, показанных в работах Бужиловой А.П. [1999], Балановской Е.В. и др., [2005, 2007].

Во-вторых, спектр и частоты фамилий в элементарных популяциях характеризуются значительной вариабельностью. При этом, следует отметить, что изменчивость «фамильных портретов» районов на региональном уровне более выражена по сравнению с областным уровнем.

Так, например, из 5 самых частых фамилий Белгородской области – Попов (0,642%), Шевченко (0,390%), Ковалев (0,360%), Новиков (0,341%), Иванов (0,318%) – все они присутствуют во всех 20 районах области, тогда как в районах Центральной России лишь 3 фамилии (Кузнецов, Иванов, Попов) из 5 наиболее частых фамилий – Кузнецов (0,525%), Новиков (0,422%), Иванов (0,418%), Попов (0,409%), Зайцев (0,407%) – наблюдаются во всех рассмотренных районах. Такая же тенденция выявлена и по 10 частым фамилиям: на областном уровне 8 из 10 распространенных фамилий регистрируются во всех 20 районах, а на региональном только 6 из 10 частых фамилий встречаются во всех 10 районах.

В-третьих, среди 50 частых фамилий Центральной России преобладают календарные фамилии (52%). Следующие ранговые места занимают профессиональные, «звериные» фамилии – по 14%, «приметные» фамилии – 12%. Иных фамилий зарегистрировано лишь 8%. При этом календарные и «звериные» фамилии имеют наибольшую распространенность на севере Центральной России, а «приметные» и иные фамилии – на юге изучаемого региона.

В-четвертых, выявлены взаимосвязи уровня подразделенности населения с частотой и спектром фамилий. Отличительной особенностью элементарных популяций с высоким уровнем инбридинга является наименьшая представленность в списке частых фамилий общерегиональных фамилий и преобладание своеобразных фамилий (например, Евсюков, Капустин и др. - на областном уровне, Кретинин, Руденский, Извеков и др. на региональном уровне) с максимальными их частотами (для областного уровня средняя частота 5ЧФ – 1,383%, 10 ЧФ – 1,157%, 20 ЧФ – 0,921%;

для регионального уровня 5ЧФ – 1,471%, 10 ЧФ – 1,230%, 20 ЧФ – 0,993%) и наибольшей скоростью падения частот (для областного уровня 20 ЧФ – 1,074%, 50 ЧФ – 1,326%;

для регионального уровня 20 ЧФ – 1,371%, 50 ЧФ – 1,678%). В районах с низким уровнем случайного инбридинга наблюдается наибольшая представленность среди частых фамилий общерегиональных фамилий с невысоким уровнем их распространенности (для областного уровня средняя частота 5 ЧФ – 0,796%, 10 ЧФ – 0,652%, 20 ЧФ – 0,523%;

для регионального уровня 5 ЧФ – 0,488%, 10 ЧФ – 0,416%, 20 ЧФ – 0,350%) и наименьшей скоростью падения частот (для областного уровня 20 ЧФ – 0,838%, 50 ЧФ – 0,960%;

для регионального уровня 20 ЧФ – 0,414%, 50 ЧФ – 0,483%).

3. Использование фамилий для оценки «генетического ландшафта» населения Центральной России Важной задачей популяционно-генетических исследований, наряду с оценкой уровня инбридинга среди населения и выявления факторов его определяющих, является еще и описание «генетического ландшафта» элементарных популяций [Ревазов А.А., 1985;

Ельчинова Г.И. и др., 1991;

Наследственные болезни…., 2002]. В нашей работе для решения этой задачи мы использовали данные о всех фамилиях среди всего изучаемого населения Центральной России, несмотря на значительную трудоемкость этого процесса – для определения генетических расстояний между элементарными популяциями необходимо было сопоставить данные о распространенности практически 60 тыс. фамилий среди более чем 1 млн. человек в 30 районах Центральной России. Однако, мы провели данную работу для того, чтобы получить репрезентативные данные о генетических соотношениях изучаемых элементарных популяций Центральной России.

В результате выполнения этого этапа исследования установлено наличие на территории Белгородской области определенной упорядоченной системы группировки элементарных популяций в четыре самостоятельных кластера (рис.2 и 3): центральный кластер (10 районов), юго-восточный ( районов), западный кластер (4 района), восточный кластер (2 района).

Следует отметить, что такой «генетический ландшафт» элементарных популяций Белгородской области соответствует их реальному территориальному расположению и географическим расстояниям между ними (коэффициент корреляции Спирмена между матрицами генетических и географических расстояний составляет =0,60±0,05, р0,001). Показаны особенности «фамильных портретов» выявленных кластеров: районы центрального и юго-восточного кластеров сходны между собой и с «фамильным портретом» области в целом;

в «фамильном портрете» западного кластера наблюдается высокий удельный вес украинских фамилий, а восточный кластер характеризуется ярко выраженным своеобразием спектра и частот фамилий.

Важно подчеркнуть, что в настоящем исследовании впервые в Российской Федерации использованы все фамилии для анализа генетических соотношений всего населения крупной подразделенной областной популяции юга Центральной России, показана эффективность применения этого маркера для оценки «генетического ландшафта» множества рядом расположенных элементарных популяций одной области, т.е., как свидетельствуют наши результаты, фамилии способны выявлять достаточно «тонкие» генетические различия среди значительно сходных между собой (по территориальному расположению, социально-экономическим условиям, этническому составу и т.д.) районных популяций одной области.

Фамилии являются эффективными маркерами и при оценке генетических соотношений территориально удаленных друг от друга элементарных популяций различных областей Центральной России (среднее расстояние между исследуемыми элементарными популяциями составляет 144 км). Нами установлена дифференцировка десяти районных популяций Центральной России на две группы (рис.4). Данная дифференцировка идет по оси «юг-север» (рис. 5), что свидетельствует о широтной изменчивости генофонда населения Центральной России. Следует отметить, что генетическая подразделенность популяций Центральной России соответствует их реальному географическому расположению и данным, полученным ранее нашим коллективом по этим же популяциям с использованием классических генетических маркеров [Жерлицына М.С.и др., 2005;

Аристова И.К. и др., 2005;

Лепендина И.Н. и др., 2008;

] – коэффициент корреляции Спирмена между матрицами генетических расстояний, рассчитанных по частотам фамилий и иммуно-биохимическим генным маркерам составил = 0,34±0,11 (р0,05). Достоверные взаимосвязи в распределении квазигенетических и генетических маркеров получены и А.А.

Ревазовым и др. [1986] при популяционно-генетическом исследовании северных русских популяций (коэффициент корреляции между матрицами генетических (полученных по частотам генов) и квазигенетических (полученных по частотам фамилий) расстояний равен 0,32±0,15), Рис. 2 Дендрограмма генетических соотношений двадцати районов Белгородской области, Пристенского района Курской области и Репьевского района Воронежской области (построена методом Уорда по частотам всех фамилий) (пунктирной линией указан уровень выделения значимых кластеров):

1 – Алексеевский, 2 – Борисовский, 3 – Валуйский, 4 – Вейделевский, 5 – Волоконовский, 6 – Грайворонский, 7 – Губкинский, 8 – Ивнянский, 9 – Корочанский, 10 – Красненский, 11 – Красногвардейский, 12 – Краснояружский, 13 – Новооскольский, 14 – Прохоровский, 15 – Ракитянский, 16 – Ровеньской, 17 – Старооскольский, 18 – Чернянский, 19 – Шебекинский, 20 – Яковлевский районы Белгородской области, 21 – Пристенский район Курской области, 22 – Репьевский район Воронежской области.

Рис. 3. Схема генетических соотношений элементарных популяций Белгородской области, Пристенского района Курской области и Репьевского района Воронежской области (по данным о распределении всех фамилий).

3, 2, 2, 1, 1, 0, 0, 10 4 3 6 9 5 7 8 2 Рис. 4. Дендрограмма генетических соотношений десяти районных популяций Центральной России (построена методом Уорда по частотам всех фамилий) (пунктирной линией указан уровень выделения значимых кластеров):

1 – Барятинский район Калужская область;

2 – Боровский район Калужская область;

3 – Черемисиновский район Курская область;

4 – Пристенский район Курская область;

5 – Болховский район Орловская область;

6 – Ливенский район Орловская область;

7 – Михайловский район Рязанская область;

8 – Спасский район Рязанская область;

9 – Петровский район Тамбовская область;

10 – Репьевский район Воронежская область.

Рис. 5. Схема генетических соотношений и географического расположения десяти районных популяций Центральной России (получена на основе распределения всех фамилий) (овалами обведены популяции, которые формируют кластеры при кластерном анализе).

Балановской Е.В. и др. [2000, 2007] при исследовании пяти регионов России (коэффициент корреляции между матрицами расстояний по фамилиям и по генам Y хромосомы равен 0,6). Полученная картина генетической дифференциации популяции Центральной России полностью согласуется с данными Е.В. Балановской и др. [2001, 2007], которые с помощью методов геногеографии (сравнение обобщенных синтетических карт главных компонент, полученных по классическим генетическим маркерам и антропологическим признакам) выделили в качестве «главного сценария» изменчивости русского генофонда широтную изменчивость.

На следующем этапе настоящего исследования мы изучили эффективность использования фамилий для оценки генетических соотношений в сложно устроенной популяционной системе, состоящей из множества элементарных популяций, географически неравномерно расположенных на большой по площади территории Центральной России (287,3 км2) (30 районов 7 областей, в том числе 20 районов в одной области).

Следует отметить, что в отечественной популяционной генетике существует точка зрения [Ельчинова Г.И. и др., 1991, 2001] о том, что при использовании фамилий как генетических маркеров не имеет смысла рассматривать генетическую структуру одновременно более чем 2-3 соседних районов, да и, то, только в том случае, если общая граница между ними весьма значительна.

Однако, в результате проведенного нами исследования установлена четко выраженная дифференцировка 30 элементарных популяций 7 областей Центральной России на 3 самостоятельных широтных кластера: северный кластер (6 районов), центральный кластер (17 районов), южный кластер ( районов) (рис. 6 и 7). Следует отметить, что генетические соотношения 5, 4, 4, 3, 3, 2, 2, 1, 1, 0, 0, 29 25 27 28 22 21 23 24 14 9 30 10 26 8 18 13 20 19 17 7 11 5 3 15 12 6 2 16 4 Рис. 6. Дендрограмма генетических соотношений 30 районных популяций Центральной России (построена методом Уорда по частотам всех фамилий) (пунктирной линией указан уровень выделения значимых кластеров):

1 – Алексеевский, 2 – Борисовский, 3 – Валуйский, 4 – Вейделевский, 5 – Волоконовский, 6 – Грайворонский, 7 – Губкинский, 8 – Ивнянский, 9 – Корочанский, 10 – Красненский, 11 – Красногвардейский, 12 – Краснояружский, 13 – Новооскольский, 14 – Прохоровский, 15 – Ракитянский, 16 – Ровеньской, 17 – Старооскольский, 18 – Чернянский, 19 – Шебекинский, 20 – Яковлевский районы Белгородской области, 21 – Барятинский район Калужская область;

22 – Боровский район Калужская область;

23 – Черемисиновский район Курская область;

24 – Пристенский район Курская область;

25 – Болховский район Орловская область;

26 – Ливенский район Орловская область;

27 – Михайловский район Рязанская область;

28 – Спасский район Рязанская область;

29 – Петровский район Тамбовская область;

30 – Репьевский район Воронежская область.

Московская область Боровск Калуга 0, Рязань Барятино Спасск Калужская Тульская область Рязанская область Михайловский область Б ол хов 1, Орёл 1, Петровское Липецкая область Орловская область Тамбов 2, 2, Ливны 2, Черемисиново Тамбовская область Курск Пристень Репьевка Курская область 1, Воронеж 2, 1,5 1, ГубкинСт. Оскол 2, Прохоровка Чернянка Красное Ивня 1, Кр. Яруга Воронежская Строитель 1, 1,5 Ракитное Короча Красногвардейское область Н. Оскол 1, 1, Грайворон Борисовка Шебекино Белгород Алексеевка Волоконовка 1, Валуйки Вейделевка 1, 2,0 Ровеньки 2, Рис. 7. Схема генетических соотношений 30 районных популяций Центральной России (получена по данным о распределении всех фамилий).

элементарных популяций соответствуют их реальному территориальному положению и географическим расстояниям между ними (коэффициент корреляции Спирмена между матрицами генетических и географических расстояний равен =0,36±0,04, р0,01). Важно подчеркнуть, что даже на такой сложно устроенной модели популяционной системы Центральной России неравномерно расположенные множество (географически элементарных популяций) выявляется четко выраженная широтная изменчивость структуры генофонда населения Центральной России. Это еще раз подтверждает репрезентативность полученных нами ранее данных о характере генетической изменчивости популяций Центральной России и свидетельствует о высокой эффективности фамилий как популяционно генетического маркера.

4. Применение различных критериев отбора частых фамилий для изучения структуры генофонда населения Центральной России При проведении популяционно-генетического исследования населения с использованием данных антропонимики, одной из особенностей этого исследования является большая численность фамилий (до нескольких тысяч или десятков тысяч в больших по численности популяциях), что затрудняет их обработку [Ельчинова Г.И. и др., 1991, 2001;

Балановская Е.В., 2003, 2007]. Кроме этого редкие фамилии исторически случайны и поэтому мало информативны при изучении структуры генофонда [Балановская Е.В. и др., 2007]. С учетом этого исследователи ограничиваются анализом какой-то части фамилий, определив при этом достаточный уровень их частоты с помощью определенного критерия. К настоящему времени в отечественной популяционной генетике применяются три критерия, разделяющие фамилии на редкие и распространенные: “частотный” критерий [Ельчинова Г.И. и др., критерий А.П., 1991];

“территориальный” [Бужилова 1999];

“демографический” критерий [Балановская Е.В. и др., 2007]. Мы, используя полученные в данной работе на основе всех фамилий материалы детального описания популяционно-генетической структуры населения Центральной России в качестве “золотого стандарта”, провели оценку эффективности применения этих критериев отбора частых фамилий при изучении структуры генофонда населения Центральной России. Эффективным считался тот критерий отбора распространенных фамилий, применяя который получали частые фамилии 100% репрезентативно описывавшие как уровень подразделенности населения, так и характер генетических соотношений элементарных популяций между собой (то есть полученные на основе частых фамилий популяционно-генетические данные должны полностью соответствовать результатам по всем фамилиям).

Установлено, что на областном уровне организации популяционной системы Центральной России, представленным множеством рядом расположенных элементарных популяций Белгородской области, корректные популяционно-генетические данные можно получить на основе частых фамилий (табл. 4), отобранных с использованием “демографического” (фамилия встречается в элементарной популяции у 4 и более человек) и “территориального” (фамилия встречается в 5 и более элементарных популяциях) критериев. Данные уровни отбора распространенных фамилий являются: по “демографическому” критерию более “мягким”, чем предложенный в литературе (в работе Е.В. Балановской [2007] в группу частых фамилий относят фамилии, встречающиеся в районе у 5 и более человек), а по “территориальному” критерию – более “жестким” в сравнении с литературными данными (согласно работе Бужиловой А.П. [1999] распространенными являются фамилии, встречающиеся одновременно в 2-х районах). Следует отметить, что “частотный” критерий отбора ЧФ оказался вообще не применим для описания “генетического ландшафта” крупной подразделенной областной популяции юга Центральной России, так как частые фамилии, встречающиеся в элементарной популяции на уровне 0,1% и выше (эта планка отбора предложена Ельчиновой Г.И. [1991]) дают искаженные результаты кластеризация элементарных (изменяется популяций, обусловливающая пересечение эквидистантных фигур в реальном пространстве), а на уровне отбора ЧФ 0,001% и выше, когда наблюдается полное соответствие результатов полученных по ЧФ и по всем фамилиям, как такового отбора распространенных фамилий не происходит – практически во всех рассматриваемых элементарных популяциях (19 из 20) в анализ включается все население.

Таблица Характеристика критериев отбора частых фамилий при популяционно генетическом исследовании населения Центральной России “Эффективные” уровни отбора ЧФ в элементарных Уровень отбора ЧФ, популяциях Центральной России Критерии отбора ЧФ предложенный в Областной уровень Региональный уровень литературе (Белгородская область) (Центральная Россия) Фамилия встречается в Фамилия встречается в районе с частотой 0,1% Не эффективен районе с частотой 0,02% “частотный” [Ельчинова Г.И. и др., и выше 1991] Фамилия встречается в Фамилия встречается в Фамилия встречается в районе у 5 и более человек районе у 4 и более районе у 9 и более “демографический” [Балановская Е.В. и др., человек человек 2007] Фамилия встречается Фамилия встречается в более чем в двух районах Не эффективен пяти и более районах “территориальный” одновременно [Бужилова одновременно А.П., 1999] Для территориально удаленных элементарных популяций Центральной России репрезентативные данные по уровню генетической дифференциации fr и “генетическому ландшафту” элементарных популяций мы получили при использовании распространенных фамилий, отобранных по “демографическому” (фамилия встречается в элементарной популяции у 9 и более человек) и “частотному” (фамилия встречается в элементарной популяции с частотой 0,02% и выше) критериям. При этом на региональном уровне планка отбора частых фамилий по “демографическому” критерию оказалась более “жесткая”, чем на областном уровне и “заработал” “частотный” критерий отбора ЧФ, неэффективный на областном уровне.

Следует отметить, что установленный нами уровень отбора ЧФ по “частотному” критерию (0,02% и выше), позволяющий получать репрезентативные данные по генетическим соотношениям элементарных популяций, значительно более “мягкий” (в пять раз) по сравнению с предложенным в литературе – 0,1% [Ельчинова Г.И. и др., 1991]. Наряду с этим установлено, что частые фамилии, полученные на основе “территориального” критерия отбора (фамилия встречается в 2 и более элементарных популяциях) оценивают уровень случайного инбридинга и лишь в целом описывают “генетический ландшафт” элементарных популяций Центральной России, территориально удаленных друг от друга.

Таким образом, полученные результаты по оценке эффективности использования различных критериев отбора частых фамилий для популяционно-генетического анализа населения Центральной России свидетельствуют о следующем: во-первых, из представленных в литературе критериев отбора ЧФ (“частотный”, “территориальный”, “демографический”) и уровней отбора ЧФ в этих критериях (фамилии встречаются 0,1% и выше при “частотном” критерии [Ельчинова Г.И., 1991], фамилии встречаются одновременно в 2 районах при “территориальном” критерии [Бужилова А.П., 1999], фамилии встречаются у 5 и более человек в районе при “демографическом” критерии [Балановская Е.В. и др., 2007]) лишь “территориальный” критерий “работает” на областном уровне, а “демографический” критерий – на региональном уровне. Исходя из этого можно сделать вывод о том, что проводить корректное сравнение литературных данных по генетическим соотношениям популяций, оцененных с использованием разных критериев отбора ЧФ не представляется возможным. Во-вторых, универсальным критерием отбора ЧФ для популяционно-генетического анализа элементарных популяций Центральной России может являться “демографический” критерий с предложенным нами уровнем отбора распространенных фамилий - “4 и более” (т.е. в анализ должны включаться фамилии, встречающиеся в элементарной популяции у и более человек). Эта планка отбора ЧФ оказалась эффективной как на областном, так и на региональных уровнях (на уровне региона планка отбора ЧФ оказалась даже более “жесткой” – к частым относились фамилии, встречающиеся у 9 и более человек). Для подтверждения данного вывода мы провели еще один анализ – использовали ЧФ, отобранные по данному “демографическому” критерию, для оценки генетических соотношений всех 30 рассматриваемых в нашей работе элементарных популяций Центральной России, т.е. популяций географически неравномерно расположенных по изучаемой территории. Полученные данные (матрица генетических расстояний, дендрограмма, эквидистантные фигуры) демонстрируют полное соответствие “генетического ландшафта” 30 элементарных популяций Центральной России, оцененного по частым фамилиям и по всем фамилиям.

Эти результаты являются дополнительным свидетельством эффективности “демографического” критерия отбора распространенных фамилий (фамилии встречаются в элементарной популяции у 4 и более человек) при популяционно-генетическом исследовании населения Центральной России.

5. Использование средних частот наиболее частых фамилий для прогнозирования уровня подразделенности населения При планировании популяционно-генетических исследований многочисленных подразделенных популяций возникает вопрос: какие “модельные” популяции выбрать для исследования? В группу “модельных” популяций исследователь заинтересован отобрать как генетически своеобразные популяции, позволяющие выявить факторы, определяющие это своеобразие, так и типичные для данного региона популяции. С этой задачей дают возможность эффективно справиться фамилии, которые, по мнению Балановской Е.В. и др. [2007], могут использоваться для “разведочного анализа генофонда при планировании генетических исследований”. Одним из маркеров генетического своеобразия популяции является её уровень внутренней дифференциации или уровень инбридинга.

Согласно полученных нами данных средние частоты самых распространенных фамилий избирателей могут быть использованы для ориентировочной оценки уровня случайного инбридинга среди населения Центральной России (выявление популяций с наибольшим, средним и наименьшим уровнем внутренней подразделенности), а также для прогнозирования уровня случайного инбридинга в конкретной элементарной популяции. Установлено, что изменчивость средних частот 20 наиболее распространенных фамилий в 10 районах Центральной России (0,322% Pi 1,109%) полностью соответствует изменчивости уровня случайного инбридинга fr* в этих популяциях (коэффициент корреляции Спирмена равен =0,98±0,06, p=0,000002). Кроме того выявлено, что районы с наименьшим уровнем внутренней подразделенности (fr* 0,00011) характеризуются и минимальными средними частотами 20 частых фамилий (Pi 0,390%), а районы с наибольшим уровнем случайного инбридинга (fr*0,00076) имеют максимальные средние частоты частых фамилий (Pi 0,876%). Аналогичные данные получены и для 20 районных популяций Белгородской области (табл.5): варьирование средних частот 20 распространенных фамилий (0,351% Pi 1,180%) полностью согласуется с изменчивостью уровня генетической дифференциации населения в этих районах: коэффициент корреляции Спирмена равен =0,95±0,07 (p0,001), а средние частоты 20 ЧФ минимальны (Pi 0,374%) и максимальны (Pi 0,834%) в районах с наименьшим (fr* 0,00009) и наибольшим (fr* 0,00052) уровнем инбридинга, соответственно.

На модели 10 районных популяций Центральной России с использованием регрессионного анализа рассчитано уравнение линейной регрессии, позволяющее прогнозировать уровень случайного инбридинга в элементарной популяции по данным о средних частотах 20 самых частых фамилий. Уравнение имеет следующий вид:

Y=-0,00033+0,11305Х, где Y – прогнозируемое значение случайного инбридинга fr*, а Х – средняя частота 20 наиболее частых фамилий. Следует отметить, очень высокий коэффициент детерминации данной модели, равный R2=0,993, при F(1,7)=1122,0, р=0,000000005, стандартная ошибка оценки данной модели составляет 0,00002. На графике линии, соответствующие границам доверительного интервала, практически совпадают с линией регрессии (рис.8).

Подставляя данные по средней частоте 20 наиболее распространенных фамилий в определенном районе Центральной России можно рассчитать ожидаемый уровень случайного инбридинга в этой элементарной популяции.

Например, в Черемисиновском районе Курской области средняя частота самых частых фамилий составила 0,01109. Подставляя этот показатель в уравнение регрессии, получаем ожидаемый уровень внутренней подразделенности данного района: Y=-0,00033+0,11305х0,01109=0,00092.

Фактический уровень случайного инбридинга в Черемисиновском районе Курской области составляет 0,00092.

Таблица Средние частоты 20 частых фамилий и значения уровня подразделенности в районных популяциях Белгородской области По фамилиям телефонных По фамилиям избирателей абонентов Районные fr* fr* Средняя Средняя популяции частота частота прогнози- прогнози реальный реальный (Pi 20) (Pi 20) руемый руемый Алексеевский 0,00595 0,00028 0,00034 0,00612 0,00030 0, Борисовский 0,00514 0,00022 0,00025 0,00526 0,00027 0, Валуйский 0,00447 0,00015 0,00018 0,00457 0,00016 0, Вейделевский 0,00606 0,00033 0,00035 0,00697 0,00045 0, Волоконовский 0,00515 0,00024 0,00025 0,00521 0,00028 0, Грайворонский 0,00574 0,00029 0,00032 0,00590 0,00037 0, Губкинский 0,00510 0,00019 0,00025 0,00495 0,00017 0, Ивнянский 0,00770 0,00048 0,00054 0,00688 0,00049 0, Корочанский 0,00494 0,00022 0,00023 0,00624 0,00041 0, Красненский 0,01180 0,00125 0,00100 0,01487 0,00174 0, Красногвардейский 0,00465 0,00025 0,00020 0,00488 0,00028 0, Краснояружский 0,00834 0,00052 0,00061 0,00930 0,00073 0, Новооскольский 0,00502 0,00019 0,00024 0,00560 0,00028 0, Прохоровский 0,00681 0,00039 0,00044 0,00887 0,00067 0, Ракитянский 0,00551 0,00029 0,00029 0,00653 0,00041 0, Ровеньской 0,00898 0,00062 0,00069 0,00993 0,00082 0, Старооскольский 0,00374 0,00007 0,00009 0,00325 0,00004 0, Чернянский 0,00544 0,00025 0,00028 0,00673 0,00041 0, Шебекинский 0,00495 0,00016 0,00023 0,00544 0,00022 0, Яковлевский 0,00351 0,00009 0,00007 0,00404 0,00015 0, 0, 0, 0, Fr 0, 0, 0, -0, 0,002 0,003 0,004 0,005 0,006 0,007 0,008 0,009 0,010 0,011 0, средняя частота по 20ЧФ 95% confidence Рис. 8. Регрессионная линия и линии доверительного интервала зависимости уровня подразделенности fr* от средней частоты 20 ЧФ среди населения Центральной России.

Далее была проведена проверка работоспособности этой модели, то есть оценена её устойчивость и эффективность на других наборах данных [Реброва О.Ю., 2006]. Для этого дополнительно к обучающей выборке (то есть на которой происходит построение модели [Реброва О.Ю., 2006] –это районов Центральной России) была сформирована еще одна – экзаменационная выборка (это дополнительно, вновь набранная выборка) – мы включили в нее 20 районов Белгородской области, не вошедших ранее в обучающую выборку. Результаты проверки работоспособности модели представлены в таблице 5. В качестве примера возьмем Ровеньской район Белгородской области, где средняя частота 20 ЧФ составляет 0,00898.

Подставляя этот показатель в уравнение регрессии, получаем ожидаемый уровень инбридинга в данном районе: Y=-0,00033+0,11305х0,00898=0,00069.

Фактический уровень случайного инбридинга в Ровеньском районе Белгородской области равен 0,00062. Следует отметить значительное совпадение реальных и прогнозируемых значений fr* и по другим районам: в Волоконовском районе fr*реальный = 0,00024, а fr*прогнозируемый = 0,00025, в Корочанском районе fr*реальный = 0,00022, fr*прогнозируемый = 0,00023, в Ракитянском районе fr*реальный = fr*прогнозируемый = 0,00029. Коэффициент корреляции Спирмена между реальными и прогнозируемыми значениями fr* составил =0,94±0,08 (p0,001). Полученные результаты свидетельствуют о работоспособности разработанной модели прогнозирования уровня внутренней подразделенности населения по данным о частотах распространенных фамилий и поэтому данная модель может быть рекомендована для использования при популяционно-генетических исследованиях населения Центральной России.

6. Использование фамилий телефонных абонентов при изучении генетической структуры населения Центральной России Одной из задач нашего исследования явилось изучение возможностей использования нового источника информации о фамилиях – списков телефонных абонентов для популяционно-генетического анализа населения Центральной России. Следует отметить, что фамилии телефонных абонентов хорошо зарекомендовали себя в популяционно-генетических исследованиях зарубежных популяций [Barrai I. et all., 2000, 2002;

Legay J.M. et all., 2000;

Branco C.C. et all., 2003;

Rodriguer-Larralde A. et all., 2003].

Установлено, что с использованием телефонных справочников можно получить информацию о 28980 фамилиях среди 186654 телефонных абонентов в 30 районах Центральной России. Удельный вес фамилий телефонных абонентов от числа всех фамилий избирателей составляет на областном уровне – более 50%, а на региональном уровне - около 30%, при этом доля населения, вовлекаемого в анализ в элементарной популяции, в среднем равняется 40% - на областном уровне и 26% на региональном уровне. Следует отметить, что изменчивость количества фамилий и числа анализируемого населения по спискам телефонных абонентов и спискам избирателей полностью согласуется как на областном (коэффициент корреляции Спирмена =0,93±0,08, p0,001), так и на региональном (коэффициент корреляции Спирмена =0,85±0,17 – 0,87±0,16, p0,001) уровнях.

Рассчитанные на основе фамилий телефонных абонентов показатели случайного инбридинга fr* демонстрируют значительную вариабельность в элементарных популяциях как области (0,00007 fr* 0,00174), так и региона (0,00004 fr* 0,00125). Следует отметить, что уровень случайного инбридинга fr* и его изменчивость в 30 элементарных популяциях Центральной России, полученная по фамилиям телефонных абонентов ( f r =0,00047, 0,00004 fr* 0,00174) и избирателей ( f r =0,00034, 0,00002fr*0,00125, коэффициент корреляции Спирмена =0,89±0,08, p0,0001) сопоставимы. Установлено, что фамилии телефонных абонентов, также как и фамилии избирателей, позволяют выявлять значимое влияние степени урбанизации популяции, её численности и миграционной активности на уровень внутренней подразделенности населения. На областном уровне организации популяции коэффициент корреляции Спирмена между числом мигрантов на 1000 жителей и уровнем подразделенности (fr*абоненты) составил =-0,54±0,19 (р0,01). Характер корреляционных взаимосвязей fr с числом фамилий и численностью населения (= -0,6 – -0,9, р0,05–0,001), полученных на основе списков телефонных абонентов и избирателей одинаков. Популяции, имеющие в своем составе урбанизированную зону (город), характеризуются высокой численностью населения и количеством фамилий телефонных абонентов при более низком уровне подразделенности в среднем 0,00036) по сравнению с популяциями, представленными (f r только сельским населением ( f r =0,00081).

При сравнительном анализе “фамильных портретов” телефонных абонентов и избирателей выявлено их соответствие (табл. 6). На областном уровне 9 из 10 частых фамилий телефонных абонентов являются распространенными фамилиями и среди избирателей. На региональном уровне таковых было 7 из 10 фамилий. Обращают на себя внимание сильные положительные коэффициенты корреляции Спирмена между частотами отдельных фамилий (например, Попов, Ковалев и др.) среди телефонных абонентов и избирателей (по десяти наиболее частым фамилиям данный показатель составил на областном уровне =0,63±0,17 – 0,97±0,07, p0,01 0,001, на региональном уровне =0,71±0,22 – 0,95±0,09, p0,05-0,0001).

Выявлены и статистически значимые коэффициенты корреляции между частотами 50 наиболее распространенных фамилий среди избирателей и телефонных абонентов (на уровне области =0,96±0,06, p0,001, на уровне региона =0,67±0,24, p0,001), а также между распределением фамилий телефонных абонентов и избирателей в каждой элементарной популяции (в 20 районах Белгородской области коэффициенты корреляции составили =0,31±0,13 – 0,61±0,11, p0,05-0,001;

в 10 районах Центральной России =0,66±0,11 – 0,99±0,02, p0,001). Эти данные позволяют сделать вывод о том, что спектр и частоты фамилий телефонных абонентов соответствуют “фамильному портрету” избирателей.

Таблица “Фамильные портреты” населения Центральной России (по десяти наиболее частым фамилиям) частота частота частота частота фамилий среди фамилий среди фамилий фамилий фамилий фамилий (избирателей) (избирателей) Номер места Номер места среди среди среди среди абонентов абонентов фамилии спектр избирателей абонентов избирателей абонентов Pix102 Pix102 Pix102 Pix (min – max) (min – max) (min – max) (min – max) Областной уровень Региональный уровень 0,642 0,615 0,525 0, ПОПОВ КУЗНЕЦОВ 1 (1) 1 (1) (0,11-2,06) (0,110-1,473) (0,151–0,982) (0,187-1,200) 0,360 0,501 0,422 0, КОВАЛЕВ НОВИКОВ 2 (3) 2 (2) (0,01-1,42) (0,000-1,954) (0,000-1,020) (0,072-1,311) 0,390 0,425 0,409 0, ШЕВЧЕНКО ПОПОВ 3 (2) 3 (4) (0,07-0,91) (0,104-1,267) (0,022-1,161) (0,000-1,280) 0,341 0,359 0,407 0, НОВИКОВ ЗАЙЦЕВ 4 (4) 4 (5) (0,07-1,69) (0,000-2,074) (0,000-1,184) (0,000-1,160) 0,290 0,317 0,418 0, ГОНЧАРОВ ИВАНОВ 5 (6) 5 (3) (0,08-0,69) (0,000-0,927) (0,209-0,961) (0,193-0,749) 0,280 0,314 0,196 0, КОЛЕСНИКОВ РОМАНОВ 6 (9) 6(27) (0,06-0,60) (0,021-0,891) (0,000-0,510) (0,000-1,337) 0,286 0,312 0,242 0, БОНДАРЕНКО ДРЕМОВ 7 (8) 7(11) (0,01 – 0,83) (0,000-0,924) (0,000-2,299) (0,000-3,279) 0,318 0,292 0,276 0, ИВАНОВ ГОНЧАРОВ 8 (5) 8 (7) (0,08-0,53) (0,000-0,549) (0,000-1,561) (0,000-1,515) 0,287 0,288 0,201 0, ТКАЧЕНКО ТАРАСОВ 9(7) 9(23) (0,05-1,00) (0,038-1,309) (0,000-0,550) (0,000-1,070) 0,252 0,281 0,331 0, ШАПОВАЛОВ МОРОЗОВ 10(11) 10(6) (0,02-0,83) (0,033-0,818) (0,140-0,612) (0,000-0,729) Далее в работе проведен анализ эффективности использования самых частых фамилий телефонных абонентов для оценки уровня инбридинга населения и прогнозирования показателя случайного инбридинга в конкретной элементарной популяции. Установлено, что распределение средних частот двадцати наиболее распространенных фамилий телефонных абонентов имеет сильные положительные коэффициенты корреляции Спирмена с показателем генетической дифференциации населения (fr) как на областном (=0,97±0,05, p0,001 с fr избиратели и =0,90±0,10, p0,001 с fr абоненты), так и на региональном (=0,88±0,15, p0,001 с fr избиратели и =0,86±0,16, p0,001 с fr абоненты) уровнях. Эти данные дают основание использовать 20 наиболее распространенных фамилий телефонных абонентов для ориентировочной оценки уровня подразделенности в популяциях Центральной России с целью выделения “модельных” популяций с высоким, средним и низким уровнем случайного инбридинга.

Используя средние частоты 20 самых распространенных фамилий телефонных абонентов и полученное ранее уравнение регрессии Y= 0,00033+0,11305Х было проведено прогнозирование уровня внутренней подразделенности в отдельных элементарных популяциях (табл.5).

Например, в Борисовском районе Белгородской области фактический показатель fr*абоненты = 0,00027, при этом ожидаемый уровень случайного инбридинга в этой элементарной популяции, рассчитанный по частотам наиболее распространенных фамилий телефонных абонентов составил 0,00026. Значительное совпадение реальных и прогнозируемых оценок fr наблюдается и по другим районам: в Ракитянском районе fr*реальный = fr*прогнозируемый = 0,00041, в Краснояружском районе fr*реальный =0,00073, а fr*прогнозируемый = 0,00072, в Вейделевском fr*реальный =0,00045, а fr*прогнозируемый = 0,00046. Следует отметить, что коэффициенты корреляции Спирмена между реальным и прогнозируемым значением fr*абоненты составили =0,97±0, (p0,001) на областном уровне и =0,99±0,04 (p0,001) на региональном.

Таким образом, можно заключить, что средние частоты 20 наиболее распространенных фамилий телефонных абонентов позволяют эффективно прогнозировать уровень подразделенности в элементарных популяциях Центральной России.

На завершающем этапе нашей работы проведен анализ эффективности использования фамилий телефонных абонентов для оценки генетических соотношений между элементарными популяциями. Обращают на себя внимание высокие статистически достоверные коэффициенты корреляции Спирмена между матрицами генетических расстояний, построенных по фамилиям телефонных абонентов и избирателей (для областного уровня =0,81±0,04, p0,001, для регионального уровня =0,87±0,07, p0,001), а также между средними генетическими расстояниями, полученными по фамилиям телефонных абонентов и избирателей (для области =0,78±0,14, p0,001, для региона =0,83±0,18, p0,01). Анализ “генетического ландшафта” элементарных популяций, оцененного на основе фамилий телефонных абонентов показал, что как на областном, так и на региональном уровнях он в целом соответствует аналогичным данным, полученным по фамилиям избирателей. На уровне области выявляется дифференциация элементарных популяций на четыре самостоятельных кластера (рис.8), соответствующих их территориальному положению и (рис.9) географическим расстояниям между ними - =0,36±0,06 (p0,001);

на уровне региона диагнозцируется дифференциация 30 районных популяций на широтных кластера (рис. 10-11), соответствующих их реальному территориальному положению, географическим расстояниям между ними (=0,36±0,04, p0,001) и данным по иммуно-биохимическим генным маркерам (=0,24±0,11, p0,05).

Таким образом, телефонные справочники являются новым источником получения информации о фамилиях для популяционно-генетического анализа населения Центральной России, а фамилии телефонных абонентов позволяют как корректно оценивать уровень случайного инбридинга среди 4, 3, 3, 2, 2, 1, 1, 0, 0, 22 10 21 14 9 20 8 18 13 17 7 15 12 6 2 16 11 5 4 19 3 Рис. 8. Дендрограмма генетических соотношений двадцати районов Белгородской области, Пристенского района Курской области и Репьевского района Воронежской области (построена методом Уорда по частотам фамилий телефонных абонентов) (пунктирной линией указан уровень выделения значимых кластеров):

1 – Алексеевский, 2 – Борисовский, 3 – Валуйский, 4 – Вейделевский, 5 – Волоконовский, 6 – Грайворонский, 7 – Губкинский, 8 – Ивнянский, 9 – Корочанский, 10 – Красненский, 11 – Красногвардейский, 12 – Краснояружский, 13 – Новооскольский, 14 – Прохоровский, 15 – Ракитянский, 16 – Ровеньской, 17 – Старооскольский, 18 – Чернянский, 19 – Шебекинский, 20 – Яковлевский районы Белгородской области, 21 – Пристенский район Курской области, 22 – Репьевский район Воронежской области.

Рис. 9. Схема генетических соотношений районных популяций Белгородской области, Пристенского района Курской области, Репьевского района Воронежской области (построена по частотам фамилий телефонных абонентов).

5, 4, 4, 3, 3, 2, 2, 1, 1, 0, 0, 29 25 27 28 22 21 23 24 14 9 30 10 26 8 18 13 20 19 17 7 11 5 3 15 12 6 2 16 4 Рис. 10. Дендрограмма генетических соотношений 30 районных популяций Центральной России (построена методом Уорда по частотам фамилий телефонных абонентов ) (пунктирной линией указан уровень выделения значимых кластеров):

1 – Алексеевский, 2 – Борисовский, 3 – Валуйский, 4 – Вейделевский, 5 – Волоконовский, 6 – Грайворонский, 7 – Губкинский, 8 – Ивнянский, 9 – Корочанский, 10 – Красненский, 11 – Красногвардейский, 12 – Краснояружский, 13 – Новооскольский, 14 – Прохоровский, 15 – Ракитянский, 16 – Ровеньской, 17 – Старооскольский, 18 – Чернянский, 19 – Шебекинский, 20 – Яковлевский районы Белгородской области, 21 – Барятинский район Калужская область;

22 – Боровский район Калужская область;

23 – Черемисиновский район Курская область;

24 – Пристенский район Курская область;

25 – Болховский район Орловская область;

26 – Ливенский район Орловская область;

27 – Михайловский район Рязанская область;

28 – Спасский район Рязанская область;

29 – Петровский район Тамбовская область;

30 – Репьевский район Воронежская область.

Московская область Боровск Калуга Рязань 1, Барятино Спасск 1, Калужская Тульская область Рязанская область Михайловский область 1, Болхов 2, Орёл Петровское Липецкая область 2, Орловская область Тамбов 2, Ливны 2, 2, Черемисиново Тамбовская область Курск 1, Курская область Пристень Р епьевка Воронеж 1, 2, Ивня 1,5 Г убкин Ст. Оскол Прохоровка Чернянка Красное 1,0 1, Кр. Яруга Воронежская 1, Строитель 1, Р акитное Короча Н. Оскол область 2,0 1,5 Красногвардейское Борисовка Грайворон Ш ебекино 1,0 Алексеевка Волоконовка Белгород 1,5 Валуй к и Вейделевка 2,0 Р овеньки 2, Рис. 11. Схема генетических соотношений и географического расположения тридцати районных популяций Центральной России (получена на основе распределения фамилий телефонных абонентов).

населения и выявлять значимое влияние на него таких факторов популяционной динамики, как численность населения, его миграционная активность, степень урбанизации популяции, географические расстояния между ними, так и в целом описывать “генетический ландшафт” элементарных популяций Центральной России. Наши результаты соответствуют данным зарубежных исследователей, эффективно использующих фамилии телефонных абонентов при популяционно генетическом исследовании населения Франции [Legay J.M. et all., 2000], Нидерланд [Barrai I. et all., 2002], Ирландии [McEvoy B. et all, 2006], Колумбии [Bedoya G. et all., 2006], США [Barrai I. et all., 2001;

Rodriguez Larralde A. et all., 2007] и др. [Zei G. et all, 2003;

Immel U.D. et all, 2006].

И в заключении, обобщая полученные результаты, можно предложить следующую стратегию использования фамилий для изучения популяционной структуры населения Центральной России:

I. При использовании фамилий для “разведочного анализа генофонда при планировании генетических исследований” оптимальным представляется проведение исследования по следующим этапам:

1) получение данных о фамилиях телефонных абонентов;

2) анализ распределения средних частот 20 наиболее частых фамилий телефонных абонентов во всех подразделениях популяции с целью ориентировочной оценки уровня инбридинга среди населения;

3) определение ожидаемого уровня случайного инбридинга в районах с использованием уравнения регрессии: Y=-0,00033+0,11305Х, на основе средних частот 20 наиболее распространенных фамилий телефонных абонентов;

4) анализ “генетического ландшафта” всех элементарных популяций на основе частот всех фамилий телефонных абонентов (при необходимости оценки генетических соотношений между популяциями);

5) выбор определенных подразделений популяции (например, с высоким, средним и низким уровнем случайного инбридинга, а также с учетом результатов их кластеризации) и анализ генных маркеров (ДНК и классических) в этих подразделениях.

II. При применении фамилий для детального описания популяционно генетической структуры населения. В этом случае оптимальным является следующая последовательность при проведении работ:

1) получение данных о фамилиях избирателей;

2) отбор частых фамилий на основе “демографического” критерия с включением в анализ фамилий, встречающихся в элементарной популяции у 4 и более человек;

3) популяционно-генетический анализ частых фамилий во всех подразделениях популяции (определение уровня случайного инбридинга, “генетического ландшафта” и т.д.);

4) выбор наиболее характерных подразделений популяции и уже в них проведение анализа генных маркеров.

ВЫВОДЫ 1. Охарактеризована популяционно-генетическая структура населения Центральной России по данным антропонимики (59995 фамилий, 30 районов 7 областей, численность населения 1,4 млн. человек). Элементарной популяцией в Центральной России является район. Уровень генетической подразделенности элементарных популяций значительно варьирует (0,00002 fr* 0,00125) и зависит от степени урбанизации популяции, её численности, количества представленных в ней фамилий и интенсивности миграционного притока. Районы, имеющие урбанизованную зону (город), высокий миграционный приток, большую численность населения и количество представленных в них фамилий характеризуются низким уровнем внутренней подразделенности. Районы с высоким уровнем генетической дифференциации отличаются меньшей численностью населения, небольшим числом фамилий, отсутствием урбанизованной зоны и низким миграционным притоком.



Pages:   || 2 |
 




 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.