авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Разработка системы функциональных молекулярно генетических маркеров на основе инсерций alu-ретроэлементов

На правах рукописи

КОМКОВ АЛЕКСАНДР ЮРЬЕВИЧ РАЗРАБОТКА СИСТЕМЫ ФУНКЦИОНАЛЬНЫХ МОЛЕКУЛЯРНО ГЕНЕТИЧЕСКИХ МАРКЕРОВ НА ОСНОВЕ ИНСЕРЦИЙ ALU-РЕТРОЭЛЕМЕНТОВ 03.01.06 Биотехнология (в том числе бионанотехнологии)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата химических наук

МОСКВА – 2012

Работа выполнена на кафедре биотехнологии и бионанотехнологии Московского государственного университета тонких химических технологий имени М. В. Ломоносова и в Лаборатории сравнительной и функциональной геномики Учреждения Российской академии наук Института биоорганической химии имени академиков М. М. Шемякина и Ю. А. Овчинникова РАН

Научный консультант:

академик РАМН, доктор химических наук, Швец Виталий Иванович профессор

Официальные оппоненты:

член-корреспондент РАН, Костров Сергей Викторович доктор химических наук, профессор доктор биологических наук, профессор Брага Элеонора Александровна Центр «Биоинженерия» РАН

Ведущая организация:

Защита диссертации состоится « 12 » марта 2012 г. в 15 ч 00 мин на заседании Диссертационного Совета Д 212.120.01 при Московском государственном университете тонких химических технологий им. М. В. Ломоносова по адресу: 119571, Москва, проспект Вернадского, д. 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, Москва, проспект Вернадского, д. 86). С авторефератом диссертации можно ознакомиться на сайте www.mon.gov.ru

Автореферат разослан « » февраля 2012 г.

Ученый секретарь Диссертационного Совета, кандидат химических наук, старший научный сотрудник А. И. Лютик

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Одной из важнейших задач, стоящих перед современной функциональной геномикой, является поиск молекулярно-генетических факторов, вовлеченных в формирование различных комплексных фенотипов, проявляющихся при нормальных и особенно при патологичных состояниях организма. Наиболее остро стоит вопрос о молекулярных механизмах и факторах, лежащих в основе возникновения и развития социально значимых многофакторных и мультигенных заболеваний.

Типичными представителями таковых являются патологии онкологического профиля.

Согласно современным представлениям, опухолевая трансформация клеток происходит в результате ступенчатого процесса накопления и отбора соматических мутаций. Часть мутаций, не являющихся нейтральными, приводит к активации генов позитивного контроля клеточного деления (онкогенов) и инактивации генов негативного контроля (онкосупрессоров). Такие мутации дают опухолевому клону пролиферативное преимущество перед клетками-предшественниками и соседними здоровыми клетками. В результате происходит бесконтрольный рост и формирование опухолевой ткани, имеющей гетерогенную структуру с одним или несколькими доминирующими клонами.

Несмотря на то, что ведущая роль в малигнизации клеток принадлежит соматическим мутациям, некоторые существующие в популяции аллели онко-значимых генов и их сочетания могут являться факторами предрасположенности к развитию новообразования и иметь прогностическое значение, оказывая влияние на различные стадии патогенеза и определяя, таким образом, путь дальнейшего развития опухоли.

Инсерции ретроэлементов, благодаря сохраняющейся ретропозиционной активности, являются богатым источником новых аллелей генов и одновременно одной из причин возникновения соматического мозаицизма. Инсерционный полиморфизм ретроэлементов считается одним из важнейших факторов вариабельности генома.

Наиболее многочисленной группой ретроэлементов в геноме человека является семейство Alu-повторов. Из более миллиона копий Alu-элементов около представляют собой полиморфные инсерции. Известно 25 de novo-инсерций Alu, участвующих в развитии различных генетических заболеваний. Интеграции в кодирующие области генов разрушают экзоны и приводят к сдвигу рамки считывания.

Подобные инсерции являются причинами возникновения болезни Дента, гемофилии А, наблюдаются при некоторых семейных случаях рака яичников и рака молочной железы.

Ряд интронных инсерций может при созревании транскрипта вызывать пропуск близлежащего экзона, в том числе со сдвигом рамки считывания. С этим явлением связана причина развития синдрома Аперта и нейрофиброматоза. Последовательности Alu-элементов являются сайтами гомологичных рекомбинаций, которые нередко приводят к появлению протяженных делеций, способных захватывать один или несколько экзонов, нарушая целостность генов. Подобные делеции наблюдаются при В руководстве работой и подготовке ее к защите принимал участие заведующий Лабораторией сравнительной и функциональной геномики ИБХ РАН, д.б.н. Лебедев Ю. Б.

Список сокращений: МГМ – молекулярно-генетические маркеры;

ОЛЛ – острый лимфобластный лейкоз;

ПЦР – полимеразная цепная реакция;

ОТ – обратная транскрипция;

SNP – однонуклеотидные полиморфные замены.

таких заболеваниях, как наследственная копропорфирия и дефицит фактора V свертывания крови. Инсерции в интроны и 3'-нетранслируемые области способны менять профили экспрессии соответствующих генов.

Имеются косвенные данные в пользу участия Alu-элементов в опухолевом патогенезе. Показано, что плотность инсерций Alu в известных онкосупрессорах значительно выше, чем в протоонкогенах. Кроме того, при многих онкологических заболеваниях инсерции Alu-элементов оказываются деметилированы. В некоторых случаях это приводит к повышению уровня транскрипции Alu-элементов, что, в свою очередь, может способствовать увеличению частоты соматических ретропозиций Alu.

Ретропозиционная активность, способность модулировать экспрессию генов, а также вовлеченность в процесс опухолевого патогенеза делает «мастер-гены» и некоторые полиморфные инсерции Alu-элементов подходящими объектами для создания на их основе тест-систем для диагностики предрасположенности к онкологическим заболеваниям, прогноза их развития и выбора адекватной терапии. Кроме того, возможности полиморфных Alu-маркеров в области идентификации личности позволяют в перспективе создать представительный набор функциональных молекулярно генетических маркеров, одновременно являющийся генетическим паспортом пациента.

Это является важным шагом в направлении развития персонифицированной медицины.

Актуальной задачей молекулярной биотехнологии в таком контексте становится создание надежной, информативной и методически доступной системы функциональных молекулярно-генетических маркеров, применимой в медицинской практике.

Работа выполнена при финансовой поддержке и в рамках ФЦП «Научные и научно педогогические кадры инновационной России» на 2009-2013 гг. (государственный контракт № 14.740.11.0120), грантов Программы Президиума РАН «Фундаментальные науки – медицине» и РФФИ 11-04-01159а.

Целью работы является создание системы молекулярно-генетических маркеров на основе полиморфных инсерций Alu-элементов для диагностики риска развития острого лимфобластного лейкоза.

Экспериментальные задачи, решаемые для достижения поставленной цели:

разработка биоинформатического алгоритма для идентификации ретропозиционно активных инсерций Alu-ретроэлементов;

биоинформатический поиск полиморфных инсерций Alu-ретроэлементов в интронах генов человека, продукты которых могут являться потенциальными участниками малигнизации кроветворных клеток;

создание системы ПЦР-адаптированных маркеров на основе выбранных инсерций Alu-элементов и сравнительное генотипирование образцов геномной ДНК здоровых доноров и пациентов с острым лимфобластным лейкозом;

сравнительный анализ транскрипции аллельных пар генов в образцах, гетерозиготных по инсерциям Alu-ретроэлементов на уровне первичных транскриптов.

Научная новизна работы. В ходе исследования разработан оригинальный алгоритм для поиска ретропозиционно активных инсерций Alu-элементов, являющихся источником новых наследуемых и соматических инсерций Alu. С помощью данного алгоритма впервые идентифицированы человек-специфичные инсерции «мастер-генов», относящихся к наиболее активно амплифицирующимся семействам AluYa5 и AluYb8.

Подтверждено полиморфное состояние 22 инсерций Alu, впервые определены частоты их встречаемости в популяциях человека. Показан ингибиторный эффект инсерций Alu на транскрипцию генов в нормальных и опухолевых клетках крови.

Впервые показана ассоциация пяти инсерций Alu-элементов с острым лимфобластным лейкозом.

Практической ценностью обладает уникальный набор из 31 молекулярно генетического маркера на основе полиморфных инсерций Alu. Предлагаемый набор адаптирован для задач по идентификации личности, популяционных и медико биологических исследований. 10 маркеров на основе инсерций, имеющих выраженный ингибиторный эффект на транскрипцию генов, применимы в исследованиях патологий кроветворной системы. Пять маркеров могут быть использованы для диагностики предрасположенности к острому лимфобластному лейкозу.

Основные положения, выносимые на защиту:

1. Создание набора МГМ на основе инсерций Alu-ретроэлементов;

2. Сравнительное генотипирование ДНК здоровых доноров и доноров с ОЛЛ;

3. Функциональный анализ Alu-ретроэлементов в лимфоидных клетках.

Апробация работы. Основные результаты работы были доложены на V съезде Вавиловского общества генетиков и селекционеров (Москва, 2009), Московской международной научно-практической конференции «Биотехнология: экология крупных городов» (Москва, 2010) и Международной конференции «Проблемы популяционной и общей генетики» (Москва, 2011).

Публикации. По материалам диссертационной работы опубликовано 3 статьи в рецензируемых журналах, тезисы к 6 научным конференциям.

Структура диссертации. Диссертация изложена на 126 листах машинописного текста, состоит из обзора литературы, результатов и их обсуждения, экспериментальной части, выводов и списка литературы с 270 ссылками;

содержит 21 таблицу, 30 рисунков.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

I. Разработка биоинформатического алгоритма для идентификации ретропозиционно активных копий Alu-ретроэлементов.

Согласно современным представлениям, распространение Alu-элементов по геному происходит за счет небольшого числа ретропозиционно активных копий или «мастер генов». В ходе эволюции одни «мастер-гены» сменялись другими, что привело к возникновению нескольких семейств инсерций Alu. В контексте поиска источников соматического мозаицизма и инсерций de novo интерес представляют, прежде всего, «мастер-гены», чьи копии продолжают распространяться по геному в настоящее время.

Ранее были предложены подходы, позволяющие идентифицировать лишь нуклеотидные последовательности «мастер-генов». В данной части работы рассматривается алгоритм, разработанный для биоинформатической идентификации инсерций Alu, которые могут рассматриваться в качестве современных «мастер-генов».

Минимальными требованиями, предъявляемыми к структурам «мастер-генов», являются нативность внутреннего промотора РНК полимеразы III и наличие достаточно протяженного poly(A)-участка, обеспечивающего эффективное связывание с обратной транскриптазой. Свидетельством эволюционно недавней ретропозиционной активности Alu-элементов является существование видоспецифичных копий Alu. Наибольшее число инсерций Alu, специфичных для генома человека, найдено среди подсемейств AluY:

Ya5, Yb8, Yb9. На присутствие активного «мастер-гена» в составе каждого из этих подсемейств указывает наличие рассеянной в геноме группы идентичных копий, часть из которых представляет полиморфные или de novo инсерции. Одна или несколько инсерций в составе таких групп и является «мастер-геном».

Имеется несколько возможных путей появления в геноме новой группы инсерций, отличающихся от существующих по нуклеотидной последовательности. Для поиска инсерций «мастер-генов» больший интерес представляет путь, предполагающий сохранение ретропозиционной активности структурно измененных аллелей предсуществующей инсерции «мастер-гена». В диплоидном геноме фиксированную инсерцию ретропозиционно активного ретроэлемента можно рассматривать как биаллельный вариант «мастер-гена». Изменение нуклеотидной последовательности «мастер-гена» начинается с появления замены в одном из его аллелей. Мутированный аллель либо закрепляется в популяции, либо из нее элиминируется. В период сосуществования в популяции обоих аллелей мутация, отличающая их нуклеотидные последовательности, интерпретируется как SNP (однонуклеотидная полиморфная замена). Если эта замена не затрагивает функционально значимые участки последовательности «мастер-гена», соответствующий ей аллель останется ретропозиционно активным, и в одной точке генома будут существовать два (или более) структурно отличающихся аллеля «мастер-гена», каждый из которых будет источником новых копий Alu-элементов в геноме. Для идентификации инсерций «мастер-генов», представленых в популяции более чем одним ретропозиционно активным аллелем и имеющих некоторое число «дочерних» копий в геноме, и предназначен описываемый алгоритм (рис. 1).

Инсерции Alu-элементов, рассматриваемые в качестве потенциальных «мастер генов», должны удовлетворять следующим основным критериям: принадлежать к подсемействам Alu, имеющим человек-специфичные инсерций;

входить в состав групп структурно эквивалентных Alu-элементов, часть из которых представлена полиморфными элементами;

должны иметь аллели, совпадающие по структуре с элементами некоторых анализируемых групп, и не должны иметь аллелей c уникальной последовательностью.

Рисунок 1. Алгоритм поиска «мастер-генов». N – количество;

L – длина последовательности;

(1) – (14) – последовательность пошаговых преобразований массива данных;

НП – нуклеотидная последовательность.

Стратегия поиска инсерций «мастер-генов» заключается в последовательном уменьшении массива данных (каждый элемент массива содержит информацию об одной инсерции Alu) за счет удаления групп элементов массива, которые с большой долей вероятности не содержат искомые «мастер-гены».

Алгоритм поиска разбивается на два основных этапа (рис. 1). Первый этап заключается в идентификации нуклеотидных последовательностей «мастер-генов» и формировании кластеров структурно идентичных элементов, содержащих полиморфные элементы. Второй этап представляет собой поиск аллелей Alu-элементов, включенных в состав кластеров, и сравнение структур аллелей потенциальных «мастер-генов» и их вероятных копий. Вывод о принадлежности Alu-элемента к «мастер-генам» делали при наличии у анализируемой инсерции двух или более аллелей, последовательности которых совпадают с таковыми присутствующих в геноме копий Alu, при условии отсутствий инсерций с таким же набором аллелей.

На первом этапе анализа были выбраны подсемейства AluYa5, AluYb8 и AluYb9, включающие наибольшее число человек-специфичных инсерций. Элементы, относимые к этим подсемействам, были отсортированы по их нуклеотидным последовательностям.

Из массива групп полноразмерных элементов, были удалены группы, не содержащие полиморфных элементов. Из числа элементов оставшихся групп были построены диаграммы кластерных сетей (рис. 2). В узлах таких диаграмм находятся группы копий (кластеры) Alu-элементов, имеющих идентичные нуклеотидные последовательности, либо единичные копии Alu. Такие диаграммы графически отображают взаимосвязь групп элементов, входящих в состав семейств и подсемейств Alu и их тонкие структурные отличия.

Рисунок 2. Диаграммы кластерных сетей (Median-Joining Network) молодых семейств Alu. Серые круги – кластеры Alu, диаметр круга пропорционален размеру кластера. Черные точки – Alu-повторы с уникальной нуклеотидной последовательностью. Показаны кластеры, включающие не менее одной полиморфной инсерции.

На втором этапе поиск «мастер-генов» осуществлялся среди элементов кластеров, имеющих в своем составе не менее трех элементов. По базе данных dbSNP были выявлены SNP, картированные внутри нуклеотидных последовательностей анализируемых Alu-элементов. В каждой из пар ближайших по нуклеотидным последовательностям кластеров были выбраны Alu-элементы с SNP в позициях, совпадающих с диагностическими позициями кластеров. Из нового массива Alu элементов были удалены те, в чьих последовательностях картированы дополнительные SNP, позициям которых не соответствовала ни одна из диагностических позиций существующих кластеров. Среди структурно идентичных кандидатных «мастер-генов» с SNP в одинаковых позициях выявить наиболее вероятный «мастер-ген» не представляется возможным, поэтому такие элементы из анализа исключались.

Выбирались только уникальные сочетания последовательности Alu и SNP. В результате было отобрано 12 элементов, удовлетворяющих выставленным критериям поиска «мастер-генов». Таким образом, в ходе анализа было идентифицировано потенциальных «мастер-генов» из семейства AluYa5, 6 из семейства AluYb8. Среди инсерций семейства AluYb9 поиск «мастер-генов» с использованием предложенного алгоритма результатов не дал.

Рисунок 3. Поиск «мастер-генов» по известным аллелям. Черные прямоугольники – инсерции Alu, треугольники – сайты интеграции Alu, белые звездочки – однонуклеотидные замены;

серые круги – кластеры Alu элементов с идентичными нуклеотидными последовательностями (согласно рис. 2).

Интересно отметить, что идентифицированные «мастер-гены» локализованы как в интронах генов, так и в межгенных областях и относятся к наиболее многочисленным группам Alu-элементов соответствующих подсемейств. Однонуклеотидные замены в последовательностях инсерций «мастер-генов» не затрагивают функционально значимые участки Alu и не должны оказывать влияния на ретропозиционную способность соответствующего аллеля «мастер-гена». Длина poly(А)-участка в среднем нуклеотида. Учитывая, что максимум ретропозиционной активности приходится на Alu элементы с poly(A)-участком длиной около 50 нуклеотидов, а Alu-элементы без poly(А) участка в ретропозиции не участвуют, ретропозиционная активность идентифицированных «мастер-генов» должна находиться в области средних значений.

Следствием этого должен быть нейтральный характер инсерций «мастер-генов», что позволило большинству из них фиксироваться в популяции. Тем не менее, повышение уровня транскрипции «мастер-генов» при некоторых патологиях может приводить к увеличению частоты ретропозиций. В таких случаях изменение уровня транскрипции «мастер-гена» относительно нормы может являться одним из диагностических показателей возникшего заболевания.

Таблица 1. Идентифицированные «мастер-гены».

Частота Alu Координаты UCSC (GRCh37/hg19) Локус Ближайший ген SNP Аллели аллелей Ya5 chr6:134453267-134453572 6q23.2 37 т.п.о. до SGK1 rs112393289 T199C 0.50|0. Ya5 chr8:127202492-127202801 8q24.13 752 т.п.о. до TRIB1 rs10093372 G98A 0.75|0. Ya5 chr6:56576608-56576904 6p12.1 Внутри DST rs34255101 T174C 0.50|0. Ya5 chr8:70753546-70753852 8q13.3 6 т.п.о. до SLCO5A1 rs13266545 T89C 0.67|0. Ya5 chr4:123299160-123299469 4q27 650 п.о. до ADAD1 rs10031286 G237C 0.50|0. Ya5 chr13:45523335-45523635 13q14.12 Внутри NUFIP1 rs112313525 T79C 0.50|0. Yb8 chr21:39092996-39093309 21q22.13 Внутри KCNJ6 rs56329555 T259C 0.50|0. Yb8 chr2:188239718-188240025 2q32.1 Внутри CALCRL rs4482438 T92C 0.33|0. Yb8 chr6:38326546-38326846 6p21.2 Внутри BTBD9 rs13206261 T268C 0.67|0. Yb8 chr6:102311731-102312039 6q16.3 Внутри GRIK2 rs6914919 T144C 0.33|0. Yb8* chr13:70861683-70861997 13q21.33 179 т.п.о. до KLHL1 rs111232413 G211A 0.50|0. Yb8 chr3:90033878-90034191 3p11.1 503 т.п.о. до EPHA3 rs112263293 T230C 0.50|0. Обозначения: «UCSC» - геномный браузер (http://genome.ucsc.edu/);

«rs» (reference SNP) – идентификационный номер по базе данных dbSNP;

цифра в обозначении аллелей – положение SNP относительно начала Alu-повтора;

* - полиморфная инсерция.

Для проверки возможности идентифицированных «мастер-генов» выступать в качестве источника соматического мозаицизма при остром лимфобластном лейкозе была разработана система для анализа транскрипции одного из «мастер-генов» семейства AluYa5. Объектом анализа был выбран «мастер-ген» в локусе 6q23.2 (табл. 1). В качестве контроля была использована инсерция с идентичной структурой, не являющаяся «мастер-геном», локализованная вне известных генов.

Рисунок 4. Анализ транскрипции «мастер-гена». (а) – схема ОТ-ПЦР. Черные прямоугольники – инсерция Alu и ее фрагменты, белые звездочки – уникальные замены, соответствующие 3'-концевым нуклеотидам праймеров, надписи в овалах сверху – номера этих позиций относительно первого нуклеотида Alu и символы соответствующих нуклеотидов;

белый треугольник – сайт интеграции Alu;

серые горизонтальные стрелки – положения праймеров. (б) – электрофореграммы продуктов ОТ-ПЦР. Обозначения дорожек: М – маркер длин ДНК 100 п.о. (Сибэнзим, Россия);

кДНК – продукты амплификации фрагментов кДНК;

ДНК – продукты амплификации фрагментов геномной ДНК;

Н2О – отрицательный контроль;

8b, 12b, 9b – номера образцов ОЛЛ (даны по табл. 2);

стрелками слева показаны длины фрагментов ДНК из некоторых полос маркера;

черными треугольниками справа показаны положения ожидаемых продуктов амплификации;

вертикальная стрелка указывает на полосу, соответствующую продукту амплификации кДНК транскрипта анализируемого Alu элемента;

MG-267 – анализируемый «мастер-ген» (координаты UCSC: chr6:134453267-134453572);

MG- – «контрольная» инсерция Alu (координаты UCSC:

chr3:137477973-137478273).

Анализ проводили методом ОТ-ПЦР. Амплификацию кДНК осуществляли при помощи стратегии nested ПЦР с двумя парами праймеров (рис. 4). В ходе ОТ-ПЦР была показана способность рассматриваемой копии Alu-повтора транскрибироваться в отдельных образцах мононуклеарных клеток крови при остром лимфобластном лейкозе.

Измерение уровня транскрипции анализируемой копии Alu совместно с уровнем экспрессии гена обратной транскриптазы LINE может использоваться для оценки степени ретропозиционной активности Alu и иметь прогностическое значение.

Предложенный алгоритм может быть реализован в программном коде и использоваться для поиска инсерций потенциальных «мастер-генов» различных семейств и подсемейств Alu-элементов, ретропозиционно активных как в герминальных, так и в соматических линиях клеток.

II. Создание функциональных молекулярно-генетических маркеров.

Одними из самых распространенных онкологических заболеваний у детей являются острые лейкозы. На их долю приходится до 20 % от всех злокачественных новообразований, возникающих у детей. Частота лейкозов достигает 4 случаев на детского населения до 14 лет. Пик заболевания приходится на возраст от 2 до 5 лет.

Термином острые лейкозы объединяют группу неопластических заболеваний гематопоэтической системы, имеющих клональную природу. Субстрат опухоли представлен потомками одной активно пролиферирующей перерожденной бластной клетки кроветворной системы, утратившей способность к дальнейшей дифференцировке. Первично поражается костный мозг. Развитие заболевания сопровождается вытеснением опухолевыми клетками здоровых форменных элементов крови и инфильтрацией различных органов и тканей, прежде всего, центральной нервной системы. Принадлежность бластов к той или иной линии гематопоэза, степень их дифференцировки обусловливают клиническое течение и прогноз острого лейкоза.

Целью данной части работы является поиск среди полиморфных инсерций Alu ретроэлементов возможных функциональных участников малигнизации кроветворных клеток при остром лимфобластном лейкозе (ОЛЛ).

Особенности подхода к функциональному анализу.

Был проведен функциональный анализ инсерций «молодых» Alu-ретроэлементов при остром лимфобластном лейкозе у детей. Исследовалось влияние интронных инсерций Alu-элементов на экспрессию содержащих их аллелей генов и возможное участие некоторых из таких инсерций в развитии лейкоза. Для функционального анализа применялся подход, использующий явление инсерционного полиморфизма и заключающийся в попарном сравнении количеств первичных транскриптов двух аллелей генов в гетерозиготном состоянии. Наиболее корректно оценить влияние инсерции ретроэлемента на соотношение количеств транскриптов аллелей удается в одноядерных клетках с диплоидным кариотипом. В таких клетках соотношения аллелей генов эквивалентны, и количества первичных транскриптов обоих аллелей в отсутствие импринтинга должны находиться на одинаковом уровне. Поэтому возникающие отличия в представленности транскриптов аллелей должны являться, прежде всего, следствием присутствия или отсутствия инсерции Alu.

В работе были использованы фракции одноядерных клеток периферической крови здоровых доноров, а также периферической крови и пунктата костного мозга пациентов с острым В-лимфобластным лейкозом.

В табл. 2 приведены некоторые характеристики использованных в исследовании образцов крови пациентов с ОЛЛ. Все образцы представляют собой В-II-вариант острого лимфобластного лейкоза (ОЛЛ общего типа). Возраст доноров от 1.5 до 12 лет, количество лейкоцитов в крови от 1 до 65 млн./мл, содержание среди них лимфобластов от 28 до 96 %. Для всех образцов был проведен анализ наличия транскриптов химерных генов, наиболее характерных для лейкозов: BCR/ABL, MLL/AF4, TEL/AML1, E2A/PBX. В 8 из 17 образцов обнаружен транскрибирующийся химерный ген TEL/AML1 (табл. 2).

Таблица 2. Характеристики образцов В-II подтипа ОЛЛ.

№ образца 1b 2b 3b 4b 5b 6b 7b 8b 9b 10b 11b 12b 13b 14b 15b 16b 17b TEL/AML1 н + + н + нн++н н ++ н + н н Пол м ж ж ж м жмжм м ммм жм ж м Возраст. лет 12 6 4 11 2 5 12 3 3 1.5 8 3 3 4 2.5 5 Лейкоциты. млн./мл 30 5.6 47.7 1.6 65.8 5.4 3.3 8.4 10 18.8 0.9 6.3 48 37.8 6.6 10.9 Лимфобласты в крови. % 38 НД 55 НД 89 85 НД 96 28 93 НД 81 83 НД 78 90 НД Обозначения: генотипы по локусу TEL/AML1 «н» - норма, «+» - наличие хромосомной перестройки и химерного гена TEL/AML1;

НД – детекцию не проводили.

Разработка системы молекулярно-генетических маркеров Молекулярно-генетические маркеры (МГМ) должны обладать двумя принципиальными характеристиками: уникальной нуклеотидной последовательностью, позволяющей точно маркировать определенный участок хромосомы, и каким-либо элементом меж- или внутривидовой вариабельности (однонуклеотидные полиморфные замены, мини- и микросателлиты, полиморфные инсерции ретроэлементов и др.). Такие маркеры находят широкое применение в популяционных исследованиях, используются для определения отцовства и генетической паспортизации населения. Поиск ассоциаций с различными фенотипами, в том числе с моно- и полигенными заболеваниями, а также функциональный анализ МГМ позволяют значительно повысить информативность маркеров и расширить области их применения в таких направлениях, как выявление предрасположенности и ранняя диагностика заболеваний, выбор стратегии лечения и др.

В настоящей работе исследовались МГМ на основе полиморфных инсерций Alu ретроэлементов. Полиморфные инсерции, характеризующиеся значимыми различиями частот встречаемости у здоровых доноров и пациентов с ОЛЛ могут обладать существенным прогностическим значением и рассматриваться в качестве одного из факторов предрасположенности к развитию ОЛЛ. Потенциальная способность таких инсерций модулировать экспрессию генов делает их возможными участниками процесса малигнизации кроветворных клеток.

Поиск полиморфных инсерций осуществлялся с помощью геномного браузера UCSC (http://genome.ucsc.edu) и специализированных баз данных dbRIP (http://dbrip.org) и PRED (http://labcfg.ibch.ru/home.html), где суммирована актуальная информация, касающаяся теоретически предсказанных и экспериментально подтвержденных полиморфных инсерций ретроэлементов. Важными характеристиками полиморфных инсерций являются геномная локализация, классификационная принадлежность к подсемействам и среднепопуляционная частота встречаемости (табл. 3, рис. 5).

Рисунок 5. Положение анализируемых инсерций Alu на хромосомах. Черные стрелки - инсерции, находящиеся в полиморфном состоянии в исследуемых выборках, серые стрелки – инсерции, полиморфное состояние которых не было подтверждено в исследуемых группах индивидов. Надписи напротив стрелок – аббревиатуры соответствующих генов.

Из более чем 2000 полиморфных инсерций Alu в геноме человека около локализованы в интронах генов, экспрессирующихся в различных органах и тканях.

Более 100 генов, несущих в интронах полиморфные инсерции Alu-элементов, имеют достаточно высокий уровень транскрипции в периферической крови (рис. 6). Из этого набора генов были выбраны те, продукты которых могут являться потенциальными участниками малигнизации клеток гематопоэтической системы. Белковые продукты отобранных генов (табл. 6) являются участниками различных, преимущественно регуляторных, внутриклеточных процессов и включают факторы транскрипции и ферменты различных классов (киназы, фосфатазы, GTP-азы).

С использованием методов биоинформатики были проанализированы относительные уровни экспрессии выбранных генов в лейкоцитах (рис. 6). Учитывая полученные результаты и данные о клеточном составе фракции одноядерных клеток крови, следует отметить, что основной вклад в уровень транскрипции генов HPSE и DSE вносит их транскрипция в моноцитах;

количество транскриптов гена RASGRP3 определяется его активностью в B-клетках;

транскрипция генов TARBP1, MAP3K7, NLRP1 и SOS осуществляется преимущественно в Т-клетках, гена RRAS2 – в В- и NK-клетках, гена TIAM1 – в Т-клетках и моноцитах, гена MEF2C – в В-клетках и моноцитах. Остальные из рассматриваемых нами генов транскрибируются на высоком уровне в трех и более типах одноядерных лейкоцитов.

Рисунок 6. Относительный уровень транскрипции генов в отдельных типах лейкоцитов. По оси ординат приведено отношение A/B x 100%, где А – средний уровень транскрипции гена в определенном типе клеток (обозначение типов приведено в нижней части рисунка), В - в лейкоцитарной фракции крови в целом. Данные об уровнях транскрипции генов получены из http://www.uniprot.org/ и http://biogps.org.

В табл. 6 суммированы основные характеристики 31 из 53 созданных в настоящей работе МГМ. Каждый маркер представляет собой пару уникальных интронных праймеров, фланкирующих сайт интеграции полиморфной инсерции Alu. Большая часть инсерций принадлежит «молодым» подсемействам: AluYa5, AluYb8 и AluYb9. Все инсерции полноразмерные, оканчиваются poly(А)-последовательностью и фланкированы короткими прямыми повторами;

локализованы в интронах на разном расстоянии от точки начала транскрипции, в прямой или обратной ориентации относительно направления транскрипции гена.

Таким образом, была создана первая версия системы МГМ, в которую вошли ПЦР-адаптированных маркера на основе полиморфных инсерций Alu-ретроэлементов в 51 гене (49 генов с одной инсерцией, гены MEF2C и BRCA2 - с двумя).

Определение аллельного состояния генов Отличительной особенностью генома каждого индивида (за исключением однояйцевых близнецов) является наличие уникального набора аллелей полиморфных локусов. На этом свойстве базируются современные системы идентификации личности и установления родства. Биаллельные маркеры на основе полиморфных инсерции Alu элементов, наряду с широко используемыми в настоящее время микросателлитами и однонуклеотидными полиморфными заменами, также могут успешно применяться для этих целей, обладая при этом рядом конкурентных преимуществ. Во-первых, для каждого Alu-маркера заранее известен предковый аллель (не содержащий инсерцию), что делает маркеры такого типа незаменимыми в филогенетических исследованиях. Во вторых, инсерции Alu обладают достаточно высокой стабильностью в геноме, обусловленной отсутствием специфических механизмов удаления инсерции из сайта интеграции. В связи с этим, можно считать, что частота встречаемости аллелей и распределение генотипов является отражением генетических процессов, происходящих в популяции. В-третьих, Alu-маркеры имеют преимущества технического характера, к которым относится низкая стоимость, методическая простота и возможность автоматизации анализа.

Рисунок 7. Генотипирование образцов геномной ДНК. (а) – схема локус специфичной ПЦР. Белые прямоугольники с надписью Экз – экзоны, черные прямоугольники – инсерции Alu, белый треугольник – сайт интеграции Alu, серые стрелки – положения праймеров. (б) – электрофореграмма продуктов ПЦР-амплификации ДНК.

Обозначения дорожек: М – маркер длин ДНК (Сибэнзим, Россия), генотипы:

«+/+» - оба аллеля содержат инсерцию, «+/-» - один из аллелей содержит инсерцию, «-/-» - оба аллеля без инсерции. Стрелками в правой части обозначены положения продуктов амплификации обоих аллелей. Стрелки слева показывают длины фрагментов ДНК из некоторых полос маркера.

На данном этапе работы было проведено исчерпывающее генотипирование образцов геномной ДНК двух выборок доноров по 53 Alu-маркерам. Обе выборки были составлены из образцов геномной ДНК представителей городского населения московского региона. Первая (контрольная) выборка формировалась из группы взрослых доноров, не имевшие в детстве онкологических заболеваний крови, вторая (целевая) из детей с диагнозом острый В-лимфобластный лейкоз общего типа. На основе результатов генотипирования были установлены генотипы индивидов из обеих групп доноров и рассчитаны частоты встречаемости Alu-содержащих аллелей генов.

В контексте решения задач по идентификации личности наибольшей информативностью обладают инсерции со значениями среднепопуляционных частот встречаемости в пределах от 0.25 до 0.75. Среди исследованных 53 маркеров подобными значениями частот встречаемости обладают 24 маркера.

Таблица 3. Генотипы здоровых доноров по присутствию/отсутствию инсерции Alu в интронах генов.

Частота 1a 2a 3a 4a 5a 6a 7a 8a 9a 10a 11a 12a 13a 14a 15a Alu (2) Ген Локус (1) М Ж Ж М Ж Ж М М М М Ж М М Ж Ж MEF2C 5q14.3 Yb8 -/- -/- -/- +/- -/- -/- -/- +/- -/- +/- -/- -/- -/- -/- +/- 0. MEF2C 5q14.3 Ya5 -/- -/- -/- +/- -/- +/- -/- +/- -/- +/- -/- +/- +/- -/- +/- 0. PHF21A 11p11.2 Ya5 +/- -/- +/- +/- +/+ +/+ +/+ +/+ +/- +/- +/- +/+ +/+ +/- +/+ 0. TAX1BP1 7p15.2 Yb8 -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- 0. RAB1A 2p14 Yd2 +/+ +/+ +/- +/+ +/- +/+ +/- +/- +/- +/- +/- +/- +/- -/- +/- 0. PTPRA 20p13 Y -/- -/- +/- +/+ -/- +/- -/- -/- -/- -/- -/- +/- -/- -/- -/- 0. SOS1 2p22.1 Ya4b +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ 1. RABL3 3q13.33 Yb8 +/+ -/- -/- -/- -/- +/- -/- -/- +/- -/- -/- -/- -/- -/- +/- 0. HPSE 4q21.23 Ya5 +/- -/- +/- +/- -/- -/- -/- +/- +/- -/- +/+ -/- +/- +/- +/- 0. ANP32B 9q22.33 Ya5 -/- +/- +/+ +/- +/+ -/- +/- +/- +/- +/+ +/+ +/+ +/- -/- +/- 0. PKD1L1 7p12.3 Ya5 +/+ +/- +/- +/- +/- +/+ +/- +/+ +/- +/- +/+ +/- +/- +/- +/+ 0. RSRC2 12q24.31 Ya5 +/- +/- -/- +/+ +/- -/- -/- +/+ +/- -/- +/- +/- -/- -/- +/- 0. GSPT1 16p13.13 Ya5 +/+ +/- +/- +/+ +/+ +/- +/- +/- +/+ +/+ +/- +/+ -/- +/- +/- 0. DSE 6q22.1 Y -/- -/- +/- -/- -/- -/- -/- +/- -/- +/- -/- +/+ +/- +/+ +/- 0. AF4 4q21.3 Y -/- +/- +/- +/- +/- +/- +/+ +/- -/- -/- +/- +/+ +/- +/+ +/+ 0. AGPS 2q31.2 Yb8 +/- +/+ +/+ +/+ -/- +/+ +/+ -/- +/- +/+ +/+ +/- +/+ +/- -/- 0. EIF2C3 1p34.3 Ya5 -/- +/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- -/- 0. NLRP1 17p13.2 Yb8 +/- +/- -/- +/+ +/+ -/- +/- +/- +/- +/- +/- +/- +/- +/+ +/- 0. TIAM1 21q22.11 Yb8 -/- +/- -/- -/- -/- -/- -/- -/- -/- -/- +/- -/- +/- -/- +/- 0. RASGRP3 2p22.3 Yb8 +/- +/+ +/+ +/- +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/- +/+ +/- 0. RRAS2 11p15.2 Ya5 +/- -/- +/- -/- -/- -/- -/- -/- -/- -/- +/- -/- +/- +/- -/- 0. MAP3K7 6q22.31 Yc1 +/- +/- -/- -/- -/- +/- +/- +/+ -/- +/- +/- +/+ +/- -/- +/- 0. TARBP1 1q42.2 Ya5 -/- +/- +/+ -/- +/- +/- +/+ +/+ +/- +/- +/- -/- +/- +/+ +/- 0. SNTB1 8q24.12 Yb8 +/- -/- +/+ +/+ +/- +/+ +/+ -/- +/+ -/- +/- -/- +/- +/+ +/- 0. STK38L 12p11.23 Ya5 -/- -/- -/- -/- -/- -/- -/- +/+ -/- -/- -/- +/- -/- +/- -/- 0. PTPN2 18p11.21 Yb8 -/- -/- -/- -/- -/- -/- +/- -/- +/- -/- +/- +/- +/- -/- -/- 0. PITPNC1 17q24.2 Yb8 +/- -/- +/- +/+ -/- -/- -/- -/- +/- +/- -/- -/- -/- -/- +/+ 0. CNOT4 7q33 Ya5 +/+ +/- +/+ +/- +/+ +/+ +/- -/- +/+ +/- +/+ +/+ +/+ +/+ +/+ 0. IL1RAP 3q28 Ya5 +/+ +/- +/- -/- +/- +/- -/- +/- +/- +/- +/+ +/- +/+ -/- +/- 0. RAB2A 8q12.1 Ya4 +/- -/- +/- +/+ +/- -/- -/- -/- -/- -/- -/- -/- -/- -/- +/+ 0. NRP1 10p11.22 Yb8 +/+ +/+ +/+ +/- +/+ -/- +/- +/- +/+ +/- +/+ +/+ +/- +/- +/- 0. SYT17 16p12.3 Yb9 -/- -/- -/- -/- +/- -/- -/- +/+ +/- -/- -/- +/- +/- -/- -/- 0. MAX 14q23.3 Ya5 +/+ +/+ +/+ +/- +/+ +/+ +/+ +/+ +/+ +/+ +/- +/+ +/+ +/+ ?/? 0. PLA2R1 2q24.2 Ya5 -/- -/- +/- +/- -/- +/- +/- +/- -/- -/- -/- -/- -/- -/- -/- 0. PCGF6 10q24.33 Ya5 +/- +/- +/- -/- -/- +/- +/+ -/- +/- -/- +/+ +/+ +/+ -/- +/- 0. ERBB2IP 5q12.3 Ya5 -/- -/- +/- +/- +/- +/- -/- +/- -/- -/- -/- -/- +/- -/- +/+ 0. RPN2 20q11.23 Ya5 -/- +/- -/- +/- -/- +/- -/- -/- +/- +/- -/- -/- -/- -/- +/- 0. CDC2L1 1p36.33 Ya3 +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- 0. + Обозначения: (1) – семейство Alu-элементов;

(2) – частота встречаемости Alu -аллелей в группе доноров;

М – мужчина, Ж – женщина;

«+/+» – оба аллеля содержат инсерцию Alu, «+/-» – один из аллелей содержит инсерцию, «-/-» – оба аллеля не содержат инсерцию.

Таблица 4. Генотипы пациентов с ОЛЛ по присутствию/отсутствию инсерции Alu в интронах генов.

Частота 1b 2b 3b 4b 5b 6b 7b 8b 9b 10b 11b 12b 13b 14b 15b 16b 17b Alu (2) Ген Локус (1) М Ж Ж Ж М Ж М Ж М М М М М Ж М Ж М MEF2C 5q14.3 Yb8 -/- +/- +/- +/- -/- -/- +/+ -/- +/- -/- -/- +/- +/+ +/- +/- +/+ +/- 0. MEF2C 5q14.3 Ya5 -/- +/+ +/- +/- -/- +/- +/+ -/- +/- -/- -/- +/- +/+ +/- +/- +/+ +/+ 0. PHF21A 11p11.2 Ya5 -/- +/+ +/- -/- +/+ -/- -/- -/- +/- +/- +/- +/+ +/- +/+ +/- -/- -/- 0. TAX1BP1 7p15.2 Yb8 +/- -/- -/- +/- -/- +/- -/- -/- -/- -/- -/- -/- -/- -/- -/- +/- +/- 0. RAB1A 2p14 Yd2 +/+ -/- +/+ +/+ +/+ +/+ +/- +/+ +/+ +/+ +/+ +/- +/+ +/+ +/- +/+ +/- 0. PTPRA 20p13 Y +/+ +/- +/- -/- +/- +/- -/- +/- -/- +/+ +/+ -/- +/- -/- -/- -/- -/- 0. SOS1 2p22.1 Ya4b +/- +/+ +/+ +/+ +/+ +/- +/+ +/+ +/- +/+ +/+ +/+ +/+ +/+ +/+ +/+ +/+ 0. RABL3 3q13.33 Yb8 +/+ +/- +/- -/- -/- +/- +/- -/- +/- -/- +/- -/- -/- +/- -/- +/- -/- 0. HPSE 4q21.23 Ya5 +/+ -/- -/- +/- +/- -/- -/- -/- +/- -/- -/- -/- -/- +/- -/- +/- -/- 0. ANP32B 9q22.33 Ya5 -/- -/- +/+ +/- +/- +/+ -/- +/- -/- -/- -/- +/- +/- +/- +/+ +/- +/- 0. PKD1L1 7p12.3 Ya5 +/+ +/+ -/- -/- +/- +/+ +/+ +/+ +/- +/+ +/+ +/+ +/+ +/+ +/- +/+ +/+ 0. RSRC2 12q24.31 Ya5 -/- +/- +/- +/- +/- +/- +/+ -/- -/- +/- -/- -/- -/- -/- -/- -/- +/- 0. GSPT1 16p13.13 Ya5 +/- +/+ +/- +/+ +/- +/+ +/- -/- +/- -/- +/+ -/- +/- +/+ +/+ -/- +/+ 0. DSE 6q22.1 Y +/- +/- -/- -/- -/- +/- -/- -/- -/- +/- -/- -/- +/- +/- -/- +/- -/- 0. AF4 4q21.3 Y +/- -/- -/- +/- -/- ?/? +/+ +/- +/- +/+ -/- +/- +/+ -/- -/- -/- +/- 0. AGPS 2q31.2 Yb8 +/+ -/- +/+ +/+ +/+ ?/? ?/? ?/? +/+ +/+ -/- -/- +/+ -/- +/- -/- ?/? 0. EIF2C3 1p34.3 Ya5 -/- -/- -/- +/- -/- -/- -/- +/- -/- -/- -/- +/- -/- -/- -/- -/- -/- 0. NLRP1 17p13.2 Yb8 +/- +/- +/- -/- +/+ -/- +/- +/+ -/- +/- -/- -/- -/- +/- +/+ +/+ +/- 0. TIAM1 21q22.11 Yb8 -/- -/- -/- -/- -/- -/- +/- -/- -/- -/- -/- +/- -/- -/- -/- +/- -/- 0. RASGRP3 2p22.3 Yb8 +/+ +/+ +/- +/+ +/- +/+ +/+ +/+ +/- +/+ +/+ +/+ +/+ +/+ +/+ -/- +/- 0. RRAS2 11p15.2 Ya5 -/- -/- -/- +/- +/- +/- -/- -/- +/- -/- -/- +/- -/- +/- +/- -/- -/- 0. MAP3K7 6q22.31 Yc1 +/- -/- -/- -/- +/- -/- +/- ?/? -/- +/+ ?/? -/- +/- +/- +/+ -/- +/- 0. TARBP1 1q42.2 Ya5 -/- +/+ -/- +/+ +/+ -/- +/+ -/- +/- +/- +/- +/+ +/+ +/+ +/- +/- +/- 0. SNTB1 8q24.12 Yb8 -/- +/- +/- +/+ +/- +/- +/- -/- +/+ +/- +/- +/+ +/- +/- +/- +/- +/+ 0. STK38L 12p11.23 Ya5 -/- -/- -/- -/- -/- +/- -/- -/- -/- -/- +/- +/+ -/- -/- -/- +/- -/- 0. PTPN2 18p11.21 Yb8 -/- +/+ -/- +/- -/- -/- +/- -/- -/- -/- -/- +/- ?/? -/- -/- -/- -/- 0. PITPNC1 17q24.2 Yb8 -/- +/- -/- -/- +/- -/- -/- +/+ +/- +/- +/- -/- -/- -/- -/- +/- +/- 0. CNOT4 7q33 Ya5 +/+ +/+ +/+ +/+ +/+ +/- -/- +/+ +/+ +/- +/- +/- +/+ -/- +/+ +/- +/+ 0. IL1RAP 3q28 Ya5 +/+ +/- +/- +/- +/- +/- +/+ -/- +/- +/- -/- -/- +/+ +/- +/- +/- +/- 0. RAB2A 8q12.1 Ya4 +/- +/- -/- -/- +/+ +/- -/- +/- -/- -/- +/- -/- -/- -/- -/- +/- +/- 0. NRP1 10p11.22 Yb8 +/+ -/- +/+ +/+ +/+ +/- +/+ +/- -/- +/+ +/+ +/- -/- +/- +/+ +/+ +/+ 0. SYT17 16p12.3 Yb9 -/- +/- +/- -/- +/- -/- -/- +/- -/- -/- -/- -/- -/- -/- -/- +/- +/- 0. MAX 14q23.3 Ya5 +/+ +/- +/+ +/+ +/+ +/+ +/+ +/- +/+ +/+ ?/? +/- +/+ +/+ +/+ +/+ +/+ 0. PLA2R1 2q24.2 Ya5 +/- -/- -/- -/- -/- ?/? -/- -/- +/+ -/- -/- -/- -/- -/- -/- +/- +/- 0. PCGF6 10q24.33 Ya5 -/- +/+ -/- -/- -/- ?/? +/+ +/- -/- +/+ -/- -/- ?/? +/+ +/- -/- +/- 0. ERBB2IP 5q12.3 Ya5 -/- -/- -/- -/- -/- ?/? ?/? ?/? +/- -/- -/- -/- +/- -/- ?/? -/- +/- 0. RPN2 20q11.23 Ya5 +/- -/- +/- -/- -/- -/- +/+ -/- -/- -/- -/- -/- -/- -/- -/- +/+ -/- 0. CDC2L1 1p36.33 Ya3 +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- +/- 0. + Обозначения: (1) – семейство Alu-элементов;

(2) – частота встречаемости Alu -аллелей в группе доноров;

М – мужчина, Ж – женщина;

«+/+» – оба аллеля содержат инсерцию Alu, «+/-» – один из аллелей содержит инсерцию, «-/-» – оба аллеля не содержат инсерцию.

Эти маркеры в дальнейшем могут быть использованы в качестве основы для создания набора интронных МГМ для идентификации личности. 14 других маркеров имеют частоты в пределах от 0 до 0.25 и от 0.75 до 1 (не включая 0 и 1). Эти маркеры имеют меньшую индивидуализирующую способность, но при этом могут представлять интерес для популяционных исследований, поскольку аллели с одними из них недавно появились в смешанной популяции московского региона, с другими – давно и близки к фиксации в геномах индивидов. Оставшиеся 15 маркеров характеризуются в обеих выборках частотами встречаемости, равными либо 1, либо 0. Маркеры из этой группы полностью лишены индивидуализирующей способности в исследуемых выборках.

На основе первых двух групп маркеров была создана вторая версия системы МГМ, включающая 38 полиморфных инсерций. Для каждой из них было проведено сравнение частот встречаемости Alu-содержащих аллелей в геномах доноров из целевой и контрольной групп. 33 инсерциям в обеих выборках соответствуют близкие значения частот встречаемости (p-value 0.05). Различия частот встречаемости 5 инсерций в генах (MEF2C, TAX1BP1, RAB1A и PHF21A) в выборках здоровых доноров и пациентов с ОЛЛ могут рассматриваться как значимые (p-value0.05) (табл. 6) и иметь диагностическое значение.

5 последних и 5 дополнительных маркеров были использованы для генотипирования образцов геномной ДНК представителей четырех этнических групп населения России.

На основе полученных результатов были установлены генотипы индивидов и рассчитаны частоты встречаемости Alu-содержащих аллелей в каждой из четырех рассматриваемых этнических групп (табл. 3). По две инсерции (из ассоциированных с ОЛЛ) в двух этнических группах (MEF2C-Yb8 и PHF21A-Ya5 в группе калмыков, TAX1BP1-Yb8 и RAB1A-Yd2 в группе украинцев) имеют частоты, сопоставимые с соответствующими частотами в выборке пациентов с ОЛЛ. Наблюдаемые результаты могут свидетельствовать о повышенном риске развития ОЛЛ у калмыков и украинцев, по сравнению с мордвой и коми. Сопоставление данных молекулярно-генетических и эпидемиологических исследований в дальнейшем может внести значительный вклад в понимание особенностей патогенеза онкологических заболеваний.

+ Таблица 5. Частоты Alu -аллелей в выборках представителей этнических групп населения России.

+ Частота встречаемости Alu -аллеля Alu Ген Локус Мордва Калмыки Коми Украинцы Контроль ОЛЛ (1) (n=15) (n=15) (n=15) (n=15) (n=15) (n=17) MEF2C 5q14.3 Ya5 0.30 0.27 0.20 0.18 0.13 0. MEF2C 0. 5q14.3 Yb8 0.33 0.30 0.23 0.23 0. PHF21A 0. 11p11.2 Ya5 0.70 0.60 НД 0.70 0. TAX1BP1 0. 7p15.2 Yb8 0.00 0.03 0.00 0.00 0. RAB1A 0. 2p14 Yd2 0.73 0.57 0.73 0.60 0. PTPRA 20p13 Y 0.50 0.10 0.23 0.47 0.17 0. SOS1 2p22.1 Ya4b 0.96 0.80 0.87 1.00 1.00 0. RSRC2 12q24.31 Ya5 0.23 0.10 0.27 0.43 0.37 0. TARBP1 1q42.2 Ya5 0.40 0.53 0.48 0.63 0.53 0. ANP32B 9q22.33 Ya5 0.57 0.70 0.45 0.48 0.57 0. Обозначения: (1) – семейство Alu-элементов;

n – размер выборки;

НД – детекция не проводилась.

Аллель-специфический анализ транскрипции На первом этапе были оценены уровни транскрипции Alu-несодержащих аллелей генов в лимфоидных клетках периферической крови здоровых доноров и пунктата костного мозга пациентов с ОЛЛ. По результатам этого анализа 7 маркеров в генах, предковые аллели которых транскрибировались на низком уровне, были исключены из дальнейшего эксперимента. На основе оставшегося 31-го маркера была сформирована третья версия системы МГМ, которая была использована для сравнительного анализа транскрипции аллелей генов.

Транскрипцию аллельных пар анализировали на образцах клеток, гетерозиготных по присутствию Alu-элемента. Анализ носил полуколичественный характер и осуществлялся методом ступенчатой ОТ-ПЦР на матрице кДНК-копий гетерогенной ядерной РНК (гяРНК). Базовый уровень транскрипции соответствующих генов оценивали для образцов, гомозиготных по отсутствию инсерции Alu, и нормировали по уровню транскрипции гена «домашнего хозяйства» GAPDH. В среднем, для всех исследованных образцов, продукт ПЦР, соответствующий несплайсированному транскрипту GAPDH, детектировался при 27-30 циклах ПЦР, что приблизительно соответствует наличию ~103 молекул транскрипта на 100 клеток. Поэтому при отсутствии продукта ПЦР после 39 циклов амплификации считали, что в образце транскрипт представлен менее чем 1-2 молекулами на 100 клеток («min» в табл.6).

Рисунок 8. Функциональный анализ интронных инсерций Alu-элементов. (a) Схема ОТ-ПЦР-анализа транскрипции аллельных пар. Черными стрелками показано расположение и ориентация праймеров G-for и G-rev. Черный прямоугольник - инсерция Alu, белые прямоугольники с обозначением «экз№» – соответствующие экзоны. Белым треугольником показан сайт интеграции Alu. (б) Электрофореграмма продуктов ОТ ПЦР. Обозначения дорожек: М – маркер длин ДНК 100 п.о. (Сибэнзим, Россия), -ОТ – отрицательный контроль, ДНК – продукты амплификации геномной ДНК, числами обозначены циклы ОТ-ПЦР, на которых отбирали аликвоты. Стрелками в правой части обозначены положения продуктов амплификации обоих аллелей или их транскриптов.

Схема анализа транскрипции аллелей приведена на рис. 8. Для каждой инсерции проводилось сравнение количеств первичных транскриптов Alu-содержащего (Alu+) и Alu-несодержащего (Alu0) аллелей. Вывод о снижении содержания Alu+-транскрипта (ингибиторном эффекте инсерции Alu) делали на основании разности числа циклов ПЦР, необходимых для появления электрофоретически детектируемых количеств + соответственно Alu - и Alu -продуктов ПЦР. Для оценки соотношения количеств n-m транскриптов аллелей использовали формулу: NAlu+/NAlu0 = 2, где n – число циклов ПЦР, необходимое для появления Alu -продукта, m – число циклов ПЦР, необходимое + для появления Alu -продукта (табл.6).

По каждому маркеру было исследовано от 1 до 4 гетерозиготных образцов из обеих выборок. Результаты сравнительного анализа уровней транскрипции 31 аллельной пары исследуемых генов обобщены в табл. 6. По характеру и степени воздействия на транскрипцию соответствующих аллелей генов исследуемые инсерции Alu-элементов можно условно разделить на несколько групп.

Инсерции в 8 генах (RAB1A, PTPRA, SOS1, ANP32B, RSRC2, AF4, NLRP1, SNTB1) практически не оказывают влияния на транскрипцию соответствующих аллелей.

Инсерции в 12 генах (HPSE, DSE, MAP3K7, PKD1L1, STK38L, PITPNC1, CNOT4, IL1RAP, RAB2A, NRP1, RPN2 и PHF21A) приводят к различной степени снижения (от одного порядка до полного ингибирования) количества транскрипта Alu+-аллеля в лейкоцитах здоровых доноров. В образцах клеток пациентов с ОЛЛ оба аллеля каждого из этих генов имеют крайне низкий уровень транскрипции (продукты ПЦР не детектировались при 39 циклах амплификации).

Причина отличий уровней транскрипции этих генов в образцах клеток двух выборок связана либо со степенью малигнизации клеток лимфоидного ряда пациентов с лейкозом, либо с тканевой или клеточной специфичностью экспрессии этих генов, поскольку в крови здоровых доноров не содержится предшественников лимфоцитов.

7 инсерций в 6 генах (MEF2C, GSPT1, EIF2C3, RASGRP3, RRAS2 и TARBP1) приводят к аллель-специфическому снижению количества первичных транскриптов как в одноядерных клетках крови здоровых доноров, так и в лимфоидных клетках костного мозга и крови пациентов с ОЛЛ.

Вне этих групп, при наличии инсерций в генах TAX1BP1 и SYT17 наблюдается ингибирование транскрипции Alu+-аллеля в лимфобластах пациентов с ОЛЛ, для гена AGPS – ингибирование в лейкоцитах здоровых доноров, для гена RABL3 – ингибирование транскрипции Alu+-аллеля только в образцах из костного мозга пациентов с ОЛЛ.

В отдельных образцах клеток крови одна и та же инсерция может приводить к различной степени снижения уровня транскрипции аллеля. Это, вероятно, связано с тканевой или клеточной специфичностью ингибиторного эффекта и с гетерогенностью клеточного состава образцов. Так, для 5 из 18 инсерций (в генах HPSE, PKD1L1, GSPT1, RASGRP3 и RRAS2), обладающих ингибиторным эффектом в одноядерных клетках крови, содержание транскрипта Alu+-аллеля было снижено на 1-2 и более порядков. Три из 5 рассматриваемых инсерций находятся в генах (PKD1L1, GSPT1 и RRAS2), транскрибирующихся во всех типах анализируемого пула клеток крови;

две – в генах (HPSE и RASGRP3), транскрибирующихся в клетках преимущественно одного типа лейкоцитов (рис. 6).

Таблица 6. Характеристики МГМ и аллель-специфичное влияние инсерций Alu-элементов на уровень первичных транскриптов генов.

Контроль B-II ОЛЛ ФУНКЦИЯ ПРОДУКТА ГЕНА Интрон Контроль (n=15) B-II ОЛЛ (n=17) p-value ГЕН ЛОКУС Alu (a) Частота (b) + (ПО UCSC) (с) (g) тация Частота ХВР (f) Частота ХВР (f) Ориен (h) Уровень Alu /Alu ФАКТОР ТРАНСКРИПЦИИ MEF2C 5q14.3 Yb8 a/s 7/10 0.24 (e) 0.13 1.00 0.41 min;

min 1.00 0.024 0.125;

0.125;

0. ФАКТОР ТРАНСКРИПЦИИ MEF2C 5q14.3 Ya5 s 7/10 0.37 (e) 0.23 0.52 0.50 min;

min;

min min 0.64 0. РЕГУЛЯЦИЯ ТРАНСКРИПЦИИ PHF21A 11p11.2 Ya5 a/s 5/18 0.51 (e) 0.70 1.00 0.41 min;

min;

0.125 0.33 0. ФАКТОР ТРАНСКРИПЦИИ TAX1BP1 7p15.2 Yb8 a/s 1/16 0.04 (e) 0.00 1.00 0.15 НД min 1.00 0. GTP-АЗА RAB1A 2p14 Yd2 a/s 1/5 0.71 (e) 0.60 0.30 0.82 1;

1 0.42 0. ТИРОЗИНОВАЯ ФОСФАТАЗА PTPRA 20p13 Y s 1/27 0.33 (e) 0.17 0.34 0.35 0.34 0.155 1 ФАКТОР ОБМЕНА GTP/GDP SOS1 2p22.1 Ya4b s 1/22 0.91 (e) 1.00 1.00 0.91 1.00 0.239 НД GTP-АЗА RABL3 3q13.33 Yb8 s 3/7 0.17 0.31 0.29 1.00 0.255 1 min;

min ГИДРОЛАЗА HPSE 4q21.23 Ya5 a/s 12/12 0.33 0.61 0.21 0.53 0.272 0.125;

min ШАПЕРОН ANP32B 9q22.33 Ya5 a/s 3/6 0.55 (e) 0.57 1.00 0.41 1.00 0.316 1;

1 ФАКТОР КЛЕТОЧНОЙ АДГЕЗИИ PKD1L1 7p12.3 Ya5 a/s 28/56 0.67 0.11 0.79 0.06 0.382 0.125;

min ПРОЛИФЕРАЦИЯ RSRC2 12q24.31 Ya5 s 1/10 0.26 (e) 0.37 1.00 0.26 1.00 0.427 1;

1;

1;

1 1;

1;

1;

GTP-АЗА GSPT1 16p13.13 Ya5 a/s 1/14 0.67 0.60 0.59 0.61 0.430 0.125;

min min(ПК);

(КМ) ЭПИМЕРАЗА DSE 6q22.1 Y s 3/5 0.30 0.55 0.21 1.00 0.552 min;

min ФАКТОР ТРАНСКРИПЦИИ AF4 4q21.3 Y a/s 14/19 0.53 1.00 0.38 0.61 0.556 1;

1;

1 СИНТАЗА AGPS 2q31.2 Yb8 a/s 10/19 0.67 0.23 0.58 0.01 0.584 min НД ФАКТОР ТРАНСЛЯЦИИ EIF2C3 1p34.3 Ya5 s 8/18 0.03 1.00 0.09 1.00 0.616 min min АКТИВАТОР КАСПАЗ NLRP1 17p13.2 Yb8 s 3/15 0.53 0.32 0.44 0.61 0.617 1;

1;

1;

1 ФАКТОР ОБМЕНА GTP/GDP RASGRP3 2p22.3 Yb8 a/s 16/18 0.76 (d) 0.87 1.00 0.82 0.42 0.738 min;

0.016 min GTP-АЗА RRAS2 11p15.2 Ya5 a/s 1/5 0.17 1.00 0.21 1.00 0.757 min;

0.125;

1 min;

min;

min MAP-КИНАЗА MAP3K7 6q22.31 Y s 13/16 0.24 (d) 0.40 1.00 0.33 1.00 0.789 0,125 ФАКТОР ТРАНСКРИПЦИИ TARBP1 1q42.2 Ya5 a/s 9/29 0.51 (e) 0.53 1.00 0.59 0.34 0.801 min;

min;

min 1;

min ПОДДЕРЖАНИЕ ЦИТОСКЕЛЕТА SNTB1 8q24.12 Yb8 s 2/7 0.57 0.28 0.56 0.34 1.000 1;

1 СЕРИН/ТРЕОНИНОВАЯ КИНАЗА STK38L 12p11.23 Ya5 a/s 1/13 0.23 (d) 0.13 0.20 0.15 0.29 1.000 min ПЕРЕДАЧА СИГНАЛА PITPNC1 17q24.2 Yb8 a/s 1/9 0.27 0.22 0.26 1.00 1.000 min ФАКТОР ТРАНСКРИПЦИИ CNOT4 7q33 Ya5 s 1/10 0.71 (d) 0.80 0.45 0.74 1.00 1.000 min РЕЦЕПТОР ИНТЕРЛЕЙКИНА- IL1RAP 3q28 Ya5 a/s 3/8 0.44 (d) 0.50 0.62 0.50 0.62 1.000 min;

min GTP-АЗА RAB2A 8q12.1 Ya4 s 6/7 0.23 0.12 0.26 1.00 1.000 min ФАКТОР КЛЕТОЧНОЙ АДГЕЗИИ NRP1 10p11.22 Yb8 s 11/15 0.74 (d) 0.70 1.00 0.71 0.08 1.000 0.125;

0.125;

0.125 ТРАНСПОРТ SYT17 16p12.3 Yb9 s 5/7 0.51 (d) 0.20 0.45 0.18 1.00 1.000 НД min МОДИФИКАЦИЯ БЕЛКОВ RPN2 20q11.23 Ya5 s 2/16 0.20 (d) 0.20 1.00 0.18 0.04 1.000 min;

min;

min Обозначения: (a) Семейство Alu;

(b) ориентация Alu относительно направления транскрипции гена;

(c) номер интрона с инсерцией Alu/число интронов гена;

(d) по базе данных dbRIP (http://dbrip.org/);

(e) установлена в настоящей работе;

(f) характеристика равновесия Харди-Вайнберга в распределении аллелей;

(g) вероятность случайного различия частот встречаемости Alu+-аллеля в контрольной и целевой выборках;

(h) уровни транскрипции Alu+-аллелей относительно Alu0-аллелей в проанализированных образцах (значения для каждого из образцов показаны через «;

»), «min» - нет Alu+, «» - нет обоих аллелей;

«НД» - детекция не проводилась.

Полученные данные наглядно показывают, что аллель-специфическое снижение количества первичного транскрипта представляет достаточно распространенное явление и может проявляться как в здоровых, так и малигнизированных клетках.

Сравнительный анализ количеств первичных и зрелых транскриптов.

Одними из наиболее вероятных причин снижения содержания в клетке транскриптов Alu-содержащих аллелей гена могут быть два аллель-специфических эффекта – ингибирование транскрипции или повышение скорости сплайсинга. При реализации первого эффекта сниженному количеству первичного транскрипта должно соотвествовать сниженное количество зрелого, в случае реализации второго – повышенное количество зрелого. Справедливость этих гипотез проверяли на примере гена TARBP1 (рис. 9). Этот ген имеет единственный белок-кодирующий транскрипт, для которого не описано альтернативного сплайсинга в районе инсерции Alu. Нами проведена оценка количества первичных транскриптов Alu+-аллелей и количества сплайсированных транскриптов обоих аллелей в образцах ОЛЛ с тремя возможными генотипами: гомозиготах (-/-), (+/+) и гетерозиготе (+/-). Было исследовано два гомозиготных образца -/-, два гетерозиготных образца +/- и три гомозиготных образца +/+. Уровень транскрипции гена TARBP1 измерялся относительно уровня транскрипции гена «домашнего хозяйства» GAPDH.

Рисунок 9. Анализ транскрипции аллельных пар гена TARBP1. В верхней части рисунка показаны схемы ОТ-ПЦР, на которых приведены структуры фрагментов анализируемых транскриптов и указаны положения праймеров относительно соответствующих экзонов (экз№). Под каждой схемой помещены электрофореграммы соответствующих типов ОТ-ПЦР (обозначения дорожек аналогичны рис.2). В левой части рисунка указаны номера анализируемых образцов (даны по табл.1) и соответствующие им генотипы: «-/-» - генотип Alu0/Alu0, «+/+» - генотип Alu+/Alu+, «+/-» - генотип Alu+/Alu0. Для каждого образца приведено по четыре электрофореграммы ОТ-ПЦР-анализа транскрипции генов TARBP1 и GAPDH на уровне пре-мРНК и мРНК. Числа в правой части рисунка – количества сплайсированных транскриптов гена TARBP1 относительно количества транскриптов гена «домашнего хозяйства» GAPDH для каждого проанализированного образца.

В образцах лимфобластов 1b, 3b, 10b, 9b, 13b детектируются первичные транскрипты хотя бы одного аллеля гена TARBP1, сплайсированные транскрипты в тех же образцах также детектируются и представлены на одинаковом уровне. В образцах 2b и 12b первичные транскрипты не детектируются, а сплайсированные транскрипты представлены на достаточно высоком уровне, но при этом в 8 раз меньшем, чем в образцах 1b, 3b, 10b, 9b и 13b. Иными словами, отсутствие детектируемого количества первичных транскриптов сопровождается лишь частичным снижением количества сплайсированных транскриптов.

Ни ингибирование транскрипции Alu-содержащего аллеля, ни повышение скорости сплайсинга, взятые отдельно, не могут описать полученные результаты. Лишь совместное действие двух этих эффектов может дать приемлемое объяснение наблюдаемых соотношений количеств сплайсированных и несплайсированных транскриптов.

Заключение. Разработанная система МГМ включает 31 высокоинформативный маркер и представляет новое поколение молекулярно-генетических диагностических систем. Обладая всеми возможностями физических и полиморфных маркеров, применяемых в настоящее время в популяционной генетике, криминалистике и медико генетической экспертизе, проанализированные полиморфные Alu-элементы имеют также важное функциональное значение, участвуя в регуляции транскрипции генов. 5 маркеров имеют выраженный диагностический потенциал в отношении острого В лимфобластного лейкоза. Остальные маркеры могут найти применение при разработке наборов МГМ для диагностики различных вариантов лейкозов, а также других патологий кроветворной системы.

ВЫВОДЫ 1. Разработан алгоритм для биоинформатической идентификации инсерций Alu ретроэлементов, обладающих ретропозиционной активностью («мастер-генов»). С помощью предложенного алгоритма впервые идентифицировано 12 инсерций «мастер-генов» в семействах AluYa5 и AluYb8.

2. Проведен полногеномный биоинформатический поиск полиморфных инсерций Alu ретроэлементов в интронах генов, продукты которых являются потенциальными участниками малигнизации кроветворных клеток. Создана серия ПЦР адаптированных молекулярно-генетических маркеров, включающая 53 пары уникальных праймеров, фланкирующих сайты интеграции выявленных инсерций.

3. Проведено исчерпывающее генотипирование геномных ДНК здоровых доноров и пациентов с ОЛЛ по 53 Alu-маркерам. Впервые определены частоты встречаемости инсерций Alu у городского населения московского региона, 10 инсерций – в четырех этнических группах населения России.

4. Впервые показаны достоверные различия частот встречаемости 5 инсерций Alu ретроэлементов у пациентов с острым лимфобластным лейкозом и здоровых доноров.

5. Осуществлен массированный функциональный анализ 31 полиморфной инсерции Alu ретроэлементов в лимфоидных клетках здоровых доноров и пациентов с ОЛЛ.

Показано выраженное снижение количества транскриптов Alu-содержащих аллелей 22 генов.

Основное содержание работы

изложено в следующих публикациях:

1. Амосова А. Л., Комков А. Ю., Устюгова С. В., Мамедов И. З., Лебедев Ю. Б.

Ретропозоны в эволюции генома современного человека. Биоорганическая химия.

2009. Т.35. №6. С.779-788.

2. Комков А. Ю., Лебедев Ю. Б., Швец В. И. Разработка тест-системы для анализа эффекта «смены матрицы» при обратной транскрипции in vitro. Вестник МИТХТ.

2011. Т.6. №6. С.77-83.

3. Комков А. Ю., Масчан М. А., Швец В. И., Лебедев Ю. Б. Функциональный анализ полиморфных инсерций Alu-ретроэлементов при остром лимфобластном лейкозе.

Биоорганическая химия. 2012. Т.38. №3. С.282-289.

4. Комков А. Ю., Амосова А. Л., Лебедев Ю. Б. Влияние полиморфных инсерций Alu элементов на экспрессию генов человека. «Съезд генетиков и селекционеров, посвященный 200-летию со дня рождения Чарльза Дарвина» и «V съезд Вавиловского общества генетиков и селекционеров». Москва, 21-28 июня 2009 (Тезисы докладов, часть II, стр. 62).

5. Лебедев Ю. Б., Комков А. Ю., Устюгова С. В., Амосова А. Л., Мамедов И. З.

Разработка систем функциональных маркеров для прогнозирования и индивидуальной терапии онкологических заболеваний крови. «Фундаментальные науки – медицине».

Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2009 году. М.: Фирма «Слово», 2009, стр.56.

6. Лебедев Ю. Б., Комков А. Ю., Мамедов И. З., Амосова А. Л., Устюгова С. В., Разработка систем функциональных маркеров для прогнозирования и индивидуальной терапии онкологических заболеваний крови. «Фундаментальные науки – медицине».

Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2010 году. М.: Фирма «Слово», 2010, стр. 66.

7. Комков А. Ю., Швец В. И., Лебедев Ю. Б. Создание молекулярно-генетических маркеров на основе полиморфных инсерций Alu-ретроэлементов. Московская международная научно-практическая конференция «Биотехнология: экология крупных городов». Москва, 15-17 марта 2010 (Материалы конференции, стр. 461-462).

8. Комков А. Ю., Лебедев Ю. Б. Функциональный анализ полиморфных инсерций Alu ретроэлементов в геноме человека. Международная конференция «Проблемы популяционной и общей генетики». Москва, 14-16 ноября 2011 (Сборник тезисов, стр.

140-141).

9. Лебедев Ю. Б., Комков А. Ю., Масчан М. А., Курносов А. А., Мамедов И. З.

Функциональный анализ полиморфных Alu-ретроэлементов при остром лимфобластном лейкозе. «Фундаментальные науки – медицине». Тезисы докладов на конференциях и семинарах по научным направлениям Программы в 2011 году. М.:

Фирма «Слово», 2011, cтр. 77.

Для заметок Для заметок

 




 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.