Молекулярно-генетическая характеристика последовательности hs.
САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТНа правах рукописи
ПОЛЕВ Дмитрий Евгеньевич МОЛЕКУЛЯРНО-ГЕНЕТИЧЕСКАЯ ХАРАКТЕРИСТИКА ПОСЛЕДОВАТЕЛЬНОСТИ HS.633957 ЧЕЛОВЕКА специальность: 03.02.07 - генетика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата биологических наук
Санкт-Петербург 2010
Работа выполнена в негосударственном научно-исследовательском учреждении «Биомедицинский центр», Санкт-Петербург.
Научный консультант: доктор биологических наук, профессор Козлов Андрей Петрович Официальные оппоненты :
доктор биологических наук Евтушенко Владимир Иванович, ФГУ «Российский научный центр радиологии и хирургических технологий Федерального агентства по высокотехнологичной медицинской помощи» доктор биологических наук Проворов Николай Александрович, ГНУ «Всероссийский научно исследовательский институт сельскохозяйственной микробиологии» Российской академии сельскохозяйственных наук
Ведущая организация: Научно-исследовательский институт экспериментальной медицины Северо-Западного отделения РАМН
Защита состоится “ “ 2010 г. в часов на заседании совета Д.212.232. по защите докторских и кандидатских диссертаций при Санкт-Петербургском государственном университете по адресу: 199034 Санкт-Петербург, Университетская наб. 7/9, СПбГУ, биолого-почвенный факультет, кафедра генетики и селекции, аудитория 1.
С диссертацией можно ознакомиться в Научной библиотеке им. М. Горького Санкт Петербургского государственного университета
Автореферат разослан “ “ _ 2010 г.
Учный секретарь Диссертационного совета Д.212.232. кандидат биологических наук Л.А. Мамон
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы.
В 2001 году двумя независимыми группами исследователей были опубликованы черновые данные по секвенированию генома человека (The Genome Sequencing Consortium, 2001;
Venter et al., 2001);
в 2003 году завершился проект по расшифровке генома человека The Human Genome Project. На сегодняшний день полностью отсеквенировано уже несколько индивидуальных человеческих геномов (Levy et al., 2007;
Wheeler et al., 2008;
Bentley et al., 2008;
Wang et al., 2008;
Ley et al., 2008;
Ahn et al., 2009;
Kim et al., 2009;
McKernan et al., 2009;
Drmanac, et al., 2010). Согласно данным по секвенированию размер гаплоидного генома человека составляет около 3*109 п.н., из которых только 5% относится к белок-кодирующим областям (The Genome Sequencing Consortium, 2001), тогда как транскрибируется 74-93% всего генома человека (The ENCODE Project Consortium, 2007). Очевидно, что основная часть транскриптов не кодирует белки. Возможно, они имеют некие регуляторные функции, но какие именно, в большинстве случаев мы не знаем, поэтому аннотация транскрибируемых участков генома человека остатся актуальной задачей.
Одним из таких неаннотированных транскрибируемых участков генома человека является локус Hs.633957, ставший объектом данного исследования. Предпосылкой его изучения явились теоретические работы А.П. Козлова, в которых он развивает гипотезу об эволюционной роли опухолей в возникновении новых клеточных типов, получившей недавно название «эволюция путм дифференцировки опухолевых клеток» (Kozlov 1979, 1996, 2010;
Kozlov et al., 1992;
Козлов 1976, 1983, 1987, 2008). Согласно этой гипотезе, неоплазмы предоставляют пространство и ресурсы для экспрессии и апробации новых генов, которые не могут проявится в нормальных тканях в силу отлаженной там регуляции экспрессии. Одним из основных следствий данной гипотезы является предсказание активации экспрессии множества молчащих участков генома в опухолях. Данное следствие получило подтверждение в биоинформатическом исследовании Барановой с соавторами (Baranova et al., 2001), в котором было обнаружено большое количество участков генома с опухолеспецифической экспрессией.
Среди таких участков был локус, соответствующий кластеру Hs.633957 (ранее Hs.104073) по классификации базы данных UniGene. Кластер Hs.633957 содержал 6 EST (от англ. Expressed Sequence Tag – ярлык экспрессирующейся последовательности), полученных из опухолевых клеток. Он был описан в базе как «транскрибируемый локус», поскольку входящие в него последовательности не кодируют белки. Ранее данный участок генома человека специально не изучался, и его роль в организме не была описана.
Характер экспрессии локуса Hs.633957 вызывает к нему практический и теоретический интерес. Перед нами встали следующие вопросы: действительно ли локус экспрессируется только в опухолях и его РНК-продукт может быть использован как онкомаркр, за счт чего это происходит, какова структура транскриптов локуса, кодирует ли он белок и может ли он иметь какую-то функцию в организме?
Цель и задачи исследования. Целью данной работы является молекулярно генетическая характеристика локуса человека, соответствующего кластеру Hs.633957 базы данных UniGene.
В соответствии с целью были поставлены следующие задачи:
1. Определить полную нуклеотидную последовательность РНК-продукта локуса Hs. 2. Выявить возможные альтернативные РНК-продукты данного локуса 3. Описать регуляторную область локуса Hs. 4. Определить, в каких органах и тканях экспрессируется локус Hs. 5. Провести филогенетический анализ последовательности локуса Hs. 6. Определить функцию локуса Hs. Практическая ценность. В ходе работы было обнаружено, что локус Hs. транскрибируется лишь в небольшом количестве нормальных органов взрослого человека, при этом представленность его РНК в образцах тканей здоровых органов низка. В лейкоцитах периферической крови изучаемая РНК не была обнаружена. В опухолях, напротив, локус Hs.633957 экспрессируется часто и на относительно высоком уровне. Полученные данные свидетельствуют о потенциальной возможности использования РНК Hs.633957 в качестве молекулярного маркра опухолей различного происхождения.
Апробация работы. Результаты работы были представлены на XIV, XVI, XVII, XVIII и XIX международных конференциях «СПИД, рак и общественное здоровье» (Санкт Петербург, 2005, 2007, 2008, 2009, 2010);
III, IV и VI Российской конференции по фундаментальной онкологии «Петровские чтения» (Санкт-Петербург, 2007, 2008, 2010);
на международной конференции Frontiers in Cancer Prevention Research (Балтимор, США, 2005), на международной конференции SMBE 2010 (Society for Molecular Biology and Evolution) (Лион, Франция, 2010).
Публикации. По материалам диссертации опубликовано 12 работ.
Объем и структура диссертации. Диссертационная работа состоит из «Введения», «Списка сокращений», «Обзора литературы», «Материала и методов», «Результатов», «Обсуждения», «Выводов», «Списка литературы», состоящего из 211 источников. Работа изложена на 148 страницах машинописного текста и содержит 26 рисунков и 6 таблиц.
МАТЕРИАЛ И МЕТОДЫ В данной работе изучали геномный локус человека, соответствующий кластеру Hs.633957 базы данных UniGene (http://www.ncbi.nlm.nih.gov/sites/entrez?db=unigene).
Образцы опухолевых тканей. Замороженные образцы опухолевых тканей, удалнных во время хирургического вмешательства, были любезно предоставлены доктором Колюбаевой С.Н. из Военно-Медицинской Академии им. Кирова, Россия. В работе было использовано 28 образцов, включавших опухоли молочной железы, матки, шейки матки, яичника, лгкого, бронха, желудка, яичка, краниоспинального стыка и лимфомы. Во всех случаях от пациентов было получено информированное согласие на использование их материала в исследовании.
Клеточные линии. В работе были использованы следующие линии клеток человека:
Panc1 (карцинома поджелудочной железы) и CaCo2 (карцинома толстой кишки). Для проведения работы клеточные линии растили в культуральных флаконах на среде DMEM, содержащей 10% сыворотки телнка и антибиотик, при 37°С, 5% СО2.
Выделение РНК. Выделение тотальной РНК из опухолевых тканей и клеточных линий проводили по стандартной методике с использованием изотиоционата гуанидина (Chirgwin et al., 1979).
Концентрацию РНК определяли на спектрофотометре Ultrospec® 3100 pro. Качество препаратов РНК оценивали по соотношению оптических плотностей А260/A280 и электрофорезом в 1%-ном агарозном геле по соотношению количества 28S и 18S рРНК (Sambrook et al., 2001). Выделенную РНК обрабатывали ДНКазой I, свободной от РНКазы (“Sigma”). Наличие в образце РНК примесей ДНК определяли с помощью ПЦР с праймерами к гену домашнего хозяйства GAPDH, а в качестве матрицы использовали препарат РНК.
Синтез кДНК проводили с помощью набора Revert Aid® First Strand cDNA Synthesis Kit (“Fermentas”, Литва) с использованием гексануклеотидных или олиго-d(T) праймеров согласно рекомендациям производителя. Полученную кДНК хранили при –20°С до использования.
Коммерческие образцы кДНК. В работе использовали коммерческие панели кДНК производства “Clontech”, США и “BioChain”, США. Наборы кДНК производства “Clontech” включали наборы кДНК нормальных тканей Human MTC™ Panel I и Human MTC™ Panel II, набор кДНК тканей иммунной системы Human Immune System MTC™ Panel, набор кДНК тканей пищеварительной системы Human Digestive System MTC™ Panel, набор кДНК фетальных тканей Human Fetal MTC™ Panel и набор кДНК опухолей Human Tumor MTC™ Panel. Всего 43 образца из 25 нормальных органов и тканей. Данные образцы кДНК не содержат примесей геномной ДНК и нормализованы по экспрессии четырех генов “домашнего хозяйства” клетки. Образцы нормальных тканей представляют собой суммарный препарат кДНК от разных доноров (от двух до пятисот пятидесяти). Набор Human Fetal MTC™ Panel содержит образцы кДНК органов и тканей плода, взятых со сроков беременности 16–36 недель. Набор Human Tumor MTC™ Panel содержит образцы кДНК полученные из опухолей человека, ксенотрансплантированных бестимусным мышам.
Препараты производства “BioChain” содержат образцы кДНК отдельных первичных опухолей, свободны от примесей геномной ДНК и нормализованы по экспрессии одного гена “домашнего хозяйства” клетки. Всего было использовано 47 образцов кДНК из опухолей двадцати восьми локализаций.
Качество всех препаратов кДНК проверяли методом полимеразной цепной реакции (ПЦР) с использованием праймеров к гену «домашнего хозяйства» GAPDH (прямой: 5' обратный: 5' TGAAGGTCGGAGTCAACGGATTTGGT-3', CATGTGGGCCATGAGGTCCACCAC-3').
Подбор праймеров. Праймеры 7Mal1F и 7Mal1R для детекции Hs.633957 специфического транскрипта методом ПЦР подбирали к наиболее протяженной последовательности кластера на момент начала исследования Hs. (идентификационный номер AI346735.1, GenBank) в сотрудничающей лаборатории в Институте биоорганической химии им. Шемякина и Овчинникова РАН. Все остальные праймеры подбирали с помощью программы Primer3Plus (Untergasser et al., 2007).
Последовательности праймеров, специфических к локусу Hs.633957, приведены в таблице 1.
Последовательности праймеров, использованных для межкластерной ПЦР, приведены в таблице 2.
Таблица 1. Последовательности праймеров, использованных в данной работе для изучения локуса Hs. Название Последовательность 5’- -3` 7Mal1F GGTCTTTACTCCCATTCAA 7Mal1R CTCCTGTCATTCACTCCG BX119057F1 CAGGTTCTTCAGCCAGGAAG BX119057R1 CTCTGCTTCCTCTTCCGTTG BX119057F2 GTGGCGCCTCAGCCACAATC BX119057R2 CAGGGAGCTTGTGGTTTCTC BX119057R3 GCCTCAGCCACAATCGTAAT R7MF GGTCTTTACTCCCATTCAACGGAAGAG R7MR CCTCCTGTCATTCACTCCGAGACGC R7MFN CATTCAACGGAAGAGGAAGCAGAGC R7MRN CATTCACTCCGAGACGCAGCAGC R7M3 GATGTTCTGCTTGGTTATTTAC R7M3N GAGCTCCAACATGAATTAAAAGT R7M5 GACTGGGAGTGAGAAGGAGC R7M5N GGAGTGAGAAGGAGCGGAG 3gsp1 CTCGCTAACCACCAAGGCGGTCC 3gsp2 CCAGTCCTCCACGCGTGGA 5gsp1 GCTGAGAGTGAATTCGGGGTGCAG 5gsp2 GCTGCTGCGTCTCGGAGTGAATG Таблица 2. Последовательности праймеров, использованных для межкластерных ПЦР Номер кластера, содержащего Название Последовательность 5’- -3` последовательнос ть AA232990F1 CGGCATAGGTCACGTAGGTT Hs. AA243851F1 CAGAAGGAGGCGCTATTGTT AI962473F1 CTGTCCTTCTGTGTGCTGGA Hs. AI962473R1 GATGGCTCCACTGACTCCTC ELFN1R1 GAGGTGCCTGCACTCTCAG AI418255F1 GAATGTGGTCCTACGTGCAA Hs. Отдельные EST, AA077731F1 CCCTCGCACTCACAAATACA не входящие в AA077543F1 TTCCCTCACAGAAAGCCACT кластеры.
AA077783F1 GGTTACAGAGGGGAGGTTCC AA077941F1 GGGAAAGGCTGTGTGATGAG AA680192F1 TGAGGGGACTGAGGCTAAGA CB105081F1 CTTCTCCACCCTCCAGACAG BY799952R1 CATTGCAGCAGGTTTTCTTG BY799952F1 AGATGGGCTGAGAGGAAGG Детекцию Hs.633957-специфических фрагментов в образцах кДНК проводили с помощью ПЦР с праймерами 7Mal1F и 7Mal1R.
Межкластерная ПЦР. Под «межкластерной ПЦР» в данной работе мы понимаем амплификацию фрагмента гипотетической РНК, включающей последовательности локуса Hs.633957 и соседних транскрибируемых участков генома. ПЦР-амплификацию проводили c различными комбинациями праймеров, указанных в табл. 2.
Определение концов транскрипта Hs.633957 производили с использованием подхода RACE (Rapid Amplification of cDNA Ends), позволяющего амплифицировать неизвестные 5’ и 3’-концы кДНК, за счт пришивания к этим концам неспецифических адаптерных последовательностей и использования их в качестве сайта посадки второго праймера при ПЦР. В работе были использованы 2 разных набора производства “Clontech”, США:
Marathon™ cDNA Amplification Kit и SMART™ RACE cDNA Amplification Kit. Оба набора использовали в сочетании с Advantage 2 PCR Kit (“Clontech”, США), согласно рекомендациям производителя.
Продукты RACE разделяли гель-электрофорезом, окрашивали бромидом этидия и визуализировали в УФ свете. При наличии ампликонов их вырезали, встраивали в вектор pGEM-T Easy (“Promega”, США), трансформировали полученным вектором бактерий E.coli (штамм DH10BR) методом электропорации и высевали их на селективную агар-содержащую среду LB. Скрининг клонов на наличие плазмиды с искомой вставкой проводили методом ПЦР с использованием стандартных праймеров M13. В качестве матрицы брали живые клетки E.coli из колоний. Часть амплификата использовали для гель-электрофореза, оставшуюся часть переосаждали ацетатом аммония и этиловым спиртом и секвенировали на приборе MegaBACE™ 1000 (“GE Healthcare Life Sciences”, США) с использованием оригинальных реагентов и рекомендованных условий.
Выравнивание нуклеотидных последовательностей и определение ОРС осуществляли в программе BioEdit (Hall, 1999).
Интернет-ресурсы, использованные в работе. В работе использовали ресурсы интернет-сервисов NCBI (http://www.ncbi.nlm.nih.gov/), UCSC Genome Browser (http://genome.ucsc.edu/index.html), Primer3Plus (http://www.bioinformatics.nl/cgi bin/primer3plus/primer3plus.cgi), The Vienna RNA Websuite и сервера Mfold института Брнета (http://mfold.burnet.edu.au/).
РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЕ Общая характеристика локуса Hs.633957. По результатам выравнивания последовательностей кластера Hs.633957 с геномом человека локус Hs.633957 расположен на участке p22.3 хромосомы 7. Его общая протяжнность составляет 3 642 п.н., он имеет два экзона, в области второго экзона расположен повтор L2b семейства повторов L2 класса LINE протяжнностью 326 п.н. По данным сервиса RepeatMasker 3.2.7, его последовательность достаточно сильно модифицирована по сравнению с предковым повтором, нуклеотидные различия составляют 33,5%, делеции – 8,3%, инсерции – 9,2%. На самой границе с локусом Hs.633957, у 3’конца второго экзона, расположен повтор AluJo класса SINE. Размер повтора 166 п.н., расхождение с предковым повтором 19,3%, делеции 0%, инсерции 0,6%. В интроне содержатся повторы класса SINE, простые повторы и повтор класса ДНК-транспозонов.
Экспрессия локуса Hs.633957 в органах и тканях человека. Экспрессию локуса Hs.633957 в различных органах и тканях человека выявляли методом ПЦР на матрице соответствующих образцов кДНК. Результаты выявления экспрессии локуса в нормальных органах и тканях представлены в таблице 3. Результаты выявления экспрессии локуса в опухолях представлены в таблице 4.
Таблица 3. Результаты выявления Hs.633957-специфической РНК в нормальных органах и тканях взрослого человека и плода Hs.633957- Hs.633957 положительные Количество положительные Количество Ткань/орган образцы/ общее доноров на Ткань/орган образцы/ общее доноров на количество образец количество образец образцов образцов Мозг Тощая кишка 0/2 4 0/1 Прямая Легкое 0/2 2–4 0/1 кишка Подвздошно 1/2* 1/1** Сердце 16 слепая кишка Подвздошная 1/1** Селезенка 0/3 6–11 кишка Тимус Яичник 0/3 9–18 0/2 Лейкоциты периферической Простата 0/3 550 0/2 крови Лимфатический Яичко 0/1 12 0/2 узел Миндалевидная Плацента 0/1 5 0/2 железа Скелетная Костный мозг 0/1 74 0/2 мышца Фетальный 1/1** Почка 0/2 14 мозг Фетальное 3/3* Печень 4 0/1 сердце Поджелудочная Фетальная 0/2 20 0/2 железа печень Фетальная 1/1** Тонкий кишечник 0/2 32 почка Фетальное 1/5** Ободочная кишка 5-19 0/1 лгкое Фетальные 1/1** Слепая кишка 29 0/1 мышцы Двенадцатиперстная Фетальная 0/1 30 0/1 кишка селезенка Фетальный Пищевод 0/1 39 0/1 тимус 1/1* Желудок * Низкий уровень сигнала ** Уровень сигнала на пределе чувствительности метода Таблица 4. Результаты выявления Hs.633957-специфической РНК в опухолях различных локализаций Hs.633957 Hs.633957-положительные Локализация положительные образцы / общее Локализация опухоли опухоли образцы / общее количество образцов количество образцов головной мозг мочевой пузырь 1/2 2/ молочная железа матка 7/8 5/ легкое фаллопиевы трубы 5/6 1/ ободочная кишка яичко 4/4 3/ простата мочеточник 2/2 2/ яичник желчный пузырь 5/6 1/ поджелудочная прямая кишка 0/2 1/ железа пищевод кожа 0/ 1/ желудок мышцы 3/3 1/ тонкий кишечник надпочечник 0/ 2/ печень лимфомы 0/2 7/ почка щитовидная железа 0/ 1/ околоушная тимус 0/ 1/ железа селезнка шейка матки 1/1 6/ краниоспинальный бронх 1/1 1/ стык Как видно из таблицы 3, в нормальных органах и тканях человека локус Hs.633957 либо экспрессируется на низком уровне, либо не экспрессируется вообще. С уверенностью можно говорить только о его экспрессии в печени, сердце и желудке, хотя и для этих органов уровень амплификации специфического фрагмента был низкий. Поскольку в работе были использованы пулированные образцы кДНК, полученные от разных доноров, то искомая РНК может быть выявлена даже при е наличии только в одном образце из пула. Низкий уровень сигнала при амплификации специфического фрагмента может быть обусловлен наличием искомой РНК только в небольшой части пулированных образцов, низким уровнем экспрессии локуса в органе или ткани, или экспрессией в небольшой доле клеток изучаемого органа или ткани. Исходя из имеющихся данных мы пока не можем различить указанные варианты.
В отличие от нормальных органов и тканей мРНК Hs.633957 была выявлена практически во всех рассмотренных опухолях (Таблица 4), при этом уровень сигнала амплификации искомого фрагмента был значительно выше, чем в нормальных тканях. Полученные данные свидетельствуют об активации экспрессии локуса Hs.633957 в опухолевых клетках.
Учитывая, что в лейкоцитах периферической крови здоровых людей экспрессия локуса выявлена не была, мРНК Hs.633957 потенциально может быть использована как маркр циркулирующих в крови раковых клеток.
Определение первичной структуры транскриптов. Первичную структуру РНК локуса Hs.633957 определяли методом RACE с использованием коммерческих наборов Marathon™ cDNA Amplification Kit и SMART™ RACE cDNA Amplification Kit (“Clontech”, США).
Дополнительно использовали межкластерную ПЦР. По совокупности полученных в нашей работе экспериментальных данных и данных базы UniGene составили схему, отражающую возможные формы транскриптов локуса Hs.633957 (рис.1).
Рисунок 1. Схема вариантов транскрипции и процессирования РНК локуса Hs.633957.
Возможные сайты инициации транскрипции обозначены стрелочками, сайты полиаденилирования подписаны «АААААА», альтернативные 3’-сплайс-акцепторные сайты обозначены СА1, СА2 и СА3. Масштаб не соблюдн.
Определение основной сплайсинговой формы РНК. Для определения основной сплайсинговой формы РНК Hs.633957 применяли ПЦР с праймеры к концам транскрипта. В результате на электрофореграмме для большинства образцов наблюдали две полосы размером около 600 и 700 п.н. (рис.2). Данные полосы соответствуют РНК-продуктам локуса Hs.633957 со сплайсингом по СА2 (700 п.н.) и СА3 (600 п.н.). Интенсивность полосы 600 п.н.
всегда была значительно выше, на основании чего можно сделать вывод, что основной сплайсинговой формой РНК Hs.633957 является форма со сплайсингом по СА3. При анализе экспрессии локуса в органах и тканях человека были использованы праймеры, фланкирующие область второго интрона. В результате этого мы могли дискриминировать сплайсинговые формы РНК с вырезанием и сохранением второго интрона. Ни в одном случае мы не наблюдали РНК-продуктов с вырезанным вторым интроном. Таким образом, среди РНК-продуктов локуса Hs.633957 преобладают BX119057-подобные сплайсинговые формы, характеризующиеся сплайсингом по третьему 3’-акцепторному сайту второго экзона и с сохранением второго интрона.
Анализ открытых рамок считывания. Получив представление о структуре РНК Hs.633957 мы провели поиск открытых рамок считывания (ОРС) в е последовательности с использованием программы BioEdit. Мы искали ОРС начинающиеся с кодона метионина АТG, заканчивающиеся стоп-кодонами ТGА, ТАА и ТАG, и кодирующие белки размером более 50 а.к.
Было выявлено 2 ОРС, удовлетворяющих заявленным критериям. ОРС-1 кодирует потенциальный белок размером 62 а.к. с последовательностью MGLRSFSLPVLWCMPPSWLKNLHQPPLRLGSSLLSFTPRRSSVAPRALPALHPEFTLSPHLV *. ОРС-2 кодирует потенциальный белок размером 53 а.к. с последовательностью MLELLLPLQEQELCVLVTAVASQGRRGAQQPGLDRLGPRCARAGMRLLCFLFR*.
Сравнение аминокислотных последовательностей ОРС-1 и ОРС-2 с известными белками проводили с использованием алгоритма blastp, реализованного на сайте Национального сервера биотехнологической информации (NCBI, http://www.ncbi.nlm.nih.gov/).
Гомологичных белковых последовательностей обнаружено не было ни у человека, ни у других организмов.
Рисунок 2. Электрофореграмма продуктов амплификации кДНК локуса Hs.633957, полученных методом ПЦР с использованием праймеров к концам транскрипта.
Реакцию ПЦР проводили на матрице кДНК из опухолей следующих локализаций: 01 – мозг, 02 – лгкое, 07 – желчный пузырь, 09 – желудок, 10 – тонкий кишечник, 11 – толстый кишечник, 12 – прямая кишка, 16 – матка, 17 – уретра, 24 – гланды, 26 – околоушная железа, 29 – селезнка, 30, 31 – лимфомы. Образец контрольной ПЦР без матрицы на рисунке не представлен.
Анализ вторичной структуры РНК. Вторичную структуру РНК Hs. предсказывали используя интернет-ресурсы The Vienna RNA Websuite (Gruber, et al., 2008) и Mfold (Zuker, 2003). Оба алгоритма предсказали сходные вторичные структуры, которые содержат шпильку, напоминающую предшественника миРНК (пре-миРНК) (рис.3).
Шпилька состоит из 75 нуклеотидов, в том числе, 26 пар комплементарных нуклеотидов, имеет концевую петлю из 8 нуклеотидов, участок миРНК, содержащий 21 пару нуклеотидов, базальную петлю (5 выпетливающихся нуклеотидных оснований) и базальный столбик, содержащий 7 п.н.
Если предположить, что разрезание первичной РНК ферментом Drosha, а затем пре миРНК ферментом Dicer происходит по обозначенным на рисунке позициям, что не противоречит имеющимся литературным данным о действии этих ферментов, то последовательность направляющей нити зрелой миРНК 5’ UCCUGGUCACUGCUGUGGCAUC-3’, а побочной – 5’-UGCCCAGCAGCCAGGACU-3’.
Рисунок 3. Строение предсказанной пре-миРНК, закодированной в РНК BX119057. На рисунке обозначены основные элементы пре-миРНК и предполагаемые сайты разрезания белками Drosha и Dicer.
Поиск потенциальных мишеней предсказанной миРНК проводили сравнивая последовательности направляющей и побочной нитей пре-миРНК, заключнные между концевой базальной петлями, с известными мРНК. Для этого использовали алгоритм blastn, реализованный на сайте NCBI. Участки, комплементарные направляющей нити, были обнаружены в мРНК генов DPYS (22 нуклеотида со 2 по 23, 1 неспаренный), SNX20 (17 нт), CBLC (16 нт). Участок, комплементарный побочной нити, был обнаружен в мРНК гена PPAPDC (17 нт) Наиболее вероятной мишенью обнаруженной миРНК мы считаем мРНК гена дигидропиримидиназы (DPYS), поскольку наблюдается практически полная комплементарность 22 нуклеотидов целевой нити миРНК и участка мРНК DPYS на границе с 3’-нетранслируемой областью. Первое нуклеотидное основание мишени – аденин, что характерно для миРНК (Lewis, et al., 2005). Более того, девятый нуклеотид миРНК не имеет комплементарной пары в мишени, а нам известно, что наличие неспаренных оснований в положениях 9-11 необходимо для выполнения миРНК функции подавления трансляции белка (Selbach, et al., 2008). Таким образом, предсказывается идеальное взаимодействие миРНК и мишени в мРНК DPYS, что подтверждает предположение, что локус Hs.633957 – это не что иное, как ген миРНК.
Изучение регуляторных участков локуса. Промоторную область локуса Hs. выявляли анализируя данные интернет-ресурса UCSC Genome Browser по модификациям гистонов в различных клетках. Мы обнаружили, что в клетках эндотелия пупочной вены HUVEC первый экзон локуса ассоциирован с модификациями гистонов H3K4me1, H3K4me2, H3K4me3 и H3K27ac, которые характерны для открытого хроматина и промоторных областей генов. В линии клеток хронической лейкемии К-562 первый экзон локуса попадает в область, где гистон H3 моно-, ди- и три-метилирован по лизину 4, ацетилирован по лизину 9 и 27, а хроматин ассоциирован с PolII. Хроматин всего локуса подвержен монометилированию по лизину 9 гистона H3, монометилированию лизина 20 гистона H4 и триметилированию лизина 27 гистона H3 (рис.4).
Рисунок 4. Распределение участков модификаций гистонов в районе локуса Hs.633957 в клетках линии К-562. 1 – связь хроматина с фактором CTCF;
2 – монометилирование H3 по лизину 4 (H3K4me1);
3 – диметилирование H3 по лизину 4 (H3K4me2);
4 – триметилирование H3 по лизину 4 (H3K4me3);
5 – ацетилирование H3 по лизину (H3K9ac);
6 – монометилирование H3 по лизину 9 (H3K9me1);
7 – ацетилирование H3 по лизину 27 (H3K27ac);
8 – триметилирование гистона H3 по лизину 27 (H3K27me3);
9 – триметилирование H3 по лизину 36 (H3K36me3);
10 – монометилирование H4 по лизину 20 (H4K20me1);
11 – Связь хроматина с PolII. Схема составлена с помощью веб утилиты http://genome.ucsc.edu.
Триметилирование лизина 27 гистона H3 преимущественно ассоциировано с закрытым хроматином, остальные модификации – с открытым активным хроматином и промоторными областями генов. Двойственное состояние хроматина, для которого характерны как активирующие, так и подавляющие транскрипционную активность генов модификации гистонов, называется бивалентным. Оно характерно для генов развития в эмбриональных стволовых клетках и генов быстрого ответа. Считается, что такое состояние позволяет клетке быстро активировать или инактивировать ген при соответствующих условиях. Для бивалентного хроматина также характерна связь с РНК-полимеразой II, находящейся в состоянии ареста на промоторе гена.
Полученные данные свидетельствуют о наличии промотора в области первого экзона локуса, поэтому на участке 7 хромосомы от -1000 до +500 п.н. от точки старта транскрипции (ТСТ) локуса Hs.633957 мы провели поиск наиболее распространнных мотивов коровых эукариотических промоторов: консенсусных последовательностей ТАТА-бокса (ТАТААА), ССААТ-бокса (ССААТ) и GC-бокса (GGGCG). Значимость обнаруженных мотивов оценивали по позиционной матрице весов (position-specific weight matrices) Ф. Бучера (P.
Bucher) (Bucher, 1990). Мы обнаружили один мотив ССААТ и несколько GC-боксов, но только один GC-бокс, расположенный на участке от -10 до -6 от ТСТ удовлетворял критериям отбора. На основании полученных данных можно заключить, что локус Hs. имеет собственный GC-бокс-зависимый промотор.
Для выявления дополнительных регуляторных элементов локуса Hs.633957 мы анализировали данные интернет-ресурса UCSC Genome Browser по ассоциации хроматина различных клеток с транскрипционными факторами. Мы обнаружили, что в некоторых линиях клеток, в частности, в летках К-562 (рис.5), с участком первого экзона ассоциирован сложный комплекс белков, включающий транскрипционные активаторы c-Myc, MAX, E2F и GATA-2, ДНК-зависимую РНК-полимеразу Pol II, транскрипционные репрессоры E2F6, SETDB1 и ZNF263, а также фактор YY1, способный как активировать, так и подавлять транскрипцию, в зависимости от белкового окружения.
Рисунок 5. Распределение участков связывания хроматина с транскрипционными факторами в районе локуса Hs.633957 в линии клеток К-562. Связывание с: А – c-Myc, Б – E2F4, В – E2F6, Г – GATA-2, Д – Max, Е – Pol2, Ж – SETDB1, З – YY1, И – ZNF263.
Схема составлена с использованием интернет-ресурса http://genome.ucsc.edu В клетках HeLa-S3 и HUVEC также наблюдали связь хроматина в районе первого экзона локуса Hs.633957 с различными транскрипционными факторами. Состав этих факторов варьировал, но во всех случаях неизменной оставалась ассоциация с c-Myc и Max. Мы провели поиск известных мотивов, с которыми связываются c-Myc и Max (Blackwell et al., 1993), в районе от -1000 до +500 п.н. от ТСТ и обнаружили, что в начале интрона на участке размером около 110 п.н., расположенном через 90 п.н. после конца первого экзона (около п.н. после ТСТ) сосредоточено сразу 7 сайтов связывания c-Myc и Max. На эту же область приходится наибольшая плотность сигнала связывания c-Myc и Max по результатам иммунопреципитации хроматина с последующим секвенированием, собранным на интернет сайте UCSC Genome Browser, что свидетельствует об активности данной области в клетках.
Полученные данные убедительно свидетельствуют о наличии c-Myc-Max-зависимого проксимального промоторного элемента на этом участке.
Филогенетический анализ локуса Hs.633957. Чтобы получить общее представление о консервативности локуса мы составили карту расположения его консервативных участков используя алгоритм PhastCons (Siepel, et al., 2005), реализованный в веб-утилите Human Genome Browser (Рис.6). Оказалось, что наиболее консервативной частью локуса является участок первого экзона, сохраняющийся практически у всех позвоночных. Второй экзон, напротив, не имеет консервативных участков.
Рисунок 6. Карта расположения консервативных участков локуса Hs.633957. Пики отражают вероятность негативной селекции по каждому положению в интервале от до 1. На схеме затенн участок 1 экзона.
Более детальный сравнительный анализ геномов сорока четырх видов позвоночных показал, что обнаруженный нами элемент корового промотора GC-бокс впервые появляется в ряду приматов у мартышки. У прочих позвоночных он отсутствует. c-Myc-зависимый промоторный элемент, содержащий у человека 7 сайтов связывания Myc и Max, также впервые появился у приматов, причм мы обнаружили, что в ряду приматов количество этих сайтов растт. У тупайи такой сайт только один, у мышиного лемура – 3, у мартышки – 4, у макака – 6, у орангутана – 7, гориллы – 6, шимпанзе – 7. Полученные данные свидетельствуют о формировании у приматов нового Myc-Max-зависимого проксимального промотора.
Последовательность, ортологичная повтору L2b, расположенному в области второго экзона локуса и содержащему обнаруженную нами шпильку пре-миРНК, обнаруживается в геномах млекопитающих начиная с тупайи – млекопитающего, долгое время относившегося к приматам, а сейчас входящего в отряд тупайеобразных. При этом, участок, ортологичный пре-миРНК Hs.633957, у тупайи сильно отличается от человеческого. При моделировании вторичной структуры ортологичного участка гипотетической РНК тупайи не образуется характерной шпильки пре-миРНК. Только начиная с мартышки в ряду приматов, последовательности, ортологичные пре-миРНК Hs.633957, приобретают способность формировать характерную вторичную структуру. В то же время, у некоторых обезьян (макак, горилла) ортологи пре-миРНК утратили способность формировать данную структуру из-за наличия замен и делеций. Интересно отметить, что сайт-мишень миРНК Hs.633957 в гене DPYS в ряду приматов впервые наблюдается у мартышки, как и сама миРНК.
Полученные данные свидетельствуют о том, что локус Hs.633957 приобрл возможность формирования миРНК у предков подотряда Haplorrhini в результате приобретения характерной шпилечной структуры и участка комплементарности с мРНК гена-мишени. В дальнейшем локус продолжал эволюционировать. У общего предка человека и шимпанзе пре-миРНК Hs.633957 приобрела свой современный вид, характерный для человека.
ВЫВОДЫ Транскрибируемый локус Hs.633957 является геном, кодирующим миРНК и 1.
характеризующимся повышенной экспрессией в опухолях.
Ген Hs.633957 имеет четыре точки старта транскрипции, а его РНК-продукт – четыре 2.
варианта сплайсинга и две возможных точки полиаденилирования.
Доминирующим РНК-продуктом данного гена является BX119057-подобная форма 3.
РНК со сплайсингом по третьему 3’-сплайс-акцепторному сайту первого интрона, с сохранением второго интрона и дистальной точкой полиаденилирования.
Экспрессия гена Hs.633957 регулируется GC-бокс-содержащим коровым промотором 4.
и проксимальным c-Myc-зависимым промоторным элементом.
Ген Hs.633957 впервые появился до расхождения приматов и тупайеобразных, а его 5.
регуляторные и функциональные элементы сформировались у общего предка человека и мартышки, т.е. до расхождения обезьян Старого и Нового света.
CПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи:
1. Krukovskaja L.L., Baranova A., Tyezelova T., Polev D., Kozlov A.P. Experimental study of human expressed sequences newly identified in silico as tumor specific // Tumour Biol. 2005.
V. 26. p. 17-24.
2. Полев Д.Е., Носова Ю.К., Круковская Л.Л., Баранова А.В., Козлов А.П. Экспрессия транскриптов, соответствующих кластеру Hs.633957, в тканях и опухолях человека // Молекулярная биология. 2009. Т. 43. С. 97-102.
Тезисы докладов на конференциях:
1. Andrei P. Kozlov, J. Nosova, L. Krukovskaja, D. Polev, V. Kobzeva, D. Golovina, G.
Volgareva Expression of novel tumor-specific DNA sequences in epithelial tumors // Proceedings of the Frontiers in Cancer Prevention Research Conference. Baltimore, MD, USA:
AACR, 2005. p. 132,
Abstract
№C3.
2. Круковская Л.Л., Носова Ю.К., Полев Д.Е., Баранова А.В., Галачьянц Ю.П., Самусик Н.А., Козлов А.П. Изучение экспрессии девяти ассоциированных с опухолями нуклеотидных последовательностей в нормальных и опухолевых тканях человека // Русский журнал “СПИД, рак и общественное здоровье”. Тезисы 16-ой Международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2007. С. 85.
3. Круковская Л.Л., Носова Ю.К., Полев Д.Е., Баранова А.В., Галачьянц Ю.П., Самусик Н.А., Козлов А.П.. Изучение экспрессии девяти опухолеассоциированных нуклеотидных последовательности в нормальных и опухолевых тканях человека // Русский журнал “СПИД, рак и общественное здоровье”. Тезисы 17-ой Международной конференции «СПИД, рак и общественное здоровье». Санкт-Петербург: Биомедицинский центр, 2008.
С. 21.
4. Круковская Л.Л., Носова Ю.К., Полев Д.Е., Козлов А.П. Экспериментальное подтверждение опухолеспецифической экспрессии четырх нуклеотидных последовательностей, выявленных in silico // Вопросы онкологии. Тезисы 4й Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург:
ФГУ НИИ онкологии им. Петрова Н.Н. Росмедтехнологий, 2008. С. 14.
5. Круковская Л.Л., Носова Ю.К., Полев Д.Е., Козлов А.П. Экспрессия шести опухолеспецифических нуклеотидных последовательностей в образцах опухолей человека // Вопросы онкологии. Тезисы 3-ей Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург: ФГУ НИИ онкологии им. Н.Н.Петрова, 2007. С. 16.
6. Носова Ю.К., Кобзева В.К., Полев Д.Е., Круковская Л.Л., Павлова Л.С., Козлов А.П.
Анализ экспрессии нуклеотидных последовательностей кластеров Hs.67624, Hs.133294, Hs.133107, Hs.426704, Hs.202247, Hs.104073 в опухолях шейки матки // Русский журнал “СПИД, рак и общественное здоровье”. Материалы 14-ой Международной конференции “СПИД, рак и общественное здоровье”. Санкт-Петербург: Биомедицинский центр, 2005.
С. 27.
7. Полев Д., Козлов А. Hs.633957: транскрипционный шум или функциональная РНК? // Вопросы онкологии. Тезисы 6-й Российской конференции по фундаментальной онкологии "Петровские чтения". Санкт-Петербург: ФГУ НИИ онкологии им. Петрова Н.Н., 2010. С. 38.
8. Полев Д., Круковская Л., Козлов А. Вероятная функция эволюционно нового гена с опухолеспецифической экспрессией // Русский журнал “СПИД, рак и общественное здоровье”. Тезисы 19й международной конференции "СПИД, рак и общественное здоровье". Санкт-Петербург: Биомедицинский центр, 2010. С. 35.
9. Полев Д.Е., Круковская Л.Л., Носова Ю.К., Козлов А.П. Определение границ транскрипта кластера Hs.633957 // Русский журнал “СПИД, рак и общественное здоровье”. Тезисы 18-ой Международной конференции “СПИД, рак и общественное здоровье”. Санкт-Петербург, 2009. С. 37.
10. Полев Д.Е., Носова Ю.К., Машарский А.Э., Круковская Л.Л., Козлов А.П. Определение полноразмерных нуклеотидных последовательностей опухолеспецифических транскриптов из кластера Hs.104073 // Русский журнал “СПИД, рак и общественное здоровье”. Тезисы 16-ой Международной конференции “СПИД, рак и общественное здоровье”. Санкт-Петербург: Биомедицинский центр, 2007. С. 94.