Структурно-функциональный анализ транскриптома mycobacterium tuberculosis при развитии инфекции in vivo
УЧРЕЖДЕНИЕ РОССИЙСКОЙ АКАДЕМИИ НАУК Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. ОвчинниковаНа правах рукописи
СКВОРЦОВ ТИМОФЕЙ АЛЕКСЕЕВИЧ СТРУКТУРНО-ФУНКЦИОНАЛЬНЫЙ АНАЛИЗ ТРАНСКРИПТОМА MYCOBACTERIUM TUBERCULOSIS ПРИ РАЗВИТИИ ИНФЕКЦИИ IN VIVO Специальность 03.01.03 – Молекулярная биология
АВТОРЕФЕРАТ
диссертации на соискание учёной степени кандидата биологических наук
Москва – 2011
Работа выполнена в лаборатории структуры и функций генов человека Учреждения Российской академии наук Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН
Научный консультант:
докт. биол. наук Татьяна Леодоровна Ажикина
Официальные оппоненты:
докт. биол. наук, профессор Арсений Сумбатович Капрельянц чл.-корр. РАН, докт. биол. наук Сергей Михайлович Деев
Ведущая организация:
Центр «Биоинженерия» РАН
Защита состоится «15» июня 2011 г. в 10:00 часов на заседании диссертационного совета Д 002.019.01 при Учреждении Российской академии наук Институте биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН по адресу: 117997, ГСП-7, г. Москва, В-437, ул. Миклухо-Маклая 16/10.
С текстом диссертации можно ознакомиться в библиотеке Учреждения Российской академии наук Института биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН.
Автореферат разослан «13» мая 2011 г.
Учёный секретарь диссертационного совета доктор физ.-мат. наук В.А. Олейников ХАРАКТЕРИСТИКА РАБОТЫ Актуальность проблемы Инфекционные заболевания, несмотря на все усилия, предпринимаемые мировым врачебным и научным сообществами, остаются серьёзной проблемой, унося каждый год миллионы человеческих жизней. Особую актуальность проблема инфекционных заболеваний приобретает в последнее время, что связано с рядом факторов, среди которых можно выделить увеличение плотности и мобильности населения, возникновение штаммов патогенов, обладающих множественной лекарственной устойчивостью, появление и распространение новых заболеваний за счет расширения ареала обитания человека и создания в ходе хозяйственной деятельности новых ниш обитания микроорганизмов. Таким образом, в настоящее время особо необходима интенсификация исследований в области профилактики и лечения инфекционных заболеваний.
Туберкулез уносит каждый год около 2 млн жизней, занимая лидирующие позиции по числу смертей от инфекционного заболевания, вызываемого одним возбудителем, и уступая по этому показателю лишь ВИЧ/СПИД. Возбудителем туберкулёза является внутриклеточная паразитическая бактерия Mycobacterium tuberculosis. По данным ВОЗ, около 30% населения Земли инфицированы M. tuberculosis, при этом вероятность развития активной формы туберкулёза в течение жизни у латентных носителей патогена составляет 10%, что соответствует возникновению 8-9 млн новых случаев туберкулеза в мире каждый год. Развитие инфекционного процесса проходит через несколько стадий, на каждой из которых Mycobacterium tuberculosis подвергается характерному спектру внешних негативных воздействий. Успешное выживание патогена на каждой из этих стадий требует от него быстрой адаптации к изменениям условий среды обитания, каковой является организм хозяина. В основе подобных адаптаций лежит динамическое изменение экспрессии генов патогена.
Так как изменения в экспрессии генов, возникающие в ответ на защитную реакцию организма хозяина, являются необходимым условием для выживания и размножения патогенных бактерий, то изучение подобных изменений необходимо для лучшего понимания молекулярных механизмов патогенеза туберкулеза. Анализ микобактериального транскриптома in vivo позволяет установить гены, активирующиеся на различных стадиях заболевания, и, следовательно, помочь в разработке новых лекарственных препаратов и диагностических средств.
Цели и задачи работы Целью настоящей работы являлось выявление динамических изменений экспрессии генов Mycobacterium tuberculosis в тканях модельных организмов, обладающих генетически детерминированными различиями устойчивости к заболеванию, а также их структурный и сравнительный анализ.
Были поставлены следующие задачи:
Разработать новый экспериментальный подход для изучения транскриптома 1.
внутриклеточных патогенов в системе in vivo. Оценить эффективность метода на модельной системе - охарактеризовать транскриптом M. tuberculosis штамма H37Rv в инфекционной системе (легкое мыши, инфицированной M. tuberculosis). Разработать программные алгоритмы статистической и биоинформатической обработки получаемых массивов данных.
С использованием разработанного метода получить наборы 2.
последовательностей M. tuberculosis H37Rv, транскрибирующихся в тканях легкого инфицированных мышей линии I/St, сверхчувствительных к инфекции, и B6, резистентных к инфекции, на 4-й и 6-й неделях с момента заражения. Определить нуклеотидные последовательности транскриптов методом массированного секвенирования.
Провести сравнительный анализ экспрессии генов M. tuberculosis в легочной 3.
ткани инфицированных мышей;
определить гены, меняющие уровень своей экспрессии при развитии инфекции;
выявить биохимические пути, с помощью которых M. tuberculosis адаптируется к защитной реакции организма хозяина.
Научная новизна и практическая ценность работы В ходе данной работы был разработан новый метод обогащения образца тотальной кДНК, полученной из инфицированной ткани хозяина, фрагментами кДНК бактериального патогена. Метод КлИП (Клонирование Идентичных Последовательностей) основан на гибридизации двух пулов ДНК и последующей избирательной амплификации целевой фракции фрагментов ДНК за счет эффекта супрессии ПЦР. Метод универсален и может быть применен для получения РНК как других внутриклеточных паразитических или симбиотических бактерий, так простейших и вирусов.
Разработанный нами метод был применен для анализа транскриптомов M. tuberculosis H37Rv из легочной ткани инфицированных мышей линии A/Sn на 9-й неделе с момента инфекции. Мыши линии A/SnYCit (A/Sn) при инфекциях M. tuberculosis проявляют сравнительно высокий уровень резистентности к заболеванию. Анализ транскриптома M. tuberculosis выявил изменения в профиле экспрессии генов патогена, характерные для хронической фазы инфекции, которая характеризуется определенными функциональными перестройками, в частности, усилением метаболизма липидов и переходом к нитратному клеточному дыханию.
В ходе экспериментальной работы были получены библиотеки кДНК M. tuberculosis из тканей легкого инфицированных модельных организмов (мышей), обладающих различными уровнями генетически детерминированной резистентности к заболеванию. Впервые был осуществлен анализ последовательностей микобактериальных кДНК при помощи метода полномасштабного секвенирования RNA-Seq. В ходе работы подобраны оптимальные способы статистического анализа данных и создан набор программ, позволяющих эффективно обрабатывать большое количество нуклеотидных последовательностей, отбирая необходимые по заданному ряду критериев.
Было установлено несколько молекулярно-генетических детерминант, характеризующих M. tuberculosis из различных моделей инфекции;
выявлен ряд генов, продукты которых являются необходимыми для размножения бактерий и развития инфекции вне зависимости от генотипа хозяина и представляют тем самым объекты потенциального терапевтического воздействия. Дальнейшие исследования в области изучения экспрессии генов патогена позволят расширить спектр молекулярно генетических детерминант, характеризующих развитие инфекции по тому или иному пути, что, в свою очередь, даст возможность более точной диагностики и достоверного прогнозирования течения заболевания и, следовательно, выбора оптимальной стратегии лечения.
Структура диссертации Диссертация изложена на 160 листах машинописного текста, имеет традиционную структуру и состоит из следующих разделов: введения, обзора литературы, экспериментальной части, изложения результатов работы и их обсуждения, выводов, списка цитируемой литературы, включающего 233 ссылки, и приложений.
СОДЕРЖАНИЕ РАБОТЫ
1. МЕТОД КЛОНИРОВАНИЯ ИДЕНТИЧНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ (КлИП) И ЕГО ПРИМЕНЕНИЕ ДЛЯ АНАЛИЗА БАКТЕРИАЛЬНОГО ТРАНСКРИПТОМА М. TUBERCULOSIS IN VIVO Анализ специфической экспрессии генов патогенов (микроорганизмов и простейших) в инфицированном организме представляет собой широко распространенную задачу как в исследовательских лабораториях, где он нацелен на получение данных о взаимодействиях организма и патогена, так и, в перспективе, в клинике, где сведения о качественном и количественном содержании различных РНК патогена могут служить средством диагностики и прогноза течения болезни. Однако анализ существующими методами транскриптома патогенной бактерии в непосредственной инфекционной среде (пораженной ткани) затруднен из-за сложностей, связанных с выделением бактериальной РНК, ее чрезвычайно малого количества и проблемы отделения бактериальной РНК от подавляющего количества тотальной РНК хозяина, в то время как изучение экспрессии генов бактерий при их выращивании в жидкой среде и имитации реальных условий инфекции не отражает реальной картины, возникающей при развитии болезни.
Мы использовали метод Клонирование Идентичных Последовательностей (КлИП, Coincidence Cloning, CC) для извлечения кДНК бактериального патогена из смеси с кДНК мыши. Метод заключается в гибридизации тотальной кДНК, синтезированной из РНК, выделенной из инфицированных тканей, со значительным молярным избытком бактериальной геномной ДНК и последующей избирательной амплификацией фрагментов при помощи ПЦР. Реассоциация бактериальной кДНК с избытком бактериальной геномной ДНК является процессом с псевдомономолекулярной кинетикой. Вследствие этого гибридизация в течение достаточного времени позволяет предотвратить появление искажений в представленности различных микобактериальных транскриптов и делает возможным количественный анализ бактериального транскриптома из инфицированных клеток хозяина.
Синтез тотальной кДНК Тотальная РНК была выделена из ткани легкого инфицированных мышей линии A/SnYCit (далее – A/Sn) на 9-й неделе с момента заражения стандартным способом, заключающимся в обработке животных аэрозолем, содержащим 1-2x102 КОЕ M.
tuberculosis H37Rv 1. кДНК была синтезирована при помощи технологии SMART (Clontech). Для затравки синтеза первой цепи кДНК был использован праймер, имеющий в составе нонануклеотид d(N)9, соединенный на 5’-конце с последовательностью, идентичной олигонуклеотиду SMART и содержащей сайт рестрикции эндонуклеазы RsaI.
После завершения обратной транскрипции кДНК была амплифицирована с использованием праймера, комплементарного константным участкам на 5’и 3’-концах первых цепей кДНК.
Клонирование идентичных последовательностей (КлИП) Для того чтобы выделить кДНК бактерии из смеси с кДНК мыши, был использован метод Клонирования Идентичных Последовательностей, позволяющий из двух образцов ДНК избирательно выделять фрагменты, одновременно присутствующие в обоих образцах (Рис. 1А). Для этого два образца ДНК рестрицировали с помощью частощепящей эндонуклеазы рестрикции. Затем проводили лигирование супрессионных адаптеров к фрагментам рестрикции из обоих наборов. Далее два набора подготовленных таким образом фрагментов ДНК объединяли, денатурировали и медленно ренатурировали. Одинаковые последовательности из разных наборов образуют гибридные дуплексы, содержашие на 5’-концах различные супрессионные адаптеры.
Последовательности, встречающиеся только в одном из 2-х наборов ДНК, могут образовывать лишь гомодуплексы с идентичными адаптерами на концах, что предотвращает возможность их амплификации в ходе ПЦР за счет эффекта ПЦР супрессии, в то время как гибридные дуплексы эффективно амплифицируются (Luk’ianov et al., 1996).
Геномная ДНК M. tuberculosis H37Rv была рестрицирована эндонуклеазой рестрикции RsaI, после этого было осуществлено лигирование к полученным фрагментам адаптера I. Смесь кДНК мыши и M. tuberculosis также была обработана RsaI, затем к полученным фрагментам лигировали супрессионный адаптер II. Подготовленные подобным образом фрагменты геномной ДНК и кДНК были взяты в равных по массе количествах и смешаны. Известно, что содержание микобактериальной РНК составляет всего лишь 0,04-0,2% от тотальной РНК (Banaiee et al, 2006), поэтому молярное соотношение между микобактериальной ДНК и микобактериальной кДНК в смеси превысило 1:100. Полученная смесь была денатурирована при 99°C в течение 3 минут и Работа по инфицированию животных проведена сотрудниками ЦНИИ Туберкулеза РАМН.
медленно ренатурирована при 68°C в течение 16 часов. Полученные в результате дуплексы были амплифицированы. ПЦР-амплификация была проведена с использованием праймеров Pr I и Pr II, комплементарных внутренним участкам адаптерных последовательностей I и II, соответственно. Селективность амплификации была продемонстрирована при помощи ПЦР с использованием одного из двух внутренних праймеров, при этом не происходило образования ампликонов (гомодуплексов), в то время как использование сразу обоих внутренних праймеров приводило к образованию целевого продукта (гибридного дуплекса) (Рис. 1Б).
ПЦР продукт представлял собой набор фрагментов, обогащенный кДНК M.tuberculosis, селективно амплифицированных из смеси фрагментов кДНК микобактерий и мыши. Чтобы оценить достигнутое обогащение ПЦР продукта бактериальной кДНК было проведено его молекулярное клонирование в E. сoli, и определена нуклеотидная последовательность 75 рекомбинантных клонов, отобранных случайным образом. клона (24%) содержали вставки, нуклеотидная последовательность которых совпадала с последовательностями геномной ДНК мыши, в то время как остальные клоны (76%) содержали вставки, соответствующие различным участкам геномной последовательности M. tuberculosis. Наличие в последнем случае во вставках двух различных адаптерных последовательностей указывало на то, что вставки были образованы из гетеродуплексов, т.е. гибридных последовательностей геномной ДНК и кДНК микобактерий. Все последовательности, картируемые на геном мыши, обладали лишь одной адаптерной последовательностью I, что свидетельствовало об отсутствии гибридных молекул кДНК мыши и геномной ДНК M. tuberculosis.
Pr I + Pr II Pr II 100 bp Pr I ladder Адаптер I Адаптер II Б (1) (2) А Pr I и Pr II B Рисунок 1. А) Схема метода КлИП. Б) Проверка эффективности супрессии ПЦР при использовании каждого из праймеров (Pr I и Pr II). В) Электрофореграмма результатов ПЦР гена Rv1664 с матрицы тотальной кДНК (1) и с матрицы ампликона КлИП (2).
Цифрами обозначен цикл ПЦР, на котором был осуществлен отбор части образца для электрофоретического анализа;
(+) – положительный контроль (ПЦР с матрицы геномной ДНК M. tuberculosis, 40 циклов);
(-) – отрицательный контроль (ПЦР без добавления матричной ДНК, 40 циклов).
Сравнительную оценку содержания транскриптов в исходном образце кДНК и в ампликоне провели для 15 случайным образом отобранных генов M. tuberculosis методом ПЦР с ген-специфическими праймерами. Так как относительное содержание бактериальной кДНК в тотальной кДНК чрезвычайно мало, в ходе ПЦР образовывались неспецифические продукты, поэтому мы использовали полуколичественную ПЦР с анализом накопления продукта через каждые 2 цикла (Рис. 1В). Несмотря на то, что наличие транскриптов всех 15 генов было обнаружено в ампликоне, лишь 10 из них было детектировано в образце тотальной кДНК, причиной чего являлось низкое относительно содержание бактериальной кДНК в препарате тотальной кДНК. Учитывая, что транскрипты 16S рРНК были визуализированы нами на 32 цикле ПЦР амплификации при использовании тотальной кДНК в качестве матрицы, мы разделили все тестируемые гены на 3 группы: 1) слаботранскрибируемые гены (5 из 15) не детектируются в исходном образце, но достоверно представлены (28-39 цикл ПЦР) в ампликоне;
2) высокотранскрибируемые гены (5 генов, детектируемых на 35-36 циклах ПЦР для образца кДНК и 8-20 циклах для ампликона) и 3) среднетранскрибируемые гены (5 генов, детектируемых на 39-40 циклах ПЦР для образца кДНК и 22-28 циклах и 8-20 циклах для ампликона). Относительная представленность транскриптов разных геновв достаточной степени сохраняется в обоих сравниваемых образцах. Мы также сравнили полученные нами в результате ПЦР данные со схожими литературными данными (Talaat et al, 2007.). В целом, наблюдалась достаточно высокая степень согласования результатов, выявленные же различия можно отнести на счет как различий в инфекционных моделях (различное время инфекции, другие линии мышей), так и методических особенностей обоих экспериментальных подходов.
Таким образом, нами было продемонстрировано, что КлИП сохраняет не только качественный, но и количественный профиль транскриптома;
кроме того, чувствительность метода позволяет анализировать даже самые низкопредставленные транскрипты (на примерах транскриптов, не детектируемых в образце тотальной кДНК).
Анализ библиотеки CC(ASN) Было проведено массированное секвенирование полученного образца кДНК и получены данные для 98692 независимых реакций секвенирования (далее «прочтений»).
Проведено картирование этих нуклеотидных последовательностей фрагментов кДНК при помощи алгоритма standalone BLASTn на последовательность генома M. tuberculosis H37Rv (сборка GenBank AL123456.2). Картирование проводилось согласно следующим условиям: длина участка последовательности, картируемой на геном – не менее 40 нт, с идентичностью не менее 95%;
последовательности, картируемые неуникально (на 2 или более места в геноме), либо не картируемые, были исключены из дальнейшего анализа. В результате было получено 53940 уникально картируемых прочтений. Эти последовательности были далее проанализированы с целью выявить гены и межгенные (IGR, intergenic region) последовательности. Выявлена экспрессия 554 генов (13,8% от общего количества генов M. tuberculosis), 158 из них экспрессировались на достаточно высоком уровне (более 20 прочтений на ген). Результаты картирования приведены в Таблице 1.
Таблица 1. Результаты секвенирования и картирования библиотеки CC(ASN).
Прочтений, всего Mtb-специфических прочтений, уникальных Mtb-специфических прочтений (уникальных), % от всех 54, Генов экспрессируется (прочтений0) Генов экспрессируется, % от общего количества генов 13, После завершения картирования гены, для которых были найдены кДНК, были отнесены к основным биохимическим категориям согласно базе данных TubercuList (http://tuberculist.epfl.ch (Таблица 2). Из-за высокой степени идентичности нуклеотидной последовательности генов транспозаз невозможно было провести однозначное отнесение фрагментов кДНК к генам этой функциональной категории (insertion sequences and phages), поэтому её не учитывали в дальнейшем анализе транскриптома.
Таблица 2. Аннотация генов, экспрессирующихся у M. tuberculosis H37Rv в легочной ткани мышей линии A/Sn на 9-й неделе с момента инфицирования, к биохимическим категориям.
Количество Количество генов % экспрессирующихся Категория экспрессирующихся категории в генов в категории генов в категории геноме Cell wall and cell 111 773 14, processes 149 1081 13, Conserved hypotheticals 31 241 12, Information pathways Intermediary metabolism 139 923 15, and respiration 50 247 20, Lipid metabolism 15 168 8, PE/PPE 26 195 13, Regulatory proteins 2 16 12, Unknown Virulence, detoxification, 22 228 9, adaptation ВСЕГО 545 В категории генов липидного метаболизма нами были найдены транскрипты 50 из 247 генов данной категории, что свидетельствует о высокой активности метаболизма липидов у микобактерий из изучаемого образца, среди них 18 генов семейства fad, являющихся ацил-КоА синтазами. Повышенная экспрессия генов данного семейства является характерной для микобактерий in vivo, так как наблюдается усиление липолиза при переходе к использованию жирных кислот и холестерина в качестве источника ацильных групп для цикла Кребса. Отдельно стоит отметить экспрессию генов fadD26 и fadD28, продукты которых участвуют в пути биосинтеза фтиоцерол димикоцерозата (PDIM), сложного липида, присутствующего в клеточной стенке M. tuberculosis;
генов ppsC и ppsD, поликетид-синтаз, также вовлеченных в синтез PDIM;
генов семейства pks, pks2 и pks6, необходимых для синтеза сульфолипида SL и нового, пока неохарактеризованного, класса полярных липидов (Waddell, 2007).
Известно, что при переходе инфекции в латентное состояние происходит ряд важных перестроек в энергетическом метаболизме микобактерий. Наиболее характерной из них является изменение клеточного дыхания, при этом осуществляется переход к использованию нитрата в качестве конечного акцептора электронов в электрон транспортной цепи (ЭТЦ). Мы обнаружили экспрессию генов кластера narGHIJ и гена narX, кодирующих субъединицы нитрат-редуктаз, а также гена narK3, кодирующего транспортный белок, осуществляющий вывод нитрита из бактериальной клетки.
Обнаружена повышенная экспрессия генов, продукты которых тем или иным образом связаны с метаболизмом аминокислот (hisB, aspC). Помимо этого мы выявили высокий уровень экспрессии генов phoH1 и atsA. Ген phoH1 кодирует белок с неизвестной функцией, экспрессия этого гена повышается при дефиците фосфатов;
продукт гена atsA является арилсульфатазой, ферментом, осуществляющим отщепление сульфата от его ароматических производных. Несмотря на то, что точная функциональная роль в метаболизме микобактерий продуктов этих 2-х генов не установлена, можно предположить, что их экспрессия связана с дефицитом неорганических сульфата и фосфата в микроокружении M. tuberculosis и необходима для устранения этого дефицита.
Таким образом, можно говорить о том, что проанализированный бактериальный транскриптом действительно качественно и количественно соответствует хронической фазе инфекционного процесса, который характеризуется усилением метаболизма липидов и переходом к нитратному клеточному дыханию (Waddell, 2010).
2. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ЭКСПРЕССИИ ГЕНОВ M. TUBERCULOSIS В ЛЕГОЧНОЙ ТКАНИ ИНФИЦИРОВАННЫ Х МЫ ШЕЙ С РАЗЛИЧНОЙ УСТОЙЧИВОСТЬЮ К ЗАБОЛЕВАНИЮ.
Помимо механизмов, участвующих в защите хозяина, развитие инфекционного процесса во многом зависит от специфической экспрессии бактериальных генов.
Изменения в экспрессии, возникающие в ответ на защитную реакцию организма-хозяина, являются необходимым условием для выживания и функционирования патогенных бактерий. Анализ этих изменений необходим для понимания патогенеза инфекционного заболевания и выработки подходов к наиболее эффективному лечению.
Нами было проведено сравнительное исследование транскриптомов M. tuberculosis в условиях in vivo с тем, чтобы установить какие именно особенности профиля экспрессии генов микобактерий ведут к прогрессирующему заболеванию и чем эффективные механизмы защиты отличаются от дефектных на уровне экспрессии бактериальных генов.
Для этого на разных этапах инфекционного процесса нами был предпринят сравнительный количественный и качественный анализ последовательностей, транскрибирующихся при инфекции мышей, генетически чувствительных (неэффективный иммунный ответ) и резистентных (эффективный ответ) к этим бактериям.
Мы провели сравнение транскриптомов M. tuberculosis H37Rv при инфекции мышей двух линий, I/StSnEgYCit (I/St) и C57BL/6JCit (B6). Эти линии мышей ранее подробно описаны (Kondratieva, 2010), была показана повышенная устойчивость к инфекции M. tuberculosis мышей линии B6 в сравнении с мышами линий I/St, что выражается в менее агрессивном течении инфекционного процесса у мышей линии B6 и более длительной выживаемости инфицированных животных (Рис. 2). Так, патологические изменения в легких мышей линии I/St, зараженных M. tuberculosis, характеризуются наличием некротизирующейся грануломы, окруженной гипоксической зоной, и обширным притоком нейтрофилов, что является дополнительным фактором, приводящим к повреждениям тканей легкого, в то время как у мышей B6 подобной картины не наблюдается.
Рисунок 2. Сравнение развития инфекции M. tuberculosis в тканях легкого мышей линий B6 и I/St. A) Выживаемость мышей обеих линий. B) Бактериальная нагрузка в легочной ткани мышей обеих линий (рисунок цитируется по Kondratieva et al., 2010).
Получение и количественная характеристика последовательностей M. tuberculosis, транскрибирующихся в легочной ткани мы шей с генетически детерминированны ми различиями в устойчивости к инфекции.
Было осуществлено аэрогенное заражение самок мышей обеих линий бактериями M. tuberculosis 2. Спустя 4 и 6 недель с момента инфекции зараженные мыши обеих линий были умерщвлены, выделена тотальная РНК легких. Образцы тотальной РНК тканей легкого мышей I/St и B6 были использованы для синтеза кДНК, обогащенной далее фрагментами бактериальной кДНК при помощи метода КлИП. Получены 3 библиотеки последовательностей, представляющие собой транскриптомы M. tuberculosis из тканей мышей линии I/St на 6-й неделе с момента инфекции (СС6(SUS)) и из тканей мышей линии В6 на 4-й и 6-й неделях с момента инфекции (СС4(RES) и СС6(RES), соответственно). Библиотеки были проанализированы методом 454 пиросеквенирования (Центр «Биоинженерия» РАН). Общая схема эксперимента приведена на Рисунке 3, общая характеристика проанализированных библиотек приведена в Таблице 3. Всего были определены нуклеотидные последовательности 190031 фрагмента кДНК. Из них в Работа по инфицированию животных проведена сотрудниками ЦНИИ Туберкулеза РАМН.
CC4(RES) были определены 73410 последовательности, 75655 – в образце CC4(SUS), 40966 - в CC6(RES).
Картирование нуклеотидных последовательностей проводилось способом, описанным ранее для образца CC(ASN). По результатам картирования было установлено, что в образце CC4(RES) 14990 (20,42%) последовательностей являются последовательностями M. tuberculosis, в образце CC6(SUS)– 43618 (57,65%) и в образце CC6(RES) – 34234 (83,57%). Приведенные результаты свидетельствуют о том, что удалось достигнуть значительного обогащения образцов кДНК бактериальными последовательностями.
Рисунок 3. Общая схема эксперимента по сравнению экспрессии генов M. tuberculosis из тканей легкого мышей линий B6 и I/St на 4-й и 6-й неделях с момента инфекции.
Таблица 3. Результаты секвенирования и картирования библиотек CC4(RES), CC6(RES) и CC6(SUS) Библиотека CC4(RES) CC6(SUS) CC6(RES) Прочтений, всего 73410 75655 Mtb-специфических прочтений, 14990 43618 уникальных Mtb-специфических прочтений 20,4 57,7 83, (уникальных), % от всех Генов экспрессируется (прочтений0) 1012 1353 Генов экспрессируется, % от общего 25,2 33,7 48, количества генов Анализ транскриптомов Анализ полученных транскриптомов был проведен с использованием аннотации генома M. tuberculosis H37Rv из базы данных Tuberculist (http://tuberculist.epfl.ch). Для получения качественной и количественной оценки экспрессии генов картированные на геном последовательности были соотнесены с положением как кодирующих, так и некодирующих участков M. tuberculosis. При подсчете количества картированных на каждый ген и межгенный участок последовательностей была учтена возможность котранскрипции в рамках одной последовательности двух или более генов и/или межгенных участков. Из 4012 генов и 7 псевдогенов M. tuberculosis в образце CC4(RES) наблюдалась экспрессия 1012 (25,2%), в образце CC4(SUS) - 1353 (33,7%), в образце CC6(RES) – 1940 генов (48,3%). 1428 ген (35,5%) не показал экспрессию ни в одном из образцов, в то время как для 469 (11,7%) генов экспрессия наблюдалась в каждом из образцов. Распределение по функциональным категориям экспрессирующихся генов каждой из библиотек приведено на Рисунке 4. Мобильные элементы (инсерционные последовательности и фаги) были исключены из дальнейшего анализа, также как и ранее.
Подробная функциональная аннотация генов проанализированных транскриптомов, а также их принадлежность к тем или иным метаболическим путям приведены в Приложении к диссертации.
Функциональные категории CC6(Res) CC6(Sus) CC4(Res) Virulence, detoxification, adaptation Unknown Regulatory proteins PE/PPE Lipid metabolism Intermediary metabolism and respiration Information pathways Conserved hypotheticals Cell wall and cell processes 0 10 20 Процентное содержание от всех генов в библиотеке Рисунок 4. Аннотация генов M. tuberculosis H37Rv, экспрессирующихся в образцах легочной ткани мышей линий B6 на 4-й и 6-й неделе с момента инфекции (CC4(RES) и CC6(RES)) и мышей линий I/St на 6-й неделе с момента инфекции (CC6(SUS)), к биохимическим категориям.
Гены, экспрессия которы х повы шается при развитии инфекции.
Нами было проведено сравнение транскриптомов при развитии инфекции в генетически устойчивой линии мышей (СС6(RES) vs CC4(RES)) и сравнение транскриптомов туберкулеза в одной временной точке в генетически различных мышах (СС6(RES) vs CC6(SUS)). Данные анализа суммированы на рисунке 5. Сравнение было направлено на поиск поиск генов, экспрессия которых повышается при развитии инфекции, т.е. в мышах линии В6 на 6 неделе по сравнению с другими точками.
Определяли:
1) гены, повышенная экспрессия которых уникальна при сравнении генетически различных хозяев 2) гены, повышенная экспрессия которых независима от генетических особенностей организма хозяина. Эти гены представляют некий базовый набор генов, отражающий универсальную компенсаторную реакцию M. tuberculosis на неблагоприятные условия окружающей среды. Эти гены обозначены далее как CUG –Commonly Upregulated Genes.
Рисунок 5. Схема сравнения транскриптомов.
Для определения достоверно значащих различий в экспрессии, дифференциально экспрессирующимися считались последовательности, для которых как минимум в одном из образцов насчитывалось не менее 20 прочтений и для которых вероятность отсутствия статистически значимых отличий в тесте Audic-Claverie была менее 0.001 (p0.001) (Audic & Claverie, 1997) и q-value при вычислении FDR (меры контроля числа ложноположительных результатов) было менее 0.05 (Storey, 2003).
Сравнение СС6(RES) vs CC4(RES) позволило нам выявить 226 генов, экспрессия которых повышена в ходе развития инфекции в тканях мышей B6. В результате сравнения СС6(RES) vs CC6(SUS) установлено 253 гена c повышенной экспрессией в образце CC6(RES) (см. рис.5).
Уникальны е для каждого сравнения гены, экспрессия которы х повы шается при развитии инфекции В сравнении CC6(RES) vs CC4(RES) определено 17 уникальных генов, что меньше, чем в сравнении CC6(RES) vs CC4(SUS), где повышена экспрессия 44 генов. Вероятно, данная статистика отражает тот факт, что первое сравнение характеризует динамику изменения экспрессии генов патогена во времени в пределах одного микроокружения. Во втором случае сравнение выявляет различия между двумя разными микроокружениями, что и отражается в большем количестве генов, экспрессия которых повышена в CC6(RES).
Гены, экспрессия которых повышена в образце CC6(RES) только в сравнении с CC4(RES), преимущественно относятся к категориям cell wall and cell processes, intermediary metabolism and respiration и lipid metabolism. Белковые продукты 12 из генов были обнаружены во фракции клеточной мембраны и/или клеточной стенки, где они выполняют преимущественно транспортные и защитные функции. Так, ген embA кодирует индолилацетилинозитол арабинозилтрансферазу EmbA, участвующую в синтезе арабинана, мутации в этом гене приводят к устойчивости к этамбутолу;
ген Rv кодирует карбонат-дегидратазу, функциональная активность которой связана с транспортом сульфатов (TubercuList, http://tuberculist.epfl.ch). После проведённого нами анализа с использованием KEGG Pathways (http://www.genome.jp/kegg/pathway.html) и TBCYC (http://tbcyc.tbdb.org/) мы не смогли обнаружить метаболических путей, активирующихся на более позднем сроке развития инфекции по сравнению с ранним.
Этот факт может быть следствием случайных флуктуаций в экспрессии генов патогена, его реакцией на такие же случайные изменения свойств микроокружения, либо же отражать небольшие, но существенные различия функциональной активности M.
tuberculosis в различных временных точках.
В образце CC6(RES) из сравнения CC6(RES) vs CC4(SUS) было обнаружено больше генов, чья экспрессия была повышена исключительно в этом сравнении. Усиление энергетического обмена выражено в повышенной экспрессии генов 3-х субъединиц NADH-дегидрогеназы (nuoH, nuoI, nuoL);
более активной работе цикла трикарбоновых кислот (acn), а также наличии повышенной экспрессии гена Rv1916. Ген Rv1916 является второй частью гена aceA (icl2), разделенного у M. tuberculosis H37Rv на два модуля, Rv1915 и Rv1916 (aceAa и aceAb), которые экспрессируются по отдельности. Среди других важных отличий можно отметить также повышенную экспрессию генов, продукты которых отвечают за метаболизм и катаболизм липидов и аминокислот (lipV, lipF, Rv2531c), а также ферментов, участвующих в репарации ДНК (recO, recB). Подобная картина достаточно предсказуема, так как микроокружение резистентного хозяина представляет собой враждебную среду обитания, что объясняет необходимость большей активности систем репарации. Повышенная экспрессия липолитических ферментов (lipF, lipV, plcA), ферментов цикла трикарбоновых кислот и aceAb могут указывать на большую степень использования липидов в качестве источника энергии и углерода.
CUGs - гены, необходимы е M tuberculosis для адаптации к различны м защитны м механизмам организма хозяина Было определено 209 генов, экспрессия которых была увеличена в обоих сравнениях. Продукты 44 генов являлись, согласно результатам транспозонного мутагенеза, незаменимыми (essential, Sassetti et al., 2003) у M. tuberculosis H37Rv;
ещё для трех генов (Rv3569c, Rv3537, Rv3563) транспозонным мутагенезом ранее была показана незаменимость для выживания в мышиных макрофагах (TubercuList, http://tuberculist.epfl.ch).
Чуть меньше трети генов приходилось суммарно на категории conserved hypotheticals (59 генов ) и unknown (2 гена). Несмотря на отсутствие известных функций, гены в данной категории представляют потенциальные терапевтические мишени, так как невысокая степень гомологии этих генов с генами других микроорганизмов означает, что данные гены являются характерными именно для микобактерий или конкретно для M. tuberculosis, возможно определяя вирулентные свойства.
Функция белков семейства PE/PPE, не вполне понятна, считается, что они необходимы для создания антигенной вариабельности у микобактерий (Karboul et al, 2008). Тем не менее, гены Rv0152c и Rv0355c обладают высоким уровнем экспрессии в образце CC6(RES) и для них была обнаружена экспрессия в образцах CC4(RES) и CC4(SUS), а ген Rv3135 относится к числу незаменимых у M. tuberculosis H37Rv, что может указывать на какие-либо дополнительные функции, помимо обеспечения антигенной вариабельности.
В числе прочих особенностей, присущих CUG, можно отметить активность путей метаболизма аминокислот. Непонятно, вызвана ли активация экспрессии ферментов метаболизма аминокислот отсутствием в среде доступных аминокислот (и необходимостью их синтеза) либо же их присутствием (и использованием возможности их утилизации). В пользу того, что микобактерии оказываются в бедных питательными веществами условиях, указывает высокий уровень экспрессии генов различных систем захвата и накопления питательных веществ, например, фосфата (pstS1), железа (irtA, mbtC, mbtE, mbtF). На нехватку фосфата указывает и повышенная экспрессия гена senX3, являющегося сенсорным компонентом двухкомпонентной регуляторной senX3/regX3, активирующей так называемый «строгий ответ» (stringent response) в условиях дефицита фосфора. На переход к использованию в качестве основного источника энергии и углерода указывает экспрессия генов метаболизма липидов (fadD, fadE, lipU, lipJ). На переход к характерному для латентной инфекции анаэробному нитратному дыханию указывает повышенная экспрессия генов (narH, narK3). Наконец, стоит отметить ген secA2. Этот ген кодирует транслоказу SecA2, являющуюся компонентом вспомогательной транспортной системы Sec M. tuberculosis, обеспечивающей, помимо прочего, секрецию супероксид-дисмутазы SodA и каталазы KatG. Живая вакцина, созданная на основе мутанта M. tuberculosis по гену secA2 (Hinchey et al., 2011), показала высокую эффективность и безопасность при испытаниях на животных. В целом, можно сказать, что CUG отражает характерные особенности инфекции в мышиной модели, кроме того факта, что мы обнаружили повышение экспрессии генов atpF и atpH, хотя в литературе обычно описывается снижение их экспрессии при развитии инфекции, так как энергетические потребности патогена снижаются по мере того, как он входит в состояние латентной инфекции.
Представленность генов CUG в библиотеке CC(ASN) После секвенирования обогащенных библиотек кДНК и соответствующей биоинформатической обработки в нашем распоряжении оказались данные о 4-х транскриптомах Mycobacterium tuberculosis (СС4(RES), СС6(RES), СС6(SUS) и СС9(ASN)). Для того чтобы выяснить, насколько экспрессия CUG характерна для микобактерий, мы предприняли анализ ранее полученного транскриптома CC(ASN) на предмет присутствия в нем транскриптов этих генов. В результате мы выявили кодирующих различные белки генов, относящихся к CUG и присутствующих в библиотеке CC(ASN) (полный список приведен в приложении к диссертации). Среди этих генов, можно выделить ряд таких, уровень экспрессии которых высок как в образце CC6(RES), так и в образце CC(ASN) (Таблица 4). В их числе гены систем метаболизма жирных кислот (fadD26, mmaA3, ppsC, ppsD) и аминокислот (hisB, aspC), гены pstS1 и phoH1, участвующие в реакции M. tuberculosis на дефицит фосфора;
kstD и Rv1106c, продукты которых участвуют в метаболизме холестерина, сюда также может быть отнесен ген Rv0785, предположительно так же, как и kstD, кодирующий 3-кетостероид--1 дегидрогеназу;
Rv0712 и atsA, кодирующие ферменты, необходимые для метаболизма серы;
а также ряд генов, кодирующих продукты с неопределенной функцией.
Таблица 4. CUG гены с высоким уровнем экспрессии (число прочтений 20).
Gene Alt. Functional Functional description name name category Rv2930 fadD26 lipid metabolism Acyl-coa synthase Rv0643c mmaA3 lipid metabolism Methoxy mycolic acid synthase 3 mmaa3 (methyl mycolic acid synthase 3) (mma3) (hydroxy mycolic acid synthase)( ec:2.1.1.79 ) Rv2933 ppsC lipid metabolism Phenolpthiocerol synthesis type-i polyketide synthase ppsc Rv2934 ppsD lipid metabolism Phenolpthiocerol synthesis type-i polyketide synthase ppsd Rv0337c aspC intermediary Aspartate aminotransferase( EC:2.6.1.- ) metabolism and respiration Rv1601 hisB intermediary Imidazoleglycerol-phosphate dehydratase( metabolism and EC:4.2.1.19 ) respiration Rv0934 pstS1 cell wall and cell Periplasmic phosphate-binding lipoprotein psts processes (pbp-1) (psts1) Rv2368c phoH1 intermediary Probable phoh-like protein phoh1 (phosphate metabolism and starvation-inducible protein psih) respiration Rv3537 kstD intermediary 3-ketosteroid-delta-1-dehydrogenase metabolism and respiration Rv0785 Rv0785 conserved Hypothetical protein hypotheticals Rv1106c Rv1106c intermediary Probable cholesterol dehydrogenase metabolism and respiration Rv0711 atsA intermediary Possible arylsulfatase atsa (aryl-sulfate metabolism and sulphohydrolase) (arylsulphatase)( ec:3.1.6.1 ) respiration Rv0712 Rv0712 conserved Hypothetical protein hypotheticals Заключение В данной работе впервые проведен параллельный широкомасштабный анализ транскриптомов M. tuberculosis в системе in vivo с использованием масштабного секвенирования. Получены данные о последовательностях M. tuberculosis, транскрибирующихся в легочных тканях генетически устойчивых и чувствительных к туберкулезу мышей в различных временных точках, что дало возможность установить факторы, ответственные за осуществление адаптации патогена к условиям конкретного микроокружения. Полученные транскриптомы M. tuberculosis были охарактеризованы качественно и количественно, выявлен ряд генов, уровень экспрессии которых инвариантно повышен при развитии инфекции. Экспрессия генов из этого ряда может рассматриваться как универсальная реакция микобактерий на различные стрессовые факторы внешней среды.
Выводы Разработан новый универсальный метод анализа транскриптомов 1.
внутриклеточных патогенов из пораженной ткани организма хозяина, основанный на обогащении и последующем массированном секвенировании полученного набора бактериальной кДНК. Разработаны биоинформатические и статистические подходы к обработке полнотранскриптомных данных. Высокая чувствительность и специфичность метода продемонстрирована на примере анализа транскриптома M.tuberculosis в хронической фазе инфекции.
С помощью разработанного метода проведен анализ набора 2.
последовательностей M.tuberculosis H37Rv, транскрибирующихся в инфицированных тканях мышей, чувствительных и резистентных к инфекции, на 4-й и 6-й неделях развития болезни. В целом, структура транскриптома M. tuberculosis при развитии инфекции свидетельствует об активизации липидного метаболизма, метаболизма аминокислот, переходе к анаэробному дыханию, повышении экспрессии факторов модуляции иммунного ответа.
По результатам сравнительного анализа транскриптомов определено 3.
генов, экспрессия которых повышается в ходе развития инфекции и не зависит от генетических особенностей организма-хозяина. Наибольший интерес представляют гены, относящиеся к функциональным категориям липидного метаболизма и клеточной стенки и клеточных процессов.
Основны е результаты диссертации изложены в следующих работах:
Т. А. Скворцов, Т. Л. Ажикина. Анализ транскриптомов патогенных бактерий в инфицированном организме: проблемы и способы их решения. // Биоорганическая химия.
2010. Том 36, № 5, с. 596–606.
Tatyana L. Azhikina, Timofey A. Skvortsov, Tatyana V. Radaeva, Andrey V. Mardanov, Nikolay V. Ravin, Alexander S. Apt, and Eugene D. Sverdlov. A new technique for obtaining whole pathogen transcriptomes from infected host tissues. // Biotechniques. 2010;
48(2):139– 144.
Д. В. Игнатов, Т. А. Скворцов, К. Б. Майоров, А. С. Апт, Т. Л. Ажикина.
Адаптивные изменения профиля экспрессии генов Mycobacterium avium при заражении мышей, генетически чувствительных и резистентных к инфекции. // Acta Naturae. 2010.
Том 2, №3(6), с. 57–62.
Skvortsov T, Ignatov D, Apt A, Azhikina T. Profiling of Mycobacterium tuberculosis gene expression during infection in genetically different mouse models. // FEBS Journal.
Abstracts of the 35th FEBS Congress. 2010;
277(S1): 104.
Skvortsov, T., D. Ignatov, A. Apt, Azhikina, T. A novel universal and powerful method for studying transcriptomes of intracellular pathogens during in vivo infection. Host-Microbes Interactions Spetsai Summer school EMBO/FEBS/IUBMB Advanced Course, Spetses, Greece, 2010,
Abstract
book, Скворцов ТА, Апт АС, Ажикина ТЛ. (2010). Изучение транскриптома Mycobacterium tuberculosis in vivo - новый эффективный подход к выявлению генетических детерминант патогенности. VII Всероссийская научно-практическая конференция с международным участием "Молекулярная диагностика-2010". Сборник трудов:178-80.
Скворцов, Т.А., Апт, А.С., Ажикина, Т.Л. Широкомасштабный анализ экспрессии генов M. tuberculosis в инфицированной легочной ткани мышей различных линий. международная пущинская школа-конференция молодых ученых "Биология - наука XXI века", Пущино, 2010, Сборник тезисов, 180.
Скворцов, Т.А., Апт, А.С., Ажикина, Т.Л. Сравнительный анализ транскриптомов M. tuberculosis in vivo. ХХII зимняя международная молодежная научная школа "Перспективные направления физико-химической биологии и биотехнологии", Москва, 2010, Сборник тезисов, 13.
Скворцов, Т.А., Ажикина, Т.Л. Инновационные подходы к выявлению молекулярно-генетических детерминант патогенности Mycobacterium tuberculosis. Школа конференция "Фундаментальная наука для биотехнологии и медицины", Москва, 2010, Сборник тезисов, 80-82.
Скворцов, Т.А., Игнатов, Д.В., Апт, А.С., Ажикина, Т.Л., Свердлов, Е.Д. Новый метод анализа экспрессии генов внутриклеточных патегенов человека и животных и его применение для изучения транскриптома M. tuberculosis in vivo. VI Международная конференция "Молекулярная медицина и биобезопасность", Москва, 2009, Сборник тезисов, 200-202.
Скворцов, Т.А., Игнатов, Д.В., Апт, А.С., Ажикина, Т.Л., Свердлов, Е.Д. Новый метод анализа экспрессии генов внутриклеточных патогенов человека и животных и его применение для изучения транскриптома M. tuberculosis in vivo. Международная научная конференция по биоорганической химии, биотехнологиии и бионанотехнологии, посвященная 75-летию со дня рождения академика Ю.А. Овчинникова, Москва, 2009, Сборник тезисов, 216.