Новые подходы к молекулярному моделированию трансмембранных доменов рецепторов, действие которых опосредовано белками белками
На правах рукописи
Чугунов Антон Олегович Новые подходы к молекулярному моделированию трансмембранных доменов рецепторов, действие которых опосредовано белками белками Специальность 03.00.02 — Биофизика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва, 2007 г.
Работа выполнена на кафедре биоинженерии Биологического факуль тета МГУ им. М.В. Ломоносова и в Лаборатории структурной биологии Инс титута биоорганической химии им. академиков М.М. Шемякина и Ю.А. Ов чинникова РАН.
Научный консультант:
Доктор физико-математических наук, доцент Р.Г. Ефремов
Официальные оппоненты:
Доктор биологических наук А.В. Веселовский Доктор физико-математических наук, профессор А.Н. Тихонов
Ведущая организация:
Московский Физико-Технический Институт
Защита диссертации состоится « » апреля 2007 г. в на заседании Диссертационного совета Д 501.001.96 Биологического фа культета Московского Государственного Университета им. М.В. Ломоносо ва по адресу: 119992, Москва, Воробьевы горы, МГУ, Биологический факуль тет, кафедра Биофизики, аудитория «Новая».
С диссертацией можно ознакомиться в библиотеке Биологического факультета Московского Государственного Университета им. М.В. Ломоно сова.
Автореферат разослан « » марта 2007 г.
Ученый секретарь Диссертационного совета, доктор биологических наук, профессор Т.Е. Кренделева.
1.
Общая характеристика работы
Мембранные белки (МБ) — объекты исключительной биологической 1.1. Актуальность проблемы и биомедицинской важности, среди функций которых можно назвать ре цепцию сигналов, транспорт веществ, создание и поддержание трансмемб ранных (ТМ) потенциалов и др. МБ составляют не менее трети всех синте зируемых клеткой белков (, 199). Одним из важнейих, классов МБ являются так называемые рецепторы, действие которых опос редовано -белками1, составляющие 1–5% всех кодируемых белков в гено -белками мах множества организмов. Об их чрезвычайной фармакологической важ ности говорит тот факт, что более половины всех выпускаемых в настоящее время лекарственных препаратов действует на эти рецепторы ( ssr, 2002). С их дисфункцией связано больое число заболеваний, (r et, 2004), и их терапевтический потенциал, по сути, только r r r начинает осваиваться. Наличие пространственной структуры рецепторов семейства является ключом к конструированию нового поколения эффективных и безопасных лекарств, действие которых направлено на эти рецепторы. К сожалению, возможности экспериментальных методов опре деления пространственной структуры МБ пока крайне ограничены и не могут полностью удовлетворить запросов фармацевтической индустрии.
На сегодняний день только для одного белка из семейства известна пространственная структура высокого разреения — фоторецептора ро допсина, выделенного из сетчатки быка (s et, 2000). В услови s ях отсутствия структур других, определенных экспериментальными, методами, оправдано использование методов молекулярного моделирова ния для предсказания теоретической структуры этих белков.
Выделяют две группы подходов к молекулярному моделированию : (1) b t (r-Frm et, 2005;
r-r et, 2006) — без :( -r r использования данных о структуре родственных белков (но, как правило, с учётом семиспиральной ТМ топологии этих рецепторов) и (2) подход мо делирования на основании гомологии с родственным белком-«аблоном» (в случае, в основном, родопсином), структура которого определена, экспериментальными методами (s et, 2004). Однако в связи с раз s личием функций, выполняемых моделируемым белком и структурным аблоном, получаемые модели необходимо оптимизировать с учетом их биологической специфики. При оптимизации теоретических моделей (в Английское название этих рецепторов — -prt p rptrs (). Эта общеприня тая аббревиатура в дальнейем будет использоваться для их обозначения.
Список других сокращений, использованных в работе: МБ — мембранный белок;
ТМ — трансмембранный;
MT1 и MT2 — рецепторы мелатонина;
ОФ — оценивающая функция;
ОФМБ — оценивающая функция для МБ;
СКО — среднеквадратичное отклонение;
МГП — молекуляр ный гидрофобный потенциал.
частности, корректировке взаимной ориентации ТМ -спиралей) необхо димо учитывать все возможные экспериментальные данные — такие, как информацию о функционально важных остатках или расстояниях между отдельными группами белка, а также общие принципы упаковки МБ, на блюдаемые в известных структурах.
Для уже построенной модели необходимо иметь возможность оценить качество ее упаковки — согласие с закономерностями строения МБ с извес тной структурой. Такое знание можно использовать для дополнительной оптимизации моделей и устранения присутствующих в них оибок. В лите ратуре описаны примеры использования для оптимизации теоретических моделей таких характерных особенностей строения МБ как распределение гидрофобных и вариабельных свойств ТМ сегментов, также склонностей тех или иных остатков находиться в области контакта с мембраной или об разовывать плотный интерфейс с другими спиралями белка. Наличие про странственных структур МБ атомного разреения позволяет исследовать и более тонкие параметры организации, учитывающие микроскопическое окружение индивидуальных остатков, такие как полярность ближайих групп белка и степень заглубленности остатка в белковую молекулу. До сих пор не предложено методов оценки качества упаковки МБ (аналогич ных уже созданным для глобулярных белков ( et, 1991;
r, 1995)), основанных на анализе микроокружений отдельных остат ков в структурах высокого разреения. Необходимость создания методов оценки, оптимизированных специально для МБ, диктуется существенны ми физико-химическими различиями сред, в которых существуют глобу лярные и мембранные белки и, следовательно, серьезными отличиями в их пространственной организации.
Одной из основных областей применения пространственных моделей структуры белка является моделирование связывания лигандов (как пра вило, низкомолекулярных веществ, при взаимодействии с которыми ре цептор запускает определенную биологическую реакцию). Такое модели рование производится с помощью алгоритмов молекулярного докинга. Ос новными ограничивающими факторами в этой области являются: (1) недо статочный учёт молекулярной подвижности белка-миени и (2) эмпири ческий и неточный расчёт свободных энергий связывания белок–лиганд.
Применение дополнительных критериев при оценке «реений» докинга (предсказанных конформаций комплекса белок–лиганд), таких, как сте пень гидрофобно/гидрофильного соответствия лиганда и его сайта связы вания, может оказаться полезным для улучения предсказаний, выдавае мых программами докинга.
В данной работе для моделирования выбраны два белка семейства — рецепторы мелатонина MT1 и MT2 человека. Мелатонин — это важ ный нейрогормон, принимающий участие во множестве жизненных про цессов — от сна и циркадных ритмов до иммунитета, и изучение структуры его рецепторов может ускорить разработку нового поколения лекарств — безопасных регуляторов сна и общей активности организма.
Построить и оптимизировать для связывания с лигандами модели 1.2. Цели исследования пространственной структуры рецепторов мелатонина MT1 и MT человека. С помощью этих моделей объяснить селективность ряда аналогов мелатонина к одному из подтипов рецепторов;
Разработать новый метод оценки качества упаковки трансмемб ранных -спиральных сегментов мембранных белков, основанный на анализе доступных экспериментальных структур МБ высокого разреения;
Изучить возможность применения критерия комплементарности молекулярного гидрофобного потенциала (МГП) в сайтах связыва ния белок–лиганд для улучения качества предсказания алгорит мов молекулярного докинга.
1. Построены и оптимизированы для связывания с лигандом модели 1.3. Основные результаты, представляемые к защите пространственной структуры рецепторов мелатонина MT1 и MT2 че ловека. Модели позволяют объяснить экспериментальные данные по связыванию и селективности ряда аналогов мелатонина;
2. Анализ пространственной организации набора экспериментальных структур МБ позволил создать метод оценки качества упаковки их ТМ доменов. Метод позволяет идентифицировать в больих набо рах теоретических моделей конформацию, наиболее близкую к на тивной структуре;
3. Для ряда исследованных кристаллографических комплексов рецеп тор–лиганд показано, что подход МГП-комплементарности уверен но разграничивает близкие к нативной структуре комплекса («хо роие») и некорректные («плохие») реения, позволяя значительно улучить результаты докинга.
Все представленные в работе результаты получены впервые. Проблема 1.4. Научное значение и новизна работы селективности лигандов между несколькими родственными рецепторами очень актуальна в фармакологии, но изучение соответствия гидрофобных характеристик лиганда и его белкового сайта связывания до сих пор поч ти не использовали для объяснения и предсказания селективности. Хотя предпринимается довольно много попыток улучить предсказательную силу алгоритмов докинга (например, комбинируя различные оценивающие функции), учёт гидрофобных эффектов, весьма важных для взаимодейс твия рецептор–лиганд, практически не производится. На ряде примеров мы показываем, что такой учёт может существенно улучить результаты стандартных алгоритмов.
Разработанный критерий оценки качества упаковки ТМ -спиральных доменов также является новым перспективным инструментом при моде лировании структуры МБ, в частности, рецепторов семейства. Мы по.
казываем, что, в отличие от предлагаемого подхода, аналогичные методы, разработанные для глобулярных белков, не позволяют реить важней ую для подобного оценивающего метода задачу — надёжно идентифи цировать нативную (или близкую к ней) структуру среди набора теорети ческих моделей, в том числе содержащих оибки.
Предложенные в работе методы найдут своё применение при постро 1.5. Практическое значение работы ении и оптимизации теоретических моделей рецепторов семейства,, а также других МБ. В частности, применение метода оценки качества упа ковки МБ позволит получить модели, находящиеся в лучем согласии с об щими принципами организации МБ, нежели модели, полученные в резуль тате непосредственного моделирования на основании гомологии или из b t предсказаний. Метод численной оценки соответствия гидрофоб ных свойств лиганда и активного сайта белка позволит с больей вероят ностью идентифицировать активные соединения и точнее предсказывать структуры комплексов белок–лиганд, чем стандартные алгоритмы докин га.
Указанные возможности чрезвычайно востребованы в фармацевти ческой промыленности и сфере направленного дизайна новых лекарс твенных веществ. Особенно актуальной в последнее время является раз работка высокоаффинных и селективных лигандов рецепторов, для осуществления которой необходимы точные пространственные модели этих белков.
Основные результаты изложены в 4 статьях, опубликованных в рос 1.6. Публикации и апробация сийских и международных журналах. Материалы работы докладывались на 14-й международной конференции «Математика. Компьютер. Образо вание» (Пущино, 2007), 19-й зимней молодёжной научной коле «Перс пективные направления физико-химической биологии и биотехнологии» (Москва, 2007), 4-й и 5-й международных конференциях «Биоинформати ка регуляции и структуры генома» (Новосибирск, 2004, 2006), 1-й между народной конференции «Математическая биология и биоинформатика» (Пущино, 2006), -х чтениях, посвященных памяти академика Ю.А. Овчин никова (Москва, 2006), 1-м международном конгрессе по молекулярному моделированию (Касабланка, 2005), 7-й международной конференции по молекулярной биологии (Суздаль, 2004), 5-м международном симпозиуме аспирантов (Европейская молекулярно-биологическая лаборатория, Гей дельберг, 2004), Российском симпозиуме по химии и биологии пептидов (Москва, 2003) и 17-м Франко-бельгийском конгрессе по фармацевтичес кой химии (Брюссель, 2003).
В главе 1 (Введение) сформулированы основные задачи исследова 1.7. Структура и объем диссертации ния и обоснована его практическая важность. Глава 2 посвящена обзору литературы по современным методам моделирования рецепторов и подходам к оценке качества упаковки белков. В Главе 3, состоящей из трех частей, описываются и обсуждаются полученные в работе результаты. Раз дел 3 посвящен построению и оптимизации для связывания с лигандами моделей рецепторов мелатонина, в разделе 3 описывается разработка и тестирование метода оценки качества упаковки ТМ -спиральных доменов МБ, а в разделе 3 исследована возможность применения метода МГП-ком плементарности для улучения результатов докинга. В Главе 4 подведены итоги работы, а также обсуждены перспективы применения полученных результатов. Подробное описание использованных в работе методов и ал горитмов дано в Главе 5. Диссертация изложена на страницах маино писного текста, проиллюстрирована рисунками и таблицами.
Список литературы включает источников.
2. Основные результаты и их обсуждение Для моделирования были выбраны только ТМ области рецепторов, 2.. оделирование структуры рецепторов мелатонина 1 и 2 человека.
.
поскольку надёжное предсказание конформаций «петель» до сих пор ос таётся одной из неоднозначных задач молекулярного моделирования.
Кроме того, по данным мутагенеза ( et, 1997, 2001), важные для связывания мелатонина остатки находятся достаточно глубоко в ТМ до мене. В качестве аблона для моделирования был выбран бычий зритель ный родопсин, так как он все еще остается единственным белком семейс тва, для которого получена экспериментальная пространственная, структура (s et, 2000). «Стартовые» модели рецепторов были s построены с использованием парных выравниваний аминокислотных пос ледовательностей рецепторов и родопсина, демонстрирующих гомологию в ТМ регионе ~40%, что считается достаточным для построения моделей.
Предсказанные положения ТМ участков, а также позиции наиболее консер вативных в каждой из семи спиралей остатков в случае каждого рецептора совпали с таковыми в последовательности родопсина, подтверждая кор ректность используемых выравниваний. Получаемые «стартовые» модели не учитывают биологической специфики моделируемых белков и поэтому нуждаются в оптимизации с привлечением экспериментальных данных о возможном механизме взаимодействия рецептор–лиганд, о сопряженной с этим процессом «активации» рецептора, а также о гидрофобной и вари абельной организации семиспиральных МБ. В качестве оптимизационной процедуры, способной удовлетворить набору экспериментальных огра ничений, не наруая при этом общей укладки белка, было предложено вращение ТМ -спирали 3 (ТМ3) вокруг её оси в направлении, указанном на рис. 1. Такое вращение делает возможным одновременное образование трёх водородных связей, посредством которых осуществляется взаимо действие мелатонина с рецепторами. Кроме того, сравнение гидрофобной Рисунок 1. Схема предлагаемой оптимизации моделей рецепторов мелатонина для удовлетворения экспе риментальным ограничениям. На рисунке схематично показано расположение ТМ спиралей в моделях рецеп торов мелатонина при виде с внеклеточной стороны. В «стартовых» моделях рецепторов ориентация ТМ3 та кова, что два функционально важных для взаимодейс твия с лигандом остатка (Ser3.35 и Ser3.39;
номенклатура по Ballesteros & Weinstein, 1995) находятся вне сайта связывания и недоступны для взаимодействия с ним (показаны кругами с темным фоном). Предлагаемое для оптимизации моделей вращение ТМ3 (изображено стрелкой) приведет оба остатка в область, доступную для взаимодействия с лигандом (круги на светлом фоне).
В ТМ5 показан третий остаток, важный для связывания мелатонина (His5.46).
Рисунок 2. Структура сайта связывания мелатонина в модели MT1 (слева) и MT2 (справа). Остовы ближайших к сайту связывания ТМ спиралей изображены трубками. Выведены боковые цепи остат ков, участвующих в образовании активных сайтов. Молекула мелатонина, а также остатки, с кото и вариабельной организации ТМ доменов полученных моделей и структу рыми он образует водородные связи, показаны толстыми линиями.
ры родопсина показывает, что предлагаемое вращение приведет эти аспек ты строения рецепторов в лучее согласие с наблюдаемыми в эксперимен тальной структуре.
Оптимальный угол поворота ТМ3 для каждой модели был выбран, ос новываясь на совместном использовании следующих критериев: (1) ми нимального наруения геометрии трех водородных связей, посредством которых мелатонин взаимодействует с рецепторами;
(2) максимального значения оценивающей функции (ОФ) GOLD e при докинге мелатонина в активные сайты и (3) наилучего «качества» упаковки спиралей в мо делях рецепторов, согласно так называемой 3-1 функции ( et, - - 1991). Эти углы оказались равными 35° и 15° для моделей рецепторов MT1 и MT2, соответственно. В дальнейем эти модели (рис. 2) использовали для объяснения селективности некоторых аналогов мелатонина к одному из подтипов рецепторов, основываясь на различиях пространственного рас пределения гидрофобных/гидрофильных свойств в сайтах связывания лигандов.
Численная характеристика гидрофобных свойств основывалась на концепции «комплементарности» молекулярного гидрофобного потенциа ла (МГП;
Frt et, 19;
Fr et, 19), рассчитываемого на молеку r r лярной поверхности лиганда. «Комплементарность» определили как долю точек поверхности лиганда, в которых гидрофобные характеристики, со здаваемые лигандом и белком, совпадали (по принципу «полярное — к по лярному, неполярное — к неполярному»). На рис. 3 приведена поверхность мелатонина, раскраенная в соответствии с разницей гидрофобности ок Рисунок 3. Различия гидрофобных характеристик сайтов связывания в рецепторах MT1 и MT2.
А. Молекулярная поверхность мелатонина, окрашенная в соответствии с величиной разности МГП в данной точке (Di) в комплексе с МТ1 и МТ2. Области поверхности с Di0 (где окружение мелатонина в комплексе с MT2 более гидрофобно, чем в комплексе с MT1), окрашены чёрным, а с Di0 — серым. Б.
Структура мелатонина (в той же конформации, что и в случае А). Символы “”, “”, “” и “” около позиций 1, 2, 6 и 7 индольного кольца изображают потенциальные заместители, придающие произ водному лиганду селективность к MT1 (показано кругом) или MT2 (показано квадратом) рецепторам в случае гидрофобной (белый цвет) или гидрофильной (черный цвет) природы заместителя.
Таблица 1. Экспериментальные данные по селективности и расчётные значения комплементарнос ти МГП для некоторых аналогов мелатонина по отношению к рецепторам MT1 и MT2.
O O OCH N NHCOCH3 O N n-C 3 H H O H R N N R H M L T, R = H 3, 8M -P D O T 1, R 1= B e nzyl, R 2 =H 2, R 1= C l, R 2= H O O O N N H H 3C O N H 5 с МТ1 с МТ Соединение Селективность Комплементарность МГП в комплексе Ссылка МЛТ Не селективен 0.52 0.52 Mr, а 1 MT2 0.55 0.60, 2 MT2 0.52 0.54, 3 MT2 0.4 0.50, 4 MT2 0.54 0.57 Fst, 5 MT2 0.56 0.57 s, 6 MT1 0.60 0.41, МЛТ — мелатонин а ружения мелатонина в комплексах с MT1 и MT2. Эти отличия использовали для объяснения селективности аналогов мелатонина, содержащих замес тители в некоторых позициях индольного кольца. Предложенная модель селективности (см. подпись к рис. 3) и подход комплементарности МГП поз волили для ряда соединений, селективных к одному из рецепторов мела тонина, объяснить эти свойства (см. табл. 1).
1. Построены и оптимизированы для связывания с лигандом моде Выводы () ли рецепторов мелатонина MT1 и MT2 человека. Модели позволяют объяснить экспериментальные данные по связыванию и селектив ности ряда аналогов мелатонина;
2. Дальнейее уточнение моделей требует разработки метода оценки качества упаковки белковой цепи (см. раздел 2.II), оптимизирован ного для мембранных белков;
3. Наблюдаемые закономерности гидрофобного/гидрофильного соот ветствия в сайтах белок–лиганд могут оказаться универсальными и перспективными для улучения результатов докинга (см. раздел 2.III).
2.. етод оценки качества упаковки доменов спиральны мембранны.
.
Разработка эмпирической Оценочной Функции для Мембранных Бел белков ков (ОФМБ) основывалась на анализе структурных особенностей белков «обучающего» набора, в который воли 26 кристаллографических струк тур неродственных -спиральных МБ, полученных с высоким разрее нием2. Границы ТМ области вычисляли путем «сканирования» модели пространственной структуры белка, ориентированной вдоль нормали к мембране, «виртуальным гидрофобным слоем» (rm et, 1999, 2001) rm переменной толщины, имитирующим гидрофобное окружение, характер ное для МБ. В случае каждого белка был идентифицирован единственный минимум энергии взаимодействия с «мембраной», соответствующий оп тимальным положению белка относительно центра мембраны и толщине мембраны. В случае применения к глобулярным белкам эта процедура да вала профиль энергии взаимодействия с максимумом вблизи центра слоя, что свидетельствует об их несовместимости с мембраной. В обучающий на бор воли остатки -спиралей, расположенные в области «гидрофобного слоя» (4991 остаток в 217 ТМ спиралях).
Предлагаемый метод оценки качества упаковки основывается на ха рактеристике окружения каждого остатка в структуре и вычислении эм пирических вероятностей нахождения того или иного остатка в опреде ленном окружении, основываясь на анализе организации МБ обучающего набора. Для характеристики окружений остатков выбрали параметры Fp и Fp1, которые равны долям площади поверхности остатка, находящейся в контакте с полярными или неполярными атомами других остатков, рас положенных в смежных TM -спиралях, соответственно. Примеры распре деления Fp1 Fp1 для остатков лейцина и аргинина из обучающего набора, а также графическое определение классов белок–мембранного окружения, основанное на значениях Fp1 и Fp1, приведены на рис. 4.
Распределения на рис. 4А позволяют заметить, что остатки аргинина реже встречаются в ТМ доменах, чем остатки лейцина, а если и встречают ся, то в основном на границе с водой. Остатки лейцина, напротив, тяготеют к центральной области мембраны и предпочитают либо экспонированные В «обучающий» набор воли структуры ТМ доменов бактериородопсина (код : 13), га лородопсина (112), сенсорного родопсина I и II (16 и 1XIO, соответственно), зрительного родопсина (1U19), p-управляемого + канала (14), механочувствительного канала (1ML), ионообменника +/- (1L), аквапорина-1 (1J4N), аквапорина Z (12), акваглицеропорина (1FX), аммониевого канала (1XQ), многофункционального выносящего канала (1I), пере носчика глицерол-3-фосфата (14), переносчика витамина 12 (1L7V), кальциевой АТФазы (1U4), роторов N+-АТФаз V- и F-типа (2L2 и 1, соответственно), комплекса фумарат ре дуктазы (1QLA), сукцинат дегидрогеназы (1N), цитохром оксидазы (1), комплексов ци тохромов b1 (1ZV и 1), формат дегидрогеназы (1QF), нитрат редуктазы А (1Q16) и мито хондриального АДФ/АТФ антипортера (1O). Структуры фотосинтетических белков не во ли в этот список по причине наличия болього числа молекул пигментов в ТМ домене, видимо, изменяющих характер межспипального взаимодействия, характерного для других МБ.
Рисунок 4. Классы белок–мембранного окружения для аминокислотных остатков в МБ. А. Распре деления параметров, характеризующих окружение остатков аргинина и лейцина из обучающего набора. Каждая точка на графике соответствует одному остатку. Черная точка соответствует по ложению остатка вблизи центра мембраны, серая — в области границы мембрана–вода толщиной 5. Б. Предлагаемая схема классов белок–мембранного окружения, основанная на распределении параметров из А. Класс 1 соответствует остаткам, экспонированным в мембрану (близость к нулю обоих параметров Fp1 и Fnp1 означает, что почти вся площадь поверхности остатка доступна мемб ране), классы 2 и 3 — частично заглубленным, а 4 и 5 — полностью заглубленным в белок остаткам.
Классы 2 и 4 заселены остатками с неполярным, а 3 и 5 — с полярным окружением. Точные значения параметров a, b и tg определяли из условия максимума значения ОФМБ для всего обучающего позиции (класс 1;
см. подпись к рис. 4Б), либо частично заглубленные, не набора.
полярные позиции (класс 2). Остатки аргинина, если все же оказываются в центральной области мембраны, находятся в полярном окружении за глубленных классов (3 и 5), свидетельствуя о невыгодности взаимодейс твия полярного заряженного остатка с неполярным окружением. Чтобы численно охарактеризовать эти предпочтения, мы ввели «оценивающую функцию для мембранных белков» (ОФМБ), описывающую частоту встре чаемости того или иного типа остатка в определенном окружении в обуча ющем наборе: ОФМБj (Pj/Pj), где Pj — вероятность найти остаток типа в ( классе j, а Pj — вероятность того, что остаток любого типа попадет в класс j («заселенность» класса). Положительные значения ОФМБ говорят о склон ности данного остатка занимать этот класс в экспериментальных струк турах, а отрицательные — о том, что данный остаток встречается в этом классе крайне редко, реже других типов остатков (см. табл. 2).
Предложенный метод концептуально схож с известным методом про филей трехмерного окружения Айзенберга ( et, 1991), однако меж ду ними есть важные отличия. Во-первых, в отличие от метода 3 про- филей, параметризованного с использованием 16 структур глобулярных белков, алгоритм оценки качества упаковки МБ разработан специально для ТМ -спиральных доменов и учитывает их структурные особеннос ти. Во-вторых, он рассматривает остатки только в одном типе вторичной структуры — -спирали, т.к. мы Таблица 2. Предпочтения остатков к классам бе сконцентрировались именно лок–мембранного окружения на этом подклассе МБ (всего из- Остатки:
вестно 2 суперсемейства МБ — 1 2 3 4 Классы окружения:
-спиральные и -структурные ALA белки), а неупорядоченная струк- AN A 0.09 0.33 0.10 0.29 0. тура крайне невыгодна в непо 0.04 0.94 0.51 1.20 0. A лярном мембранном окружении. LN 0.21 1.05 0.56 1.13 0. 0.04 1.12 0.86 1.67 0. И, наконец, предложенная схема LU 0.42 0.23 0.25 0.71 0. классов окружения существенно I 0.22 1.02 0.66 0.18 0. L отличается от таковой в методе IL 0.56 0.77 0.57 0.34 0. 0.16 0.32 0.15 0.36 0. Боуи и Айзенберга.
0.72 0.55 0.90 0.97 1. LU Для белков обучающего на- MT 0.27 0.40 0.65 0.19 2. L 0.10 0.34 0.53 0.01 0. бора показана линейная зависи- 0.48 0.78 0.64 2.02 0. мость значения ОФМБ (равного 0.21 0.44 0.74 0.19 1. O сумме значений по всем остат- T 0.20 0.25 0.28 0.26 0. 0.36 0.38 0.50 0.87 0. кам) от длины последователь 0.25 0.51 0.54 0.37 0. T ности ТМ домена (L), что даёт VAL 0.19 0.19 0.22 0.11 0. T 0.31 0.11 0.10 0.11 0. возможность сравнивать «ка 0.58 0.40 0.44 0.21 0. чество» упаковки теоретических моделей с таковым для белков с экспери 0.28 0.10 0.12 0.03 0. ментально определенной структурой и обладающих близким значением L (рис. 5). Кросс-валидация метода и использование альтернативных наборов обучающих и тестовых данных подтверждают, что метод ОФМБ является весьма устойчивым и надежным, а используемый набор данных — пред ставительным и не приводит к переопределению метода.
На рис. 5 также приведены данные о собранных из открытых источ ников теоретических моделях родопсина, предложенных до выхода его кристаллографической структуры, а также построенных с помощью обще доступных средств моделирования специально для целей тестирования метода ОФМБ. Метод оценки качества упаковки МБ позволяет однозначно идентифицировать кристаллическую («корректную») структуру родопси на — для нее значение оценивающей функции значительно болье, чем для остальных моделей. Кроме того, имеется четкая связь между близостью модели к нативной структуре (в терминах величины среднеквадратично го отклонения (СКО), см. врезку на рис. 5) и значением ОФМБ. Как правило, луче оцениваются те модели, которые при построении были тщательно оптимизированы авторами и уже pst (после публикации кристал лографической структуры родопсина) демонстрируют меньее значение t СКО, чем те, которые были построены в полностью автоматическом режи ме на общедоступных веб-серверах и часто содержат грубые оибки, допу щенные при выравнивании последовательностей или на других стадиях моделирования.
Рисунок 5. Зависимость значения ОФМБ от длины последовательности ТМ домена для белков обу чающего набора (черные круги) и набора теоретических моделей родопсина (треугольники). По ложение кристаллографической структуры родопсина (PDBId: 1U19) отмечено стрелкой. На врезке:
Задача идентификации правильной (или близкой к правильной) струк зависимость ОФМБ для набора теоретических моделей родопсина от среднеквадратичного откло нения (СКО) от кристаллографической структуры (отмечена белым кругом).
туры среди сколь угодно болього набора теоретических моделей являет ся одной из ключевых в молекулярном моделировании. Метод 3 профиля, разработанный для глобулярных белков ( et, 1991), хуже справля ется с этой задачей в случае МБ, чем предлагаемый нами метод. Например, не позволяет отличить кристаллическую структуру родопсина от компью терных моделей — значение 3-1 ОФ в первом случае либо не самое высо - - кое, либо разрыв со следующей по порядку моделью крайне невелик. Что еще более важно, при использовании этого метода, не предназначенного для работы с МБ, теряется корреляция между значениями оценочной фун кции и СКО от нативной структуры.
Чтобы более подробно сравнить возможности этого «классического» метода оценки качества и подхода, разработанного специально для МБ, был предложен следующий тест. В кристаллическую структуру родопсина вносили изменения, которые, учитывая тонкую организацию МБ, должны почти наверняка соответствовать нестабильным конформациям белка. Эти изменения заключались в систематическом повороте всех ТМ -спиралей вокруг своих осей как твердых тел и оптимизации получаемых моделей «ротамеров» для устранения грубых атомных наталкиваний. С учетом не зависимого вращения всех семи спиралей и выбора ага вращения 90°, мы получили более 16000 конформаций, среди которых только одна («нулевой Рисунок 6. Распределения значений оценивающих функций для ансамбля «ротамерных» конфор маций зрительного родопсина. А. 3D-1D функция Боуи и Айзенберга (Bowie et al., 1991). Б. Функция оценки качества для мембранных белков (ОФМБ). Положение кристаллографической структуры ротамер») соответствовала кристаллической структуре. Результаты при («нулевого» ротамера) отмечено стрелкой.
менения обоих методов оценки к этому набору конформаций приведены на рис. 6.
Метод трехмерных профилей оказался неспособным идентифициро вать «корректную» структуру среди сгенерированного ансамбля оибоч ных моделей, поместив ее вблизи математического ожидания распределе ния, приведенного на рис. 6А. Метод оценки качества упаковки МБ оказал ся значительно более чувствительным (рис. 6Б), поместив «нулевой» ро тамер в самый верх списка, за пределы 3 диапазона от математического ожидания распределения значений ОФМБ. Более того, лиь ~4% структур получили положительное значение ОФМБ, что фактически исключает не обходимость рассмотрения бльей части полученных конформаций.
Возможность метода оценки качества упаковки МБ идентифицировать близкую к нативной конформацию (т.е., демонстрировать корреляцию зна чения ОФМБ и СКО модели от нативной структуры) была показана еще на нескольких примерах. Так, при построении моделей бычьего акваропори на-1 (чья экспериментальная структура известна) по гомологии с аблона ми с различной степенью эволюционного родства и разным разреением экспериментального метода, использовавегося для получения структу ры аблона, было показано, что наиболее близкие к нативной структуре модели получают самые высокие значения ОФМБ. Напротив, модели, при построении которых были допущены оибки, и которые вследствие это го оказываются достаточно далеки от нативной структуры (в терминах СКО), получают очень низкие (отрицательные) значения ОФМБ (рис. 7). Та кие оибки моделирования как сдвиги на аминокислотном выравнивании чрезвычайно чётко идентифицируются методом ОФМБ, поскольку подоб ный сбой характерен тем, что сразу больое число остатков оказывается Рисунок 7. Зависимость значений ОФМБ для моделей бычьего аквапорина1 от СКО от нативной структуры (изображена белым кругом). Шесть серий из десяти моделей бычьего аквапорина-1 в каждой построе ны на основании гомологии с несколькими шаблонами с различной степенью родства.
Одному из шаблонов — акваглицеропорину (код PDB: 1FX8) — соответствуют две серии моделей, основанных на корректном (белые треугольники) и ошибочном (чёрные треу гольники) выравниваниях.
Рисунок 8. «Движение в направлении нативной структуры» в оценке методом ОФМБ. Приведе на зависимость значений ОФМБ от СКО от нативной структуры для моделей родопсина (А) и ци тохром C оксидазы (Б) с альтернативной упаковкой боковых цепей (во всех приведенных моделях конформация основной цепи идентична таковой в соответствующей кристаллической структуре).
Кристаллические структуры обозначены чёрными кольцами, черные круги соответствуют моделям с квазислучайными конформациями боковых цепей, ромбы — промежуточным этапам перехода к в неестественном окружении и, следовательно, характеризуется низким нативной структуре.
«качеством» упаковки.
Корреляция ОФМБ и СКО от нативной структуры сохраняется и в диа пазоне «высоких разреений» (СКО 2 ). Для двух МБ с известной струк ).
турой, родопсина и цитохром оксидазы, построили серию моделей с иден тичной конформацией основной цепи и отличающейся упаковкой боковых цепей, причём эти модели соответствуют промежуточным состояниям не прерывного перехода из модели с квазислучайными конформациями боко вых цепей «обратно» к нативной структуре (рис. ). Высокий уровень анти корреляции ОФМБ и СКО от нативной структуры (коэффициент 0. 0.9) позволяет практически однозначно выбрать близкие к нативной структу ре модели только по значению оценивающей функции.
1. На основе анализа структур МБ высокого разреения разработан Выводы () ) ) новый метод оценки «качества» упаковки -спиральных ТМ доме нов;
2. Для белков обучающего набора и других экспериментальных струк тур показана корреляция значения ОФМБ и длины ТМ домена, что дает возможность оценивать качество отдельно взятой теоретичес кой модели;
3. На ряде примеров показано, что функция оценки качества упаковки МБ способна идентифицировать близкие к нативной структуре те оретические модели;
4. Предложенный метод может использоваться при оптимизации упа ковки ТМ доменов в теоретических моделях МБ, в частности, рецеп торов семейства.
В первой части работы (см. 2.I) было показано, что гидрофобные/гид I) ) 2.. Новы подод к улучени результатов докина.
.
рофильные взаимодействия играют важную роль в связывании лиганда с миенью, и изучение их распределений может помочь объяснить селек тивность ряда лигандов к одному из подтипов рецепторов мелатонина.
Кроме того, было сделано предположение, что «комплементарность» гид рофобных свойств в сайтах связывания лигандов может являться одной из важных характеристик комплексов рецептор–лиганд, и что учёт этой комплементарности может быть использован для улучения предсказа тельной силы современных алгоритмов докинга, не рассматривающих гидрофобные взаимодействия при оценке реений. Целью данной, заклю чительной, части работы является проверка применимости предложенно го подхода комплементарности молекулярного гидрофобного потенциала (МГП) для улучения предсказательной силы докинга (то есть, идентифи кации реений, близких по СКО к кристаллическим структурам комплек сов). При этом использовали набор из 132 кристаллографических структур комплексов белков с лигандами, для которых проводили докинг «изъятых» лигандов обратно в их сайты связывания и сравнивали результаты, полу чаемые как с использованием стандартной функции GOLD e, так и при ранжировании получаемых реений с помощью подхода МГП-комплемен e тарности (в каждом случае сохраняли по 100 реений).
Свойства гидрофобного соответствия рассчитывали на молекулярной поверхности лиганда, выступающей в качестве сайта связывания. Компле ментарность (Cp) определяли как долю точек поверхности, в которых гидрофобные характеристики, создаваемые лигандом и белком, совпада ют. Для этого использовали независимые для белка и лиганда «порого вые» значения МГП, разграничивающие «полярный» и «неполярный» диа пазоны. Так, считали, что лиганд создает в точке поверхности полярные свойства, если МГП t («пороговое» значение для лиганда, “), ), ), и неполярные — если МГП t. Аналогично для белка использовали «пороговое» значение tp (“prt).
prt). ).
Расчёт комплементарности для полного набора кристаллографичес ких комплексов3 показал, что в больинстве случаев гидрофобное/гидро фильное соответствие довольно высоко (Cp 0.5). Особенно это верно для достаточно больих лигандов, поскольку величина эффекта гидро фобных взаимодействий пропорциональна площади контакта белка с ли гандом.
Основное внимание было уделено тем комплексам, для которых уда лось показать существенное различие комплементарности МГП между «хороими» (СКО 3.5 от структуры нативного комплекса) и «плохими» реениями докинга. Оптимальные параметры расчёта комплементарнос В этом случае использовали «естественную» границу полярного и неполярного диапазона значений МГП: t tp 0.
Таблица 3. Комплексы, для которых удаётся достигнуть высокой (Dmax* 0.25) разницы компле ментарности МГП между «хорошими» (СКО 3.5 от структуры нативного комплекса) и «плохи ми» решениями докинга.
Код 2PLV 2AK3 1EAP 1CTR 1GLQ 1IVE 1CBS 1HRI 1ETR 1AEC 1TDB t * PDB 0.30 1.00 0.15 0.55 0.80 0.15 0.25 0.35 0.60 0.15 0. tp 0.25 0.85 0.30 0.05 0.20 1.00 0.10 0.50 0.55 0.65 0. Dx 0.65 0.47 0.37 0.32 0.32 0.31 0.30 0.29 0.29 0.28 0. * cutl и cutp — параметры, разграничивающие полярный и неполярный диапазоны значений МГП для лиганда и белка, соответственно. Приведенные значения соответствуют «оптимальным» па раметрам границ, при которых достигается максимальное значение D (Dmax). Dmax — максимальная разница средней комплементарности между «хорошими» и «плохими» решениями докинга в каж дом из комплексов, соответствующая приведенным значениям cutl и cutp.
Рисунок 9. Распределения комплементарности МГП для «хороших» (черный цвет) и «плохих» (се рый цвет) решений докинга в трех комплексах. По осям абсцисс и ординат отложены значения комплементарности и число решений докинга, соответственно. «Оптимальные» параметры, ис пользовавшиеся в случае каждого комплекса для вычисления комплементарности (cutl и cutp), и соответствующие им значения разницы средней комплементарности «хороших» и «плохих» комп ти и значения разности комплементарности между «хороими» и «плохи лексов (Dmax) приведены в табл. 3.
ми» реениями для некоторых из этих комплексов приведены в табл. 3. На рис. 9 в качестве примера приведены распределения комплементарности гидрофобных свойств для реений докинга в трех комплексах. Для при веденных комплексов эти распределения практически не перекрываются, давая возможность по величине комплементарности идентифицировать корректную структуру комплекса белок–лиганд.
Ранжирование реений докинга по значению комплементарности в ряде случаев дает улучение по сравнению со стандартными результа тами докинга, отсортированными по значению ОФ GOLD e. На рис. приведены результаты ранжирования реений по значению МГП-комп e лементарности и GOLD для тех же трёх комплексов, что и на рис. 9.
«Лучим» считается тот результат, для которого верхняя часть отсорти e рованного списка реений обогащена «правильными» структурами ком плексов (с СКО от кристаллической структуры, не превыающим 3.5 ). В Рисунок 10. Применение метода МГПкомплементарности для улучшения результатов докинга.
Для трёх комплексов приведено сравнение результатов, получаемых при ранжировании решений докинга по критерию МГП-комплементарности (чёрный цвет) и по стандартной ОФ GOLD Score (бе лый цвет). По оси абсцисс дан номер решения в соответствующем отсортированном списке (первые 10 позиций), по оси ординат — СКО решения от кристаллической структуры. Комплементарность рассчитывали с «индивидуальными» параметрами (табл. 3).
Таблица 4. Ранжирование результатов докинга с использованием стандартной ОФ GOLD Score и критерия МГП-комплементарности Код 2PLV 2AK3 1EAP 1CTR 1GLQ 1IVE 1CBS 1HRI 1ETR 1AEC 1TDB Ngd * PDB 5 35 90 3 8 98 19 84 5 99 NGOLD 1 0 10 0 2 9 8 10 3 10 NMHP 5 10 10 3 7 10 10 10 5 10 * Ngood — общее число «хороших» решений докинга для данного комплекса;
NGOLD — число «хоро ших» решений в первой десятке при сортировке списка по значению стандартной ОФ GOLD Score;
случае комплекса 2LV программа OL помещает только одно «правиль LV NMHP — число «хороших» решений в первой десятке списка, отсортированного по значению комп лементарности МГП с «оптимальными» для каждого комплекса параметрами (см. табл. 3).
ное» реение в первую десятку списка, но не на первую позицию. СКО ос тальных девяти реений превыают 6. При использовании метода МГП комплементарности «в десятке» уже все пять «правильных» реений из сотни, причём они занимают позиции с первой по пятую. Для комплекса 2A3 все 10 реений OL оказываются «некорректными», а все 10 рее A ний, отобранных по комплементарности МГП — корректными. Наконец, в случае комплекса 1A все 10 реений по обоим методам оказываются A «корректными», что также является важным результатом, поскольку ни одно из «неправильных» реений (которые также присутствовали среди 100 реений докинга) не попало в верхнюю часть списка. Более подробно результаты докинга с применением ранжирования по МГП-комплементар ности даны в табл. 4.
Как видно из табл. 4, применение критерия МГП-комплементарности с «оптимальными» параметрами позволило во всех случаях получить луч ий результат, чем использование стандартной функции GOLD e Од нако определение «оптимальных» параметров подразумевает использо e.
вание структуры нативного комплекса, что в больинстве практических приложений может быть невозможно. Кроме того, не все исследованные комплексы (из 132 исходных) продемонстрировали существенное разли чие комплементарности МГП между «хороими» и «плохими» реениями.
Таким образом, максимальный эффект от метода МГП-комплементарности применительно к ранжированию реений докинга стоит ожидать на оп ределённом классе близкородственных миеней и/или лигандов, хотя бы для одного из которых есть возможность оптимизировать параметры расчёта комплементарности.
1. Для ряда исследованных кристаллографических комплексов рецеп Выводы () ) ) тор–лиганд показано, что подход МГП-комплементарности уверен но разграничивает «хороие» и «плохие» реения, позволяя значи тельно улучить результаты докинга;
2. Хотя на данный момент этот подход не является универсальным, он может использоваться для практически важных задач, если его па раметризация проведена на ограниченном классе миеней и/или лигандов.
Предложен ряд новых подходов к молекулярному моделированию 3. Основные выводы трансмембранных доменов рецепторов, действие которых опосредовано - белками:
1. Разработан новый метод оценки качества упаковки ТМ -спиралей в молекулах белков. Подход основан на анализе доступных кристал лографических структур МБ и позволяет идентифицировать моде ли, близкие к нативной структуре;
2. Предложен метод улучения предсказательной силы докинга. Ме тод основан на анализе гидрофобного/гидрофильного соответствия в сайтах связывания рецептор–лиганд. Во многих случаях удается получить лучий результат, чем при использовании стандартной оценивающей функции GOLD 3. Построены и оптимизированы для связывания с лигандом модели e;
e пространственной структуры рецепторов мелатонина MT1 и MT2 че ловека. Модели позволяют объяснить ряд экспериментальных дан ных по селективности некоторых аналогов мелатонина к одному из рецепторов;
4. Эффективное совместное использование предложенных методик позволит оптимизировать процесс дизайна лекарственных препа ратов, действие которых направлено на рецепторы семейства и другие мембранные белки.
4. Публикации по теме диссертации 1., A.O., Fr, A., tt,., rm,.. (2006). ffrs sts t mt rptrs p t xp tr stt t sm mt s:
mr m st. J B Dy 24, pp. 91–10.
–10.
10.
2. rm,..,, A.O., r, T.V., rst, J.., Ars, A.., J,. (2007).
Mr ppt prt m r s. C Md Ch 14(4), pp. 393–415.
–415.
415.
3. Чугунов А.О., Новоселецкий В.Н., Арсеньев А.С., Ефремов Р.Г. (2007). Новый метод оценки качества упаковки трансмембранных -спиральных доменов в белках.
Биохимия Т. 72(3), стр. 35–367. Первоначально английский вариант рукописи –367..
был опубликован на сайте “mstr (Ms), prs rss, M 06–279. –279.
279.
4., A., tt,., rm,. (2005). Mr M m MT MT2 Mt ptrs. I: rmts m t trtr II. (s. N.. stt) pg +Bsss Md, 2005, pp. 259–270.
–270.
270.
5. Новоселецкий В.Н., Чугунов А.О., Ефремов Р.Г. (2007). Метод оптимизации моделей мембранных белков низкого разреения. Тезисы 14-й международной конференции «Математика. Компьютер. Образование», Пущино, 22–27 января, – стр. 176.
6., A.O., Nsts, V.N., rm,.. (2006). A mt t ssss rrt/ ms strtrs trsmmr ms mmr prts. Pdgs 5h C Bs G Rg d, N srs, ss, 16–22, pp. 247–251.
–251.
251.
7. Новоселецкий В.Н., Чугунов А.О., Ефремов Р.Г. (2006). Метод оценки упаковки трансмембранных -спиралей в моделях мембранных белков. V ения, повя щенные памяи академика ЮА Овинникова, Москва, 25–27 октября, стр. 5.
повя. Nsts, V.N., A.O., rm,.. (2006). Assssmt t p qt - trsmmr ms. Pdgs h 1st C Mh Bgy d Bs, s, ss, tr 9–15, pp. 14–15.
–15.
15.
9. Fr A., A.O., L., s,., Vrt,., rm,.., rtt,., tt,. (2005). Mst s ptrs Mtrqs. 1e Cgs d Mds M, s, Mr, mr 23–25, p. 25.
–25, 10., A.O., tt,., rm,.. (2004). Mr M m MT MT2 mt rptrs. Pdgs h 4h C B s G Rg d 1, Nsrs, ss, 25–30, pp. 372– –30, – 373.
11., A.O., tt,., rm,.. (2004). Mr M m MT MT2 mt rptrs. 7h C M Bgy,, ss, mr 27–30.
12., A.O., rm,.. (2004). Mr M m MT1 MT2 m t rptrs. 5h EMBL PhD d yps “Dsg L — L g N”, r, rm, mr 2–4, p. 39.
13. tt,., L,.,. A.O., Fr, A., rm,.., Vrt,., Lsr,.
(2003). Ms trmss s rptrs mtrqs. 17s Js FBgs d Phh, rxs, m, m 22–23.
14. Чугунов А.О., L., tt., Ефремов Р.Г. (2003). Молекулярное моделирова.Г.
Г.
.
ние рецепторов мелатонина MT1 и MT2. Роийкий импозиум по химии и биологии пепидов, Москва, 17–19 ноября, стр. 49.
5. Список цитируемой литературы 1. strs, J.A., st,. (1995). Itrt Mts r t strt Tr ms Ms mptt r trtr-Ft ts rt-p ptrs. Mhds Ns 25, 366–42.
2., J.U., Lt,., sr,. (1991). A mt t t prt sqs tt t tr-ms strtr. ee 253, 164–170.
3.,.,,.J., rrtt,., r-Lmtr,., r,., Mr,.J.
(1997). T rs 20 st 211 rptr t t M1 t mt rptr. Bh Bphys Rs C 239, 41–423.
4.,., Mt,.., r, J.., rrtt,., r,., Mr,.J. (2001). r rss 110 114 r rqr r st t t tst t t mt MT1 rptr. Bh Bphys Rs C 282, 1229–1236. –1236.
1236.
5. r, M.,,. (1995). Atm rmt rs prts f rm st tsts ss tt sr rs. J M B 249, 675–690.
6. rm,.., N,.., Vrt,., Ars, A.. (1999). pts mmrs:
ssssmt t ffts rmt smts t mpt st m.
Th Ch A 101, 170–174.
7. rm,.., Vs,.., N,.., Ars, A.. (2001). Impt t-ps s t m s t t ssss rmt rts prts mmr mm m. Th Ch A 106, 4–54.
. Fr, J.-L., Qr,., ttr, L. (19). stmt rprst r pt ptt. J M Gph 6, 203–206.
9. Frt,.,, A.,, N.. (19). 3 mr ppt ptt prfs:
t mr m. J M Gph 6, 12–19.
10. s, A.,, L.F.,,. (2004). Utt m Ms t r sr rss. Dg Dsv Tdy 9, 659–669.
11., T., ssr,. (2002). r s trts r Trt –rt-p ptrs. Chbh 10, 92–944. –944.
944.
12. s,., ms, T., r, T.,,.A., Mtsm,., Fx,.A., L Tr, I., Tr,.., O, T., tmp,.., mmt, M., M, M. (2000). rst tr tr ps: A –rt-p ptr. ee 289, 739–745.
13. r, T.,, A., rm,., rmsr, T., mpr,.,,.
(2004). Mtt –prt-p ptrs s s m sss. Ph Th 104, 173–206.
14. r-Frm, O.,,., r,., Msr,., r,. (2005). rrss M rt trtrs Itrts. ee 310, 63–642.
15.,.,,. (199). m- ss tr mmr prts rm tr, r, rt rsms. P 7, 1029–103.
16. r-r, V., r, J., r,. (2006). Mtpss Mmr rt tr tr rt Us stt. Ptes 62, 1010–1025.