Выявление аминокислотных остатков, определяющих специфичность ферментов семейств альфа-бета гидролаз и пенициллин-связывающих белков, методами биоинформатического анализа
На правах рукописи
Суплатов Дмитрий Андреевич Выявление аминокислотных остатков, определяющих специфичность ферментов семейств альфа-бета гидролаз и пенициллин-связывающих белков, методами биоинформатического анализа 03.01.04 - биохимия
Автореферат на соискание ученой степени кандидата химических наук
Москва - 2011 1
Работа выполнена на факультете биоинженерии и биоинформатики и в Научно-исследовательском институте физико-химической биологии имени А.Н.Белозерского Московского государственного университета имени М.В.Ломоносова
Научный консультант:
Швядас В.К., профессор, доктор химических наук
Официальные оппоненты:
Синицын А.П., профессор, доктор химических наук Рахманов С.В., старший научный сотрудник, кандидат биологических наук
Ведущая организация:
Институт биохимии имени А.Н.Баха РАН
Защита состоится «26» апреля 2011 года в 1500 на заседании диссертационного совета Д 501.001.59 по химическим наукам при Московском государственном университете имени М.В.Ломоносова по адресу: 119991, Москва, Ленинские горы, МГУ, Химический факультет, кафедра химической энзимологии, аудитория 202.
С диссертацией можно ознакомиться в библиотеке Химического факультета МГУ имени М.В.Ломоносова Автореферат разослан 25 марта 2011 года
Ученый секретарь диссертационного совета, кандидат химических наук, Сакодынская И.К.
Общая характеристика работы
Актуальность проблемы. Установление связи между структурной организацией белков и их функциональными свойствами представляет одну из фундаментальных проблем современной биохимии. Консервативные позиции в структурах гомологичных ферментов, связанные особыми ограничениями на изменчивость в процессе эволюции и потому содержащие аминокислоты одного функционального типа, как правило важны для обеспечения общей функции в семействе. В то же время ферменты одного семейства, обладая, например, общим каталитическим механизмом, могут значительно различаться по другим функциональным свойствам.
Актуальным является поиск и изучение таких специфических позиций в структурах белков одного семейства, изменчивость которых в процессе эволюции привела к разнообразию их функциональных характеристик (субстратной специфичности, стереоселективности, стабильности и др.).
Широкие возможности для решения этой задачи предоставляют методы биоинформатики и молекулярного моделирования, эффективность которых в последнее время постоянно растет в связи с развитием суперкомпьютерных технологий.
Цели и задачи исследования. Целью исследования являлась разработка алгоритма поиска специфических позиций в структуре белка (специфических позиций подсемейства), изменчивость которых в процессе эволюции привела к разнообразию функциональных характеристик в семействе ферментов (субстратной специфичности, стереоселективности, стабильности и др.), на основе анализа геномной и структурной информации, а также реализация алгоритма в виде программного кода для ЭВМ;
разработка метода биоинформатического анализа для определения специфических позиций больших семейств ферментов;
биоинформатический анализ роли специфических позиций в определении типа катализируемой реакции в суперсемействе альфа-бета гидролаз - одной из наиболее крупных групп ферментов со схожей структурной организацией и широким разнообразием типов активностей;
биоинформатический анализ роли специфических позиций в формировании субстратной специфичности D-аминопептидазы из Ochrobactrum anthropi (семейство пенициллинсвязывающих белков).
Научная новизна. Предложен систематический подход для изучения структурно-функциональных взаимосвязей в семействах ферментов на основе биоинформатического анализа и определения специфических позиций подсемейства. Разработан и реализован в виде программного кода для ЭВМ алгоритм поиска специфических позиций подсемейства. Разработан алгоритм сравнительного анализа удаленных гомологов на уровне структурной организации активных центров. Биоинформатический анализ впервые применен для изучения вариабельных аминокислотных остатков, определяющих разнообразие свойств суперсемейств ферментов альфа-бета гидролаз и пенициллинсвязывающих белков.
Практическая значимость работы. Программа поиска специфических позиций подсемейств и метод биоинформатического анализа могут быть использованы при изучении эволюции ферментов, особенностей структурной организации их активных центров и механизма действия. Сравнение удаленных гомологов позволяет изучать ферменты различных классов и охватить широкое разнообразие свойств. Информация о специфических позициях подсемейства может быть использована для получения ферментов с заданными свойствами и открывает принципиально новые возможности дизайна биокатализаторов.
Апробация работы. Результаты исследований были представлены на международных конференциях: Международном конгрессе по биокатализу Biocat2010, Гамбург, Германия, 2010 г.;
Международной конференции “Biocatalysis-2009: Fundamentals&Applications;”, Архангельск, 2009 г.;
Международной конференции «Moscow Conference on Computational Molecular Biology», Москва, 2009 г.;
Симпозиуме «ESF-EMBO symposium “Protein Design and Evolution for Biocatalysis”», Сан-Фели-де-Гюксольс, Испания, 2008 г.;
Второй международной конференции «2nd International Conference “Biocatalysis in Non-Conventional Media”» Москва, 2008 г.;
Научно-практической конференции "Живые Системы" ФЦП "Исследования и разработки по приоритетным направлениям развития научно технологического комплекса России на 2007-2012 годы", в 2008 и 2009 г.г., Москва;
Конференциях «Ломоносов-2010», Москва, 2010 г. и «Ломоносов 2008», Москва 2008 г.
Публикации. По теме диссертации опубликовано 10 печатных работ Объем и структура работы. Диссертация состоит из введения, литературного обзора, постановки задачи, описания методов и протоколов расчетов, результатов и их обсуждения, заключения, выводов и списка цитируемой литературы. Работа изложена на 182 страницах машинописного текста, содержит 15 таблиц и 57 рисунков.
Содержание работы 1. Биоинформатический анализ специфических позиций подсемейства, определяющих функциональное разнообразие внутри семейств ферментов В процессе эволюции белки развиваются от общего предка путем аминокислотных замен, вставок и делеций, что обеспечивает функциональное многообразие семейств гомологичных ферментов.
Рис. 1. Схематичное представление различных типов аминокислотных остатков при биоинформатическом анализе семейства ферментов: (1) Консервативная позиция – определяет общую для всего семейства функцию или особенность каталитического механизма (кол. 16);
Специфическая позиция подсемейства – отвечающая за специфические свойства, присущие подсемействам по отдельности (кол. 4, 7, 10, 12, 14);
Неинформативная позиция – распределение аминокислот не соответствует ни одной из двух предыдущих закономерностей (кол. 1).
Некоторые аминокислотные остатки в структуре важны для функции и поэтому связаны особыми ограничениями на изменчивость в процессе эволюции. Множественное выравнивание является ключевым инструментом изучения структурно-функциональных взаимосвязей белков по их первичным и третичным структурам. Важным этапом биоинформатического анализа является поиск консервативных позиций, которые определяют общие свойства1 семейства ферментов. Замена аминокислотных остатков в этих позициях, как правило, приводит к потере каталитических функций.
Однако ферменты одного семейства, обладая общими характеристиками, могут значительно различаться в свойствах. Представляет интерес выявление и изучение аминокислотных остатков, изменчивость которых в процессе эволюции привела к разнообразию функциональных особенностей в семействе. Такие аминокислотные остатки консервативны только внутри определенных функциональных групп (подсемейств) внутри семейства и различаются между группами.
Варфоломеев С.Д., Упоров И.В., Федоров Е.В. // Биохимия, Мы предлагаем называть такие позиции в колонке множественного выравнивания специфическими позициями подсемейства (СПП), чтобы подчеркнуть различие аминокислотных остатков в этих позициях у подсемейств с разными свойствами.
Таким образом, при проведении биоинформатического анализа семейств ферментов можно идентифицировать следующие позиции:
Консервативная позиция – определяет общие для всего семейства функции или особенности каталитического механизма (Рис.1, кол. 16);
Специфическая позиция подсемейства – отвечает за специфические свойства, присущие подсемействам по отдельности (Рис.1, кол. 4, 7, 10, 12, 14);
Неинформативная позиция – распределение аминокислот не соответствует ни одной из двух предыдущих закономерностей (Рис.1, кол. 1).
Задачей диссертационной работы была разработка алгоритма поиска специфических позиций подсемейства, написание программы на основе этого алгоритма, создание метода биоинформатического анализа больших семейств ферментов и его применение для суперсемейств ферментов альфа бета гидролаз и пенициллинсвязывающих белков.
1.1 Алгоритм поиска СПП состоит из трех этапов:
Разбиение семейства гомологичных ферментов на подсемейства с потенциально разными свойствами. Оптимальным критерием разбиения семейства ферментов на группы с разными свойствами является экспериментальная аннотация субстратной специфичности, стабильности, типа активности и т.д., для каждого представителя семейства. Белки могут быть объединены в одно подсемейство, если они имеют одинаковый признак по изучаемому свойству. Однако применение такого подхода не позволяет учитывать всю доступную геномную и структурную информацию о малоизученных ферментах. В связи с этим была разработана процедура кластеризации на подсемейства. Для каждых трех последовательностей семейства i, j и k рассчитывается трехмерная матрица С(i,j,k) количества консервативных колонок в этих последовательностях. Далее семейство разбивается на подсемейства: для каждого значения Т (от 1 до количества колонок в выравнивании) последовательности i и j объединяются в подсемейство, если существует последовательность k, такая что C(i,j,k) больше или равно Т. Таким образом, множественное выравнивание преобразуется в граф, где каждая вершина соответствует последовательности выравнивания, а каждое ребро E(i,j) соответствует наибольшему C(i,j,k).
Далее, каждая связная компонента с T консервативными колонками закрепляется как новое подсемейство. Таким образом, процедура учитывает функциональное многообразие ферментов и не ограничивается единственным разбиением семейства на подгруппы.
Расчет специфичности колонки выравнивания. Для каждой колонки выравнивания с учетом выбранного разбиения на функциональные подсемейства необходимо количественно оценить степень специфичности т.е. сходства аминокислот внутри функциональных групп семейства и различия между группами. Критерий основывается на сравнении наблюдаемых (в выравнивании ферментов семейства) и случайных (сгенерированных) колонок множественного выравнивания для того, чтобы оценить степень случайности получаемых результатов.
Для оценки специфичности колонки выравнивания вводится следующая функция, основанная на формуле относительной энтропии:
где A и B обозначают тип аминокислоты в колонке множественного выравнивания (в том числе и делецию);
qi(AB, G) – частота пары AB в подсемействе G колонки i;
qi(A) и qi(A, G) – частоты аминокислоты типа А в колонке i и в подсемействе G этой колонки соответственно;
NG обозначает общее количество подсемейств, а значение M(AB) соответствует оценке взаимозаменяемости аминокислот типов A и B, рассчитанной как, где m(AB) – значение матрицы BLOSUM62. Все частоты q опционально могут быть рассчитаны с учетом взвешивания последовательностей. Все диагональные элементы M(AA) считаются равными 1, чтобы исключить переоценку редких аминокислот.
Представленная оценка специфичности Si будет максимальна для колонок выравнивания с высокой степенью сходства аминокислот внутри подсемейств и различиями между подсемействами. Для того чтобы провести статистическую оценку полученного значения Si, применяется процедура перетасовки2. Чтобы распознать, является ли распределение аминокислот по колонке случайным или ассоциировано с разбиением на конкретные подсемейства, каждая колонка случайно перетасовывается n раз. Для каждого случайного распределения вычисляется оценка Sirnd. В окончательном варианте оценка специфичности колонки i для заданного разбиения на подсемейства выражается через Z-оценку стандартного нормального распределения:
Mirny L, Gelfand M // J.Mol.Biol., 2002, 321, 7- Большие значения Z-оценки соответствуют высокой степени специфичности позиции. Полученные Z-оценки корректируются с использованием информации о пространственной организации фермента для того, чтобы улучшить показатели аминокислотных остатков, которые располагаются в структуре в окружении консервативных остатков или других специфических позиций подсемейства:
где ZiSSP обозначает Z-оценку специфичности колонки (subfamily-specific position), а ZiCns обозначает Z-оценку ее консервативности, j – соседи по структуре аминокислотного остатка, который представлен в колонке i выравнивания, а N – общее количество структурных соседей. Список соседей рассчитывается по структуре одного из ферментов, представленных во множественном выравнивании, для каждого остатка в радиусе 4. Для оценки консервативности колонки I выравнивания используется оценка Valdar&Thornton.;
Статистический анализ заключается в присвоении каждой Z-оценке специфичности колонки выравнивания так называемой Р-оценки, которое является мерой случайности полученного результата. Для этого использовалась процедура ранговой статистики Бернулли B-cutoff3.
Полученные Z-оценки специфичности сортируются по убыванию, после чего ранг k рассчитывается так, что первые k оценок (соответствующие k колонкам выравнивания) представляют результаты, которые с наименьшей вероятностью могут возникнуть в случайном распределении:
где n обозначает общее число посчитанных Z-оценок, а Таким образом, мы получаем список специфических позиций подсемейства, отсортированных в порядке убывания статистической достоверности.
По завершении работы алгоритм определяет такие разбиения семейства на подсемейства, которые привели к обнаружению наиболее статистически Vinogradov D.V., Mironov A.A. // BGRS’2002, 2002, Novosibirsk, Russia, July 1, 28– значимых специфических позиций, и находит наиболее достоверные группы ферментов с разными свойствами внутри семейства.
Реализация. Разработанный алгоритм поиска специфических позиций подсемейства был реализован в виде программного кода для ЭВМ на языке Java. Программа с рабочим названием ZEBRA была оптимизирована для работы в параллельном режиме на компьютерах, оснащенных многоядерными процессорами, и может функционировать на всех основных операционных системах.
Тестирование программы было проведено на семействах гомологичных ферментов аденилилциклаз (ЕС 4.6.1.1) и гуанилилциклаз (ЕС 4.6.1.2). Были найдены СПП, определяющие субстратную специфичность ферментов к связыванию нуклеотидов. Полученные результаты полностью соответствовали имеющимся литературным данным, что подтвердило правильность работы программы.
1.2 Биоинформатический анализ семейств ферментов Для поиска и изучения специфических позиций в больших семействах ферментов был разработан метод биоинформатического анализа, который состоит из следующих этапов:
i. Подготовка выборки гомологичных ферментов: поиск гомологичных ферментов по сходству структур или аминокислотных последовательностей с помощью программ SSM и PSI-BLAST.
Последовательности, идентичные более чем на 95%, группируются в кластеры, из которых для последующего анализа отбирается только один представитель;
ii. Подготовка множественного выравнивания. Сравнительный биоинформатический анализ ферментов является важным шагом при изучении взаимосвязи их структуры и функции. Сравнение удаленных гомологов позволяет изучать ферменты различных классов и охватить широкое разнообразие свойств. Однако многие ферменты, произошедшие от одного предка в результате эволюции и претерпевшие значительные функциональные изменения в ходе естественного отбора, не обладают достаточным сходством по аминокислотным последовательностям для проведения статистически достоверного сравнительного анализа. При этом пространственная организация активных центров таких ферментов может быть консервативной, а остальные части структуры – принципиально отличаться. В связи с этим при изучении общих принципов организации гомологичных ферментов представляется целесообразным проводить сравнительный биоинформатический анализ наиболее важных с функциональной точки зрения элементов структуры – активных центров, т.е. аминокислотных остатков, формирующих участки связывания субстрата и участвующих в механизме каталитического превращения. В связи с этим был разработан алгоритм для выделения структур активных центров ферментов, основанный на использовании базы данных структур белков PDB, алгоритмов структурного анализа, а также идентификации функционально важных аминокислотных остатков и полостей в структуре фермента. Для множественного структурного выравнивания полноразмерных структур и активных центров, а также последовательностей ферментов используются программы T-coffee и Mustang;
iii. Поиск специфических позиций подсемейства: с помощью разработанной программы ZEBRA, отбор наиболее статистически достоверных результатов;
iv. Изучение роли специфических позиций подсемейства с помощью программ визуализации данных (Pymol, Jalview) и методов молекулярного моделирования. Конструирование молекулярных моделей ферментов с заменами по СПП, изучение роли аминокислот в специфических позициях в процессе связывания субстрата с помощью метода молекулярного докинга. При компьютерном скрининге библиотеки мутантных ферментов для характеристики продуктивного связывания в фермент-субстратных комплексах, полученных в результате докинга, следует использовать структурные фильтры, накладывая ограничения, например, на величину расстояния между кислородом каталитического остатка серина и карбонильным атомом субстрата – 2,7±0,2, величину угла между кислородом серина, карбонильными углеродом и кислородом субстрата – 94±7°;
а также на величину двугранного угла между плоскостями нуклеофильной атаки и амидной связи – 89±7° (Рис. 2).
Рисунок 2. Характеристики структурных фильтров для оценки реакционноспособности фермент-субстратных комплексов при молекулярном моделировании: расстояние между взаимодействующими атомами, простой и двугранный углы нуклеофильной атаки каталитического серина на амидную связь субстрата. Объяснение в тексте.
Метод биоинформатического анализа может быть использован для изучения закономерностей и особенностей организации активных центров и механизма действия ферментов. При этом сравнение удаленных гомологов позволяет изучать ферменты различных классов и охватить широкое разнообразие свойств. Этот метод открывает принципиально новые возможности для изучения взаимосвязи структуры и функции ферментов и представляет информацию для направленного изменения свойств биокатализаторов.
2. Биоинформатический анализ ферментов суперсемейства альфа-бета гидролаз на уровне сравнения структурной организации активных центров Дивергентная эволюция создала родственные ферменты, которые способны катализировать различные химические превращения несмотря на структурное сходство активных центров. Понимание того, как изменение структуры фермента приводит к изменению его функциональных свойств, представляет одну из важнейших задач современной энзимологии. С этой целью разработанная методология была применена к одной из наиболее крупных групп ферментов со схожей структурной организацией – суперсемейству альфа-бета гидролаз, которая охватывает такие активности, как гидролиз эпоксидов, пептидов, сложных эфиров и амидов карбоновых кислот, ацильный перенос, синтез С-С связей и перокисление органических соединений.
При изучении структурно-функциональных взаимосвязей между дальними эволюционными родственниками выравнивание третичных структур является значительно более информативным и точным, чем выравнивание аминокислотных последовательностей. Биоинформатический анализ показал, что ферменты суперсемейства альфа-бета гидролаз с различными типами активностей в значительной степени потеряли сходство не только по аминокислотным последовательностям, но и по трехмерным структурам.
При этом было установлено, что пространственная организация активных центров оказалась наиболее консервативным элементом структуры альфа бета гидролаз. В связи с этим для сравнительного биоинформатического анализа ферментов семейства альфа-бета гидролаз с липазной, пептидазной и оксинитрилазной активностью был разработан и использован алгоритм выделения структур изолированных активных центров. Пространственное выравнивание активных центров удаленных гомологов показало консервативность и гомологичное расположение в структуре аминокислот каталитической триады (Рис.3).
Анализ консервативных позиций определил четыре остатка с наибольшей статистической достоверностью, а именно (нумерация по липазе Б из Candida Antarctica) – остатки каталитической триады 105Ser, 224His и 187Asp, а также остаток 39Gly, близкий к остатку оксианионного центра Thr40. Анализ специфических позиций подсемейства определил 6 наиболее значимых аминокислотных остатков – 79N, 104W, 38P, 40T, 134D, 225A (Табл. 1), еще 17 остатков были определены как СПП с меньшей степенью статистической достоверности. Варьирование аминокислотных остатков в этих позициях в основном обеспечивает разнообразие свойств между отдельными подсемействами. Изучение роли обнаруженных специфических позиций подсемейства проводили методами молекулярного моделирования.
2.1 Изучение роли специфических позиций подсемейства в проявлении липазной и амидазной активностей в альфа-бета гидролазах Липазы (триацилгрицерол гидролазы, ЕС 3.1.1.3) катализируют реакцию гидролиза сложных эфиров жирных кислот. Липазы гидролизуют амиды с чрезвычайно низкой скоростью, в то время как родственные пептидазы способны эффективно гидролизовать как амиды, так и сложные эфиры. Как с фундаментальной, так и практической точки зрения важно понять, как эта разница каталитических свойств обеспечивается на уровне организации активных центров родственных ферментов, можно ли усилить минорную или индуцировать новую каталитическую активность в ферменте.
Биоинформатический анализ специфических позиций подсемейства (Табл.1) выявил четкие различия между альфа-бета гидролазами с липазной и амидазной активностями. Так, например, остаток Ala225 липазы B из Candida antarctica заменяется в карбоксипептидазах на Met и Glu, остаток Glu134 – на Leu, и т.д. Роль специфических позиций подсемейства в дискриминации липазной и амидазной активностей в ферментах суперсемейства альфа-бета гидролаз, была изучена методами молекулярного моделирования. Были проведены замены аминокислот в специфических позициях липазы Б из Candida Antarctica на аминокислотные остатки, характерные для пептидаз, и проведен скрининг свойств возможных мутантов (11971 комбинация) in silico. Исследование способности мутантов образовать реакционноспособные фермент-субстратные комплексы с амидными субстратами позволило обнаружить замены, усиливающие проявление амидазной активности: Leu278Ala, Trp104Phe, Ala225[Met/Val], Asp134Leu и Gln157Leu (Рис.4). Остатки Trp104 и Ala225 расположены в липазе Б из Candida antarctica в непосредственной близости от каталитической триады. Замена Leu278Ala необходима для правильной ориентации Ala225Met, а в результате замен Asp134Leu и Gln157Leu создается благоприятное окружение для связывания гидрофобных заместителей субстрата.
Ранг Позиция Z-оценка P-оценка Липазы Карбоксипептидазы Дипептидилпептидазы ОНЛ SSSSS SSSSS STSSS NNNNN NNSNN NN AAVVA VVAAV IIVVV V TTTTT TTTTT VTTTA T EEEEE EEEEE EEEEE EEEEE PPPPP PPP YYY 1 79N* 6.652475 1.210460E- HHHHH HHHHH HHHHH WWWWW WWWWW WW EEEEE EEEEE EEEEE E EEEEE EEEEE EEEEE E FFFWW WWWWW WWWWW WWWWW AAAAA AAA FEE 2 104W* 5.940676 7.021722E- HHHHH HHHHH HNHHP PPPPP PPPPP PP NNTTN TTNNT TNTNN N NNNNN NNNNN NNNNN N AGGGG AGAGG AAGGA GGGAG GGGGG GGG HHH 3 38P* 5.794331 3.844048E- TTTTT TTTTT TTTTT TTTTT TTTTT TT GGGGG GGGGG GGGGG G GGGGG GGGGG GGGGG G PPPPP PPPPP PPPPP PPPPP PPPPP PPP AII 4 40T* 5.118177 2.695955E- TTTSS STTTP TSSAA DDDDD DDDDD DD LLLLL LLILL MYLLL L LLDLL VLLVL LVLLL L VVVVV VVVVV VVVVV VVVVV TTTTT TTT FLV 5 134D* 4.599652 3.648069E- 6 225A* 4.497449 2.574429E-29 ADVLL LLAGD ALVLG AAEEA AAESS EA MMMMM MMMMM MMMMM M EEEEE EEEEE EEEEA E GGGGS GSGSG GGSSG SSGGG WWWWW WWW MKK TTTTT TNTTT TTTTT QQQQQ QERQQ QQ NNNNN NNNNN NNNNN N PPPPP PPPPP PPPPP P HHHHH HHHHH HHHHH HHHHH SPSSP PSS PLL 7 191Q* 4.041383 1.080419E- 8 137G* 3.530454 4.014081E-25 GGGGG GGGGG GGGGG GGGGG GGGGG GG PPPPP PPPPP PPPYY Y DDKDD DDDND DNLLL L WFWFW WWWWW WWWWW WWFWF DEDDE EDD LVV VTAMM MALTM VMMAI LLLPL LLLLI LL HHHHH HHHHH HHHII I HHHHH HHHHH HHHHH H YFYFF YYYYY YYYFY FYFYF FFFFF FFF ILL 9 109L* 3.138349 2.917945E- IIIII IIIII IVALV TTVIA AAIAI AS TTEET EETTE EDEDD D TDDDD DDDDD DDDDD D GGGGG GGGGG GGGGG GGGGG GGGGG GGG VFF 10 76T* 2.999971 3.785976E- TSTTT TTTSA TSDTT VVVVV VVIVL RI QQQQQ QQQQQ QQQNN N DDDDD DDDDD DDDDD D YLYLA YFYLY YYFLY AFLYL FFFFF FFF YLL 11 139V* 2.505505 6.968691E- LLILI LYVLM LLIVL FFIII IIIVV IF GGGGG GGGGG GGGGG G GGGGG GGGGG GGGGG G VTVTG VVVVV VVGVV GGTVT HHHHH HHH LHH 12 131F* 2.387914 1.788333E- TWFFF VWSWT GTLWG GGAAG GGAGA GG PPPPP PPPPP PPPPP P PPPPP PPPPP PPPPP P CGCGQ CNCGC CCQGC QQGCG QQQQQ QQQ YCC 13 41G* 2.359597 8.530478E- AAPPP PAPAA APPPA PPPPP PPPPG PP GGGGG GGGGG GGGGG G GGGGG AAAAP PAPPP P PPPPP PPPPP PPPPP PPPPP GGGGG GGG ASS 14 133P* 2.212031 4.177797E- QTEEE EETTT QDEGT EEEEE EEKEF EE YFLLF LLYFL WVLMM M AAAAA GAGSA GSSSS S DDDDE DDDDD DDEDD EEDDD FYFFY YFF KKE 15 188E* 2.161328 1.025878E- 16 132A* 2.151781 7.563415E-21 GGAAV TGAGG GSAGV AASSS SSSSS SA NNNNN NNNNN NNNNN N NNNNN NNNNN NNNNN N AAAAA AAAAA AAAAA AAAAA DDDDD DDD NNN QLQQQ QQQLQ QQQQQ QQQQQ QQQQQ QQ YYYYY YYYYY YYYYY Y YYYYY YYYYY YYYYY Y YYYYY YYYYY YYYYY YYYYY FYFFY YFF FCC 17 106Q* 1.980272 1.814714E- NNNNN NHYNF NNNHN YYFFY YFFFF FY TTTTT TTTTT VTTSA S IIMII ITLTV TTLLL L SSSST STSTS SSTTS TTSSS FFFFF FFF LLL 18 135Y* 1.894755 1.111038E- ----- ----- ----- SSDDD DDDDD DS GGGGG GGGGG GGGGG G AAGAA SSAAG GASGG G GGQGG GGGNQ GGGGG GGGGG GGGGG GGG FFF 19 201S* 1.689616 3.442086E- PPYYY YYNPN PYWRY QQMMQ QQMQQ QQ YWWWW WWWWW FHWFF F LLVLL VVVVL VVLFF L ----- ----- ----- ----- ----- --- CPP 20 193Q* 1.450093 2.841031E- TTGTT TTTTT TTTTT TTTTT TTTTT TT LLAAL AALLA YTEEE E YYHYY WFEHY EQDDD D ----- ----- ----- ----- ----- --- DED 21 138T* 1.265302 9.918473E- IATRR AFVAF IVKFH VVALA ALAPF SL IVLLV LLVVL MILLL L IIMII LLVML VIMMM M ----- ----- ----- ----- ----- --- DDD 22 149V* 1.119167 4.920354E- Таблица 72M* 23 0.910317 3.748176E-05 GGGGG GGAGA GTGAF MMSSL FMSMS LM SSKKA QTNGQ MNKLL L KKTKK HQKSK QKKKK K ----- ----- ----- ----- ----- --- -- 1. Аминокислотные остатки, определенные как СПП среди ферментов суперсемейства альфа-бета гидролаз с липазной, пептидазной и оксинитрилазной (ОНЛ) активностями. Результаты представлены SS порядке уменьшения статистической достоверности (Z-оценка), показано в ASAAA AAASA AAAAA SSSAS SSSSA IMIIM LIMMI TYLLL L LLILL ILVLL AIIII I ----- ----- ----- ----- ----- --- -- 33 153S* 0.472015 9.063115E- разделение выборки0. на подсемейства. Р-оценка является мерой статистической достоверности результатов (см. стр.6). Жирным шрифтом выделены 34 7.451640E-02 TSTST STSSS TTTAT SSSSS SGSSS SS GGGGG GGGGG GGGGG G GGGGG GGGGG GGGGG G GGGGG GGGGG GGGGG GGGGG NSNNS SNN STT 184S пороги статистической достоверности – наиболее значимыми являются первые шесть специфических позиций (79N, 104W, 38P, 40T, 134D, 225A).
Рисунок 3. Пространственное выравнивание структур активных центров ферментов семейства альфа-бета гидролаз: сериновой карбоксипептидазы из Triticum aestivum, липазы Б из Candida antarctica, оксинитрилазы из Hevea brasiliensis, а также их гомологов.
Одинаковые расположение и ориентация аминокислотных остатков каталитической триады в структуре показаны стрелками.
Мутанты липазы Б из Candida antarctica с заменами, отобранными в результате биоинформатического анализа и молекулярного моделирования, были получены компанией Novozymes (Дания) в рамках совместного проекта 7-й рамочной программы ЕС. Результаты предварительных исследований показывают, что предложенные замены в СПП L278A, W104F, A225K и A225M приводят к увеличению амидазной активности, в то время как замены этих позиций на другие остатки, а также замены не по СПП, подавляют и без того чрезвычайно низкую амидазную активность липазы. Эти экспериментальные данные подтверждают выводы проведенного нами биоинформатического анализа.
2.2 Изучение роли специфических позиций подсемейства в проявлении эстеразной и оксинитрилазной активностей в альфа-бета гидролазах Гомологичные ферменты эстеразы и оксинитрилазы катализируют различные химические реакции: эстеразы осуществляют гидролиз сложноэфирных связей, оксинитрилазы участвуют в присоединении цианида к альдегидам (кетонам) и катализируют образование С-С связей.
Рисунок 4. Структура фермент-субстратного комплекса мутанта липазы Б с амидным субстратом 2-хлоро-N-бензилацетамидом. Показаны замены по специфическим позициям - 278A, 104F, 225M и гидрофобная поверхность, закрывающая каталитический гистидин от раствора.
По механизму действия оксинитрилазы с альфа-бета укладкой (ЕС 4.1.2.11, 4.1.2.37) существенно отличаются от других альфа-бета гидролаз.
Принципиально отличается роль каталитического остатка серина – он участвует в образовании водородной связи с кислородом гидроксильной группы и не является нуклеофилом. Биоинформатический анализ специфических позиций подсемейств выявил четкие различия между альфа бета гидролазами с эстеразной и оксинитрилазной активностями.
Возможность введения замен по специфическим позициям, которые могут привести к проявлению эстеразной активности в оксинитрилазах и наоборот, была исследована при помощи молекулярного моделирования. In silico скрининг каталитических свойств 21633 мутантов оксинитрилазы из Hevea brasiliensis по специфическим позициям подсемейства по отношению к библиотеке из 7 сложноэфирных субстратов позволил выявить наиболее важные специфические позиции для контроля типа катализируемой реакции:
Thr11, Lys236 и His14 (нумерация по оксинитрилазе из Hevea brasiliensis), которые в эстеразах и липазах заменены на небольшие гидрофобные аминокислоты. Остаток Thr11 участвует в координации гидроксильной группы циангидрина, а Lys236 (гомолог Ala225 в липазе Б из C.antarctica) Рисунок 5. Связывание сложного эфира (4-нитрофенилацетата) в активном центре мутанта Thr11Gly/His14Gly/Lys236Leu оксинитрилазы из Hevea brasiliensis, способного проявлять гидролитическую активность. Показаны аминокислотные остатки каталитической триады (Ser80, His235, Asp207), а также остатки оксианионного центра, Ile12 и Cys81, которые стабилизируют тетраэдрический интермедиат.
выполняет несколько функций в механизме действия оксинитрилаз:
участвует в связывании и ориентации субстрата, стабилизации отрицательного заряда на уходящей CN- группе и обеспечивает изменение рКа каталитического остатка гистидина His2354. Отобранный в результате компьютерного скрининга тройной мутант Thr11Gly/His14Gly/Lys236Leu оксинитрилазы из Hevea brasiliensis был предложен для экспериментальной проверки эстеразной активности. (Рис. 5).
Рекомендованный тройной мутант оксинитрилазы был получен в Техническом университете г.Дельфт (Голландия) в рамках совместного проекта 7-й рамочной программы ЕС. Эксперименты, проведенные голландскими коллегами, показывают, что замены в специфических позициях T11G, H14G, K236L подавляют оксинитрилазную активность и приводят к появлению эстеразной активности в соответствии с результатами молекулярного моделирования.
Gruber K, Gartler G, Krammer B, Schwab H, Kratky C//J Biol Chem, 2004, 279, 19, 20501- Рисунок 6. Связывание манделонитрила в активном центре мутанта эстеразы из Nicotiana tabacum G12T и M239K (розовый). Структура комплекса наложена на кристаллографическую структуру фермент-субстратного комплекса оксинитрилазы из H.brasiliensis с манделонитрилом (1YB6, желтый). Нумерация по Nicotiana tabacum.
Для решения обратной задачи – превращения эстеразы в оксинитрилазу – был выбран фермент из Nicotiana tabacum. Аминокислоты Thr11 и Lys оксинитрилазы из Hevea brasiliensis заменены в эстеразе из Nicotiana tabacum на, соответственно, глицин и метионин. Для индуцирования оксинитрилазной активности в этом ферменте мы использовали мутации, обратные отобранным для моделирования эстеразной активности в оксинитрилазах - G12Т и M239K (нумерация по эстеразе из Nicotiana tabacum). Молекулярный докинг показал возможность связывания и правильную ориентацию субстратов оксинитрилазы в активном центре мутантов эстеразы из Nicotiana tabacum с образованием водородных связей с Thr12 и каталитическим Ser81. Цианогруппа также ориентирована правильно в направлении положительно заряженного Lys239 (Рис. 6). Влияние предложенных замен G12Т/M239K в эстеразе из Nicotiana tabacum на оксинитрилазную активность было экспериментально проверено независимой группой исследователей. Было показано угнетающее действие мутаций на эстеразную активность и появление оксинитрилазной активности. Эти экспериментальные данные подтвердили результаты проведенного нами биоинформатического анализа.
Padhi S.K., Fujii R., Legatt G.A., et.al. // Chemistry & Biology, 2010, August 27, 17, 863- 3. Биоинформатический анализ ферментов семейства пенициллин связывающих белков. Изучение роли специфических позиций подсемейства в формировании субстратной специфичности D аминопептидазы.
Семейство пенициллин-связывающих белков включает также D аминопептидазы, D-амидазы аминокислот, щелочные D-пептидазы и лактамазы. Для биоинформатического анализа ферментов этого семейства был проведен поиск гомологов D-аминопептидазы из Ochrobactrum anthropi по первичной и третичной структуре в банках данных белковых последовательностей UniProt и белковых структур PDB, получена выборка из 734 гомологов по первичной структуре и 24 гомологов по третичной структуре. Биоинформатический анализ показал, что область активного центра D-аминопептидазы обладает достоверным сходством с D-амидазами аминокислот, щелочными D-пептидазами и -лактамазами как на уровне аминокислотной последовательности, так и на уровне пространственной организации (Рис.7). Одиннадцать аминокислотных остатков были определены как наиболее вероятные специфические позиции в подсемействе D-аминопептидаз: 112D, 159R, 115A, 128F, 66Q, 222W, 114W, 220I, 288G, 156G, 229C (приведены в порядке уменьшения статистической значимости, Табл.2). Специфичность D-аминопептидазы из Ochrobactrum anthropi к ацильной группе субстрата ограничена D-аминокислотами с небольшой боковой цепью, такими как аланин и валин, и их производными: D-AlaHN2, а также D-Ala-D-Ala и D-Ala-L-Ala дипептидами.
Таблица 2. Аминокислотные остатки, определенные как наиболее вероятные специфические позиции в семействе пенициллин-связывающих белков: 112D, 159R, 115A, 128F, 66Q, 222W, 114W, 220I, 288G, 156G, 229C.
# Позиция Z-оценка p-оценка Подсемейства 112D* DDDDD DD. LLLLL L. AAAAA A. SSSSS S. RRRR. KKK. HHH 32.45 1.08E- 159R* RRRRR RR. GGGGG G. MMMMM M. DDDDD D. SSAA. LLL. TTT 31.63 3.77E- 115A* AAAAA AA. PPPPP P. QQQQQ Q. TTTTT T. PPPP. SSS. KKK 27.87 1.76E- 128F* FFFFF FF. ----- -. QQQQQ Q. NNNNN N. CCCC. ---. EEE 30.54 5.69E- 66Q* QQQQQ QQ. TTTTT T. MMMMM M. AAAAA A. VTTV. FFF. SSS 27.12 1.82E- 222W* WWWWW WW. LLLLL L. GGGGG G. WWWWW W. HHHH. QQQ. YYY 25.85 6.57E- 114W* WWWWW WW. FVIVL V. PPPPP P. IIIII I. TTVV. KKK. EEE 25.73 2.64E- 220I* IIIII II. GGGGG G. MMMMM M. NNNNN N. SALV. LLL. -- 25.78 4.10E- 288G* GGGGG GG. TTTTT T. YYYYY Y. SSSSS S. NNAA. NNN. TTT 23.28 1.91E- 156G* GGCGC QG. PSSAA S. VVVVV V. MMMMM M. LLLL. GGG. FFF 24.62 3.19E- 229C* CCSCS GC. KKKKK K. FFFFF F. MMMMM M. FFYY. YYY. LLL 23.41 4.37E- Нумерация позиций представлена по кристаллографической структуре 1EI5. Результаты представлены в порядке уменьшения статистической достоверности (Z-оценка). В графе «Подсемейства» показан аминокислотный состав соответствующих колонок множественного выравнивания, разделенный на потенциальные подсемейства (через «.») с различной субстратной специфичностью.
Рисунок 7. Фрагмент трехмерного выравнивания представителей семейства пенициллин связывающих белков - структурных гомологов D-аминопептидазы из Ochrobactrum anthropi. Показаны остатки активного центра, участвующие в каталитическом механизме (Ser62, Lys65, Tyr153, His287) и являющиеся консервативными в D-аминопептидазе и других представителях семейства - D-амидазах аминокислот, щелочных D-пептидазах и лактамазах.
Структурный анализ показал, что три позиции отвечают за связывание ацильной группы субстрата и геометрически расположены в соответствующей полости активного центра D-аминопептидазы из Ochrobactrum anthropi: 222W, 114W, 220I. Их роль в определении субстратной специфичности была изучена методами молекулярного докинга и молекулярного моделирования.
Результаты биоинформатического анализа свидетельствуют о том, что аминокислотный остаток 114Trp подсемейства DAP может заменяться в других подсемействах на Phe, Val, Pro, Ile, Thr, Lys и Glu;
остаток 220Ile – на Gly, Met, Asn, Leu и Val;
а остаток 222Trp – на Leu, Gly, His, Gln и Tyr.
In silico скрининг каталитических свойств 1981 мутанта D-аминопептидазы из Ochrobactrum anthropi по специфическим позициям подсемейства по отношению к библиотеке производных L- и D-аминокислот позволил Рисунок 8. Молекулярная модель тройного мутанта W222H.W114L.I220V DAP из Ochrobactrum anthropi в комплексе с D-фенилаланинамидом D-PheNH2 (нумерация согласно структуре 1EI5 из банка данных PDB). Карбонильный углерод амидной связи расположен на оптимальном расстоянии 2.8A от атакующего гамма кислорода каталитического Ser62, промежуточный тетраэдрический интермедиат стабилизируется в оксианионном центре водородными взаимодействиями с атомами азота основной цепи Ser62 и Ala290 (2.2A and 2.0A, соответственно).
выявить замены, позволяющие расширить субстратную специфичность фермента. Была показана способность мутанта Trp222His/Trp114Leu/Ile220Val взаимодействовать с D-PheNH2, D-IleNH2, D CysNH2, D-ValNH2 и D-AlaNH2 (Рис. 8).
Экспериментальное конструирование, выделение и очистка предсказанного тройного мутанта D-аминопептидазы из Ochrobactrum anthropi была проведена японскими партнерами в рамках совместного проекта. Результаты экспериментального исследования каталитических свойств, проведенные в нашей лаборатории И.Г.Халиуллиным, подтвердили расширенную субстратную специфичность тройного мутанта и доказали правильность выводов Trp222His/Trp114Leu/Ile220Val проведенного биоинформатического анализа.
Основные результаты и выводы 1. Разработан алгоритм поиска специфических позиций в структуре белка (специфических позиций подсемейства) на основе анализа геномной и структурной информации;
алгоритм, способный функционировать на всех основных операционных системах, реализован в виде программного кода для ЭВМ и использован в программе для работы в параллельном режиме на суперкомпьютере;
2. Разработан метод биоинформатического анализа больших семейств ферментов на уровне аминокислотных последовательностей, полноразмерных структур и уровне структурной организации активных центров;
3. Проведен биоинформатический анализ удаленных гомологов суперсемейства альфа-бета гидролаз с липазной, амидазной и оксинитрилазной активностями. Определен список статистически достоверных специфических позиций подсемейств;
4. Определены специфические позиции суперсемейства альфа-бета гидролаз, ответственные за дискриминацию липазной и амидазной активностей (Trp104, Ala225, Asp134, Gln157 и Leu278 в липазе Б из Candida antarctica);
5. Определены специфические позиции суперсемейства альфа-бета гидролаз, ответственные за дискриминацию эстеразной и оксинитрилазной активностей (Thr11, His14 и Lys236 в оксинитрилазе из Hevea brasiliensis);
6. Проведен биоинформатический анализ ферментов семейства пенициллин-связывающих белков. Определены специфические позиции 222W, 114W и 220I, ответственные за формирование специфичности D-аминопептидазы из Ochrobactrum anthropi к ацильной части субстрата.
Публикации по теме работы 1. Д.А.Суплатов, В.К.Аржаник, В.К.Швядас;
Сравнительный биоинформатический анализ изолированных структур активных центров эволюционно удаленных гомологов суперсемейства ферментов альфа-бета гидролаз;
Acta Naturae, 2011, 3(1), 78-84.
2. И.Г.Халиуллин, Д.А.Суплатов, Д.Н.Шалаева, М.Оцука, Я.Асано, В.К.
Швядас;
Биоинформатический анализ и молекулярное моделирование участия Lys65 в каталитической триаде D-аминопептидазы из Ochrobactrum anthropi;
Acta Naturae 2010, 2 (2), 70-74.
3. Д.А. Суплатов;
рН-Зависимость активности и стабильности бактериальных пенициллинацилаз;
Доклады на юбилейном заседании, посвященном 200-летию Московского общества испытателей природы;
М. МОИП, 2005, стр. 48-62.
4. I. Khaliullin, D. Suplatov, V. vedas, Y. Asano, M. Otsuka, D. Shalaeva;
“The Role of Lys65 Residue in the Catalytic Triad of D-aminopeptidase from Ochrobactrum anthropi Revealed by Bioinformatic Analysis and Molecular Modeling”;
Proc. 5th Internat. Congress on Biocatalysis Biocat2010, Hamburg, Germany, August 29 - September 2, 2010, p.196.
5. D.A. Suplatov, I.V. Pouliakhina, V.K. Arzhanik, D.T. Guranda, V.K.
vedas;
“Bioinformatic analysis reveals crucial penicillin acylase inactivation step and outlines strategy for pH-stabilisation”;
Proceedings of the International Conference “Biocatalysis-2009: Fundamentals &Applications;”, Arkhangelsk, June 19-24, 2009, 70-71.
6. D. Suplatov, I. Pouliakhina, V. Arzhanik, V. vedas;
”Modeling of structure and substrate recognition of penicillin acylase from Streptomyces mobaraensis using molecular docking to evaluate proper active site geometry”;
Proceedings of the International Moscow Conference on Computational Molecular Biology, Moscow, July 20-23, 2009, 343-344.
7. D.A. Suplatov, D.T. Guranda, V.K. vedas;
Bioinformatic analysis of penicillin acylase family reveals key residues essential for enzyme stability, ESF-EMBO symposium “Protein Design and Evolution for Biocatalysis”;
Book of Abstracts, San Feliu de Guixols, Spain, 2008, 122.
8. D.A. Suplatov, D.T. Guranda, V.K. vedas;
Sequence, structural and kinetic analyses of penicillin acylase family;
Abstracts of Oral Presentations, 2nd International Conference “Biocatalysis in Non-Conventional Media” June 11–16, 2008, Moscow, Russia, p.33-34.
9. Shalaeva D.N., Suplatov D.A., Khaliullin I.G., vedas V.K.;
Bioinformatics insight into structural determinants of D-aminopeptidase from Ochrobactrum anthropi substrate specificity to amino acid derivatives;
Международная конференция «Ломоносов-2010», 2010, Москва.
10.Д.Ф.Гуранда, А.В. Немухин, Б.Л. Григоренко, В.И. Тишков, Д.А. Суплатов, Н.В. Панин, М.Г. Хренова, И.В. Поляков, П.А.
Кудрявцев, И.В. Шаповалова, И.Г. Халиуллин, В.К. Швядас, Д.А.
Долгих, М.Э. Гаспарян, Р.В. Черткова, Е.Н. Люкманова, Г.А. Копеина, П.А. Елистратов, М.П. Кирпичников, О.В. Строганов, Ф.Н. Новиков, В.С. Стройлов, Г.Г. Чилов, Г.А. Ушаков, О.В. Ямскова, А.С. Ясная, М.И. Юшко, Е.В. Тарасова, А.А. Семенова, И.Р. Куклина;
Рациональный дизайн промышленных ферментов, основанный на методах молекулярного моделирования. Материалы итоговой конференции по результатам выполнения мероприятий за 2009 год в рамках приоритетного направления «Живые системы» ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2012 годы», Москва, 25-27 ноября 2009 г., 251-252.
Список сокращений СПП Специфическая позиция подсемейства Protein data bank – банк структур белков PDB Безразмерная случайная величина, имеющая Z-оценка стандартное нормальное распределение.
Используется в математической статистике для расчета достоверности некой полученной оценки (например, оценки специфичности колонки выравнивания). Для этого искомая оценка вычисляется для реальных данных, а впоследствии центрируется и нормируется относительно случайно полученных данных. Таким образом вычисляется степень отличия реальных данных от случайных.
Формула расчета Z-оценки приведена на стр. Р-оценка Вероятность случайной встречи полученных результатов, иными словами, их статистическая достоверность. Значение, близкие к 0, говорят о высокой значимости результатов. Для результатов, отсортированных в порядке уменьшения Z-оценки, Р-оценка позиции ранга i означает вероятность одновременной встречи позиций с первой по i в случайно распределенном выравнивании.
Разъяснения к расчету и интерпретации Р-оценки приведены на стр. D-PheNH2 D-фенилаланинамид D- изолейцинамид D-IleNH D-CysNH2 D-цистеинамид D-ValNH2 D-валинамид D-AlaNH2 D-аланинамид