Теория скоростей сворачивания глобулярных белков
УДК 577.322на правах рукописи
ИВАНКОВ ДМИТРИЙ НИКОЛАЕВИЧ ТЕОРИЯ СКОРОСТЕЙ СВОРАЧИВАНИЯ ГЛОБУЛЯРНЫХ БЕЛКОВ 03.00.02. – биофизика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата физико-математических наук
Москва 2006 1
Работа выполнена в Институте белка РАН Научные руководители:
доктор физико-математических наук, профессор Финкельштейн Алексей Витальевич
Официальные оппоненты:
доктор физико-математических наук Потехин Сергей Александрович доктор физико-математических наук, профессор Шайтан Константин Вольдемарович
Ведущая организация:
Институт биофизики клетки РАН
Защита диссертации состоится 22 марта 2006 года в на заседании диссертационного совета К212.156.03 в Московском физико-техническом институте по адресу: 141700, г. Долгопрудный Московской области, Институтский пер., 9.
С диссертацией можно ознакомиться в библиотеке МФТИ.
Автореферат разослан «» _ 2006 г.
Ученый секретарь диссертационного совета кандидат физико-математических наук В.Е. Брагин
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. С тех пор, как в 1961 году было показано, что белок способен сам — в подходящих условиях — находить свою нативную, т.е биологически-активную пространственную структуру, проблема самоорганизации белка является одной из важнейших проблем биофизики.
Актуальность ее связана с тем, что процесс самоорганизации является наименее понятным на данный момент этапом на пути от закодированной в ДНК информации к функционирующему белку. Один из первых вопросов, возникших после открытия явления самоорганизации, известен как парадокс Левинталя: каким образом белок за секунды находит свою самую стабильную структуру среди астрономического числа возможных? И хотя обнаружение нуклеационного механизма самоорганизации («сворачивания») белка привело к решению парадокса Левинталя, вопрос о том, какие факторы обусловливают скорость сворачивания белков, остается открытым. Важность ответа на этот вопрос связана с тем, что некоторые заболевания обусловлены агрегацией или неправильным сворачиванием белков — процессами, эффективность которых напрямую зависит от скорости «правильной» самоорганизации белка. В связи с этим изучение кинетических аспектов самоорганизации белков остается актуальнейшей проблемой физики белка.
Цель и задачи исследования. Целью данного исследования является выяв ление факторов, определяющих скорость самоорганизации однодоменных глобулярных белков (далее, для краткости, — просто «белки»), и степени их влияния на скорость сворачивания белков. Задачами исследования были: 1) разработка метода анализа совокупности путей сворачивания-разворачивания белка с известной трехмерной структурой;
2) расчет скорости сворачивания и разворачивания белка и локализации ядра его сворачивания;
3) разработка быстрых, не требующих анализа сети путей сворачивания-разворачивания, методов оценки скорости самоорганизации белка по его известной третичной (пространственной), вторичной (локальной) или первичной структуре (т.е. по аминокислотной последовательности белка).
Научная новизна работы. Впервые разработан метод анализа сети путей сворачивания-разворачивания белков с известной трехмерной структурой, основанный на решении системы кинетических уравнений, написанных для всех «полусвернутых» структур, возникающих в процессе сворачивания белка.
Предложенный метод был успешно применен для расчета скоростей сворачива ния и разворачивания всех более чем 80 белков с экспериментально исследованной на сегодняшний день кинетикой сворачивания. Этот метод также позволяет более или менее удовлетворительно предсказывать локализацию ядер сворачивания белков. Также впервые предложен метод, позволяющий успешно предсказывать скорости сворачивания белков на основании одной лишь аминокислотной последовательности белка. Во всех разработанных в работе методах предсказанные скорости сворачивания коррелируют с экспериментально измеренными на уровне 0.8.
Практическая значимость работы. Понимание закономерностей процесса самоорганизации белка совершенно необходимо как при предсказании трехмер ной структуры белка по его аминокислотной последовательности — этой дав ней, чрезвычайно важной и все еще не решенной проблемы современной био физики, так и при конструировании de novo белков с заданными свойствами.
Кроме того, из накопленных на сегодняшний день знаний следует, что медленно сворачивающиеся белки для правильного сворачивания в клетке нуждаются в помощи шаперонов, в отсутствии которых резко увеличивается вероятность агрегации или расщепления таких белков. Таким образом, выявление разработанными нами методами медленно сворачивающихся белков может оказаться полезным для установления возможности управления процессом их сворачивания и в клетке, и вне нее. Результаты нашей работы найдут свое применение в белковой инженерии, биотехнологии, а, в перспективе, и в фундаментальной медицине.
Апробация работы. Материалы работы представлены на следующих Российских и международных школах и конференциях: ежегодные научные конференции Института белка РАН (Пущино, Московская область, 1999, 2001, 2002, 2003, 2004, 2005), Pacific Symposium on Biocomputing (Hawaii, USA, 2000), школа-конференция «Горизонты физико-химической биологии» (Пущино, Московская область, 2000), Annual Meeting of International Research Scholars of the Howard Hughes Medical Institute (Washington DC, USA, 2000;
Vancouver, Canada, 2001;
Palm Cove, Australia, 2002;
Tallinn, Estonia, 2004;
Merida, Mexico, 2005), Fourth European Symposium of The Protein Siciety (Paris, France, 2001), «Protein Structure, Dynamics, Genomics and Function» (Erice, Italy, 2001), «Critical Assessment of Techniques for Protein Structure Prediction» (Pacific Grove, USA, 2002;
Gaeta, Italy, 2004), Les Houches summer school «Slow relaxations and non equilibrium dynamics in condensed matter» (Les Houches, France, 2002), EMBO lecture course on Protein Folding and Misfolding (Rome, Italy, 2003), CSB summer school «Understanding protein stability» (Stockholm, Sweden, 2004), III Съезд Биофизиков России (Воронеж, 2004), First European school in Bioinformatics (Ve rona, Italy, 2004), Московский семинар по биоинформатике (Москва, 2004), отчетные конференции по программе РАН «Молекулярная и клеточная биология» (Москва, 2004, 2005), семинар Institut des Hautes Etudes Scientifiques (Paris, France, 2005), Moscow conference on computational molecular biology (Moscow, 2005), «Exploring Protein Structure» (Haifa, Israel, 2005), Spetsai summer school «Protein Folding, Misfolding and Age-Related Diseases» (Spetses, Greece, 2005).
Публикации. Основные результаты диссертации представлены в печатных работах, в том числе в 8 статьях в реферируемых научных изданиях.
Структура диссертации. Диссертация изложена на 105 страницах машинописного текста и состоит из введения, трех глав (обзор литературы, описание метода анализа сети путей сворачивания-разворачивания белка, обсуждение результатов), заключения, благодарностей, выводов, и списка цитируемой литературы, включающего 157 ссылок. Кроме того, работа содержит два приложения: в первом рассматривается задача из области электродинамики, математически эквивалентная задаче, рассмотренной в нашей работе;
второе состоит из 6 таблиц, содержащих использованные в работе экспериментальные данные по кинетике сворачивания-разворачивания исследованных белков, а также результаты проделанных нами для них расчетов. Работу иллюстрируют 20 рисунков.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ.
Модель последовательного разворачивания белка. Сначала мы проводим моделирование сворачивания-разворачивания белка, используя «модель последовательного сворачивания», разработанную ранее в нашей лаборатории. Эта модель, суть которой изложена ниже, построена в соответствии с механизмом нуклеации, открытым при исследовании белков, у которых нет стабильных интермедиатов сворачивания во всем диапазоне концентраций денатуранта.
Рис.1. Схема зависимости свободной энергии G от координаты реакции по хо ду сворачивания белка. U — денатури рованное (развернутое) состояние, N — нативное (свернутое) состояние, TS — переходное состояние.
Согласно механизму нуклеации, для попадания белка в переходное состояние (TS ) — на вершину барьера свободной энергии (Рис.1) — белку нужно сформировать специфический для данного белка набор нативных контактов (т.н. «ядро сворачивания»). Как только они завязаны, белок может быстро свернуться в нативную структуру.
Измеряемые в эксперименте скорости сворачивания и разворачивания как функции концентрации денатуранта принято изображать в виде так называемого «шевронного» графика (Рис.2). Ядро сворачивания белка формируют остатки, мутация которых влияет на скорость сворачивания в той же степени, что и на константу равновесия (Рис.3а). Вовлеченность в ядро сворачивания выражается величиной ln k f =, (1) ln K kf где K = — константа равновесия, k f и ku — скорости сворачивания и ku разворачивания, соответственно, а означает вызванный мутацией сдвиг соответствующего значения (Рис.3). Доказательством нуклеационного механизма сворачивания белка является то, что значения 0 и 1, не имеющие структурной интерпретации в рамках модели нативоподобного ядра сворачивания, встречаются очень редко и всегда относятся к остаткам с недостаточно точно измеренными значениями ln K.
Рис.2. Шевронный график — график зависимости логарифма наблюдаемой скорости релаксации соотношения нативной и развернутой форм белка ( ln k набл ).
Величины ln k набл, полученные в опытах по сворачиванию белка, отмечены темными кружками, а полученные в опытах по разворачиванию — светлыми.
Для белка с одностадийной кинетикой сворачивания, ln k набл = ln( k f + k u ), где k f и ku — скорости сворачивания и разворачивания. Сплошной линией изображена наилучшая аппроксимирующая кривая, пунктиром — экстраполяции k f и ku за пределы области сворачивания и разворачивания, соответственно.
Согласно «модели последовательного сворачивания», разворачивание свернутой структуры представляет собой процесс, каждый шаг которого состоит в «отплавлении» одного звена цепи (состоящего из одного или нескольких идущих подряд по цепи остатков) от нативной пространственной структуры (Рис.4а). Отплавленные звенья образуют неупорядоченный клубок.
Они теряют все невалентные взаимодействия, но приобретают энтропию клубка (за вычетом энтропии замыкания развернутых петель, торчащих из нативоподобной глобулярной части). Самое главное упрощение состоит в том, что мы сосредотачиваем наше внимание на переходных состояниях, т.е. на стабильности (точнее, нестабильности) частично развернутых структур, а не на подробном описании движений цепи. Процесс отплавления происходит до тех пор, пока не будет получена полностью развернутая структура. Так получается один путь разворачивания. (Рис.4а). Путь сворачивания — в этих же условиях — будет таким же, только пройденным в обратную сторону (согласно принципу детального равновесия). В результате рассмотрения всевозможных путей разворачивания, получается полная сеть путей сворачивания разворачивания (Рис.4б).
Рис.3. Экспериментальное получение значений : (а) Mутация остатка, входящего в ядро сворачивания, изменяет скорость сворачивания мутантного белка (по отношению к белку без мутации, т.е. белку «дикого типа»), не меняя скорости его разворачивания. (б) Мутация остатка, не входящего в ядро сворачивания, наоборот, скорости сворачивания не меняет.
Cвободная энергия «полусвернутой» структуры. Оценка свободной энергии каждой из полусвернутых структур, изображенных на Рис.4б, была предложена ранее в нашей лаборатории. Цепь белка, состоящего из L остатков, разбивается на N звеньев (по L / N остатков в каждом), чтобы смочь рассмотреть все 2 N интермедиатов сворачивания-разворачивания. Поэтому величина N в наших расчетах составляет около 20.
Рис.4. Модель последовательного сворачивания-разворачивания согласно нуклеационному механизму. U — полностью развернутая цепь;
TS — переходное состояние, лежащее на вершине барьера свободной энергии (точнее, в седловой точке ландшафта свободных энергий);
N — нативное состояние. Свободная энергия рассчитывается согласно формуле (2). Рисунок соответствует точке, где свободные энергии нативного и развернутого состояний одинаковы. (а) Один гипотетический путь разворачивания. (б) Множество гипотетических путей сворачивания-разворачивания, образующих сеть пересекающихся путей, подобных тому, что изображен в левой части рисунка (этот путь выделен жирным).
Свободная энергия структуры s n, в которой только какие-то n из N звеньев цепи фиксированы, а N n звеньев еще (или уже) нет, представляется в виде:
G ( s n ) = E ( s n ) TS ( s n ), (2) где E ( s n ) энергия, S ( s n ) энтропия структуры s n, T абсолютная температура.
Энергия структуры рассматривается как величина, пропорциональная числу ван-дер-ваальсовых контактов ( s n ) между фиксированными в этой структуре s n неводородными атомами: E ( s n ) = ( s n ) (считается, что все контакты обладают одинаковой энергии). Атомы контактируют, если расстояние между ними не превышает определенного порогового значения (нами использовалось значение 5, если не оговорено отдельно). Сумма берется по всем парам остатков в структуре s n, кроме соседей по цепи (между ними контакты есть и в клубке).
Мы считаем, что энтропия структуры зависит от числа m n фиксированных в структуре s n остатков цепи и от суммарной энтропии замыкания выходящих S ( sn ) = ( L mn ) + петли S loop, где = 2.3R из этой структуры петель: константа, равная известной из опыта средней потере энтропии остатка при переходе из клубка в глобулу, S loop энтропия замыкания петли, выходящей из глобулярной части s n и затем входящей в нее. В соответствии с теорией Флори, ( ) 3 R r a 2 = R ln S loop для такой петли берется в виде: S loop, где r 2 2aA расстояние между C атомами остатков и, a = 3.8 расстояние между соседними по цепи C атомами, R газовая постоянная, и A = известная из опыта характерная персистентная длина для полипептидной цепи.
Все приводимые в этой работе расчеты свободной энергии относятся к окрестности точки термодинамического равновесия между нативной структурой и клубком. Так как нативная структура белка отделена от развернутой фазовым переходом типа «все или ничего», то в этой точке а значит, и в ее окрестности нет метастабильных интермедиатов сворачивания-разворачивания, которые затруднили бы анализ процесса. Это справедливо для всех однодоменных глобулярных белков, независимо от того, наблюдается или нет интермедиат сворачивания в чистой воде (вдали от точки термодинамического равновесия) или нет.
Рассмотрим сначала саму точку, где свободные энергии нативной структуры s N и развернутого (клубкового) состояния s0 совпадают, то есть G (s N ) = G (s 0 ), или E (s N ) = TL. Таким образом, температура перехода T и энергия атом-атомного контакта 0 в точке перехода связаны соотношением 0 (s N ) = 2.3RTL (поскольку = 2.3R ).
Величина изменяется при изменении растворителя, поэтому, рассматривая величины = (1 + ) 0, мы автоматически попадаем в условия, в которых разность свободной энергии нативной и развернутой структур составляет G (s N ) G (s 0 ) = 2.3RTL. Малым величинам ( 1 ) соответствуют малые отклонения от равновесия. Так как полная энергия денатурации белка, равная 2.3RTL, составляет 100-150 ккал/моль для белка из ~100 остатков, а G (s N ) G (s 0 ), в условиях эксперимента составляет около 5–10 ккал/моль, то ис следуемые отклонения от равновесия действительно малы, а интересующий ди апазон простирается от –0.05 до +0.05.
Скорость элементарного шага. Пусть индекс клубкового (начального) состояния будет равен нулю, индекс конечного (нативного) — M + 1, а i = 1, M — индексы промежуточных микросостояний. Определим константу скорости k ij элементарного перехода из состояния i в состояние j согласно критерию Метрополиса:
N (i, j = 0, M + 1), min(1, exp( G i G j )), (3) k ij = k L где k 0 = 10 8 с 1 — некая константа (она имеет смысл скорости элементарного перехода из одной конформации в другую одного остатка при понижении свободной энергии, и равна экспериментально измеренной скорости включения одного остатка в растущую альфа-спираль);
L — число остатков в белке;
N — число звеньев, на которое мы делим белок;
Gi Gi G0 и G j G j G0 — свободные энергии i -го и j -го состояний, отсчитанные от свободной энергии G0 развернутого (« 0 -го») состояния, выраженные в единицах RT.
N Множитель отражает влияние размера звена на скорость его перехода из L одной конформации в другую. Мы считаем, что при преодолении элементарно го барьера при элементарном переходе остатки меняют свою конформацию L последовательно, один за другим. Следовательно, для звена из остатков N L ожидаемая скорость элементарного шага должна быть в раз меньше, чем для N одного остатка.
Алгоритм расчета скорости сворачивания и разворачивания белка.
Населенности микросостояний, ni, будут изменяться со временем в соответ ствии с обычными кинетическими уравнениями:
M +1 M + dni = k ij ni + k ji n j, (i = 0, M + 1). (4) dt j =0 j = M + n (мы полагаем, что =1, а также что, если между состояниями i и j элементар j j = ного перехода нет, то k ij = 0 ). Поскольку мы считаем, что в окрестности точки термодинамического равновесия имеются в наблюдаемом количестве только два состояния — нативное и развернутое, то для всех остальных микросостояний мы можем использовать квазистационарное приближение:
dni = 0, (i = 1, M ). С его учетом система (4) в векторном виде будет выглядеть dt как:
dn dt = An + Bn 0 + Cn M +1 = dn, (5) = bn 0 + B * n dt dn M +1 = cn M +1 + C n * dt A — матрица с элементами где n — вектор с компонентами ni, M + = ip k, i= j Aij,B — вектор с компонентами Bi = k0i, B* — вектор с p = k ji, i j компонентами Bi* = ki 0, C — вектор с компонентами Ci = k M +1,i, C* — вектор с M +1 M + компонентами Ci* = ki, M +1 (здесь везде i, j = 1, M ), b = k0i, c = kM +1,i. Отсюда i =0 i = dn0 dn = M +1 = (b B * A1 B)n0 + B * A1Cn M +1. То есть n (t ) = A1 Bn 0 (t ) + A1Cn M +1 (t ), dt dt скорости сворачивания и разворачивания будут равны, соответственно, k f = b B * A1B, (6) k u = B * A 1 C. (7) Вектор n ( f ) = A1B найдется решением уравнения An ( f ) = B, а вектор n (u ) = A1C — уравнения An (u ) = C. Вектор n ( f ) описывает населенность промежуточных микросостояний в том случае, если населенность состояния 0 поддерживается равной единице, а населенность состояния M + 1 — равной нулю. Вектор n (u ) описывает населенность промежуточных микросостояний в противном случае, т.е. если населенность состояния поддерживается равной нулю, а населенность состояния M + 1 — равной единице. Оба уравнения мы решаем численно, с помощью компьютера, методом итераций Зейделя.
Алгоритм расчета ядра сворачивания белка. Пусть вовлеченность в ядро сворачивания, как и в эксперименте, определяется величиной (для удобства мы считаем, что все свободные энергии выражены в единицах RT ):
ln k f ln k f, то есть =, поскольку в стационарном режиме G M + ln(k f / k u ) рассматриваемого процесса = GM +1. Заметим, что задача ln( k f / k u ) нахождения скорости сворачивания белка и вовлеченности аминокислотных остатков в ядро сворачивания аналогична поиску тока, текущего по сети сопротивлений, а также изменению этого тока вследствие изменения некоторых сопротивлений (эта задача подробно рассмотрена в приложении к диссертации). В результате, величину для остатка можно найти через M + параметры сети как = i Pi, где i — доля нативных контактов, i = Wij 1 + sign(Gi G j ) M + сформированных остатком в состоянии i, а Pi =, где W j = Wij = I ij (U i U j ) — аналог тепловой мощности, выделяемой на сопротивлении M +1 M + ij, W = Wij — аналог тепловой мощности, выделяемой во всей сети i = 0 j i сопротивлений, I ij = kij ni( f ) k ji n(j f ) — поток молекул на переходе ij (аналог тока, текущего по сопротивлению ij ), U i = ni( f ) exp(Gi ) — аналог потенциала узла i.
Рис.5. Сравнение предсказанных с помощью развитой нами теорией (горизонтальная ось) и экспериментально измеренных (вертикальная ось) скоростей сворачивания белка в точке рав новесия ( mt, где GM +1 = 0 ). Все ско рости измеряются в с 1. Корреляция составляет 0.79.
Предсказание скорости свора чивания белка в точке термодина мического равновесия между свер нутой и денатурированной структу рами. В соответствии с уравнением (6) мы рассчитывали скорости сворачива ния белков с экспериментально исследованной кинетикой сворачивания в точке термодинамического равновесия. Результаты вычислений представлены на Рис.5. Коэффициент корреляции между предсказанными и экспериментально исследованными скоростями сворачивания составляет 0.79. Видно, однако, что для части белков с низкой скоростью сворачивания предсказываемое значение скорости существенно ниже экспериментально измеренной. Мы считаем, что это происходит из-за того, что используемая нами модель не вполне корректна для медленно сворачивающихся белков, длина цепи L у которых обычно столь велика, что длина их звеньев, включающих ~ L/20 аминокислотных остатков, превосходит диаметр белковой глобулы, так что эти звенья уже нельзя рассмат ривать как бесструктурные «бу синки».
Рис.6. Шевронный гра фик для белка G, полу ченный в результате тео ретического моделирова ния сворачивания-разво рачивания белка вблизи точки термодинамическо го равновесия. Экспери мент — серая сплошная линия, теория — черная сплошная линия, пунктиры – их экстраполяции. Пустыми кружками обозначены результаты измерений;
черными треугольниками — результаты расчетов.
Предсказание скорости сворачивания и разворачивания белка при нулевой концентрации денатуранта. Обычно исследователей интересует скорость сворачивания при «биологических» условиях, то есть при отсутствии денатуранта, а не в точке равновесия. Нас тоже интересует возможность предсказания скоростей сворачивания в окрестности точки равновесия. С этой целью мы провели моделирование сворачивания и разворачивания белков при разных значениях стабильности свернутого состояния относительно денатурированного. Результаты моделирования для одного из белков (белка G) приведены вместе с экспериментальными данными на шевронном графике (Рис.6). Для их совместного изображения мы совместили абсциссу (концентрацию денатуранта) точки термодинамического равновесия в теоретическом графике с ее экспериментальным значением, и наложили условие равенства, при любой концентрации денатуранта, константы равновесия нативной структуры и развернутого состояния белка для теоретической кривой и для экспериментальной.
Сворачивание Разворачивание Рис.7. Сравнение предсказанных с помощью развитой нами теорией (горизонтальная ось) и экспериментально измеренных (вертикальная ось) скоростей сворачивания белка в воде (а) и экстраполированных скоростей разворачивания белка в воде (б). Корреляция в первом случае составляет 0.73, а во втором — 0.88.
Теперь мы можем посмотреть, как соотносятся рассчитанные скорости сворачивания и разворачивания в воде с экспериментом. Результаты сравнения приведены на Рис.7. Коэффициент корреляции между теоретически предсказан ными и экспериментально измеренными (точнее — экстраполированными к ну левой концентрации денатуранта) скоростями составляет 0.73 при предсказании скоростей сворачивания, и 0.88 — скоростей разворачивания.
Заметим, что при предсказании скоростей сворачивания и разворачивания в воде (как и скоростей сворачивания в точке перехода) для белков с низкой скоростью сворачивания предсказываемые значения скоростей часто заметно ниже экспериментально измеренных. Кроме того, видно, что коэффициент корреляции возрастает при переходе от скоростей сворачивания в воде (0.73) к скоростям сворачивания (равным скоростям разворачивания) в точке термодинамического равновесия (0.79) и затем к скоростям разворачивания в воде (0.88). Заметим, что скорости сворачивания в воде определяются измерениями в области низких значений концентраций денатуранта, в точке термодинамического равновесия — всей совокупностью измерений, а скорости разворачивания в воде (где развернутое состояние белка нестабильно) — экстраполяцией измерений, сделанных в области высоких концентраций денатуранта. Получается, что, чем выше концентрация денатуранта, использованная в эксперименте, тем выше согласие теории и эксперимента (ср.
Рис.5 и Рис.7).
Предсказание вовлеченности аминокислотных остатков белка в ядро сворачивания в точке термодинамического равновесия. Для проведения расчетов вовлеченности аминокислотных остатков в ядро сворачивания мы взя ли 17 белков с экспериментально исследованными ядрами сворачивания. Мы сравнили предсказанные нами величины с экспериментально полученными.
Результат вычислений представлен на Рис.8.
Рис.8. Коэффици ент корреляции при предсказании -значений 17 бел ков с эксперимен тально исследо ванным ядром сворачивания. Се рым цветом пока заны результаты в случае, когда при вычислении не учитывались ато мы водорода, чер ным — атомы водорода учитывались (при этом, как и в работе [Garbuzynskiy et al., 2004], сделанной по тем же структурам методами Монте Карло и динамического программирования, контактный радиус атома водорода принимался равным 2, остальных атомов — 3). Коэффициент корреляции теории и эксперимента в среднем по всем 17 белкам составляет 0.37 без учета атомов водорода и 0.51 — с учетом.
Хочу отметить, что все наши попытки (как и попытки других исследователей) разработать феноменологический, то есть не требующий анализа сети путей сворачивания-разворачивания белка, метод предсказания ядра его сворачивания успеха не имели: коэффициент корреляции всех таких методов с опытом не превышал 0.2.
Феноменологическое предсказание скорости сворачивания белка по его третичной структуре. В этой части работы мы разработали феноменологический, не требующий анализа сети путей сворачивания разворачивания метод предсказания скоростей сворачивания белков в воде по их известной трехмерной структуре. За основу мы взяли аналитическую теорию Финкельштейна-Бадретдинова, построенную на основе нуклеационного механизма, и существующий эмпирический метод, разработанный в группе Baker’а.
Начнем с последнего. Его идея заключается в том, что скорость сворачивания в воде белков, сворачивающихся (и разворачивающихся) без интермедиатов во всем диапазоне концентраций денатуранта («одностадийные» белки), определяется параметром ПК («порядок контактов»):
1N Lij, (8) ПК = L N где – число нековалентных контактов (в пределах 6) между N неводородными атомами в белке, L – число аминокислотных остатков в цепи белка, и Lij — это число остатков, разделяющих взаимодействующую пару атомов (предполагается, что атомы соседних по цепи остатков разделены одним остатком, и т.д.). Этот параметр принимает маленькое значение для белков, чья нативная структура стабилизирована преимущественно локальными контактами (то есть, для альфа-спиральных белков) и большое значение для белков, в чьей нативной структуре много дальних по цепи контактов (в первую очередь, для бета-структурных белков). «Порядок контактов» был специально придуман для сравнения топологии (а не размера) различных белков и зависит от содержания вторичной структуры в белке и от взаимного расположения альфа-спиралей и бета-структурных элементов в нативной структуре белка. Коэффициент корреляции между ПК и скоростями сворачивания одностадийных белков, экспериментально исследованных к 1998 году, составил –0.85.
Предпосылкой для нашей работы стало то, что ПК слабо (и к тому же с об ратным знаком!) коррелировал со скоростями сворачивания остальных («многостадийных», образующих метастабильные интермедиаты сворачивания) белков — коэффициент корреляции составлял 0.34 для совокупности экспериментально исследованных на 2003 год многостадийных белков (это было установлено нами совместно с О.В. Галзитской и С.А. Гарбузинским).
Поэтому мы выдвинули предположение о том, что успех ПК в предсказании скоростей сворачивания одностадийных белков определяется тем, что экспериментально исследованные к 1998 году одностадийные белки были примерно одной длины цепи, поэтому на первое место в определении скоростей сворачивания вышел топологический параметр ПК. Это предположение согласуется с тем фактом, что скорости сворачивания многостадийных белков коррелируют с длиной цепи и никак не коррелируют с ПК (это было также установлено нами совместно с О.В. Галзитской и С.А. Гарбузинским). Кроме того, наше предположение подтверждается тем, что коэффициент корреляции между ПК и скоростями сворачивания одностадийных белков, изученных на сегодня, составляет всего –0.52. В соответствии с гипотезой, мы исследовали следующую зависимость для всей совокупности белков и пептидов:
(9) ln k w ~ ПК LP f К этой же формуле мы пришли, критически рассматривая теорию Финкельштейна-Бадретдинова, согласно которой скорость сворачивания белка в точке термодинамического равновесия определяется формулой ln k mt ~ (1 ± 0.5) L2 / 3. Здесь независимый от длины цепи коэффициент, стоящий в f скобках, зависит от топологии переходного состояния — он близок к 0.5, если белок стабилизируется преимущественно локальными взаимодействиями, и к 1.5, если белок имеет много дальних по цепи контактов, так что много замкнутых петель торчит из любого ядра сворачивания. Хотя Финкельштейн и Бадретдинов не дали алгоритма вычисления этого коэффициента из белковой структуры, ясно, что по физическому смыслу этот коэффициент схож с ПК :
они оба малы для белков с локальными контактами (в первую очередь, альфа спиральных), и оба велики для белков с преимущественно дальними по цепи контактами, когда белок по ходу сворачивания не может избежать формирования замкнутых петель, торчащих из уже свернутой части глобулы.
Таким образом, мы опять приходим к формуле (9).
На Рис.9 изображен случай наилучшего согласия формулы (9) с эксперимен тально измеренными скоростями сворачивания (при P = 0.9 ). Во время иссле дования оказалось, что ПК пропорционален L0.22 для совокупности всех белков и пептидов. Это значит, что параметр ПК L0.9, имеющий на данный момент максимальную корреляцию с экспериментом для всех белков и пептидов в со вокупности, зависит от длины цепи белка как L0.68. Это более чем хорошо сов падает с показателем степени в формуле Финкельштейна и Бадретдинова, а так же с оценкой L0.61±0.18, вытекающей из работы Koga & Takada (2001) сворачивания упрощенных моделей белковых цепей на решетке.
Рис.9. Сравнение скорос ти сворачивания в воде, - ln k w ( k w измеряется в c ) f f и ПК L0.9 для различных белков и пептидов.
Пустые кружки: белки с одностадийной кинети кой сворачивания при всех внешних условиях.
Черные кружки: белки, сворачивающиеся с ин термедиатами при низкой концентрации денатуран та. Плюсики — короткие пептиды. Пунктирная ли ния представляет собой линейную экстраполяцию только для одностадийных белков (корреляция составляет -0.77);
точечная линия представляет собой линейную экстраполяцию только для многостадийных белков (корреляция составляет –0.68);
сплошная линия представляет собой линейную экстраполяцию для всех белков и пептидов (корреляция составляет –0.77).
Предсказание скорости сворачивания белка по его аминокислотной последовательности. Согласно вышесказанному, логарифм скорости сворачивания падает пропорционально некой степени длины белковой цепи.
При этом длину цепи обычно определяют просто как число аминокислотных остатков в ней. Однако если сворачивающаяся цепь заранее содержит сформированные блоки (или эти блоки цепи могут свернуться быстро и независимо от других час тей белковой цепи), эффективная длина цепи должна быть меньше, чем полная длина цепи.
Рис.10. Предсказание скорости сворачивания в воде, ln k w ( k w измеряется в c-1), с f f помощью эффективной длины цепи для всей совокупности белков и пептидов с экспериментально измеренными скоростями сворачивания (по оси абсцисс отложен натуральный логарифм эффективной длины). Пустые кружки: белки с одностадийной кинетикой сворачивания при всех внешних условиях. Черные кружки: белки, сворачивающиеся с интермедиатами при низкой концентрации денатуранта. Плюсики — короткие пептиды. Сплошная линия представляет собой линейную экстраполяцию для всех белков (корреляция составляет -0.79).
Эффективная длина цепи, LЭФФ, вычислена по вторичной структуре, предсказанной по аминокислотной последовательности с помощью программы PsiPred.
Поскольку альфа-спирали — самый естественный кандидат на роль внутренне стабильного и/или быстро и независимо сворачивающегося блока, эффективная длина сворачивающейся цепи может быть взята в виде LЭФФ = L LH + l1 N H, где LH — число остатков в спиральной конформации, N H — число спиралей, а l1 означает, что мы рассматриваем целый блок (т.е., спираль) как l1 остатков (с физической точки зрения l1 не должно превышать l длину одного спирального витка (4 остатка);
это значение должно быть оптимизировано из сравнения теории с экспериментом). Зависимость, которую мы исследовали, выглядит так: ln k w ~ const LP, где значение степени P f ЭФФ должно быть подобрано из сравнения с экспериментом (надо заметить, что случай P = 0 соответствует корреляции ln k w с ln LЭФФ, поскольку const LP = f const exp( P ln L) = (const + 1) P ln L ~ const / ln L при P 0 ). Кроме того, важно, что вторичная структура, необходимая для предсказания скорости сворачивания, может быть успешно предсказана по аминокислотной последовательности белка (для этого мы использовали программу PsiPred), т.е.
ее знание не требует знания трехмерной структуры белка, необходимой для всех описанных выше методов. Результаты сравнения параметра и ln LЭФФ экспериментально измеренных скоростей сворачивания представлены на Рис.10.
Примерно такие же результаты получаются, если предсказывать вторичную структуру с помощью программы ALB (в этом случае коэффициент корреляции составляет –0.76) или брать действительную вторичную структуру белка, вычис ленную из третичной согласно программе DSSP (в этом случае коэффициент корреляции также составляет –0.79). Таким образом, предсказание скорости сворачивания белков по аминокислотной последовательности (с помощью программы предсказания вторичной структуры PsiPred) по крайней мере не хуже, чем предсказание скоростей сворачивания по известной трехмерной структуре.
Из наших результатов следует, что альфа-спирали уменьшают эффективную длину белковой цепи. Мы считаем, что это происходит из-за того, что спирали быстро и независимо сворачиваются по ходу сворачивания (хотя не исключена возможность того, что некоторые альфа-спирали уже сформированы в развернутом состоянии цепи, что, конечно же, может быть правдой для «биологических» условий).
ВЫВОДЫ 1. Разработан метод расчета скоростей сворачивания и разворачивания однодо менных глобулярных белков с известной трехмерной структурой с помощью моделирования процесса их сворачивания-разворачивания вблизи точки тер модинамического равновесия между нативным и развернутым состоянием белковой цепи.
2. Предложенный метод позволяет успешно предсказывать скорости сворачивания и разворачивания белков вблизи точки термодинамического равновесия, а для белков, стабильность нативной структуры которых в воде известна, — также и скорости их сворачивания и разворачивания в воде.
3. Разработанный метод позволяет также удовлетворительно предсказывать вовлеченность аминокислотного остатка в ядро сворачивания белка. В среднем корреляция с экспериментом составляет 0.51.
4. Предложен метод оценки скоростей сворачивания однодоменных глобулярных белков по известной трехмерной структуре без моделирования процессов их сворачивания-разворачивания, — а именно, по среднему расстоянию по цепи между атомами, контактирующими в нативной структуре белка.
5. Показано, что скорость сворачивания белка в первом приближении определяется длиной цепи белка, а во втором — вторичной структурой белка, которую можно либо взять из известной трехмерной структуры, либо предсказать по аминокислотной последовательности белка.
6. Предложен феноменологический метод оценки скорости сворачивания по числу неспиральных остатков в белке;
этот метод не требует знания пространственной структуры белка, так как число неспиральных остатков в нем может быть предсказано по первичной структуре белка.
СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Галзитская О.В., Иванков Д.Н., Финкельштейн А.В. (2001). Нуклеация и скорость сворачивания в белках. Мол. Биология. 35, 708-717.
2. Финкельштейн А.В., Иванков Д.Н., Галзитская О.В. (2005). Предсказание скоростей и ядер сворачивания глобулярных белков на основе теории их самоорганизации. Успехи биологической химии, 45, 3-36.
3. Galzitskaya O.V., Skoogarev A.V., Ivankov D.N., Finkelstein A.V. (1999) Fold ing nuclei in 3D protein structures. Proceedings of the Pacific Symposium on Biocomputing’2000 (Altman R.B., Dunker A.K., Hunter L., Lauderdale, K., Klein T.E., eds.). World Scientific, Singapore - New Jersey - London - Hong Kong, pp. 131-142.
4. Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). Folding nuclei in pro teins. FEBS Letters. 489: 113-118.
5. Ivankov D.N., Finkelstein A.V. (2001). Theoretical Study of a Landscape of Pro tein Folding-Unfolding Pathways. Folding Rates at Mid-Transition. Biochemis try. 40, 9957-9961.
6. Galzitskaya O.V., Garbuzynskiy, S.O., Ivankov D.N., Finkelstein A.V. (2003).
Chain length is the main determinant of the folding rate for proteins with three state folding kinetics. Proteins. 51, 162-166.
7. Ivankov D.N., Garbuzynskiy S.O., Alm E., Plaxco K.W., Baker D., Finkelstein A.V. (2003). Contact order revisited: influence of protein size on the folding rate.
Protein Science, 12, 2057-2062.
8. Ivankov D.N., Finkelstein A.V. (2004). Prediction of protein folding rates from the amino acid sequence-predicted secondary structure. Proc. Natl. Acad. Sci.
USA. 101, 8942-8944.
9. Д.Н. Иванков, О.В. Галзитская, А.В. Скугарев, А.В. Финкельштейн. (2000).
Теоретический поиск ядер сворачивания в белках с известной трехмерной структурой. Школа-конференция «Горизонты физико-химической биологии», Пущино. стр. 29.
10. Иванков Д.Н., Финкельштейн А.В. Предсказание скорости сворачивания белков по аминокислотной последовательности. (2004). III Съезд биофизиков России, Воронеж. т. I, стр. 43.
11. A.V. Finkelstein, O.V. Galzitskaya, D.N. Ivankov. (2001). Protein folding nu cleus and protein folding rate: a theoretical study. Fourth European Symposium of The Protein Society. Institut Pasteur, Paris, France, 2001. Protein Sci. (Suppl.1), 47.
12. Galzitskaya O.V., Ivankov D.N., Finkelstein A.V. (2001). The State of Art in Steps of Protein Folding. Summer School "The prediction and mechanism of pro tein folding: from topology to intermediate states". (Chomilier, J., Labesse, G, and Sadoc, J.-F., eds.) Institute d'etudes scientifiques de Cargese, pp. 8-19.
13. Finkelstein A.V., Galzitskaya O.V., Ivankov D.N., Bogatyreva N.S., Garbuzins kii S.O., Lobanov M.Yu., Dolgikh D.A., Oliveberg M. (2002). Protein folding:
Theoretical and experimental study. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, p. A202.
14. Lobanov M.Yu., Litvinov I., Bogatyreva N.S., Galzitskaya O.V., Kondratova M.S., Garbuzinskii S.O., Ivankov D.N., Roytberg M.A., Finkelstein A.V. (2002).
Threading using multiple homology and secondary structure prediction informa tion. Proceedings of the Fifth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A130-A131.
15. Krieger E., Ivankov D.N., Finkelstein A., Vriend G. (2002). WHAT IF YASARA folds a protein. Proceedings of the Fifth Meeting on the Critical As sessment of Techniques for Protein Structure Prediction, Asilomar Conference Center, Pacific Grove, California, pp. A169-A170.
16. M.Yu. Lobanov, D.N. Ivankov, S.O. Garbuzynskiy, N.S. Bogatyreva, O.V. Galzitskaya, I.I. Litvinov, M.A. Roytberg, A.V. Finkelstein. (2004).
Threading the use of multiple homology and secondary structure prediction in formation. Proceedings of the Sixth Meeting on the Critical Assessment of Tech niques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 120-121.
17. S.O. Garbuzynskiy, M.Yu. Lobanov, D.N. Ivankov, N.S. Bogatyreva, A.V. Finkelstein, O.V. Galzitskaya. (2004). Prediction of domain boundaries and disordered regions in proteins with unknown tertiary structure. Proceedings of the Sixth Meeting on the Critical Assessment of Techniques for Protein Structure Prediction, Gaeta, Italy, 2004, p. 109-110.
18. A.V. Finkelstein, D.N. Ivankov, S.O. Garbuzynskiy, O.V. Galzitskaya. (2005) Prediction of protein folding rates. Proceedings of the international Moscow conference on computational molecular biology, Moscow, Russia, 2005, pp.
101-103.