Интерактом белков, кодируемых генами хромосомы 18 человека
На правах рукописи
ПОВЕРЕННАЯ Екатерина Владимировна ИНТЕРАКТОМ БЕЛКОВ, КОДИРУЕМЫХ ГЕНАМИ ХРОМОСОМЫ 18 ЧЕЛОВЕКА 03.01.09 – математическая биология, биоинформатика
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата биологических наук
Москва – 2013 г.
Работа выполнена в Федеральном государственном бюджетном учреждении «Научно исследовательский институт биомедицинской химии имени В.Н.Ореховича» Российской академии медицинских наук.
доктор биологических наук,
Научный консультант:
член-корреспондент РАМН Лисица Андрей Валерьевич Баранова Анна Вячеславовна
Официальные оппоненты:
доктор биологических наук, ФГБУ «Медико-генетический научный центр» РАМН, главный научный сотрудник Брускин Сергей Александрович кандидат биологических наук, ФГБУН «Институт общей генетики им. Н.И. Вавилова» РАН, заведующий лабораторией ФГБУН «Научно-исследовательский
Ведущая организация:
институт физико-химической медицины» Федерального медико-биологического агентства
Защита состоится «17» октября 2013 года в 11:00 часов на заседании Диссертационного совета Д 001.010.01 при Федеральном государственном бюджетном учреждении «Научно-исследовательский институт биомедицинской химии имени В.Н. Ореховича» Российской академии медицинских наук (ФГБУ «ИБМХ» РАМН) по адресу: 119121, г. Москва, Погодинская ул., д.10, стр. 8.
С диссертацией можно ознакомиться в библиотеке ФГБУ «ИБМХ» РАМН.
Автореферат разослан «» сентября 2013 г.
Ученый секретарь Диссертационного совета, кандидат химических наук Е.А. Карпова 1.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы, цель и задачи 1.1.
Результаты завершенной в 2001 году международной программы «Геном человека» [Venter et al., 2001] позволили перейти к более масштабным задачам инвентаризации белков и взаимодействий между ними. Для реализации международного проекта «Протеом человека» [The big ome, 2008] был принят хромосомоцентричный подход, согласно которому каждая страна-участница исследует конкретную хромосому человека: корейские ученые сконцентрировали усилия на работе с хромосомой 13, исследователи из США – на хромосоме 17 и т.д. Россия выбрала белки, кодируемые генами хромосомы 18 [Ponomarenko et al., 2012]. Искусственное разделение объектов исследования по хромосомам позволяет детально проанализировать массив белков человека, который по предварительным расчетам включает от 2 млн до 1 млрд протеоформ [Archakov et al., 2009, Kelleher, 2012].
Важнейшей задачей проекта «Протеом человека» является анализ белок-белковых взаимодействий (ББВ). Построение интерактомных сетей (карт ББВ) является способом изучения молекулярных процессов, нарушение которых приводит к развитию заболеваний. Опубликованы описания интерактомных карт заболеваний, к примеру, при ишемической болезни сердца [Ren&Liu;, 2012] или колоректальном раке [Sanz-Rampona et al., 2012]. Изучение топологии сети при развитии патологии дает возможность выявлять потенциальные мишени для создания новых лекарств, в том числе для лечения генетических и вирусных заболеваний [Rodriguez-Soca et al., 2010].
Несмотря на фундаментальное значение белковых взаимодействий, данные об интерактоме человека противоречивы и неполны [Lehne&Schlitt;, 2009]. Для выявления сведений о ББВ преимущественно используют две группы экспериментальных методов - двугибридную дрожжевую систему и аффинную пробоподготовку в сочетании с масс спектрометрией (АП-МС). Оба метода характеризуются высокой производительностью, но низкой достоверностью выявленных взаимодействий. Ограничения высокопроизводительных экспериментальных методов возникают из-за отсутствия возможности измерения термодинамических параметров комплексообразования [Bai et al., 2011].
Биоинформатические инструменты, разрабатываемые для анализа результатов интерактомных экспериментов, позволяют повысить уровень достоверности выявления ББВ, т.е. оценить вероятность определения ложноположительных взаимодействий.
Достоверность повышается за счет сопоставления полученных сведений с протеомной и геномной информацией. Использование вычислительных методов позволяет выявлять новые взаимодействия, в том числе, с участием белков с неизвестной функцией.
Суть методов вычислительной интерактомики заключается в корректном совмещении множества противоречивых данных. Противоречия являются следствием не только проблем экспериментальных методов, но и тем, что сеть ББВ динамично изменяется в процессе функционирования клетки. Изменения накладываются на высокую сложность объекта исследования: интерактом человека, по приблизительным оценкам, включает от 300 до 650 тысяч различных взаимодействий [Stumpf et al.,2008].
Хромосомоцентричный подход к анализу интерактома позволяет ограничить масштаб белковой сети, и провести подробное исследование состава карты ББВ. За счет хромосомоцентричного подхода повышается вероятность выявления новых, ранее не известных ББВ.
Обработка массива экспериментов, выполненных методом АП-МС, является одним из способов получения сведений о белковых взаимодействиях. В данной работе был использован метод виртуальной ко-преципитации (ВКП) [Zhang et al., 2010]. Этот метод позволяет выявлять ББВ по результатам масс-спектрометрических экспериментов, хранящихся в интернет-репозитории Global Proteome Machine Database (GPMdb). Принцип метода виртуальной ко-преципитации заключается в определении частоты совместной встречаемости белков в масс-спектрометрических экспериментах.
Физические взаимодействия между белками обеспечивают их совместное определение во многих экспериментах, выполненных методом АП-МС, что позволяет отличить их от функциональных взаимосвязей.
Цель работы: выявление белковых взаимодействий для продуктов генов хромосомы 18 человека с помощью автоматической обработки результатов масс спектрометрических экспериментов методом виртуальной ко-преципитации (ВКП).
В работе были поставлены задачи:
1. Обосновать параметры метода виртуальной ко-преципитации для выявления белок-белковых взаимодействий путем обработки результатов масс спектрометрических экспериментов.
2. Оценить достоверность метода и исследовать его применимость на примере белок-белковых комплексов и сетей функциональных взаимодействий.
3. Применить метод виртуальной ко-преципитации для белков, кодируемых генами хромосомы 18 человека, и охарактеризовать полученные результаты с учетом молекулярной функции белков.
4. Сопоставить результаты виртуальной ко-преципитации с известными данными о белок-белковых взаимодействиях, определить узловые1 белки в составе интерактома хромосомы 18 человека.
Положения, выносимые на защиту 1.2.
1. Метод виртуальной ко-преципитации позволяет выявлять белок-белковые взаимодействия, при этом достоверность определяемых взаимодействий повышается с увеличением объема данных, получаемых масс спектрометрическими методами.
2. Белковые взаимодействия, устанавливаемые методом виртуальной ко преципитации, обеспечивают выявление функциональных различий между формами белков, образующихся в результате альтернативного сплайсинга.
3. Хромосомоцентричный подход применим для создания интерактомной карты взаимодействий между белками, кодируемыми генами одной хромосомы. В составе интерактомной карты, построенной на основе результатов виртуальной ко-преципитации, определяются кластеры, сходных по функции белков.
Научная новизна и практическая значимость 1.3.
Впервые хромосомоцентричный подход применен для исследования интерактома человека. Среди полученных сведений о взаимодействиях белков, кодируемых генами хромосомы 18 человека, впервые обнаружены данные о ББВ для серпина В7. В работе также показано, что сплайс-формы одного белка взаимодействуют с разными партнерами, т.е. имеют разные интерактомные профили.
Построена интерактомная карта хромосомы. На карте выделены группы взаимосвязанных белков, представляющих собой одно семейство (серпины и кадгерины), или выполняющих определенную молекулярную функцию в организме, например формирующие транскрипционный комплекс.
Практическая значимость работы заключается в повышении эффективности использования данных масс-спектрометрических измерений, выполненных в разных лабораториях. Полученные при выполнении работы результаты обеспечивают переход от накопления противоречивых данных, сгенерированных с применением высокопроизводительных постгеномных методов, к обоснованным научным гипотезам и их дальнейшей биохимической проверке. Результаты предназначены для использования при рациональном планировании научно-исследовательской работы, направленной на выявление перспективных мишеней для экспериментальной интерактомики.
Узловыми (в англоязычной литературе «hub») считаются белки, отличающиеся повышенным количеством белковых взаимодействий, обеспечивающие участие данного белка в различных биологических процессах.
Апробация работы 1.4.
Основные положения диссертационной работы были представлены в виде устного доклада на 11-м Ежегодном всемирном конгрессе Международной организации «Протеом человека» (HUPO 11-th Annual World Congress, Бостон, 2012). Постерные сообщения представлялись на 6-м азиатском конгрессе Международной организации «Протеом человека» (AOHUPO 6th Congress, Пекин, 2012);
на научном конгрессе «Протеомный форум» (Proteom forum, Берлин, 2013);
на ХХ Российском национальном конгрессе «Человек и Лекарство» (Москва, 2013);
а также на конгрессе Федерации европейских биохимических обществ 2013 «Биологические механизмы» (FEBS congress, St.Petersburg, 2013).
Публикации 1.5.
Материалы диссертационной работы отражены в 13 публикациях: в 5 статьях и публикациях в материалах научных конференций.
Объем и структура диссертации 1.6.
Диссертационная работа изложена на 155 страницах машинописного текста;
содержит 10 таблиц и 25 рисунков. Состоит из глав: «Введение», «Обзор литературы», «Материалы и методы», «Результаты и обсуждение», «Заключение», «Выводы», «Список литературы»;
включает 3 приложения.
2. МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ Репозиторий GPMdb 2.1.
Данные масс-спектрометрических экспериментов, в т.ч. полученные в результате использования метода АП-МС, загружали из протеомного репозитория GPMdb в формате SQL с ftp-сайта по адресу ftp://ftp.gpmdb.org/gpmdb/tables/gpmdb.sql и размещали в реляционной базе данных MySQL v.5.5. На момент загрузки (январь года) в локальной версии GPMdb содержались 214 256 масс-спектрометрических экспериментов. Загруженные данные представляли собой коды доступа белков (в формате Ensemble) и последовательности идентифицированных пептидов.
2.2. Аминокислотные последовательности белков человека и данные о контаминантах Сведения об аминокислотной последовательности канонических2 и сплайс-форм белков человека были загружены в виде файлов в формате fasta с ftp-сайта UniProtKB по адресу и ftp://ftp.uniprot.org/pub/database /uniprot_sprot.fasta Здесь и далее под «канонической» формой белка понимается наиболее полный вариант последовательности, включающий трансляцию всех экзонов в составе гена. Термин принят в международном ресурсе белков UniProtKB.
ftp://ftp.uniprot.org/pub/database /uniprot_sprot_iso.fasta. На апрель 2013 года в базе данных UniProtKB имелись сведения о 38 692 белках человека, представленных 20 каноническими последовательностями и 18 167 изоформами.
Перечень кодов доступа (AC) для белков, кодируемых генами хромосомы человека, загружали из ресурса UniProtKB в виде текстового файла http://www.uniprot.org/docs/humchr18.txt. В 15-м релизе UniProtKB (апрель 2013) было опубликовано 277 белок-кодирующих гена, локализованных на хромосоме 18 человека.
Определение потенциальных контаминантов среди белковых партнеров осуществляли с использованием сведений об их встречаемости в АП-МС экспериментах, путем запроса по коду доступа интернет-ресурса CRAPOME (http://crapome.org/?q=wk_1_1_search).
Контрольные наборы данных 2.3.
Для исследования возможностей метода виртуальной ко-преципитации использовали опубликованные в литературе экспериментально установленные данные трех наборов ББВ. Физические взаимодействия в составе белковых комплексов были представлены 20 белками-партнерами гистонового белка HIST4H4 и использовались в качестве контроля в работе [Zhang et al., 2010]. Второй набор физических ББВ содержал взаимодействия в составе коровой части (20S) белкового комплекса 26S протеасомы, состоящего из 8 видов субъединиц и [Zwickl et al., 1999]. Третий контрольный набор включал функциональные взаимодействия белков, принимающих участие в процессе ремоделирования хроматина [Sardiu et al., 2012].
Интерактомные ресурсы 2.4.
Сведения из интерактомных баз данных (табл.2) использовали для сопоставления с результатами виртуальной ко-преципитации.
Таблица 2. Интерактомные базы данных.
Название Адрес ресурса Версия Формат данных ресурса tab файл BioGRID http://thebiogrid.org/ 3. tab файл HPRD http://www.hprd.org xml файл IntACT http://www.ebi.ac.uk/intact 4.0. tab файл MINT http://mint.bio.uniroma2.it/mint 2012_10_ xml файл STRING http://string-db.org/ 9. Подготовка входных данных 2.5.
Формирование входных данных осуществляли в два этапа: удаление дубликатов экспериментов в локальной версии GPMdb и повторная идентификация белков по пептидам для каждого эксперимента. Подготовленные данные вносили в таблицу в локальной версии базы данных.
Идентификацию белков проводили для каждого эксперимента путем сравнения пептидов с последовательностями аминокислотных остатков, загруженными из базы данных UniProtKB. Отбирали эксперименты в том случае, если не менее 90% пептидов относились к белкам человека. Белок считался идентифицированным при условии нахождения совпадения последовательности не менее чем с двумя уникальными пептидами.
Для белков рассчитывали покрытие (cov) как отношение длины последовательности белка к количеству аминокислотных остатков, входящих в состав идентифицированных пептидов. Значение cov определяли вычислением покрытия аминокислотной последовательности белка пептидами. Достоверность идентификации белка (sc) рассчитывали как сумму оценок достоверности идентификаций к этому белку пептидов.
Метод виртуальной ко-преципитации (ВКП) 2.6.
Метод заключается в выявлении белков, совместно идентифицированных в наборе экспериментов, выполненных методом аффинной очистки в сочетании с масс спектрометрией. В основе виртуальной ко-преципитации (ВКП) лежит гипотеза, что взаимодействующие белки должны чаще идентифицироваться совместно в масс спектрометрических экспериментах, чем не взаимодействующие. На рисунке приведена блок-схема метода ВКП.
Метод ВКП применялся для каждого белка-«наживки». Для «наживки» из локальной базы данных отбирали те эксперименты, характеристики которых указывали на использование метода АП-МС. Такими характеристиками эксперимента являлись:
количество идентифицированных белков (sz) и достоверность идентификации белка «наживки» по набору пептидов (cov и sc). Для каждого эксперимента рассчитывали коэффициент разброса ProDis, отражающий дисперсию молекулярных масс идентифицированных белков:
( ) ( ), ProDis = (1) где Ai – молекулярная масса белка i, идентифицируемого в эксперименте;
µg – среднее геометрическое отклонение молекулярных масс, рассчитанное по всем идентифицированным в эксперименте белкам. ProDis применяли, чтобы исключить из рассмотрения эксперименты, выполненные путем разделения белков в одномерном геле (SDS-PAGE).
Начало Массив АС КБ Таблица Поиск GPMdb i =1, КБ ‘Human’ экспериментов (Э) Расчет FREQ i =1, Э нет FREQ ПЗ Расчет sz нет sz ПЗ, Добавление АС cov ПЗ, в список sc ПЗ да Расчет ProDis Список АС (PREYS) нет ProDis ПЗ Взаимодействие i = 1, PREYS Добавление АС AC = AC PREYS[i] в список Подпрограмма ВКП (AC, ПЗ) Подпрограмма ВКП Взаимодействие нет да Список АС в списке Конец ББВ Рисунок 1. Блок-схема метода виртуальной ко-преципитации (ВКП), используемого для выявления белковых взаимодействий. Применяемые в процессе работы алгоритма фильтры обозначены: sz – количество белков в эксперименте;
sc – оценка достоверности идентификации;
cov – степень покрытия последовательности белка пептидами;
ProDis – оценка разброса молекулярных масс белков, идентифицированных в одном эксперименте. АС – код доступа белка, ПЗ - пороговые значения фильтров, КБ – ко-встречающиеся белки.
Пороговые значения для характеристик sz, sc, cov и ProDis определили эмпирически (см.
раздел Основные результаты). При соответствии пороговым значениям, белки эксперимента включали в массив ко-встречающихся белков (КБ). Для каждого белка k из массива КБ рассчитывали частоту встречаемости (FREQ) в масс-спектрометрических экспериментах, соответствующих белку-«наживке»:
, (2) где N1 – количество экспериментов, содержащих белок-«добычу», а N – общее количество экспериментов для белка «добычи».
Если FREQ превышало установленное пороговое значение, то белок-«добычу» включали в список потенциальных партнеров 'PREYS' (см. рис.1).
Описанный выше фрагмент алгоритма был реализован в виде отдельной подпрограммы виртуальной ко-преципитации (ВКП). В методе ВКП эта подпрограмма вызывается дважды, сначала для целевого белка-«наживки», а затем поочередно для каждого белка «добычи» (список 'PREYS'). В случае определения наличия белка «наживки» среди партнеров белка «добычи», принимали, что между «наживкой» и «добычей» осуществляется взаимодействие.
Характеристика взаимодействий, выявленных методом ВКП 2.7.
В результате применения метода ВКП для каждого белкового продукта хромосомы 18 человека был сформирован интерактомный профиль (ИП), представляющий собой список белков-партнеров. ИП загружали в веб-сервис GOrilla (http://cbl-gorilla.cs.technion.ac.il/) и получали для каждого белка аннотацию в терминах Gene Ontology (GO). С использованием полученной аннотацией белки-«наживки» характеризовали в соответствии с категориями «участие в биологическом процессе», «молекулярная функция» и «внутриклеточная локализация».
В составе сети ББВ выделяли кластеры. Для этого силу взаимосвязи (Sim) между двумя белками X и Y рассчитывали по формуле:
() () Sim (X, Y) = (3), () ( )) ( где ИП – интерактомный профиль белка. В кластер объединяли белки, для которых значения Sim превышало 0,5.
Сведения об интерактоме представляли в виде списка пар взаимодействующих белков. Визуализацию попарных взаимодействий в виде интерактомных сетей осуществляли в программе Cytoscape v.2.8.3.
Обработку интерактомных профилей целевых белков проводили с применением геноцентричной базы знаний (ГЦБЗ) (www.kb18.ru). Для каждого целевого белка загружали количество партнеров, полученных методом ВКП, а также доступных в интерактомных ресурсах (табл. 2). Кроме того, из базы данных CRAPOME в ГЦБЗ загружали сведения о типовых контаминантах, наблюдающихся при использовании АП МС.
Программная реализация алгоритмов 2.8.
Используемые алгоритмы реализованы с использованием интерпретатора python v.2.7.7. При работе с таблицами СУБД MySQL v.5.5.25а, использовали встроенный язык разработки pl/sql, позволяющий быстро индексировать большой объем данных.
3. ОСНОВНЫЕ РЕЗУЛЬТАТЫ Определение параметров метода виртуальной ко-преципитации 3.1.
Метод виртуальной ко-преципитации применяли для обработки результатов масс спектрометрических экспериментов, размещенных в протеомном репозитории GPMdb.
В исходных данных GPMdb присутствовала вырожденность: один и тот же набор идентифицированных пептидов мог соответствовать нескольким белкам. В связи с этим было проведены картирование пептидов, содержащихся в GPMdb, на последовательности аминокислотных остатков белков, указанные в базе данных UniProtKB. Из 4,5 млн пептидов, идентифицированных в 214 256 протеомных экспериментах, почти треть (1,3 млн) пептидов соответствовали белкам человека.
Итоговый набор входных данных состоял из 50 815 экспериментов, содержащих суммарно 19 539 видов белков человека.
Поскольку репозиторий GPMdb вырос в объеме в несколько раз со времени разработки метода ВКП (2010 год), то задачей стало определение пороговых значений для параметров метода. Рассматривали параметры, определяющие принадлежность эксперимента к АП-МС: количество идентифицированных в эксперименте белков (sz) и коэффициент ProDis;
достоверность идентификации целевого белка в эксперименте (cov и sc), а также уровень частоты встречаемости белков (FREQ) в результатах экспериментов.
В среднем методом АП-МС идентифицируют 200-300 белков [Malovannaya et al., 2010]. Для 679 экспериментов в описании которых явным образом был указан метод АП-МС, среднее количество идентифицированных белков составило 148. Однако, большинство содержащихся в GPMdb экспериментов не имеют описания (38 950), либо в описании нет указания на АП-МС (3 367), или же содержится информация о других масс-спектрометрических методах (7 819). Например, термин «shotgun» указывает, что аффинная пробоподготовка, скорее всего, не применялась.
Для отбора из массива масс-спектрометрических экспериментов тех, в которых применялась аффинная пробоподготовка, сравнивали количество белков в экспериментах (sz) с различными описаниями методической части (рис. 2А). Видно, что наибольшая вероятность выявления эксперимента, выполненного методом АП-МС, реализуется при значениях sz от 5 до 250 идентифицированных белков.
В установленный диапазон значений sz попадает большое количество экспериментов, в которых белки идентифицировали в полосах одномерного геля. Чтобы отличить эксперименты с разделением в геле от экспериментов с использованием аффинной пробоподготовки, рассчитывали коэффициент разброса ProDis (Protein Dispersion).
Расчет коэффициента ProDis основан на предположении, что во взаимодействиях могут принимать участие белки с разными молекулярными массами, тогда как при разделении в геле в вырезанной полосе могут содержаться белки примерно одинаковой массы. Следовательно, значение ProDis для экспериментов, в которых не проводили фракционирование в геле, должно соответствовать величине, рассчитанной для набора случайных белков. Пороговое значение определили путем анализа значений ProDis для выборок различных размеров, многократно сгенерированных случайным образом на основе аминокислотных последовательностей белков человека. На рисунке 2Б видно, что минимальная величина среднего значения ProDis равна 2,1 и существенно не меняется при увеличении количества белков в эксперименте.
Отбор проводили не только с использованием характеристик экспериментов в целом (sz и ProDis), но и по параметрам sc и cov, которые отражают достоверность идентификации белка-«наживки». Эксперименты, в составе которых белок-«наживка» обладал невысокой достоверностью, отсеивали. Пороговые значения для отсеивания определяли, построив корреляционную зависимость для данных, приведенных на рисунке 2В.
На рисунке 2В показано, что между величинам cov и sc наблюдается значимая корреляция (r2 = 0,8). Уравнение линейной регрессии имело вид sc = 0,54 cov – 9,7.
Область значений, для которых отсутствует корреляция, позволяет определить пороговую величину sc = 9,5 (точка отмечена на рис. стрелкой). Подставляя в уравнение регрессии sc=9,5 получили, что пороговое значение для cov равно ~40 аминокислотных остатков или 12% при нормировании на среднюю длину последовательности. С использованием найденных пороговых значений в среднем отфильтровывалось до 16% экспериментов, не соответствующих принятым в данной работе критериям достоверности идентификации «наживок».
А Б АП-МС 25 2, Интерактомные Другие 2, 20 Неизвестные % от общего количества экспериментов в группе коэффициент ProDis 2, 2, 1, 0 1, 1 2 3 4 5 6 7 8 6 10 15 20 50 100 150 200 sz sz В Г 40 среднее количество ББВ 35 30 sc 0 10 20 30 40 0 20 40 60 80 100 FREQ (%) cov Рисунок 2. Определение пороговых значений параметров метода ВКП. Распределение количества идентифицированных белков (sz) в экспериментах (А);
распределение коэффициента ProDis для набора белков, сгенерированных случайным образом;
линиями отмечено стандартное отклонение (Б);
увеличенный фрагмент зависимости покрытия белка пептидами (cov) от оценки достоверности идентификации (sc) (В);
распределение среднего количество ББВ в зависимости от встречаемости (FREQ) белка в экспериментах (Г).
Оптимальные значение частоты встречаемости (FREQ) белков в наборе экспериментов подбирали исходя из диаграммы, приведенной на рисунке 2Г. Исходные данные для построения диаграммы получали, используя в качестве «наживок» 92 белка, каждый из которых был идентифицирован не менее чем в пяти экспериментах. Для каждого белка-«наживки» подсчитывали количество белков «добычи» при разных значениях FREQ в диапазоне от 10 до 50 % с шагом в 5%. Например, при FREQ = 10% каждому белку-«наживке» в среднем соответствовало 80 партнеров, а при FREQ = 50% только шесть. На рисунке 2Г видно, что точки можно аппроксимировать прямыми, выделив участок быстрого снижения в диапазоне от 10% до 20% по оси абсцисс. По пересечению аппроксимирующих прямых установили пороговое значение FREQ = 21%.
Валидация метода виртуальной ко-преципитации 3.2.
Метод ВКП тестировали на трех наборах белков, взаимодействия между которыми известны из литературных данных. Для первого набора в качестве белка «наживки» использовали гистоновый белок HIST4H4 (Р62805). Согласно GPMdb этот гистоновый белок был идентифицирован в 7 250 экспериментах, из которых в результате применения фильтров было отсеяно 5 551. Из 8 048 белков «добычи» только 121 соответствовали условию FREQ21%. Полученные данные о партнерах для гистонового белка на 75% соответствовали контрольному набору [Zhang et al., 2010].
Контрольный набор для HIST4H4 был представлен 20 белками, среди которых было семь гистонов и пять кератинов. Методом ВКП не удалось идентифицировать гистона, для одного из которых вообще не было экспериментов в GPMdb. Среди выявленных нами белковых партнеров HIST4H4, были обнаружены 9 гистоновых белков, 4 из которых вошли в рассматриваемый контрольный набор. Большая часть партнеров гистонового белка (74%) относилась к контаминантам метода АП-МС.
Гистоновые белки, включая HIST4H4, также относятся к типовым контаминантам, что объясняет большое количество ложноположительных определений ББВ в первом контрольном наборе.
Анализ полученных методом ВКП интерактомных профилей для семи субъединиц протеасомного комплекса показал наличие полного набора (15) взаимодействующих субъединиц 20S протеасомы3. В среднем для -субъединиц протеасомного комплекса было установлено по 30 белковых партнеров, в составе которых были также «выловлены» некоторые из субъединиц регуляторной части (19S) протеасомы. Интерактомные профили семи -субъединиц на 22% состояли из ложноположительных результатов. При этом 68%. белковых партнеров, выявленных для этих субъединиц, совпадали у разных «наживок». Для протеасомного комплекса метод ВКП показал абсолютную чувствительность (все элементы 20S протеасомы были выявлены), а специфичность на уровне 50%. Невысокая специфичность объясняется тем, что в расчет не принимали субъединицы 19S протеасомного комплекса.
Специфичность, рассчитанная при суммировании всех субъединиц 26S протеасомного комплекса, оказалась на уровне 70%.
Третий контрольный набор отличался тем, что представлял собой функциональную сеть. Узлы такой сети не обязательно физически взаимодействуют 26S протеасома состоит из двух компонентов: 20S (коровой протеасомы) и 19S (регуляторной части) друг с другом. Из комплекса белков, участвующих в ремоделировании хроматина ( взаимодействий), методом ВКП были найдены только отдельные белковые взаимодействия, например между белками TIP49a и TIP49b, PIH1D1 и URI1. Это означает, что чувствительность метода ВКП для функциональных взаимодействий крайне низка.
Возможное объяснение несовпадения результатов ВКП с данными о сети ремоделирования хроматина заключается в низкой концентрации части белков, участвующих в данном процессе. Различие в концентрациях влияет на встречаемость белков в экспериментах, поскольку аналитическая чувствительность масс спектрометров ограничена.
Появление новых данных о количественном содержании белков помогает снять ограничение метода, если нормировать значение FREQ на количество копий каждого партнера. По нашим данным для эффективного определения ББВ, количество АП-МС экспериментов для двух белков не должно различаться более чем в четыре раза.
3.3. Выявление белок-белковых взаимодействий с участием продуктов хромосомы Загрузив из ресурса GPMdb результаты 13,8 тыс. масс-спектрометрических экспериментов, была проведена идентификация 250 белков хромосомы 18 человека.
Идентификацию проводили с использованием ранее подобранных пороговых значений sс и cov (см. раздел 3.1). Из числа установленных белков 211 были представлены канонической формой, а 39 – сплайс-формой.
Применение фильтров сократило количество экспериментов для белков «наживок» в среднем на 81%. Более 37% экспериментов содержали существенно большее количество идентифицированных белков, чем обычно получается в методе АП МС (пороговое значение 5sz 250). Еще 30% экспериментов отсеяли из-за низких значений ProDis, то есть была высока вероятность, что эти эксперименты содержат не белковые комплексы, а результаты идентификации белков в полосах одномерного геля.
В итоге, методом виртуальной ко-преципитации с частотным фильтром FREQ20% выявлено ~4,4 тыс. взаимодействий для 103 канонических форм и изоформ белков хромосомы 18. Во взаимодействиях принимали участие 2 318 белков партнеров, найденных методом ВКП в качестве «добычи». Из числа выявленных партнеров было исключено 146 белков, которые являются типовыми контаминантами метода АП-МС.
На гистограмме (рис.3) наиболее высокий пик позволяет заключить, что примерно для 20% всех белков-«наживок» методом ВКП было найдено по пять партнеров. Ранее в работе [Shevchenko et al., 2002] методом двугибридной дрожжевой системы было показано, что среднее количество белков-партнеров в интерактоме равно 4,7. Однако, такое количество идентифицированных белков не типично для метода АП-МС.
Полученное методом ВКП среднее количество белковых партнеров (35) в два раза превышало среднее значение, характерное для некоторых АП-МС экспериментов [Varjosalo et al., 2013]. Расхождения в средних значениях могут объясняться тем, что при ВКП анализируется вся совокупность АП-МС экспериментов, выполненных при различных условиях. В конкретном экспериментальном исследовании, определение ББВ происходит в более стабильном состоянии, достигаемом одинаковыми условиями среды, унификации биоматериала и лабораторного протокола.
На основе приведенных на рисунке 3 данных о количестве ББВ можно рассмотреть две группы белков-«наживок». Первая группа представлена 82 белками, для которых выявили не более 60 взаимодействий. Ко второй группе относятся «наживки», обладающие относительно большим количеством ББВ. Среди таких белков «наживок» - метил-СрG-связывающий белок MBD2 (Q9UBB5) и представители семейства SMAD – SMAD2 (Q15796) и SMAD4 (Q13485), являющиеся ключевыми белками в развитие опухолевых процессов.
количество белков "наживок" 1 5 10 20 30 40 50 60 70 80 90 100 150 количество ББВ Рисунок 3. Количество взаимодействий, в которых выявлены белки-«наживки», кодируемые генами хромосомы 18 человека.
Опираясь на данные рисунка 3, мы предположили, что белки, взаимодействующие со многими партнерами, представляют собой узловые элементы интерактомной сети. В дальнейшем, чтобы подтвердить эту гипотезу использовали геноцентричную базу знаний (см. раздел 3.5).
3.3.1. Аннотирование интерактомных профилей (ИП) в терминах онтологии генов (GO) Наличие функциональных взаимосвязей между белками подтверждали с использованием аннотирования по интерактомному профилю. Белку-«наживке» сопоставляли интерактомный профиль, представляющий собой перечень, выявленных методом ВКП, белков-партнеров. Аннотирование профилей проводили для 82-х «наживок», для каждой из которых было не менее 10 взаимодействующих партнеров.
Статистически значимое «обогащение» терминами онтологии (p 10-5) получили для 70% целевых белков. Это означает, что в 70% случаев метод ВКП обеспечивает выявление групп белков, связанных общностью молекулярно-биологических свойств.
Глубина аннотирования различалось по уровню детализации GO-терминов: в одних случаях обогащение происходило по терминам общего характера, например, «биосинтез белка». В других случаях, например для АТФазы (О43861) аннотирование профиля указывало на конкретную функцию – обеспечение трансмембранного транспорта фосфолипидов. При этом, для той же АТФазы в другой категории «клеточный компонент» удалось аннотировать только самое общее свойство – встраивание в мембранную структуру.
Белковые продукты одного гена, образующиеся в результате альтернативного сплайсинга, могут иметь различные функции [Buljan et al., 2012;
Ellis et al., 2012], т.е.
участвовать в разных белковых взаимодействиях. Сравнение результатов ВКП для девяти генов и соответствующих им 19-ти вариантам трансляции белков (рис. 4) проводили путем сравнения интерактомных профилей. Совпадение ИП рассчитывали по формуле (3) и получили, что для шести генов партнеры разных белковых продуктов совпадают более чем на 80%. В случаях несоответствия профилей отмечено, что в составе ИП было менее 10 белковых партнеров.
Применение метода ВКП позволяет выявлять различие между интерактомными профилями канонической и сплайс-формой. Например, для -субъединицы АТФ синтазы ИП обоих вариантов белков (P25705 и P25705-2) совпали на 86%. Однако, при аннотировании партнеров по генной онтологии белок с канонической последовательностью оказался ассоциирован с транспортными процессами (ATP synthesis coupled proton transport), а изоформа этого белка – с метаболическими (ATP biosynthetic process). Для канонической формы, в отличие от изоформы, была выявлена локализация в митохондриях (категория GO «клеточный компонент»), что связано с участием этой субъединицы АТФ-синтазы в транспорте протона водорода через митохондриальную мембрану (GO:0042776).
Q96VF P02686- 0% P P Q9P 100 0% 86% 82% Q9Y4B P25750- 80 100% 98% Q8TAA Количсетво ББВ P Q9Y2J2- Q9Y2J2- Q8TAA3- P52179- Q96VF9- 50% 0% Q9P260- Q9Y4B5- 90% P P22830- Q9Y2J 81% ATP5A1 MYOM1 PSMA8 THOC1 KIAA1468 EBP41L MBP FECH CCDC Рисунок 4. Распределение количества ББВ среди альтернативных белковых продуктов генов хромосомы 18 человека. Сплайс-формы обозначены кодом доступа, после которого через тире цифрой указан номер формы, согласно ресурсу UniProtKB. В прямоугольниках указано относительное количество партнеров, совпадающих у канонической и сплайс-формы.
3.3.2. Интерактомная карта На рисунке 5 приведена интерактомная карта, построенная по результатам применения метода виртуальной ко-преципитации к хромосоме 18 человека. Карта представляет собой неориентированный граф, вершины которого – белки-«наживки», а ребра – взаимосвязи между ними. Сплошными линиями обозначены прямые взаимодействия, выявленные для целевых белков, а пунктиром или двойными линиями – взаимосвязи, устанавливаемые через общего партнера или через группу общих партнеров, соответственно.
На карте отображено 93 белковых продукта, транслируемых с генов хромосомы 18 человека. Из 115 белков хромосомы 18, для которых были получены данные об их взаимодействиях (4 тыс.), 22 не вошли в построенную интерактомную сеть. Не отображенные белки либо не имели контактов с другими белками-«наживками», либо были представлены единичными взаимосвязями, образующими обособленный фрагмент графа. Белки-«наживки», обладающие сходными интерактомными профилями (не менее 50% партнеров совпадают), были объединены в 9 кластеров, обозначенных на рисунке буквами. В состав кластеров вошло 56 белков, примерно половина из отображенных на карте.
(Е) (Д) (И) (К) (А) (В) (Г) (Б) (Ж) Рисунок 5. Интерактомная карта хромосомы 18 человека, узлами которых являются белки «наживки». Розовым фоном отмечены белки, образующие кластеры. Продукты одного гена (сплайс-формы), имеющие сходный ИП, отмечены красным кругом. Сплошная линия отражает взаимодействия, установленные между отображенными на карте белками;
пунктирная или двойная линия обозначают взаимодействия, осуществляемые посредством одного промежуточного партнера (не кодируемого хромосомой 18) или замыкаются через группу (кластер) таких промежуточных партнеров.
Содержащий наибольшее количество узлов кластер «А» включал в себя серпины и десомальные белки. В группу серпинов вошли девять из 10-ти локализованных на хромосоме 18 представителей этого семейства. Десомальные белки, входящие в группу кадгеринов (трансмембранные белки, элементы цитоскелета) представлены на карте десмоглеинами и десмоколинами. Аннотирование по терминам онтологии генов объектов кластера «А» показало четкое разделение серпиновой и десомальной группы.
Однако внутри кластера наблюдается сильная схожесть интерактомных профилей представителей серпинов и десомальных белков. Например, совпадение выявленных партнеров между белками десмоколина 2 (Q02487) и серпина В5 (P36952) составляло 89%. Участие данных белков в опухолевых процессах при раке желудка и молочной железы [Kim et al., 2012;
Resende et al., 2011;
Sanz-Pamola et al., 2012], а также способность серпина В5 подавлять метастазирование путем повышения клеточной адгезии [Abraham et al., 2003] свидетельствует о наличие объективной взаимосвязи между этими семействами. Таким образом, хромосомоцентричный анализ позволил выявить два семейства, представители которых тесно взаимодействуют в составе интерактомной сети.
Белки кластера «Б», представленные SMAD2 и SMAD4, GATA6, ONECUT2, ZFP161 и THOC1, локализованы в ядре (GO:0005634) и функционируют в составе взаимодействующего с ДНК комплекса (GO:0003677). Участие в транскрипционных процессах (GO:0006351) обуславливает связь белков в кластере «Б» с онкологическими заболеваниями [Shi et al., 1997;
Shakib et al., 2005] Сопоставление результатов ВКП с базами данных по интерактомике 3.4.
Из пяти Интернет-ресурсов (см. Материалы и методы) была получена информация о взаимодействиях с участием белков, кодируемых на хромосоме человека. Максимальное количество данных для исследуемых белков предоставляет ресурс STRING – 4714 взаимодействий для 182 белков. Наибольшее количество белков «наживок» (191), для которых имеются сведения о взаимодействиях, содержится в базе данных BioGRID. Суммарно по всем интерактомным базам известны взаимодействия для 233 белков исследуемой хромосомы, из которых для 58 информация присутствует во всех ресурсах;
54, 42 и 48 белков упомянуты в четырех, трех и двух базах данных соответственно, а для 30 белков- сведения о партнерах встречаются только в одном ресурсе.
Сопоставление данных о взаимодействиях между ресурсами показало, что большинство (80%) выявленных взаимодействий между белками встречаются только в одной базе данных. То есть, даже если белки присутствуют в нескольких базах данных, то в каждом ресурсе для него указаны разные партнеры. Во всех пяти интерактомных ресурсах ББВ совпадают только для 27 белков, 10 из которых кодируются генами хромосомы 18: белки сигнального пути SMAD2 и SMAD4, регулятор апоптоза BCL2, а также CDH2, PARD6G, RALBP1, ROCK1, EPB41L3.
Наибольшая доля белков, кодируемых генами хромосомы 18, имеющих пересечение между данными ВКП со сведениями из интерактомных баз данных, составила около 30% с ресурсом STRING: для 23 из 95 белков-«наживок» были обнаружены общие ББВ. Для остальных интерактомных баз данных доля пересечений c результатами ВКП составила от 23% (BioGRID) до 14 % (MINT).
Выборочный анализ показал, что для некоторых белков наблюдалась высокая степень совпадения между партнерами, полученными методом ВКП и опубликованными сведениями. В таблице 3 приведен перечень белков-«наживок», интерактомный профиль которых совпадал не менее чем на 60% со списком белковых партнеров, загруженный из ресурса STRING. Высокий уровень соответствия наблюдался для некоторых белков, кодируемых хромосомой 18, и в других базах.
Например, для кинетохорного белка NDC80 10 из 11 ББВ, полученных в работе, присутствуют в данных STRING, и частично подтверждаются данными ресурсов BioGRID (6 совпадений), IntACT и HPRD (4 и 3 совпадения соответственно).
Таблица 3. Сопоставление белков-партнеров, выявленных методом виртуальной ко преципитации (ВКП), с данными ресурса STRING.
Количество ББВ Код Название белка-«наживки» Ген Совпа ВКП UniProtKB STRING дающих Метил-СрG-связывающий белок MBD2 Q9UBB5 16 160 Кинетохорный белок Hec1 NDC80 O14777 179 11 Митохондриальная NADH NDUVF2 P19404 52 90 дегидрогеназа, флавопротеин Рибосомальный белок RL17 RPL17 P18621 65 76 субъединицы 60 S Нуклеопротеин SEH1 SEH1L Q96EE3 10 7 – тубулин 6 TUBB6 Q9BUF5 9 40 Проведенное сопоставление сведений из интерактомных ресурсов с результатами ВКП отражает сложившуюся ситуацию с разнородностью данных о ББВ, которые составляют от 15 до 60% [Lehne&Schlitt;, 2009]. Использование различных экспериментальных и биоинформатических методов выявления ББВ порождает массив данных, требующих дополнительной интерпретации. Увеличение объема экспериментальных данных, доступных для обработки методом ВКП, улучшает качество обнаруживаемых ББВ, повышая их специфичность по отношению к белку «наживке».
Геноцентричная база знаний (ГЦБЗ) по интерактому хромосомы 18 человека 3.5.
На примере аннотирования интерактомных профилей белков, кодируемых генами хромосомы 18 человека, было показано, что в пределах своих ограничений применяемый нами метод, позволяет получать новые результаты, отличающиеся от сведений в современных базах данных по интерактомике. Например, для серпина B (O75635) методом ВКП впервые было показано участие в ББВ. Для обобщения сведений об интерактоме хромосомы 18 человека использовали геноцентричную базу знаний (ГЦБЗ). База знаний позволяет перейти от исследования усредненных характеристик интерактома, таких как количество узлов, ребер и кластеров, к анализу свойств отдельных белков. Вместо исследования статистических гипотез в базе знаний применяется субъективный подход, основанный на интерактивном взаимодействии человека с интуитивно-воспринимаемым форматом представления данных [Ki-Paik et al., 2011].
В ГЦБЗ создали рабочее пространство, куда были загружены идентификаторы белков, кодируемых генами хромосомой 18 человека. Характеристики белков были представлены в виде тепловой матрицы. В матрице цветом кодировались результаты, полученные методом ВКП, также данные, загруженные из интерактомных ресурсов, и другие сведения, отражающие свойства белков (см. рис. 6).
На рисунке 6 показана итоговая выборка узловых белков, полученная с применением базы знаний. В состав выборки вошли белки, для которых методом ВКП было выявлено большее количество взаимодействий. Критерием формирования выборки также являлось наличие у отобранных белков большого количества партнеров согласно интерактомным базам данных. Соблюдение этого требования на рисунке отражено тем, что большинство ячеек в первом секторе (обозначения колонок S-I-B-H M) окрашены в зеленые тона.
Рассмотрение рисунка 6 позволяет увидеть противоречие в отношении отображенных в формате тепловой матрицы белков. Так, для белков RBBP8 и NDC все ячейки в строке первого сектора окрашены в тона зеленого, то есть согласно базам данным эти белки участвует во многих взаимодействиях. В то же время, данные ВКП свидетельствуют о незначительном количестве выявленных белковых партнерах (ячейки окрашены в желтый цвет). Наоборот, для белка TGIF1 ячейки, отражающие количество партнеров согласно данным ресурсов STRING и IntACT, имеют желтую окраску, тогда как ячейка «ВКП» (VC) – темно-зеленую. Приведенный пример иллюстрирует, что применение метода ВКП в сочетании с базой знаний позволяет выделять белки, потенциально обладающие необычными свойствами в составе хромосомоцентричного интерактома.
В заключение надо указать, что с использованием геноцентричной базы знаний мы анализировали количество белков-партнеров, не учитывая, насколько эти партнеры совпадают в разных источниках. Такой подход на сегодняшний день является единственно возможным, поскольку источники данных о ББВ противоречивы вследствие ограничения экспериментальных методов (см. раздел 3.4).
Рисунок 6. Визуализация интерактомных данных в виде тепловой матрицы в геноцентричной базе знаний. S, I, B, H и M –– количество ББВ в ресурсах STRING, IntACT, BioGRID, HPRD и MINT, соответственно;
VC – количество ББВ, полученных методом ВКП;
CT – данные о встречаемости в АП-МС экспериментах в качестве контаминанта;
H1 и H2 – концентрация белков, измеренная в клеточной линии HEK293 (по данным ресурса MOPED и статьи [Geiger et al., 2012]);
MS –количество масс-спектрометрических экспериментов, в которых был идентифицирован белок в PRIDE, GPMdb, PeptideAtlas;
DR – связь белка с заболеваниями [Archakov et al., 2011];
CD – связь белка с опухолевыми процессами, согласно ресурсу OMIM.
Градиентом цветов обозначено количество сведений по каждой характеристике от максимального значения (темно-зеленый) к минимальному (светло-оранжевый).
Сопоставление разных источников данных позволяет утверждать, что в составе хромосомоцентричного интерактома можно выделить узловые белки (hub), на которые замыкаются многие взаимодействия (рис. 6). Множественные интерактомные связи узловых белков указывают на их ключевую роль в организации биологических процессов. Нарушение структуры или свойств узлового белка приводит к развитию патологических процессов, преимущественно опухолевых [Ekman et al., 2006].
ВЫВОДЫ 4.
Реализован метод виртуальной ко-преципитации, и для него определены 1.
основные параметры, позволяющие в автоматическом режиме выявлять взаимодействия белков на основе анализа масс-спектрометрических экспериментов из ресурса GPMdb.
Разработанный метод позволяет выявлять белковые комплексы с высокой 2.
чувствительностью, но низкой специфичностью. Выявленные с использованием метода виртуальной ко-преципитации компоненты функциональных белковых комплексов совпадают с ранее описанными в литературе.
Построена интерактомная карта для 115 белков, кодируемых генами хромосомы 3.
18 человека, содержащая сведения о 4 тыс. взаимодействиях. На примере серпина В показана возможность выявления новых данных о взаимодействиях методом виртуальной ко-преципитации. В составе карты выделено 9 кластеров объединяющие функционально-сходные белки, часть из которых принимает участие в патогенезе опухолевых заболеваний. Показано, что функциональное аннотирование в GO-терминах для сплайс-вариантов одного белка различно.
Результаты, полученные методом виртуальной ко-преципитации, совпадают с 4.
известными данными о белок-белковых взаимодействиях для хромосомы 18 человека примерно на 30%. Невысокая специфичность метода отражает неполноту и противоречивость опубликованных сведений об интерактоме. Анализ доступной информации о белковых взаимодействиях с помощью геноцентричной базы знаний позволяет выделить в составе хромосомы узловые белки, играющие ключевую роль в биологических процессах.
5. СПИСОК ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ Статьи:
1. Ivanov A.S., Ershov P.V., Mezentsev Yu. V., Poverennaya E.V., Lisitsa A.V. and Archakov A.I. Protocols of Protein Interactomics: Molecular Fishing on Optical Chips and Magnetic Nanoparticles// Biochemistry (Moscow). 2012. V. 6(2), P 99- 2. Ponomarenko E.A.;
Poverennaya E.V.;
Pyatnitskiy M.A.;
Lisitsa A.V.;
Moshkovskii S.A.;
Ilgisonis E.V.;
Chernobrovkin A.L.;
Archakov A.I. Comparative ranking of human chromosomes based on post-genomic data// OMICS: A journal of integrative biology.
2012. V. 16 (1), P. 604– 3. Поверенная Е.В., Боголюбова Н.А., Булко Н.Н., Филимонов А.Д., Ромашева Ю.А.
Объектно-ориентированная информационная система для визуализации, хранения и обработки молекулярно-биологических данных// Интеграл. 2012. №3 (65). С. 18- 4. Zgoda VG, Kopylov AT, Lisitsa AV, Ponomarenko EA, Poverennaya EV, Radko SP, Khmeleva SA, Kurbatov LK, Filimonov AD, Bogolyubova NA, Ilgisonis EV, Chernobrovkin AL, Ivanov AS, Medvedev AE, Mezentsev YV, Moshkovskii SA, Naryzhny SN, Ilina EN, Kostrjukova ES, Alexeev DG, Tyakht AV, Govorun VM, Archakov AI. Chromosome 18 transcriptome profiling and targeted proteome mapping in depleted plasma, liver tissue and HepG2 cells// JPR. 2013. V 12(1). P. 123-134.
5. Poverennaya EV, Bogolubova NA, Ponomarenko EA, Lisitsa AV, Archakov AI.
GenoCMS – The Content Management System for genes and proteins// Proteomics and Bioinformatics. 2013. V 6. P.176-182.
Тезисы:
6. E Ponomarenko, M Pyatnitskiy, E Poverennaya, A Lisitsa. Comparative analysis of human chromosomes based on post-genomic data// In: Proceedings 6th Congress AOHUPO.
Beijing. 2012. P. 7. Поверенная Е.В., Лисица А.В., Пономаренко Е.А. Gene-Centric Content Management System: база знаний по белкам 18-й хромосомы человека// Сборник трудов ХIХ Российского национального конгресса «Человек и лекарство». Москва. 2012. C. 8. Poverennaya EV, Chernobrovkin AL, Lisitsa AV. Deciphering of the 18th chromosome centered interactome by analysis of PRIDE and GPMDB datasets// In: Proceedings the HUPO 11th Annual World Congress. Boston. 2012. P.84.
9. Ekaterina Poverennaya, Elena Ponomarenko, Andrey Lisitsa. Chromosome-centric view of human protein-protein interactions based on In Silico analysis// In: Proceedings the Proteomic Forum 2013. Berlin. 2013. P.138.
10. Andrey V. Lisitsa, Ekaterina V. Poverennaya, Nadezhda A. Bogolubova, Elena A.
Ponomarenko. Consolidating Chr18 data using knowledge base of protein and transcript features// In: Proceedings the Proteomic Forum 2013. Berlin. 2013. P.143.
11. Поверенная Е.В., Чернобровкин А.Л., Пономаренко Е.А., Лисица А.В. Выявление белок-белковых взаимодействий путем анализа масс-спектрометрических данных// Сборник трудов ХХ Российского национального конгресса «Человек и лекарство».
Москва. 2013. C. 12. Поверенная Е.В, Пономаренко Е.А., Пятницкий М.А., Лисица А.В., Мошковский С.А., Ильгисонис Е.В., Чернобровкин А.Л., Арчаков А.И. Сравнительный анализ хромосом человека на основе постгеномных данных// Сборник тезисов докладов научной конференции ФГБУ «ИБМХ» РАМН. Москва. 2013. С. 13. Poverennaya E.V., Chernobrovkin A.L., Ponomarenko E.A., Lisitsa A.V. Chromosome centered interactome of human chromosome 18 by analysis of GPMDB datasets// In:
Proceedings the FEBS Journal. V. 280. Saint Petersburg. 2013. P.