авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Информационная поддержка базы данных по лекарственным средствам, снабженным транспортными системами доставки лекарств

На правах рукописи

Угольникова Ольга Анатольевна

ИНФОРМАЦИОННАЯ ПОДДЕРЖКА БАЗЫ ДАННЫХ ПО

ЛЕКАРСТВЕННЫМ СРЕДСТВАМ, СНАБЖЕННЫМ

ТРАНСПОРТНЫМИ СИСТЕМАМИ ДОСТАВКИ ЛЕКАРСТВ

05.13.01 – Системный анализ, управление и обработка информации

(химическая промышленность)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата технических наук

Москва – 2010

Работа выполнена на кафедре Информационных технологий и кафедре Биотехнологии государственного образовательного учреждения высшего профессионального образования "Московская государственная академия тонкой химической технологии им. М.В. Ломоносова".

Научный руководитель доктор технических наук, профессор, заслуженный деятель науки и техники РФ Корнюшко Валерий Федорович

Официальные оппоненты доктор технических наук, член-корр. РАМН, профессор Береговых Валерий Васильевич доктор технических наук, профессор Бахвалов Лев Алексеевич

Ведущая организация Российский химико-технологический университет им. Д.И. Менделеева

Защита состоится « 12 » « октября » 2010 года в 11.00 часов на заседании диссертационного совета Д 212.120.08 при Московской Государственной Академии тонкой химической технологии им. М.В. Ломоносова по адресу: 119571, г. Москва, просп. Вернадского, 86.

С диссертацией можно ознакомиться в библиотеке МИТХТ им. М.В. Ломоносова (119571, г. Москва, просп. Вернадского, 86).

Автореферат диссертации размещен на сайте http://www.mitht.ru.

Реферат разослан «10» «сентября» 2010 г.

Ученый секретарь диссертационного совета, доктор технических наук Колыбанов К.Ю.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

* Актуальность работы Разработка систем доставки лекарств является актуальной и быстро развивающейся областью биотехнологии. В основе данного направления лежит комплекс биотехнологических подходов, позволяющих встраивать молекулы лекарственного вещества в состав носителя. В результате встраивания изменяется фармакокинетика и фармакодинамика препарата. При этом происходит повышение эффективности действия и снижение побочных эффектов лекарственного вещества как за счет увеличения биодоступности, так и за счет избирательной концентрации вещества в пораженных тканях и органах.

В настоящее время накоплен огромный объем информации по доставке различных лекарственных соединений, в связи с чем появляются проблемы охвата всей области знаний и систематизации информационных ресурсов. Общепринятым способом сообщения информации является ее представление в виде научных публикаций, состав которых разнороден и может включать в себя сведения о структуре, физико-химических свойствах, биологической активности и пр. Для обобщения информации часто используются литературные обзоры, представляющие собой объединение и анализ накопленных фактов в конкретной области знаний. Обзоры относительно быстро устаревают, так как скорость обновления информации достаточно велика. В биомедицинской электронной библиотеке PubMed за последние 20 лет размещено более 600 тыс. публикаций, непосредственно описывающих создание и испытание систем транспорта, и более 1,5 млн. публикаций, имеющих косвенное отношение к разработке систем транспорта и посвященных биологическим свойствам лекарственных композиций.

Такой объем информации невозможно систематизировать без привлечения автоматических средств интеллектуальной обработки данных.

Цель работы Целью работы является разработка информационной поддержки базы данных по свойствам и технологиям получения транспортных систем доставки, предназначенной для прогнозирования встраивания лекарственных средств в транспортные системы доставки на основе экспериментальных данных, полученных из электронных библиотек PubMed и PubChem.

Для достижения цели работы были поставлены следующие задачи:

1. Применение системного подхода к алгоритмизации комплексной методики сбора, обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки.

2. Разработка экспертно-алгоритмической информационной системы сбора, обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки, из электронных библиотек PubMed и PubChem.

* Автор выражает искреннюю благодарность академику РАМН, профессору Швецу В.И. за постоянную помощь, внимание, обсуждение результатов и ценные советы.

3. Разработка информационных моделей для проектирования информационной системы обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки, на основе методологий IDEF0, IDEF1X и DFD.

4. Построение и анализ сетевых диаграмм, содержащих кластеры веществ, характеризующихся общностью химической структуры или сходными биологическими свойствами для получения и анализа общего представления о дифференцированном распределении объектов исследования по семантически родственным группам (кластерам).

5. Создание базы литературных данных «Drug Delivery» по лекарственным средствам, снабженным транспортными системами доставки, на основе информации из электронных библиотек PubMed и PubChem.

6. Построение вербальной модели предметной области базы данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств, предназначенной для прогнозирования встраивания лекарственных средств в транспортные системы доставки;



построение ER- и реляционной моделей.

Научная новизна - На основе системного подхода разработана алгоритмизированная комплексная методика сбора, обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки.

- Разработана экспертно-алгоритмическая информационная система обработки информации по лекарственным средствам, снабженным транспортными системами доставки, из электронных библиотек PubMed и PubChem.

- Разработаны информационные модели системы обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки, на основе методологий IDEF0, IDEF1X и DFD.

- На основе экспертно-алгоритмической информационной системы обработки информации построена сетевая диаграмма, содержащая кластеры веществ, характеризующиеся общностью химической структуры или сходными биологическими свойствами, доминирующий кластер преимущественно содержал вещества, используемые для адресной доставки лекарственной субстанции при помощи какой-либо транспортной системы.

- Показано, что для биологически активных соединений сетевые диаграммы могут быть получены на основе анализа смысловой родственности публикаций, то есть, когда названия объектов совместно в тексте документа не упоминаются.

- Составлена вербальная модель предметной области базы данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств на основе информации из электронных библиотек PubMed и PubChem для прогнозирования встраивания лекарственных средств в транспортные системы доставки;

построены ER- и реляционная модели базы данных.

Практическая значимость На основе разработанной экспертно-алгоритмической информационной системы сформирована выборка из 2358 лекарственных соединений, которые имеют прямое или косвенное отношение к транспортной доставке лекарственных средств.

На основе отобранных наименований химических соединений ( веществ) и соответствующей им библиографии создана база литературных данных «Drug Delivery». Полученные результаты были использованы при проведении поисковых научно-исследовательских работ по направлению «Биоинформационные технологии», по проблеме «Создание интерактивной экспертной системы для обработки научных публикаций в области систем доставки лекарств» в научно-исследовательском институте биомедицинской химии имени В.Н.Ореховича РАМН.

Разработанная экспертно-алгоритмическая информационная система была использована в учебном процессе при работе со студентами, обучающимися по специальности «Прикладная информатика (в экономике, в менеджменте)» в курсе «Мировые информационные ресурсы» и по магистерской программе «Информационные системы в химической и биотехнологии» в курсе «Компьютерные технологии обработки информации».

Методы исследования Для проектирования информационной системы были применены технологии функционального моделирования, а именно, методология IDEF0 и методика построения моделей потоков данных DFD.

При обработке информации использовали методы ассоциативного анализа.





При разработке базы данных использована теория построения реляционных баз данных.

Апробация работы Результаты работы были представлены на следующих конференциях:

IV Московский международный конгресс "Биотехнология: состояние и перспективы развития", 7-ая международная специализированная выставка"Мир Биотехнологии 2009", Москва;

III молодежная научно-техническая конференция «Наукоемкие химические технологии - 2009», Москва;

V Московский международный конгресс "Биотехнология: состояние и перспективы развития", Международная научно-практическая конференция «Биотехнология: экология крупных городов», Москва, 2010;

ХIII международная научно-техническая конференция «Наукоемкие химические технологии», Иваново-Суздаль, 2010;

Научно-практическая конференция «Инновационные и информационные технологии в образовании, экономике, бизнесе и праве», Волоколамск, 2010;

III международная конференция «Математическая биология и биоинформатика», Пушкино, 2010.

По результатам работы были получены два диплома и две медали на Московских международных конгрессах "Биотехнология: состояние и перспективы развития".

Публикации По материалам диссертации опубликовано 8 печатных работ, в том числе статьи в журналах, рекомендованных ВАК РФ для опубликования результатов диссертационных работ, 1 статьи, 4 публикациях в сборниках трудов и тезисов докладов конференций и семинаров.

Структура и объем диссертации Диссертационная работа состоит из введения, 4 глав, заключения, изложенных на 164 страницах, включая библиографию из 112 источников, рисунков и 6 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении рассмотрены актуальность и практическая ценность работы.

Сформулирована цель работы и поставлены задачи, решение которых необходимо для достижения поставленной цели. Обоснованы методы исследований, научная новизна, апробации работы.

В первой главе проведен анализ основных видов транспортных систем доставки лекарственных средств, выявлены их преимущества и недостатки использования, а также технологии их получения и способы применения. Сделан вывод о необходимости систематизации полученной информации.

Одно из направлений развития наномедицины – применение наночастиц для доставки лекарственных соединений к необходимым мишеням (клеткам, тканям, органам). Для этих целей используют множество различных типов наночастиц:

полимерные и металлосодержащие наночастицы, мицеллы, квантовые точки, дендримеры, липопротеины, липосомы, микрокапсулы и многие другие (Рис.1).

Рис.1. Основные виды транспортных систем доставки лекарственных средств.

В общем случае транспортные средства позволяют увеличить эффективность действия лекарственных средств, а также замаскировать их от ретикулоэндотелиальной системы. Упаковка лекарственных средств в транспортные системы может увеличить концентрацию действующего вещества в целевой области, если обеспечить контролируемое высвобождение загруженных компонентов, также зачастую удаётся избежать опасных иммунных и аллергических реакций, особенно в случае использования липосом и других липидных комплексов. Для достижения успеха необходимо учитывать особенности упаковки: биосовместимость и биодоступность получаемых транспортных систем.

Плотность упаковки, размер, форма, структура и особенности химии частиц влияют на последующий выход лекарственных средств из частиц, направленность доставки, таким образом, позволяя регулировать фармакокинетику процесса.

Широкое распространение получили долгоживущие носители, благодаря ряду преимуществ. Многие вещества коллоидного типа при введении быстро обнаруживаются и разрушаются под действием различных защитных механизмов организма. Долгоживущие же носители, такие как, например, полимерные наносферы, способны продолжительное время циркулировать в организме и используются для доставки лекарств посредством сосудистой системы, контролируемого высвобождения, активного и пассивного нацеливания. Такие частицы могут быть получены различными способами, иметь заданные, определяемые конкретной задачей свойства.

Первыми наноконтейнерами были липосомы, они позволяют включать различные типы лекарственных соединений, как гидрофильные так и гидрофобные.

Позже стали использовать и другие наноразмерные переносчики: полимерные мицеллы, полимерные наночастицы, твёрдые липидные наночастицы и др., а также наноформы лекарственных средств: микро- и наноэмульсии, наносуспензии и нанокристаллы и т.п. Каждый из типов имеет свои особенности, преимущества и недостатки, более подробное рассмотрение проводится в диссертационной работе.

Во второй главе рассмотрен системный подход к разработке и алгоритмизации комплексной методики сбора, обработки, анализа и хранения информации по свойствам транспортных систем доставки, предназначенных для определения условий получения лекарственных композиций, снабженных вышеуказанными транспортными системами (Рис.2).

Методика включает в себя комплексирование ряда стандартных и разработанных автором баз данных, алгоритмов обработки и блоков принятия решений на отдельных этапах, а также разработку информационных моделей на всех этапах проектирования информационной системы.

В основе проектирования любой информационной системы (ИС) лежит моделирование предметной области. Для того чтобы получить адекватный предметной области проект ИС, необходимо иметь целостное, системное представление в виде модели, которое отражает все аспекты функционирования будущей информационной системы. Наиболее известными подходами к построению моделей предметной области являются в настоящее время функциональное программирование и структурное графическое моделирование.

Сбор информации PubMed Экспериментальные Литературные данные данные PubChem Формирование входных данных БПР Обогащение списка БПР Обработка Неспецифическая информации Блок информация Создание целевой и фоновой экспертизы (эксперт) БПР Проектирование информационной системы выборки БПР4 Формирование перечня Контролируемый Выбор химических соединений словарь химических соединений Создание промежуточной БД БД Drug Delivery Создание обучающей выборки Анализ Обработка обучающей выборки при помощи программы PASS информации Нет Выборка собрана правильно?

Да Хранение информации Создание базы данных по лекарственным средствам БД по свойствам Управление информацией Формирование запроса Прогнозирование Ввод запроса Рис. 2. Системный анализ разработки и алгоритмизации комплексной методики сбора, обработки, анализа и хранения информации по лекарственным средствам, снабженным транспортными системами доставки Функциональное программирование — раздел дискретной математики и парадигма программирования, основанные на применении -исчисления, реализуются в настоящее время с помощью ряда языков, наиболее известными из которых являются LISP и Haskell. Функциональное программирование обеспечивает возможность алгоритмизации и программирования всего процесса моделирования на одном из стандартных языков, но реально доступно только узкому классу специалистов. В то время как структурное графическое моделирование очень наглядно, широко доступно, полностью обеспечивает понятность для заказчиков и разработчиков на основе применения графических средств отображения модели;

но не поддается процессу сквозного программирования. При этом к моделям предметных областей предъявляются следующие требования:

формализация, обеспечивающая однозначное описание структуры предметной области;

реализуемость, подразумевающая наличие средств физической реализации модели предметной области в ИС;

обеспечение оценки эффективности реализации модели предметной области на основе определенных методов и вычисляемых показателей.

Для реализации перечисленных требований, как правило, строится система моделей, которая отражает структурный и оценочный аспекты функционирования предметной области.

Построение комплекса моделей информационной системы обычно начинается с построения функциональной модели, для которой может быть использована методология IDEF0.

В самом общем виде множество моделей некоторой x-й системы имеет вид:

M x M xy y 0, Yx, ( 1) где M xy кортеж, представляющий в x-й системе y-ю модель (примем M );

Y число моделей в x-й системе. Модель с нулевым индексом M M xy x x называется системной моделью, она имеет то же название, что и система, создается и удаляется вместе с системой. Каждая y-я модель x-й системы представлена в виде блока на системной диаграмме (контекстного блока модели), описываемой в виде кортежа:

S = ‹ I,C,O,M,F ›, (2) где ICOMF-атрибуты информационных потоков системы и реализуемая ею функция (I - Input, C - Control, O - Output, M - Mechanism, F - Function, реализуемая моделью).

Методологии IDEF0 и DFD были использованы в работе для построения информационных моделей экспертно-алгоритмической системы сбора и обработки данных по свойствам и технологиям получения транспортных систем, предназначенных для определения условий получения лекарственных композиций, снабженных транспортными системами. Контекстная диаграмма представлена на Рис.3.

В соответствии с обозначениями (2) для этой модели информационные потоки I и O - это соответственно электронные библиотеки PumMed и PubChem (I), экспериментальные данные, вероятность встраивания (O), C - это условие отбора, запрос пользователя, нормативная документация, контролируемый словарь лекарственных соединений;

M - эксперты и программное обеспечение и F прогнозирование встраивания лекарств в транспортные системы доставки.

Рис. 3. Контекстная диаграмма А-0 функциональной модели Декомпозиция контекстной диаграммы позволяет уточнить модель с требуемой степенью детализации, при этом обеспечивается соответствие граничных стрелок на родительской и дочерней диаграммах при помощи ICOM кодирования стрелок. На Рис.4. показана декомпозиция первого уровня блока А- контекстной диаграммы.

Следующий этап – это построение модели потоков данных, которая, помимо внешних по отношению к моделируемой системе сущностей, включает в себя как наименования функций (процессов), так и абстрактные накопители данных (документы, базы данных и т.д.). Диаграмма потоков данных DFD (Data Flow Diagram), приведенная на Рис.5, построена с использованием нотации Гейна-Сарсона.

Рис. 4. Декомпозиция первого уровня А0 функциональной модели.

Рис.5. Диаграмма потоков данных В третьей главе описана реализация информационно-экспертной системы сбора и обработки данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств.

Разработанные модели были применены при создании информационной поддержки системы сбора и обработки данных по свойствам транспортных систем, предназначенных для определения условий получения лекарственных композиций, снабженных транспортными системами доставки (Рис.6). Эта система представляет собой информационно-экспертную систему, включающую стандартные базы данных и алгоритмы, а также базы данных и алгоритмы, разработанные автором и блоки принятия решений на основе экспертных заключений.

Как показано на Рис.6, в качестве исходной выборки была использована доступная в сети Интернет электронная библиотека PubMed, в которой на 01 октября 2009 г содержалось более 19 млн. рефератов научных статей в области биомедицины и биотехнологии. Автоматическое извлечение информации из ресурсов сети Интернет и ее обработку проводили с использованием программного пакета «BiblioEngine» (ООО «КуБ», Москва). Поисковыми средствами сервера PubMed отобрали 646 тыс. рефератов, соответствующих тематике доставки лекарств. Публикацию считали соответствующей тематике, если в ней встречался хотя бы один термин из сформированного экспертом перечня ключевых слов.

Выборку из 6500 наименований химических соединений формировали согласно разделу «PharmacologicalAction» контролируемого словаря терминов MeSH (Medical Subjects Headings), загруженного с сайта Национального центра биотехнологической информации США. С использованием сервера PubChem для каждого химического соединения были получены регистрационные номера CID и варианты синонимичных названий и аббревиатур. Контекстным поиском из химических соединений отобрали 2358 веществ, наименования или номера CID которых встречались в ранее созданной выборке рефератов по тематике доставки лекарств.

В соответствии с методикой, предложенной в работе, наименования химических соединений направляли по HTTP-запросу в систему PubMed. В ответ на запрос система PubMed предоставляла перечень релевантных статей, в которых упоминается данное химическое соединение. Для каждого химического соединения идентификаторы таких статей объединяли в состав релевантного библиографического профиля. Затем, для каждой релевантной публикации определяли 5 родственных по смыслу документов, используя поле «Related Articles» системы PubMed, и включали их в состав родственного библиографического профиля. При этом в число родственных публикаций не включали тривиальные случаи, когда в тексте статьи наименования двух любых соединений встречаются совместно.

Ассоциативные связи рассчитывали между каждой парой химических соединений. Принимая за k количество ссылок, совпадающих в библиографических профилях родственных публикаций двух соединений, индекс сходства r вычисляли по формуле:

r = k / (m + n – k) (3) где m и n – количество статей в библиографических профилях одного и другого соединения. Для построения сетевой диаграммы отбирали только те пары соединений, для которых выполнялось условие: r 0,018.

Попарные ассоциативные связи были вычислены по формуле (3) для соединений, вследствие чего только для 1087 соединений значение индекса сходства превысило установленный порог 0,018. Отобранные 1087 соединений были отображены на сетевой диаграмме, фрагмент одного из изолированных кластеров которой показан на Рис. 7. Видно, что узлами сетевой диаграммы являются наименования химических соединений, а показанные пунктирами ребра соединяют химические соединения попарно, в соответствии с количеством общих публикаций.

Рис. 7. Фрагмент сетевой диаграммы, относящийся к кластеру №1 (см. Таб.1).

Пунктирными линиями обозначены связи между химическими соединениями;

для каждой связи показано количество общих для двух соединений родственных публикаций.

При выбранном пороге отсечения в составе сетевой диаграммы выявили кластеров (подграфов), сведения о которых представлены в Таб.1. Кластерами считали такие подграфы, в которых узлы соединены ребрами, а между узлами из разных подграфов ребер нет.

Таб.1. Характеристики кластеров в составе семантической диаграммы химических соединений.

№ Количество Среднее Примечание кластера веществ значение индекса r 1 0, 2 0, 20 транквилизирующие средства антибатериальные и антипротозойные 3 0, 15 средства 4 0, 14 гипогликемические средства 5 0, 10 допаминовые средства антиконвульсивные и успокаивающие 6 0, 8 средства 7 0, 8 допаминовые антагонисты 8 0, 8 анаболические средства и андрогены 9 0, 8 никотиновые антагонисты 10 0, 8 адренергические альфа-антагонисты 11 0, 8 витамины группы А 12 0, 7 опиатные алкалоиды антинеопластичные средства и 13 0, 7 ингибиторы ароматазы антинеопластичные средства и 14 0, 7 андрогенные антагонисты 15 0, 7 гормоны гипофиза и их производные 16 0, 7 ингибиторы протеазы 17 0, 7 нейромедиаторные средства антиинфекционные средства и 18 0, 7 вспомогательные вещества Видно, что в составе семантической сети образовался один доминирующий по количеству узлов кластер №1, а также существенно меньшие кластеры, насчитывающие от 7 до 20 узлов. В таблице 1 для каждого кластера, кроме первого, указана принадлежность к одной из терапевтических групп. Во всех кластерах присутствуют выраженные ассоциативные связи, обусловленные сходством биологической активности входящих в них соединений. Например, в кластер №2 вошли 20 соединений, который образуют 27 ассоциативных связей между веществами транквилизирующего действия, а в кластере № сгруппированы соединения, относящиеся к витаминам группы А.

В состав кластера №7, 9, 14 вошли активные вещества, являющиеся антагонистами. Отдельную группу составляют представители кластера №12, куда вошли соединения, относящиеся к группе опиатных алкалоидов, например дигидроморфин, кодеин, гидроморфон.

Приведенные в Таб.1 данные показывают, что кластеры в составе сетевой диаграммы отличаются средними значениями индекса r. Наибольшее значение r = 0,061 получено для кластера №11. Это означает, что кластер обладает компактной структурой, и вершины в его составе образуют большое количество перекрестных ребер. Другие кластеры, например №№ 4, 8, 18, наоборот, обладают низкой плотностью связей, и поэтому соответствующие значения индекса находятся практически на уровне выбранного порога отсечения. Можно предположить, что различия усредненных индексов связаны с интенсивностью выполнения исследований в области соответствующих групп соединений.

Кластер №1, содержащий 766 соединений, анализировали более детально.

Прежде всего, было отмечено, что в этот кластер вошли разнородные по своей химической структуре и биологическим свойствам соединения. Поэтому, для его детального анализа необходимо использовать более низкие пороговые значения индекса семантического сходства. С наибольшей частотой в кластере № встречаются статьи, относящиеся к антибиотикам и соединениям с противоопухолевой или противовоспалительной активностью. Например, на рисунке 1 показан центральный фрагмент кластера №1, где отмечены химиотерапевтические антинеопластические агенты: доксорубицин, винкристин, цисплатин и др., а также антибиотики: рифампицин, изониазид, рифабутин.

Исходя из Рис.7, можно отметить, что в кластер №1 объединены соединения, для многих из которых выполнены экспериментальные работы по встраиванию в систему транспорта. В частности, липосомальные формы доксорубицина, кверцетина, цисплатина, фторурацила, доцетаксела, дофамина, рифампицина, изониазида, рифабутина, даунорубицина, амикацина, винкристина, цисплатина, нистатина являются либо коммерческими препаратами, либо проходят испытания различных уровней. Это означает, что наиболее крупный кластер отражает тематическую направленность, согласно которой производили отбор публикаций из библиотеки PubMed.

Сетевая диаграмма позволяет получить общее представление о дифференцированном распределении объектов исследования по семантически родственным группам (кластерам). Варьирование индекса ассоциативного сходства позволяет регулировать степень обобщения опубликованного материала. В интересных участках сетевой диаграммы структура ассоциативных связей между химическими соединениями может быть детализирована. Каждая ассоциативная связь, появляющаяся на диаграмме, может быть интерпретирована с привлечением обеспечивающих эту связь статей. Ранее сходный подход использовали применительно к анализу генов и белков, однако при этом связи устанавливали только для тех объектов, названия которых вместе встречались в одном реферате.

В данной работе мы показали, что для биологически активных соединений сетевые диаграммы могут быть получены на основе анализа смысловой родственности публикаций, то есть, когда названия объектов совместно в тексте документа не упоминаются.

На основе отобранных наименований химических соединений ( веществ) и соответствующей им библиографии была создана база литературных данных «Drug Delivery».

В четвертой главе составлена вербальная модель предметной области базы данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств, предназначенной для прогнозирования встраивания лекарственных средств в транспортные системы доставки. Для информационного наполнения базы данных были использованы библиографические сведения о свойствах и характеристиках химических соединений и технологиях получения транспортных систем доставки лекарственных средств на основе информации из электронных библиотек PubMed и PubChem. Фрагмент одной из таблиц представлен на Рис. Рис.8. Фрагмент таблицы «Технологии получения транспортных систем доставки лекарственных средств».

При проектировании структуры базы данных были построены ER-модель (Рис.9) и реляционная модель.

описываются входят Транспортные Литературные в состав системы ссылки доставки Лекарственные Сферы использования препараты изготавливаются лекарственных входит препаратов в состав Технологии Лекарственное получения вещество влияет Рис 9. ER-модель базы данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств.

Заключение:

В диссертационной работе получены следующие результаты:

- На основе системного подхода разработана алгоритмизированная комплексная методика сбора, обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки.

- Разработана экспертно-алгоритмическая информационная система обработки информации по лекарственным средствам, снабженным транспортными системами доставки, из электронных библиотек PubMed и PubChem.

- Разработаны информационные модели системы обработки и хранения информации по лекарственным средствам, снабженным транспортными системами доставки, на основе методологий IDEF0, IDEF1X и DFD.

- Построена сетевая диаграмма, содержащая кластеры веществ, характеризующиеся общностью химической структуры или сходными биологическими свойствами, доминирующий кластер преимущественно содержал вещества, используемые для адресной доставки лекарственной субстанции при помощи какой-либо транспортной системы.

- Сформирована выборка из 2358 лекарственных соединений, которые имеют прямое или косвенное отношение к транспортной доставке лекарственных средств. Из полученной выборки обработано 972 соединения, которые разделены на две группы – 517 веществ, для которых существуют транспортные системы доставки лекарств, и 455 веществ, которые входят в состав транспортных систем доставки или являются вспомогательными агентами для синтеза таких систем.

- На основе отобранных наименований химических соединений (2358 веществ) и соответствующей им библиографии создана база литературных данных «Drug Delivery».

- Полученные результаты были использованы при проведении поисковых научно исследовательских работ по направлению «Биоинформационные технологии», по проблеме «Создание интерактивной экспертной системы для обработки научных публикаций в области систем доставки лекарств» в научно исследовательском институте биомедицинской химии имени В.Н.Ореховича РАМН.

- Составлена вербальная модель предметной области базы данных по свойствам и технологиям получения транспортных систем доставки лекарственных средств на основе информации из электронных библиотек PubMed и PubChem для прогнозирования встраивания лекарственных средств в транспортные системы доставки;

построены ER- и реляционная модели базы данных.

- Применение данной экспертно-алгоритмической системы позволяет сократить время, затрачиваемое на поиск полной информации по свойствам и технологиям получения транспортных систем доставки лекарственных средств.

Список трудов Статьи в журналах, рекомендованных ВАК для опубликования результатов диссертационных работ:

1. О.А. Угольникова, Ю.А. Демич, В.Ф. Корнюшко, А.В. Лисица.

Информационно-аналитическая система для построения базы данных по лекарственным субстанциям, снабженным транспортной системой доставки // Вопросы современной науки и практики. Университет им. В.И.

Вернадского, 2010, № 4-6 (29), с. 134-140.

2. О.А. Угольникова, Ю.А. Демич, А.В. Лисица, В.Ю. Кистанова, В.Ф.

Корнюшко, А.И. Арчаков, В.И. Швец. Использование ассоциативного анализа для обработки научных публикаций в области систем доставки лекарств. // Вестник МИТХТ, 2010, т.V, № 2, с. 91-96.

3. О.А. Угольникова, В.Ф. Корнюшко. Экспертно-алгоритмический комплекс обработки информации по лекарственным средствам, снабженным транспортными системами доставки. // Химия и химическая технология,2010, т.53, №8, с. 96-97.

Статьи и тезисы докладов:

4. О.А. Угольникова, Ю.А. Демич, А.В. Лисица. Алгоритмический подход к группированию активных соединений с использованием ассоциативного библиометрического анализа. // Алгоритмы, методы и системы обработки данных: cборник научных статей;

2009, выпуск 14, с. 184 -190.

5. О.А. Угольникова, В.И. Швец, А.В. Лисица. Создание базы знаний по свойствам, характеристикам и технологиям получения липидных систем транспорта лекарственных субстанций. // Материалы Пятого Московского международного конгресса,. М.: ЗАО «Экспо-биохим-технологии», РХТУ им. Д.И. Менделеева, 2009, Ч.2. – с.416-417.

6. О.А. Угольникова, В.И. Швец, А.В. Лисица. База знаний по свойствам и технологиям получения липидных систем транспорта лекарственных средств. // Тезисы докладов III молодежной научно-технической конференции «Наукоемкие химические технологии». Москва – 2009, с. 56.

7. О.А. Угольникова, Ю.А. Демич, А.В. Лисица, В.Ф. Корнюшко, В.И. Швец.

Использование ассоциативного анализа для обработки научных публикаций в области систем доставки лекарств. // Материалы Московской международной научно-практической конференции М.: ЗАО «Экспо-биохим-технологии», РХТУ им. Д.И. Менделеева, 2010, с. 490 491.

8. О.А. Угольникова. Применение ассоциативного анализа для обработки опубликованной информации в области систем доставки лекарств. // Материлы XIII Международной научно-технической конференции «Наукоемкие химические технологии – 2010» / ГОУВПО Иван. гос. хим. технол. ун-т Иваново, 2010, с. 231.

Подписано в печать 08.09.2010. Формат 60х84/16, бумага писчая.

Отпечатано на ризографе. Уч.-изд. л.0,9. Тираж 100 экз. Заказ № Московская государственная академия тонкой химической технологии им. М.В. Ломоносова Издательско-полиграфический центр 119571, Москва, пр. Вернадского,

 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.