авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Разработка методов автоматического определения количественных характеристик опушения листа

На правах рукописи

ГЕНАЕВ МИХАИЛ АЛЕКСАНДРОВИЧ РАЗРАБОТКА МЕТОДОВ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ КОЛИЧЕСТВЕННЫХ ХАРАКТЕРИСТИК ОПУШЕНИЯ ЛИСТА 03.01.09 Математическая биология, биоинформатика

Автореферат диссертации на соискание ученой степени кандидата биологических наук

Новосибирск 2013

Работа выполнена в лаборатории эволюционной биоинформатики и теоретической генетики Федерального государственного бюджетного учреждения науки Институт цитологии и генетики СО РАН, г. Новосибирск, Россия.

Научный консультант: кандидат биологических наук, доцент Афонников Дмитрий Аркадьевич

Официальные оппоненты: Ратушняк Александр Савельевич, доктор биологических наук, зав. лабораторией “Биомедицинская информатика” Федеральное государственное бюджетное учреждение науки Конструкторско-технологический институт вычислительной техники СО РАН, г. Новосибирск Дорогина Ольга Викторовна, доктор биологических наук, профессор, зав. лабораторией интродукции редких и исчезающих видов растений Федеральное государственное бюджетное учреждение науки Центральный сибирский ботанический сад СО РАН, г. Новосибирск Ведущее учреждение: Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования Санкт-Петербургский государственный политехнический университет, г. Санкт-Петербург

Защита диссертации состоится «_» 2013 г. на утреннем заседании диссертационного совета Д 003.011.01 по защите диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук в ИЦиГ СО РАН в конференц-зале Института по адресу:

630090, г. Новосибирск, проспект ак. Лаврентьева, 10, т./ф. (383)363-49-06, факс (383) 333-12-78, e-mail: [email protected].

С диссертацией можно ознакомиться в библиотеке ИЦиГ СО РАН.

Автореферат разослан «_» _ 2013 г.

Ученый секретарь диссертационного совета, доктор биологических наук Т.М. Хлебодарова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Одной из ключевых проблем современной биологии — изучение взаимосвязи между генотипом и фенотипом у живых организмов, в том числе растений. Для определения взаимосвязей между генотипом и фенотипом при анализе комплексных признаков применяются компьютерно-экспериментальные подходы, основанные на методе картирования генов, контролирующих количественные признаки (quantitative trait loci, QTL). Эти подходы основаны на статистическом анализе комбинаций молекулярных маркеров и фенотипических данных (Shavrukov et al., 2010;

Kearsey, 1998).

Одной из эффективных технологий, позволяющей получать массовым образом данные о последовательностях маркеров в геноме отдельно взятого организма, является секвенирование нового поколения. Эта технология ориентирована на прочитывание коротких фрагментов нуклеотидных последовательностей (30-200 п.н.), но в массовом порядке и с высокой степенью покрытия, что позволяет идентифицировать в геноме последовательности большого количества маркеров одновременно (Mardis, 2008). Таким образом, высокопроизводительное генотипирование (получение большого пула данных по ДНК-маркерам) в анализе взаимосвязи генотип фенотип сейчас не является проблемой, как это было еще 10-20 лет назад. В этой связи становится актуальным массовое получение данных по фенотипам растений. Именно поэтому область исследований в биологии, связанная с получением данных о фенотипических признаках растений в массовом порядке (высокопроизводительное фенотипирование), сейчас получает все большее развитие (Eberius et al., 2009).

Совокупность фенотипических признаков организма в последнее время стали называть «фенм» (по аналогии с геномом), а область науки, которая посвящена его анализу – феномика (Houle et al., 2010;

Furbank et al., 2011). В основе технологий высокопроизводительного фенотипирования растений лежат методы оцифровки морфологических признаков. Разработка быстрых и относительно точных методов автоматического определения фенотипических признаков необходима для проведения экспериментов по исследованию взаимосвязи генотипа и фенотипа, основанных на анализе тысяч растений (Benfey et al., 2008, Ajjawi et al., 2010;

Brachi et al., 2010).

Если ранее для фенотипирования применялись механические средства (весы, рулетка, штангенциркуль), то в настоящие время появляются технологии, позволяющие получать фенотипические характеристики в автоматическом режиме на основе методов цифровой обработки изображений. Основное преимущество таких технологий – максимальное исключение человека из процесса оценки какого либо признака. Это позволяет: (а) существенно ускорить процесс получения данных за счет автоматизации;

(б) увеличить точность оценки фенотипических параметров, устранив субъективизм и неточность измерений, присущих человеку;

(в) получать оценки новых характеристик фенотипа, наблюдение или оценка которых ранее были недоступны (например, параметры микроскопических органов растений).

Один из важных фенотипических признаков растений – опушение.

Опушение формируется совокупностью эпидермальных образований, которые называются трихомами, и имеет большое физиологическое значение для растения. Оно может защищать растение от вредителей и агрессивного воздействия окружающей среды, влияя на микроклимат вблизи поверхности листа, регулируя такие параметры как влажность, температуру. Трихомы некоторых растений могут синтезировать, накапливать и секретировать различные метаболиты (Schilmiller et al., 2008). К числу метаболитов, секретируемых трихомами, относятся терпены, производные фенилпропаноидов, метилкетоны, флавоноиды и др., часть из них используются в фармацевтике, пищевой промышленности, парфюмерии.

Таким образом, трихомы служат своеобразными «химическими фабриками» по производству ценных продуктов для биохимии и биотехнологии. Между тем в настоящие время в мире не существует технологии высокопроизводительного фенотипирования этого признака. Существующие методы оценки опушения растений или достаточно дороги и трудоемки или не дают необходимой точности.

Цель и задачи исследования. Целью работы является разработка метода автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов, и сравнительный анализ количественных характеристик опушения листа у растений яровой пшеницы и табака, как модельного растения.

Для достижения заявленной цели были поставлены следующие задачи:

1) Разработать алгоритм автоматической оценки количественных характеристик опушения листа на основе анализа цифровых микроизображений его сгибов у пшеницы и табака.

2) Создать компьютерную программу для анализа количественных характеристик опушения листа пшеницы и табака.

3) Провести массовый анализ количественных характеристик опушения листа сибирских и европейских сортов пшеницы.

4) Провести анализ взаимного расположения трихом на поверхности листа у различных сортов пшеницы.

5) Провести анализ количественных характеристик опушения листьев табака на примере линии SR1 и ее генетически-модифицированных вариантов.

6) Разработать интегрированную систему для хранения и анализа данных по взаимосвязи фенотипических признаков растения, генотипа и окружающей среды на примере пшеницы.

Научная новизна работы. В работе предложен метод автоматического определения количественных характеристик опушения листьев растений на основе анализа цифровых микроизображений их сгибов. Метод адаптирован для анализа опушения у пшеницы и табака. Данный метод реализован в программе LHDetect2, доступной в качестве web-сервиса, что впервые позволило обеспечить возможность фенотипирования растений с использованием сети Интернет. Впервые проведен массовый анализ количественных характеристик опушения листьев пшеницы для нескольких десятков сортов и выявлены их различия у сибирских и европейских сортов.

На основе анализа распределений расстояний между ближайшими трихомами выявлены различия в распределении коротких и длинных трихом на поверхности листа для 4 сортов мягкой пшеницы. Впервые проведено сравнение количественных характеристик опушения листьев растений табака Nicotiana tabacum L. линии SR1 и ее генно-модифицированных линий, несущих трансгенную конструкцию, ингибирующую экспрессию гена пролиндегидрогеназы и характеризующихся повышенным содержанием пролина. Результаты показали, что генно-модифицированные растения обладают более плотным опушением листа. Для обеспечения информационной поддержки сбора и анализа данных в селекционно генетическом эксперименте у пшеницы, разработана система WheatPGE, которая позволяет вводить и хранить фенотипические, генотипические и средовые характеристики для растений и устанавливать взаимосвязь между генотипическими и фенотипическими признаками растений и параметрами окружающей среды.

Теоретическая и практическая ценность работы. Предложенный метод позволяет оценивать такие характеристики опушения, как плотность трихом, их распределение по длинам, линейные размеры, расстояние между трихомами на поверхности листа. Это позволяет характеризовать опушение с высокой степенью детализации, недоступной прежде. Время обработки изображения программой LHDetect2 составляет менее секунды, что позволяет существенно ускорить процедуру фенотипирования растений и проводить широкомасштабные генетические эксперименты, включающие анализ десятков генотипов и сотен растений.

Массовый анализ опушения у растений 47 сортов пшеницы продемонстрировал, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

Система WheatPGE обеспечивает информационную поддержку (ввод, хранение, обработку) данных о фенотипе, генотипе и окружающей среде растений пшеницы в ходе селекционно-генетического эксперимента и доступна для работы как с персональных компьютеров, так и с мобильных устройств, что позволяет использовать ее в полевых условиях.

Основные положения, выносимые на защиту.

1) Разработанный алгоритм анализа изображений сгиба листа, реализованный в компьютерной программе LHDetect2, позволяет автоматически с высокой точностью оценивать количественные характеристики опушения листьев пшеницы и табака и обеспечивает эффективное проведение экспериментов по массовому фенотипированию этого признака.

2) Высокая точность предложенного метода при определении количественных характеристик опушения листа позволяет установить, что частичная супрессия гена пролиндегидрогеназы у трансгенных растений табака линии SR1 (Nicotiana tabacum L.), приводящая к повышению уровня пролина, сопровождается увеличением плотности опушения листьев.

3) Созданная компьютерная система WheatPGE обеспечивает информационную поддержку экспериментов по анализу взаимосвязи генотип – фенотип – окружающая среда у пшеницы.

Публикации. По материалам диссертации опубликовано 18 работ, из них 4 статьи в рецензируемых научных журналах, входящих в перечень ВАК, авторских свидетельства, 12 тезисов конференций.

Апробация работы. Работа представлена в виде устных и стендовых докладов на научных конференциях, среди которых: «Электронные библиотеки: перспективные методы и технологии, электронные коллекции.

XII Всероссийская научная конференция RCDL’2010» (2010, Казань), «VIII Всероссийская научно-практическая конференция студентов, аспирантов и молодых ученых «Молодежь и современные информационные технологии»» (2010, Томск), «XLVIII Международная научная студенческая конференция» (2010, Новосибирск), «Молодежный научный форум "ЛОМОНОСОВ 2010"» (2010, Москва), «The 7th International Conference on Bioinformatics of Genome regulation and Structure» (Новосибирск, 2010), «XVI Biotechnology Summer School» (Гданьск, 2010), International Conference «Plant Genetics, Genomics and Biotechnology» (Иркутск, 2012).

Объём и структура работы. Работа состоит из введения, обзора литературы и трех глав. Работа изложена на 141 листах, содержит 53 рисунка и 10 таблиц. Список литературы содержит 101 источник.

Личный вклад автора. Основная часть работы выполнена автором самостоятельно, в частности, разработка метода автоматического получения количественных характеристик опушения листа по изображению его сгиба и реализация этого метода в компьютерной программе LHDetect2.

Глава 1. Обзор литературы.

В обзоре литературы детально описаны функции опушения, строение трихом, существующие методы определения опушения растений.

Приводится классификация и обзор методов обработки биологических цифровых изображений, описан набор компьютерных библиотек для обработки изображений. Подчеркивается важность интеграции и структуризации информации о фенотипах, генотипах и параметрах окружающей среды. Приводятся примеры систем, решающих эту задачу для разных видов животных и растений. Описана обобщенная блок схема архитектуры такой системы.

Глава 2. Метод оценки количественных характеристик опушения листа.

Алгоритм анализа изображений сгиба листа для определения количественных характеристик опушения. Трихомы пшеницы – одноклеточные эпидермальные образования, которые идентифицируются как выросты, сужающиеся от основания (области прикрепления к поверхности листа) к вершине. Типичные микроизображения, которые получаются в результате протокола подготовки сгибов листа, приведены на рисунке 1.

Область листа Область фона Вершины Граница трихом Длина листа и фона трихом Трихомы Основания трихом Рис. 1 – Пример микроизображения сгиба листа пшеницы. На изображении хорошо видны область фона, область листа и трихомы. Для каждой трихомы можно визуально определить её вершину, основание и длину.

При анализе изображений поперечного сгиба листа можно определить следующие количественные характеристики: число трихом на изображении (характеристика плотности опушения);

длина трихом и распределение трихом по длинам (характеристики размеров трихом);

среднее значение длины трихом (характеристика среднего размера трихом);

площадь трихом на изображении (характеристика объема трихом).

Алгоритм, разработанный нами для оценок этих параметров, работает в несколько этапов:

(1) преобразование изображения в шкалу оттенков серого и удаление шумов;

(2) бинаризация изображения на области листа с трихомами и фона;

(3) построение границы между листом и фоном;

(4) выделение одиночных трихом и их групп как объектов изображения;

(5) анализ размеров и форм объектов.

Алгоритм содержит 8 параметров, включая минимальную длину трихом (min_trichome), порог интенсивности цвета между листом и фоном (T), кривизну линии контура в вершинах трихом (alpha), число пикселей границы трихомы, по которым определяется ее кривизна в области вершины (N) и др.

Предложенный алгоритм анализа числовых характеристик опушения у пшеницы реализован в программе LHDetect2, консольном приложении, написанном на языке Си с использованием библиотеки OpenCV. Программа LHDetect2 доступна так же в виде web-сервиса по адресу http://wheatdb.org/lhdetect2.

Для оценки точности определения числа трихом использовалась тестовая выборка, на каждом изображении которой мы размещали окружности с диаметром в 15 пикселей с центрами в вершинах трихом, определенных вручную. Для оригинального изображения при помощи нашего алгоритма мы идентифицировали положение вершин трихом и сравнивали их координаты с выделенными нами областями. Если вершина трихомы, определенная программой автоматически, находились в пределах отмеченных областей, то считалось, что вершина указана правильно. В этом случае для каждого из изображений можно оценить ошибку недопредсказания положения вершины fn (доля трихом на изображении, для которых автоматический метод не определил вершину в пределах заданной области), перепредсказания fp (отношение ложно указанных вершин к полному числу трихом), а так же долю правильно предсказанных трихом, tp. На основе этих значений вычисляли оценки точности pr (англ. термин precision), полноты re (англ.

термин recall) и общую F-меру точности (van Rijsbergen, 1979).

,, Чем выше F, тем меньше ошибок в идентификации трихом на изображении. В случае если все трихомы идентифицированы правильно и не идентифицировано ни одного лишнего объекта F равно 1.

Дополнительно мы оценивали среднее значение абсолютного отклонения рассчитанного программой числа трихом на изображении от числа трихом, определенного вручную (MAE, mean absolute error) и отношение ошибки MAE к числу трихом на изображении, выраженном в процентах (MAPE, mean absolute percentage error):

, где N – число тестовых изображений, ni – число трихом, определенных на изображении i вручную, n'i – число трихом, определенных компьютерным методом. Чем больше значение параметров MAE и MAPE, тем выше ошибка определения числа трихом на изображении.

Кроме того, мы оценивали коэффициент корреляции Пирсона r между числами трихом на изображении, подсчитанными LHDetect2 и вручную.

Для того чтобы определить ошибку оценки длин трихом на изображении, на тестовом наборе из 20 изображений мы вручную, при помощи программы «segmented line» из пакета ImageJ, для каждой трихомы проводили центральную линию и оценивали ее длину. Затем для каждой трихомы сравнивали это значение со значением, полученным автоматически, мерой точности служил коэффициент корреляции Пирсона.

Значения параметров алгоритма для пшеницы выбирались так, что на обучающей выборке из 76 изображений (полученных при анализе листьев от растений разных сортов, как сильно, так и слабо опушенных) максимизировалось среднее значение F-меры. Оптимизация осуществлялась автоматически методом перебора в определенном интервале значений.

Применение алгоритма для анализа опушения листа пшеницы. Для набора оптимальных параметров точность метода на тестовой выборке из изображений составила для оценок числа трихом F=0.85, MAE=3. MAPE=11.65%, r=0.986 (p0.001) (рисунок 2А), для оценок длин трихом r=0.999 (p0.001) (рис. 2Б).

Рис. 2 – A - Корреляция между автоматическим и ручным подсчетом количества трихом пшеницы;

Б – корреляция между автоматическим и ручным определением длины трихом у пшеницы.

Анализ характеристик опушения листа у растений табака. Опушение табака формируется многоклеточными секретирующими трихомами.

Типичное изображение сгиба листа табака под микроскопом, сделанное в тех же условиях, что и у пшеницы показано на рисунке 3А.

Для трихом табака характерно массивное основание. Вершина трихом – секретирующая головка овальной формы. Большинство трихом содержат одну секретирующею головку, однако встречаются трихомы на которых вблизи вершины образуются небольшие выросты на каждой из которых формируется секретирующая головка. Для анализа трихом у табака алгоритм был модифицирован за счет дополнительного параметра, учитывающего форму секретирующей головки трихом (рисунок 3Б). Оптимальные параметры определялись на обучающей выборке из 20 изображений, точность метода (F-мера) оценивалась по выборке из 53 тестовых изображений и составила 0.9, коэффициент корреляции r между ручным и автоматическим подсчетом вершин трихом составил 0.927 (p0.001).

Рис. 3 – A – Микроизображение сгиба листа табака;

Б – учет формы секретирующей головки при определении вершины трихомы. В результате модификации значения параметра N (число пикселей границы трихомы, по которым определяется ее кривизна в области вершины) последовательно увеличивается от Nmin до Nmax с шагом 1. Для каждой такой пары пикселей измеряется величина угла alphai с вершиной в тестируемом пикселе.

Если на определенном шаге alphai меньше порогового значения alpha, перебор останавливается и тестируемый пиксель считается потенциальной вершиной трихомы.

Таким образом, были разработаны алгоритмы автоматической оценки количественных характеристик опушения листьев растения по микрофотографии сгиба листа для пшеницы и табака. Создана компьютерная программа LHDetect2, реализующая эти алгоритмы;

продемонстрирована высокая точность программы при определении количества трихом и их длин у пшеницы и табака.

Глава 3. Применение метода оценки количественных характеристик опушения листа Массовый анализ характеристик опушения листа пшеницы. Для того чтобы оценить фенотипическое разнообразие опушения у пшеницы сибирских и европейских сортов мы выполнили сравнение количественных характеристик их опушения. Исследовались 47 сортов пшеницы, 30 из которых представляли растения с сильным опушением, в основном сибирской селекции, а 17 со слабым опушением. Определение количественных характеристик опушения на основе цифрового анализа микроизображений производилось с помощью программы LHDetect2. Для каждого микроизображения сгиба листа рассчитывалась гистограмма распределения трихом по длине в пределах 0–2500 мкм с шагом 31,5 мкм. На основе гистограммы для каждого изображения строился вектор n, элемент ni которого соответствовал числу трихом с длиной в интервале от 31,5·(i-1) мкм до 31,5·i мкм, i = 1, …, 80. Значения элементов n для растений одного и того же сорта усреднялись. Набор из 47 полученных таким образом векторов распределения трихом по длинам был проанализирован при помощи метода неметрического многомерного шкалирования (Oksanen, 2011).

Рис. 4 – Классификация 47 сортов пшеницы по опушению листа, полученная с помощью метода неметрического многомерного шкалирования.

Анализ позволил выделить две группы сортов, формирующих кластеры 1 и 2 (рис. 4). К первому кластеру относятся сорта, которые являются сильно опушенными, ко второму слабоопушенные, в основном, европейские сорта.

Анализ координатных осей показал, что ось Х связана с интенсивностью опушения. Мы рассчитали коэффициент корреляции Пирсона между значениями координаты X указанных сортов, средней длиной трихом, и средним числом трихом,. Эти коэффициенты значимы (p0.05) и отрицательны (r(X, )=-0.99;

r(X, )=-0.82). Это означает, что с ростом значений X наблюдается ослабление опушения.

Дополнительный анализ показал, что между средней длиной и средним числом трихом у растений в кластере 2 наблюдается значимая корреляция (r2(, )=0.80, p0.05), а для растений кластера 1 она отсутствует (r1(, )=0.06, p0.05). Это может означать, что для сортов со слабым опушением гены, контролирующие опушение, действуют как на формирование длин трихом, так и на их число. Этим же может быть обусловлен меньший разброс точек из второго кластера вдоль второй главной компоненты Y.

Проведенный анализ демонстрирует, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

Изучение взаимного расположение трихом у пшеницы. Для того чтобы охарактеризовать особенности взаимного расположения трихом на поверхности листа, программа LHDetect2 для каждой трихомы выдает расстояние вдоль границы листа от середины ее основания до середины основания ближайшей трихомы. С помощью этого метода нами были проанализированы особенности взаимного расположения коротких (длина до 100 мкм) и длинных (длина более 100 мкм) трихом вдоль границы листа у растений сорта Hong-mang-mai, линии 102/00i сорта Родина, Саратовская 29 и Голубка. Для каждого сорта по 60 изображениям строилось распределение расстояний в парах ближайших коротких и длинных трихом, оценивались их параметры, и проводилось сравнение формы этих распределений у растений одного сорта с использованием критерия Колмогорова-Смирнова. Результаты приведены в таблице 1.

Таблица 1. Сравнение распределений коротких и длинных трихом для различных сортов пшеницы. Приведено количество проанализированных пар трихом для исследуемых генотипов (Np), средние ( ) и дисперсии ( ) расстояний между ближайшими короткими и длинными трихомами, уровень значимости (p) при проверке гипотезы о равенстве распределений коротких и длинных трихом критерием Колмогорова-Смирнова.

Сорт Тип Критерий К-С Np Голубка короткие 624 153.33 145.98 p 0. длинные 588 164.17 136. Саратовская короткие 556 184.48 180.51 p 0. длинные 29 1232 89.89 89. 102/00i короткие 174 362.78 339.61 p 0. длинные 184 421.30 318. короткие Hong-mang- 999 124.70 133.49 p 0. длинные mai 549 207.09 173. Анализ продемонстрировал разнообразие распределений трихом на поверхности листа у исследованных нами генотипов пшеницы. Кроме того, было установлено, что между распределениями коротких и длинных трихом на поверхности листьев пшеницы для всех исследованных нами генотипов существуют значимые различия (таблица 1). Выявленные нами различия можно объяснить тем, что длинные трихомы располагаются в основном вдоль жилок листа.

Изучение количественных характеристик опушения листа линий табака с различным содержанием пролина. Мы исследовали количественные характеристики опушения листа трансгенных линий табака, полученных на основе сорта Petit Havana SR-1 (Nicotiana tabacum L.), далее по тексту несущие антисмысловой супрессор гена SR1, пролиндегидрогеназы (pdh). Сравнивались растения исходного сорта SR1 и трансгенные растения линий pdh5, pdh6 и pdh8 пятого поколения самоопыления (потомки трех независимых трансформантов). Трансгенные растения табака, характеризовались пониженной активностью гена pdh и повышенным содержанием пролина, по сравнению с исходным сортом SR (Кочетов и др., 2004;

Колодяжная, 2006).

Рис. 5 – Сравнение опушения листа табака трансгенных линий pdh5, pdh6, pdh8 с линией дикого типа SR1;

диаграммы A, В, Д – распределение трихом по длинам с шагом мкм.;

диаграммы Б, Г, Е – зависимость количества трихом (ось X) и их средней длины (ось Y).

Для анализа опушения одновременно срезалось по одному листу каждой линии из среднего яруса растения. В средней части каждого листа высекались два фрагмента, заключённые между радиальными жилками.

Средние данные по количеству трихом и их длины для каждого препарата, получали на основе анализа 4-х изображений. Всего было проанализировано 440 микроизображений сгиба листа табака в трех экспериментах:

64 изображения линии pdh5 и 56 изображений сорта SR1;

64 изображения линии pdh6 и 64 изображений сорта SR1;

100 изображений линии pdh8 и 92 изображения сорта SR1.

Результаты анализа этих изображений программой LHDetect2 показали, что опушение листьев генно-модифицированных линий значимо выше, чем у растений линии SR1, как показано на графиках распределения трихом по длинам и графиках зависимости между средней длиной и количеством трихом (рисунок 5). Генно-модифицированные растения обладают большим числом трихом в интервалах длин от 100 до 300 мкм.

Полученные нами результаты позволяют предположить, что повышенное содержание пролина способствует образованию большего количества трихом, которые являются морфологическим проявлением стрессоустройчивости растений. Полученные результаты согласуются данными о том, что пролин является осмолитом, уровень, которого многократно повышается в ответ на стрессовые условия окружающей среды (Babaei et al., 2010), а трихомы табака играют важную роль в устойчивости растений к абиотическим факторам среды (Harada et al, 2010).

Глава 4. Компьютерная система для анализа взаимосвязи признаков фенотипа, генотипа и параметров окружающей среды Для интеграции информации о фенотипе, генотипе и окружающей среде в селекционно-генетических экспериментах у пшеницы нами разработана система WheatPGE (http://wheatdb.org, рисунок 6А). Система служит для ввода разнородных данных о растении, их хранения, поиска и вывода для дальнейшего статистического анализа.

А Б Рис. 6 – Компьютерная система системы WheatPGE. А). Веб интерфейс системы. Б).

Схема взаимосвязи между основными разделами информации в системе WheatPGE.

Всего в текущей версии БД содержит 32 таблицы и 55 отношений между ними. Центральным объектом в эксперименте является растение. Оно характеризуется уникальным генотипом, фенотипом и местом произрастания (рисунок 6Б). Генотип растения описывается девятью таблицами. Они включают описание сорта растения или линии. Генотип связан с рядом таблиц, описывающих молекулярные маркеры. Фенотип растения описывается 15 таблицами: содержащие базовые признаки растения (длина стебля, число колосьев, общую урожайность), структуру урожая (главный и вторичные колосья), опушение листа, стадии развития растения. Место произрастания описано двумя таблицами, основная информация в которых содержит название места произрастания, широту, долготу, тип климата, климатические характеристики (среднегодовую температуру, среднегодовую влажность, средние температуры января и июля).

Блок информации, связанный с проведением эксперимента, включает две таблицы, описывающие событие, и список событий для растения. Событие содержит поле названия, типа и значения. Типичные события селекционно генетического эксперимента у пшеницы показаны на рисунке 7.

Дни 00 07 10-13 21 25 30 31 37 49 51 60-65 70 75 80- Мониторинг tС погоды Агротехнич. Внесение Опры Прополка Уборка удобрений Рыхление скивание мероприятия Фазы Посев Прорастание и всходы Кущение Выход в трубку и колошение Созревание развития Оценка опу- Измерение Оценка ка Измерения шения листа длины стебля чества зерна фенотипа Обработка данных Планирование эксперимента Рис. 7 – Общая схема селекционно-генетического эксперимента у пшеницы, представленного в виде шкалы времени. На ней отражены основные типы событий: запись данных о состоянии окружающей среды, агротехнические мероприятия, фазы развития растения и измерения параметров фенотипа.

Для автоматизации сбора информации о температуре и влажности воздуха в месте произрастания растений на основе прибора UniPing RS-485 был реализован программно-аппаратный комплекс. В режиме реального времени через Интернет этот комплекс осуществляет считывание информации с датчиков прибора и сохранение их в базе данных системы WheatPGE.

WheatPGE обеспечивает интерфейс для сбора данных в процессе селекционно-генетического эксперимента. Система позволяет загружать данные о фенотипе, как в текстовом виде, так и в виде изображений, осуществлять поиск данных и вывод их в формате CSV, удобном для дальнейшего анализа программами статистической обработки. Для удобства взаимодействия с базой данных при идентификации растений используется система QR кодов. QR-код присваивается в базе каждому растению или группе растений, может быть распечатан на плотной бумаге и прикреплен к его стеблю.

Рис. 8 – Пример QR кода, который содержит ссылку на растение в БД WheatPGE, результат считывания QR кода мобильным устройством под управлением ОС Android в программе NeoReader и переход по ссылке на страницу записи соответствующего растения.

При измерении параметров отдельного растения в процессе эксперимента достаточно с помощью мобильного устройства (например, телефона) считать прикрепленный к нему код (рисунок 8) и занести параметры в базу.

Таким образом, интерфейс системы WheatPGE позволяет сохранять информацию об измерениях фенотипов растений в ходе эксперимента непосредственно в базу данных как со стационарного компьютера в лаборатории, так и в поле, минуя записи в журналах. Это позволяет экспериментатору затрачивать меньше времени на сбор данных, обеспечивает их сохранность, доступ к данным в любой момент времени.

ВЫВОДЫ 1) Разработаны алгоритмы автоматической оценки количественных характеристик опушения листьев растения по микрофотографии сгиба листа для пшеницы и табака.

2) Создана компьютерная программа LHDetect2, реализующая эти алгоритмы;

продемонстрирована высокая точность программы при определении количества трихом и их длин у пшеницы и табака.

3) На примере анализа растений 47 сортов яровой пшеницы, имеющих различную степень опушения листа, показано, что предложенный метод позволяет количественно оценивать плотность опушения и среднюю длину трихом, четко выделять классы опушенных и неопушенных сортов и выявлять статистические зависимости между плотностью опушения и средней длиной трихом.

4) На примере анализа растений пшеницы сортов Саратовская 29, Голубка, Hong-mang-mai и линии 102/00i впервые показано, что распределения расстояний по поверхности листа между ближайшими короткими и ближайшими длинными трихомами у растений значимо различаются.

5) Впервые проведено сравнение количественных характеристик опушения листа у модельных трансгенных линий табака сорта Petit Havana SR- (SR1), несущих антисмысловой супрессор гена пролиндегидрогеназы арабидопсиса, и характеризующегося повышенным содержанием уровня пролина. Показано, что повышение содержания пролина у трансгенных линий табака сопровождается увеличением плотности опушения листа.

6) Создана интегрированная система WheatPGE для поддержки селекционно генетических экспериментов у пшеницы, которая позволяет хранить и анализировать данные по взаимосвязи фенотипических признаков растения, генотипа и окружающей среды, осуществляет автоматический мониторинг температуры и влажности воздуха в местах произрастания растений и обеспечивает доступ к работе через мобильные устройства.

Список работ, опубликованных по теме диссертации.

1. Genaev М.А., Doroshkov A.V., Pshenichnikova T.A., Kolchanov N.A., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image-processing technique // Planta, 2012, N 236, 1943 1954.

2. Генаев М.А., Дорошков А.В., Пшеничникова Т.А., Морозова Е.В., Симонов А.В., Афонников Д.А. Информационная поддержка селекционно генетического эксперимента у пшеницы в системе WheatPGE. // Математическая биология и биоинформатика. 2012. Т. 7. № 2. С. 410–424.

3. Генаев М.А., Дорошков A.В., Морозова Е.В. и др. Компьютерная система WheatPGE для анализа взаимосвязи фенотип–генотип–окружающая среда у пшеницы // Вавиловский журнал генетики и селекции. 2011. Т. 15. С. 784– 793.

4. Кочетов А.В., Смирнова О.Г., Ибрагимова С.М., Рассказов Д.А., Афонников Д.А., Генаев М.А., Дорошков А.В., Пшеничникова Т.А., Симонов А.В., Морозова Е.В. Информационный портал "Биотехнология растений" Интернет ресурс для поддержки экспериментов в области генной инженерии растений, генетики и селекции пшеницы // Вавиловский журнал генетики и селекции, 2012 Т. 16 № 4/1 C. 838–848.

5. Генаев М.А., Дорошков А.В., Афонников Д.А. (2012) Программа автоматического определения количественных характеристик опушения листа (ОЛДетект2). // Свидетельство о регистрации программы для ЭВМ N 2012612357 от 5.03.2012, дата приоритета 17.11.2011.

6. Генаев М.А., Дорошков А.В., Афонников Д.А. (2010) База данных для анализа взаимосвязей генотип-фенотип-окружающая среда у пшеницы (ВитПГЕ). Свидетельство о регистрации базы данных N 2010620602 от 23.10.2010, дата приоритета 30.06. 7. Genaev M.A., Doroshkov A.V., Pshenichnikova T.A., Afonnikov D.A. Extraction of quantitative characteristics describing wheat leaf pubescence with a novel image processing technique // Proc. of the 2nd International Conference "Plant Genetics, Genomics and Biotechnology", Иркутск, 2012.

8. Genaev M.A., WheatPGE : a system for analysis of phenotypic, genotypic and environmental relationships in wheat // XVI Biotechnology Summer School, Gdansk, Poland, 2010.

9. Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A.. Analysis of leaf hairiness morphology wheat: computational approaches using image processing technique. // Proc. of the International Conference “Wheat Genetics Resources and Genomics” Новосибирск, 2011.

10.Afonnikov D.A., Doroshkov A.V., Genaev M.A., Pshenichnikova T.A. High througput phenotyping approach to analysis of the leaf hairiness in wheat // Proc.

of the International Conference “Wheat Genetics Resources and Genomics” Новосибирск, 2011.

11.Doroshkov A., Genaev M., Pshenichnikova T., Afonnikov D. Analysis of leaf hairiness in wheat Triticum aestivum L. using image processing technique // Proc.

of European Conference on Mathematical and Theoretical Biology, Krakow, Poland, 12.Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A. Analysis of leaf hairiness in wheat Triticum aestivum L. using the high throughput phenotyping approach // Proc. of the International Conference “Plant Genetics, Genomics, and Biotechnology, Новосибирск, 2010.

13.Doroshkov A.V., Genaev M.A., Pshenichnikova T.A., Afonnikov D.A. Using a computer-base image processing technique in genetic analysis of leaf hairiness in wheat Trticum aestivum L. // Proc. of the 7th International Conference on Bioinformatics of Genome regulation and Structure, Новосибирск, 2010.

14.Афонников Д.А. Дорошков А.В., Генаев М.А. Анализ морфологии опушения листа у пшеницы: компьютерный подход с использованием анализа изображений // Тезисы. Российско-Французский семинар "Геномика, биоинформатика и моделирование в науках о жизни", Новосибирск, 2010.

15.Дорошков А.В., Генаев М.А., Пшеничникова Т.А., Афонников Д.А. Методы компьютерного анализа в исследовании опушения листа пшеницы Triticum aestivum L. // Тезисы. VIII Всероссийской научно-практической конференции студентов, аспирантов и молодых ученых "Молодежь и современные информационные технологии" Томск, 2010.

16.Генев М.А., Дорошков А.В. Визуализация схем скрещивания пшеницы в рамках разработки системы WheatDB // Тезисы. XLVIII Международная научная студенческая конференция "Студент и научно- технический прогресс", Новосибирск, 2010.

17.Генаев М.А., Дорoшков А.В., Афонников Д.А. WheatPGE — система анализа взаимосвязей фенотип-генотип-окружающая среда у пшеницы // Тезисы.

Молодежный научный форум "ЛОМОНОСОВ - 2010", Москва, 2010.

18.Генаев М.А., Дорoшков А.В., Афонников Д.А. WheatPGE - компьютерная система анализа взаимосвязи признаков фенотипа генотипа и окружающей среды у пшеницы // Тезисы. Электронные библиотеки: перспективные методы и технологии, электронные коллекции. XII Всероссийская научная конференция RCDL'2010, Казань, 2010.

Благодарности. Автор выражает искреннюю благодарность руководителю диссертации к.б.н. Афонникову Д.А., соавторам и коллегам по работе – к.б.н.

Дорошкову А.В., к.б.н. Пшеничниковой Т.А., к.б.н. Ибрагимовой С.М., Морозовой Е.В. за предоставление биологического материала, консультации, ценные советы и за помощь в биологической интерпретации результатов.



 




 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.