авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Pages:   || 2 |

Алгоритмические и программные средства аналитического и неразрушающего контроля параметров природной среды на основе метода выделения структур

-- [ Страница 1 ] --

На правах рукописи

Катаев Сергей Григорьевич Алгоритмические и программные средства аналитического и неразрушающего контроля параметров природной среды на основе метода выделения структур 05.11.13 Приборы и методы контроля природной среды, веществ, материалов и изделий

АВТОРЕФЕРАТ

диссертации на соискание ученой степени доктора технических наук

Томск - 2012

Работа выполнена в Томском государственном педагогическом университете и Томском государственном университете систем управления и радиоэлектронике

Научный консультант: Кориков Анатолий Михайлович, доктор технических наук, профессор, заведующий кафедрой АСУ ТУСУР Кулешов Валерий Константинович, доктор технических Официальные наук, профессор, ИНК при ФГБОУ ВПО «Национальный оппоненты:

исследовательский Томский политехнический университет», профессор кафедры физических методов и приборов контроля качества Кулижников Александр Михайлович, доктор технических наук, профессор, ФГУП «Российский дорожный научно исследовательский институт», заведующий отделением методов проектирования и экспертизы проектной документации Немирович-Данченко Михаил Михайлович, доктор физико математических наук, Томский филиал Института нефтегазовой геологии и геофизики СО РАН, ведущий научный сотрудник государственное учреждение Федеральной службы России по

Ведущая организация:

гидрометеорологии и мониторингу окружающей среды «Центральная аэрологическая обсерватория», г. Долгопрудный, Московская область.

Защита состоится 12.02.2013 г. в 15-00 на заседании совета по защите докторских и кандидатских диссертаций Д 212.269.09 при ФГБОУ ВПО «Национальный исследовательский Томский политехнический университет» по адресу: Россия, 634028, г. Томск, ул. Савиных, 7, ауд. 215 (актовый зал).

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Национальный исследовательский Томский политехнический университет»

Автореферат разослан 2012 г.

Ученый секретарь диссертационного совета к.т.н., доцент Винокуров Б.Б.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Для решения глобальных проблем, стоящих перед человечеством, необходимо иметь глубокое понимание процессов, происходящих на нашей планете. Построение реалистичных моделей, описывающих различные явления в такой сложной системе, как наша планета, требует знания множества разнообразных параметров.

Именно поэтому в настоящее время проводится большое количество измерений в режиме мониторинга, что порождает стремительный рост объемов получаемых данных. Эти данные несут в себе много скрытой информации, поскольку они, как правило, отражают совместное действие большого количества влияющих факторов. И здесь исследователи сталкиваются с серьезными трудностями, связанными, в частности, с отсутствием универсального подхода, который позволял бы получать необходимую информацию. К каждой сложной системе применяется свой набор методов исследований, зависящий от специфики рассматриваемой системы, различного рода ограничений, типа и объема имеющихся данных и, конечно, целей исследования.

Научное исследование любой системы начинается со сбора фактов и их анализа. Если отбор данных о системе проведен на основе корректных теоретических воззрений, то массив таких данных будет внутренне структурирован. И уже на этом, первом этапе, особенно при изучении сложных систем, структуризация предоставляет дополнительные возможности в осмыслении того, что предстоит изучать. Выявление информации о существующих связях, т.е., обнаружение определенных закономерностей в наборе данных – это одна из задач обработки данных;

очень полезный этап, позволяющий, в частности, сжать первоначальную информацию и представить задачу в обозримом виде, что дает возможность строить гипотезы и модели для дальнейших более глубоких исследований. Для решения подобных задач в настоящее время широко используют, наряду с обычными статистическими методами, методы многомерной статистики: факторный, дискриминантный и кластерный анализы.

Данная диссертационная работа посвящена разработке подходов, созданию методов и алгоритмов на основе предлагаемого автором метода выявления структур (МВС) для изучения сложных систем различной природы. МВС относится к классу кластерных методов, т.е., является процедурой, позволяющей либо провести разложение данных на структуры, либо обнаружить в них заранее заданные структуры. Структуры, если они существуют в данных наблюдений – это математические структуры. Они отражают совокупное проявление связей между переменными системы, которые не всегда очевидны, и по этой причине часто являются скрытыми.

Фактически МВС реализует скрытый алгоритм, присутствующий, согласно математической энциклопедии, в самом определении понятия математической структуры:

«Структуры математические – родовое название, объединяющее понятия, общей чертой которых является то, что они применимы к множествам, природа элементов которых не определена. Чтобы определить структуру, задают отношения, в которых находятся элементы множества, затем постулируют, что данные отношения удовлетворяют условиям – аксиомам структуры» (Математическая энциклопедия. – М.: Советская энциклопедия, 1985. - с. 250).

Эта формулировка и определила название метода, которое показалось автору довольно удачным, поскольку оно, кроме всего прочего, отражает главную цель кластерного анализа – поиск существующих структур.



Кластерный анализ – это обобщенное названия ряда процедур, целью которых является создание классификации, т.е. распределение объектов на небольшое число групп, которые называются кластерами, используя при этом тот или иной принцип схожести объектов по выбранной системе признаков. Кластерные методы нашли особенно широкое применение в социологии, практических геофизических исследованиях, биологии, археологии. В литературе можно встретить разнообразные названия, характеризующие, в общем, одну и ту же задачу – разбиение множества объектов, обладающих общей системой признаков, на классы. Общепринятого определения понятия кластер нет, в каждом конкретном случае исследователь вкладывает свой смысл, который зависит от специфики задачи и используемого алгоритма. Но обычно под кластером понимается совокупность точек, объединяемая в единое целое, исходя только из их положения в пространстве признаков.

Результаты, полученные автором с помощью МВС, показывают, что использование понятия структура, как совокупности точек, объединяемые в один класс не только по степени близости, но и с использованием дополнительного набора правил на отношения между ними, позволяет существенно расширить круг решаемых задач.

Согласно М.С. Олдендерферу и Р.К. Блэшфилду (Факторный, дискриминантный и кластерный анализ: пер с англ. / Дж.–О. Ким [и др.];

под ред. И. С. Енюкова. – М.: Финансы и статистика, 1989. –с.143), различные приложения кластерного анализа можно свести к четырем основным задачам:

1) разработка типологии или классификации;

2) исследование полезных концептуальных схем группирования объектов;

3) порождение гипотез на основе исследования данных;

4) проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.

Задачи, рассмотренные в данной диссертационной работе, можно отнести, главным образом, к третьему и четвертому типам и в меньшей степени ко второму. Эти задачи относятся к классу обратных задач, которые, как известно, не имеют однозначного решения за редким исключением. Каждая задача обладает своими особенностями, языком описания и областью практического применения. Естественно, что при исследовании и интерпретации полученных результатов использовались и другие методы, но МВС в той или иной модификации в качестве одного из этапов присутствует в каждой задаче. Адаптация МВС к конкретной проблеме заключается, главным образом, в выборе объектов, системы признаков для них и определении понятия структуры.

Цель работы Разработка и исследование методов и алгоритмов аналитического и неразрушающего контроля параметров природной среды на основе метода выделения структур и построение с использованием МВС программных средств для решения задач обнаружения закономерностей в экспериментальных данных геофизической и иной природы.

Основные задачи

исследований 1. Разработать алгоритмы, создать программы, реализующие выделения структур из эмпирических данных произвольной природы.

2. Разработать подход на основе МВС к исследованию периодических и непериодических полей данных.

3. Изучить с помощью предлагаемого подхода различные метеорологические поля (температуры, осадков, O3, CO2, ветра и т.д.).

4. Разработать алгоритмы и создать программы, позволяющие исследовать тепловлажностные и диэлектрические свойства пористых сред (почв и строительных материалов) при разнообразных внешних воздействиях, а также моделировать поведение отраженного от такой среды электромагнитного импульса.

5. Создать алгоритмы и программы, позволяющие обнаруживать структуру подповерхностного слоя и объекты, находящиеся в нем, а также объекты, располагающиеся за преградой из данных по электромагнитному зондированию сверхширокополосным сигналом.

6. Создать алгоритмы и программы на основе МВС, позволяющие аппроксимировать неизвестный поток событий МC-потоком.

7. Разработать на основе МВС метод, позволяющий по потоку изображений находить контур движущегося объекта.

Методологическими и теоретическими основами послужили работы:

зарубежных ученых: У. Гренандера, Н. Винера, Р. Сокэла, П. Снита, Дж.–O. Кима, Ч.У.

Мьюллера, У.Р. Клекка, М. Кендала, Э. Майники, Р. Ними, А. Стюарта, К. Фу, Э.П.

Фридмана, С.Г. Голдстейна, Дж. Д. Линдена и других;

российских ученых: С.А.Айвазяна, Э.М Браверманна, В.М. Бухштабера, И.С. Енюкова, Н.Г. Загоруйко, В.Н. Елкиной, Г.С. Лбова, Л.Д. Мешалкина, И.Б. Мучник, Г.В. Груза Р.Г.

Рейтенбаха, Ю.А. Будыко, М.С. Израэля, Е.С.Рубинштейна, С.П. Перова, А.Х. Хргиана, Л.С. Гандина, Р.Л. Каган и других.

Обозначенные в работе цели и задачи диссертационного исследования ставились и решались с применением разных методов, включая методы многомерной и обычной статистики.

Научная новизна Научной новизной обладают следующие результаты:

1. Создан метод выявления структур (МВС), позволяющий отыскивать структуры в массивах данных по заданному правилу объединения элементов в структуру. Метод и его модификации, в отличие от многих существующих, не требует априорной информации о природе исследуемых экспериментальных данных, способах их получения, а также о числе отыскиваемых структур.

2. Предложен и использован при решении задач геофизики комплексный подход к исследованию природных периодических полей, заключающийся в согласованном выполнении ряда этапов: разложения геофизических полей на составляющие, их кластеризации и компонентного анализа.

3. В задачах определения структуры подповерхностного слоя и обнаружения находящихся в нем объектов по данным электромагнитного сверхширокополосного зондирования впервые предложены оригинальные алгоритмы, являющиеся модификациями МВС.

4. Предложена алгоритмическая разновидность МВС, адаптированная к задаче построения радиоизображения объектов, находящихся за преградой, с использованием данных электромагнитного сверхширокополосного зондирования.

5. Впервые предложен подход, использующий совместное решение тепловлажностной задачи и задачи обнаружения, к решению проблемы распознавания подповерхностных объектов по данным электромагнитного сверхширокополосного зондирования. Этот подход позволяет более точно интерпретировать отраженный сигнал, поскольку учитывает зависимость формы отраженных пиков от профиля влажности в среде.

6. Впервые предложен метод, использующий идеологию выделения структур для выявления участков стационарности во входящем потоке событий. Это позволяет решать задачу аппроксимации входящего потока событий дважды стохастическим марковским потоком.

7. Для решения задачи отбора модельных деревьев впервые применен метод, в основе которого лежат базисные положения МВС, позволяющий описывать пространственно временные характеристики окружающей среды.

8. Впервые предложен алгоритм локализации фигуры человека, на основе МВС, обладающий значительно большей устойчивостью и скоростью обнаружения, при сохранении точности существующих методов.

Практическая ценность работы и реализация результатов исследования диссертационной работы определяется возможностью широкого применения методов выделения структур в различных модификациях при решении практических задач неразрушающего контроля состояния сложных систем. Они могут быть использованы при создании математического обеспечения для решения задач мониторинга окружающей среды, для геолокаторов, предназначенных для решения разнообразных задач инженерного и экологического плана, а также при разработке и исследовании систем массового обслуживания.

Созданы программы:

1. Разложения временных рядов на составляющие с последующей классификацией и компонентным анализом каждой составляющей (ICCC).

2. Для моделирования при заданных граничных условиях профилей температуры, влажности в слоистых пористых материалах (почвы, строительные материалы), построения для этих профилей модельной функции комплексной диэлектрической проницаемости, и расчета отраженного от такой структуры электромагнитного сигнала (TWES).

3. Решения задачи профилирования и обнаружения подповерхностных объектов из данных по электромагнитному зондированию сверхширокополосным сигналом (GEO).

4. Решения задачи аппроксимации входящего потока событий дважды стохастическим потоком (APFLOW).

Разработанный программный продукт ICCC используется на кафедре метеорологии ТГУ (г. Томск), экологии и природопользовании ЮГУ (г. Ханты-Мансийск) и в ИМЭКС СО РАН (г. Томск) при изучении различных метеорологических полей. В ОАО Томгипротранс (г.

Томск), ОАО Фундаментпроект (г. Москва) и РГУПС (г. Ростов-на-Дону) при решении георадиолокационных задач применяются программы интерпретации георадарных данных комплекса GEО_TWES.

Разделы работы, посвященные изучению поведения природных полей, использовались при чтении лекций студентам гуманитарных специальностей по курсу «Концепции современного естествознания» Томского государственного педагогического университета.

Апробация работы Основное содержание диссертационной работы докладывалось на:

на Сибирском Совещании по климатоэкологическому мониторингу (I, Томск 1995, III 1999, IV 2001, VI 2005), 4-ой Международной научно-технической конференции «Распространение и дифракция электромагнитных волн в неоднородных средах» (Москва, 1994), Progress in Electromagnetic Research Symposium (PIERS), (1996, Innsbruck, Austria), 3-ем Сибирском Конгрессе по прикладной и индустриальной математике, ИНПРИМ-98 (Новосибирск, 1998), Научно-практической конференции «Актуальные вопросы неврологии и нейрохирургии» (Рязань, 1999), VII-ом Международном симпозиуме «Оптика атмосферы и океана», KOREA-RUSSIA International Symposium on Science and Technology (Tomsk, 2001, 2004), Сибирском поляризационном семинаре, СибПол (Сургут, 2004), Международных конференциях по измерениям, моделированию и информационным системам для изучения окружающей среды, ENVIROMIS (Томск 2004, 2007, 2011), Conference on spatial interpolation in climatology and meteorology (Budapest, 2004), Всероссийской научно-практической конференции «Проблемы информационной безопасности государства, общества и личности», (Томск, 2005), Всероссийских симпозиумах «Радиолокационное исследование природных сред» (XXV,XXVI Санкт Петербург, 2007), 11-th international conference on ground penetrating radar (USA, Columbus Ohio, 2006), 3-ей, 5-ой, 7-ой и 8-ой международных научно-практических конференциях «Инженерная и рудная геофизика» (Геленджик, 2007, 2009, 2012;

Москва 2011), Международной конференции Ultrawideband and Ultrashort impulse signals, (UWBUSIS, Sevastopol, 2008, 2009), 2-ой Международной геолого-геофизической конференции «Тюмень – 2009» (Тюмень, 2009), 29th Annual EARSeL Symposium 2009, (Chania, Crete, Greece).

Основные защищаемые положения 1. Метод выявления структур (МВС), дающий возможность отыскивать структуры в массивах данных по заданному правилу объединения элементов в структуру, и не требующий вычисления функционала качества.

2. Комплексный подход к исследованию периодических и непериодических геофизических полей естественного и антропогенного происхождения, заключающийся в выполнении последовательности известных алгоритмов по определенным правилам.

3. Методика обработки пространственно-временных наборов данных электромагнитного сверхширокополосного зондирования, основанная на МВС, позволяющая выявлять структуры изучаемого подповерхностного слоя.

4. Методика обработки данных электромагнитного сверхширокополосного зондирования, представляющая собой алгоритмическую разновидность МВС, позволяющая проводить обнаружение объектов неизвестной природы, в том числе находящихся за преградой.

5. Методика обработки информационных потоков, базирующаяся на принципах МВС, позволяющая только по временам прихода событий аппроксимировать входящий поток МС-потоком.

6. Основанная на МВС методика обработки и анализа потока изображений, позволяющая выделять движущиеся объекты в режиме, близком к реальному времени.

Публикации По теме диссертации опубликовано 76 работ, в том числе 2 монографии, статей в изданиях, входящих в перечень ведущих рецензируемых научных журналов и изданий из списка ВАК, получено 2 патента и 3 свидетельства о регистрации программ для ЭВМ.

Структура диссертации Диссертация состоит из введения, шести глав, заключения, списка использованной литературы, включающего 284 наименования, приложения.

Содержит 355 страниц текста, 145 рисунков, 37 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность и новизна предлагаемых методов и исследований, сформулирована основная цель и решаемые задачи, общая характеристика работы, приводятся основные положения, выносимые на защиту.

В первой главе излагаются основные положения метода выделения структур, сравнение этого метода с другими методами многомерной статистики. Приводится краткий обзор методов кластерного анализа.

Метод выделения структур Пусть имеется множество объектов каждый из которых a {a1, a2,..., a M }, X X,, где X x1, x2,..., x N, – характеризуется общей системой признаков 1, 2,..., K множество основных, а – множество вспомогательных или дополнительных признаков. Исходная матрица для основных признаков: T tij. Пусть M N D d ij – матрица расстояний между объектами, построенная с использованием только M M основных признаков, задаваемых T. Можно сформулировать задачу отыскания на множестве a структур, удовлетворяющих определенному набору аксиом. Аксиомы структуры – это набор требований (ограничений), которые вытекают из цели исследования, и их можно разбить на 3 типа.

1. Тип AD. Аксиомы, сформулированные в терминах только матрицы D.

2. Тип AX. Аксиомы, являющиеся ограничениями, записанными через множество основных признаков X.

3. Тип A. Аксиомы, определенные с помощью множества вспомогательных признаков.

В этих обозначениях возможный набор аксиом можно представить в виде упорядоченной тройки следующим образом: A A, AX, AD. Ясно, что в рамках такого представления можно выделить 8 классов аксиом, в зависимости от присутствия того или иного типа.





Алгоритм выделения структур REVPAT наиболее просто может быть описан на языке теории графов. Соотнесем с каждым объектом ai, i 1,..., N вершину xi некоторого графа G ( X, E ), а каждому ребру eij ( xi, x j ) E, i, j 1,..., N, связывающему вершины xi и x j, в качестве стоимости cij припишем величину, равную расстоянию dij между соответствующими объектами в пространстве признаков: cij dij. Выделение структур возможно в двух вариантах.

Вариант 1.

Начальное состояние – полный граф. Будем последовательно удалять из графа ребра eij со значениями, большими некоторого порога d tp, получая на каждом шаге G t ( X t, E t ) t t – граф на уровне t, множество ребер которого E {eij E : cij d p }. Будем уменьшать t t* величину d p, и тогда, начиная с некоторого значения d p, исходный граф станет несвязным, появится kt подграфов (компонент связности) G1t, G2,..., Gkt t с различным числом t вершин, среди которых могут быть подграфы, состоящие из одной вершины. Повторение t процедуры дальнейшего уменьшения порогового значения d p приводит к выделению все более связных подграфов.

Вариант 2.

Начальное состояние – граф без ребер. Будем последовательно добавлять в граф ребра eij со значениями, меньшими некоторого порога d tp, получая на каждом шаге G t ( X t, E t ) множество ребер которого E t {eij E : cij d p }, состоящий из kt t – граф на уровне t, компонент связности G1t, G2,..., Gkt t с различным числом вершин.

t t Будем увеличивать величину d p. При этом число компонент связности и число t* изолированных вершин будет уменьшаться и, начиная с некоторого значения d p, исходный граф станет связным. Назовем структурой множество вершин графа, образующее на некотором шаге t компоненту связности и удовлетворяющее при этом наперед заданным аксиомам структуры (A): S { x : x X, G ( X, E );

c d pt, ( A)}. Аксиомы отражают и t t t t t цель исследования, и специфику решаемой задачи. Например, при изучении поля какой-либо метеорологической величины можно сформулировать следующее понятие структуры:

t t t t t t t S { X : G ( X, E );

R ( X ) R0, D ( X ) D0, ( x j, xk ) X, max rk rj r0 } Т.е., средняя связность поля в каждой выделяемой структуре должна быть не меньше, чем R0, среднее значение дисперсии не больше, чем D0 и при этом максимальное расстояние между объектами из одной структуры в реальном пространстве не должно превышать r0.

Введение понятия структуры и поиск именно структур отличает МВС от традиционных кластерных методов. На самом деле, любой метод кластерного анализа основывается на предположении о существовании оптимального разбиения, т.е. такого разбиения множества объектов на классы, которое удовлетворяет некоторому критерию качества, сформулированному для всего множества. Иными словами кластерные методы осуществляют разложение системы на структуры. В МВС каждая структура фиксируется по отдельности в соответствии с внешними требованиями к структуре;

полагается, что в массиве экспериментальных данных структуры могут существовать, но не обязательно массив данных должен раскладываться на структуры без остатка.

В сравнении с кластерным анализом такой подход имеет ряд преимуществ, а именно, нет проблемы выбора функционала качества, не требуется задания количества классов, кластеры могут иметь любую форму и т.д. В качестве примера работы МВС на рис. 1 и 2 отображены начальная, промежуточные и конечная стадии классификации аномальной составляющей средней месячной температуры 90 станций на азиатской территории России.

Рис. 1– Начальная стадия (слева) и появление первого класса (справа) Левая часть рисунка 1 иллюстрирует начальную стадию – практически полный граф, а в правой части - ситуация после удаления ребер с большими весами;

граф распался на компоненты связности, на Севере АТР выделился 1 класс, состоящий из 2 станций. В левой части рисунка 2 помещена практически конечная стадия выделения, связей уже очень мало.

На этой стадии видно присутствие одновременно 6-и классов, (пункты, окрашенные в разные цвета), и окончательный результат - 11 классов приведен в правой части рисунка 2.

Далее следует описание алгоритма BINREL, являющегося разновидностью МВС и метод структурного анализа MSA.

Рис. 2 – Конечная стадия классификации Вторая глава посвящена решению задачи аппроксимации входящего потока событий дважды стохастическим потоком.

В теории массового обслуживания широко исследуются системы массового обслуживания с входящим МС-потоком заявок. Обычно его исследование осуществляют в предположении, что математическая модель потока известна с точностью до определенных параметров. Как правило, относительно исследуемого потока известны лишь времена наступления событий. В связи с этим при изучении реального потока можно поставить задачу об его аппроксимации МС-потоком для дальнейшего исследования СМО уже разработанными методами. МС-потоком называется поток, интенсивность которого представляет собой кусочно-постоянный марковский процесс t, принимающий значения из конечного множества констант {1, 2,..., n }, называемых состояниями процесса t.

Длительности участков стационарности, т.е. участков, где const, есть случайные величины, распределенные по экспоненциальному закону с параметрами {1, 2,..., n } соответственно. На каждом таком интервале времени поток событий ведет себя как пуассоновский поток событий с интенсивностью i (простейший поток событий с интенсивностью i ). Переход из состояния i в состояние j осуществляется по вероятности pij p из матрицы вероятностей переходов, которая обладает свойством: pii 0.

1, ij j Очевидно, для аппроксимации наблюдаемого потока событий MC-потоком необходимо выделить в реализации наблюдаемого потока событий интервалы времени, на которых поток ведет себя как простейший, т.е. события поступают с примерно одинаковой интенсивностью.

Тем самым будут определены и моменты смены состояний. После обнаружения таких интервалов можно оценить интенсивности потока на этих интервалах, а при наличии в потоке большого числа смены состояний и интенсивности переходов, и вероятности перехода из состояния в состояние.

В данной главе предлагается метод, использующий идеологию МВС, определения параметров MC-потока, который мог бы аппроксимировать реальный поток по наблюдениям за моментами наступления событий потока. Основная характеристика потока событий – это его интенсивность, которая для простейшего потока оценивается по формуле:

(1) k / (t k 1 t 0 ).

где k- это число событий, наступивших на интервале времени от t0 до tk Таким образом, под структурой реализации МС-потока с s состояниями можно понимать последовательность времен t m переключения с одного состояния на другое. И тогда задача аппроксимации произвольного потока из N событий МС-потоком сводится к отысканию его структуры, т.е., таких t m, чтобы поток событий, приходящих за каждый интервал времени (t m, t m 1 ), являлся бы приблизительно пуассоновским. Для нахождения такой структуры предлагается воспользоваться МВС, построив матрицу расстояний D. Входящий поток можно рассматривать как совокупность объектов (событий), которые характеризуются только одним признаком – временем их наступления. В этом случае матрица T будет представлять собой столбец, размерностью N. В качестве расстояния между объектами i и j можно выбрать разность tij ti t j, либо какую-нибудь иную величину d ij, связанную с tij. Поскольку в данной задаче в качестве характеристики состояния МС-потока выступает интенсивность, определяемая согласно (1), то для отношения d ij, удобно использовать подобную оценку.

j i 1 t t, i j;

i, j 1,..., N dij j 1 i 1 (2) 0, i j;

i, j 1,..., N Определенные таким образом элементы d ij, образуют верхнетреугольную матрицу D [d ij ]N N. Тогда формализация МВС для данной задачи может быть изложена в следующей редакции. Сопоставим каждому i-му событию потока, i 1, N, вершину с тем же номером i некоторого графа G V, Е, где V множество вершин графа мощности N, а Е множество пар вершин, т.е. множество ребер графа. Стоимостью каждого ребра графа, связывающего i-ю и j-ю (ij) вершины, будем считать величину dij, т.е. соответствующий элемент матрицы D. Определение структуры можно сформулировать, исходя из понятия интервала стационарности. А именно, если группа событий с номерами i1p, i2p,..., ikp составляет участок стационарности потока с интенсивностью p, то это означает, что а) среднее значение всех ребер, связывающих между собой вершины с номерами i1p, i2p,..., ikp примерно равно интенсивности p :

dij p, (3) k (k 1) (i, j )I где I множество всевозможных упорядоченных по номерам пар из { i1p, i2p,..., ikp };

б) номера i jp, j 1, k, идут подряд, т.е. i jp i jp1 1;

в) все dij, i, j I, принадлежат, в основном, некоторому интервалу ( p, p ).

Необходимо отметить, что оценка интенсивности, полученная по всей группе событий, т.е.

(i1p, ikp ) -я компонента матрицы D, должна быть наиболее близкой к истинному p.

Изложенные соображения определяют идею алгоритма выделения участков стационарности потока. При выборе удачного интервала ( p, p ) и удалении из графа G всех ребер, стоимость которых не попадает в указанный интервал, в графе выделятся компоненты связности Gk (Vk, Ek ), соответствующие участкам стационарности, относящимся к p-му состоянию МС-потока ( Gk является подграфом графа G ). Разумно ожидать, что участку стационарности в наибольшей степени отвечает такой подграф, в котором, во-первых, максимальное число ребер, а во-вторых, каждая вершина должна быть соединена с наибольшим числом вершин, т.е. степени вершин должны быть примерно одинаковыми.

Эти требования могут быть учтены введением следующих характеристик для выделенных компонент связности Gk :

а) Степень компактности компоненты:

Nk 2 si i COMP[k ], (4) N k ( N k 1) где Nk число вершин Gk, а si степень i-ой вершины;

величина COMP k характеризует близость подграфа Gk к полному;

б) степень однородности компоненты:

Nk pi log pi i ENTR[k ], (5) log N k где pk есть отношение степени i-ой вершины компоненты Gk к величине ( N k 1) ;

характеристика ENTR k по виду напоминает формулу энтропии S случайной величины с распределением pk, i 1, N k :

Nk Nk S pk log pk, p 1. (6) k k 1 k Величина энтропии, как известно, характеризует степень однородности множества, и для заданного N k S max при pk.

Nk Будем называть элемент матрицы D {ij } чистой оценкой интенсивности потока на t, t,..., t j 1, интервале стационарности, если все события, наступившие в моменты i i принадлежат одному и тому же интервалу стационарности потока. Остальные элементы матрицы назовем ложными оценками или шумом. Если исследуемый поток пуассоновский, то все элементы матрицы D являются чистыми оценками его интенсивности. В случае МС потока матрица оценок имеет скрытую блочную структуру: на диагонали компактно в виде треугольных блоков расположены чистые оценки интенсивности. Каждый блок соответствует участку стационарности. Размеры блоков совпадают с количеством событий в соответствующем отрезке пуассоновского потока. Остальные элементы матрицы – шум.

Далее сгруппируем данные, содержащиеся в матрице оценок, в гистограмму:

nk ;

N nk (7) kh;

N k Здесь: h – шаг гистограммы;

nk – частоты, т.е. количество элементов матрицы D, значения которых принадлежат интервалу ((k - 1)h,kh];

N – количество элементов матрицы D, значения которых принадлежат интервалу (0, mh] ;

m – количество шагов гистограммы.

Из свойств оценки вытекает, что для пуассоновского потока полигон частот, при образную кривую, максимум достаточной длине реализации, представляет собой которой совпадает со значением интенсивности потока с точностью до шага гистограммы (левая часть рис.3). Если бы для МС-потока удалось выделить из матрицы оценок только те элементы, которые являются чистыми оценками, полигон частот выглядел бы как сумма образных кривых, максимумы которых совпадают с интенсивностями потока на интервалах стационарности. Наличие шумовых оценок в МС-потоке приводит к усложнению вида гистограммы (правая часть рис.3).

Процедура выделения связных компонент графа может быть описана следующим образом.

1. Задан интервал. Из графа удаляются все ребра, стоимости которых не попадают в данный интервал. Граф G разбивается на компоненты связности Gk, k 1,2,..., (в том числе изолированные вершины).

2. Интервал увеличивается. Получаются новые разбиения графа G, в которых компоненты изменяются: расширяются за счет изолированных вершин, поглощают другие компоненты. Наконец, при достижении интервалом некоторой величины граф G не разобьется на компоненты, останется связным. На множестве разбиений k-я компонента характеризуется последовательностями характеристик COMP k и ENTR k.

Рис. 3 – Полигон частот для пуассоновского потока с интенсивностью =50, состоящего из 500 событий (слева) и для MC-потока с 3-мя состояниями с интенсивностью =20,50,90 (справа) Выбирается то разбиение, для которого COMP k достигает своего локального максимума, но при этом и функция ENTR k близка к своему локальному максимуму. Те компоненты, которые этому условию удовлетворяют, считаются перспективными в смысле соответствия интервалам стационарности. Средняя стоимость ребра полученной компоненты, которая рассчитывается с учетом ранее отброшенных ребер, будет оценкой интенсивности потока для одного из состояний. Если эти оценки для разных компонент близки, то это интервалы стационарности одного состояния МС-потока.

Для выбора перспективных интервалов можно воспользоваться информацией о местоположении пиков огибающей гистограммы. Ясно, что, если события с номерами i, j ые i1, i2,..., ik, относятся к одному интервалу стационарности, значит компоненты а j {i1, N }, и при i i1, ik, а j ik 1, N, являются матрицы D при i {1,..., i1 1}, заведомо шумом. Если при удалении из матрицы D ложных оценок и повторения процедуры выделения связных компонент графа состав компонент не изменяется, то интервалы стационарности для данных состояний считаются определенными. Для устранения неоднозначности при определении границ интервалов стационарности и для оценки качества проведенной аппроксимации разработаны соответствующие критерии, основанные на критерии Пирсона.

Эффективность метода иллюстрируется рисунком 4, где приводятся «экспериментальная» матрица чистых оценок МС-потока с тремя состояниями, полученного методом имитационного моделирования, (слева) и «теоретическая» матрица оценок того же потока, построенная в результат работы алгоритма (справа).

Рис. 4 Структуры «экспериментальной» и «теоретической» матриц оценок потока с тремя состояниями Проведенное большое количество численных экспериментов и исследование реального потока событий позволяют сделать вывод о возможности аппроксимации исходного потока МС-потоком с небольшим числом состояний с помощью разработанной авторами процедуры.

В третьей главе приводятся конкретные примеры применения МВС при исследовании непериодических геофизических полей, а также излагается комплексный подход к исследованию периодических и непериодических природных полей (ПП) (температура, содержание озона, ветер и т.д.).

В начале главы рассматривается применение МВС для исследования профилей концентрации СО2 в различных регионах Земного шара с целью оценивания возможности этого метода для нахождения областей с близкими характерами поведения. В качестве исходных данных для моделирования были взяты 3-х часовые значения профилей концентрации СО2, на пространственной сетке [0.50 0.50 ] на 15 стандартных высотах. Были отобраны несколько однородных и неоднородных по свойствам подстилающей поверхности и равных по географическим размерам ареалов, находящихся на разных континентах. В каждой области располагалось по 377 точек сетки;

каждой точке был поставлен в соответствие временной ряд, составленный из суточных временных рядов (8 значений) на каждой высоте. Таким образом, в данной задаче 377 объектов и 120 признаков.

В результате применения МВС в каждой области было выделено от 20 до 40 структур (классов) с близким поведением профилей. Каждой точке, относящейся к определенному классу, приписывался типовой (средний по структуре) профиль. Средняя квадратичная ошибка такой аппроксимации по однородным районам не превышает 1%, а по D, где D – исходная дисперсия всей области. Таким образом, неоднородным – 2% от предлагаемый подход позволяет обеспечивать необходимую (заданную) точность при аппроксимации временных рядов концентрации СО2. Разбив всю поверхность Земли на несколько сотен регионов, мы тем самым сокращаем необходимый объем вычислений при восстановлении, например, спутникового сигнала в случае сетки [2.50 2.50 ], по крайней мере, на 2 порядка. На рис.5 приводится результат выделения структур для приповерхностного поля концентрации СО2. (2001 год).

Рис. 5 – Результирующее положение структур поля концентрации СО2.

Нумерация ведется отдельно для каждого полушария Далее излагается подход к исследованию периодических природных полей. Значение конкретного природного поля в пространственной точке x представляет собой непрерывно изменяющуюся величину, которая состоит как из детерминированных, так и случайных составляющих. Выбор временного интервала, по которому проводится усреднение, зависит, в первую очередь, от цели исследования. При этом уровень усреднения должен позволять, с одной стороны, получать достаточно подробную информацию, а с другой стороны, давать возможность строить обобщенную картину эволюции ПП. Использование среднемесячных значений для многих ПП вполне удовлетворяет подобным требованиям. Этот уровень усреднения, с одной стороны, позволяет выявлять достаточно тонкие тенденции изменения ПП внутри года по исследуемой территории, которые исчезают при использовании среднегодовых значений, а с другой стороны, дает возможность избежать анализа возможных артефактов, неизбежно возникающих при выборе более короткого временного периода. Предполагается, что для описания ПП следует использовать некоторую промежуточную стадию – результаты обработки экспериментальных данных, представленных в виде набора параметров, характеризующих временные ряды в каждой пространственной точке xi. Необходима математическая модель, представляющая собой набор эмпирических уравнений эволюции этих параметров и соотношений, связывающих их друг с другом. Эта модель может играть роль эксперимента при построении физических моделей, объясняющих изменения природных полей.

Предлагаемый подход к исследованию периодических ПП заключается в последовательном применении известных и используемых при анализе временных рядов, как правило, по отдельности процедур:

1) выделение из временных рядов в каждой точке пространства составляющих:

периодической, тренда и аномалии;

2) пространственную и (или) временную классификацию каждой из составляющих;

3) выявление сопряженности, как исходного поля, так и его составляющих для различных классов.

Первый этап позволяет сформировать набор понятий для сжатого описания временных рядов: среднее значение, дисперсия, фаза, параметры тренда и периодической составляющей.

При этом предполагается, что каждая из составляющих временного ряда обусловлена действием своего природного механизма в своем временном масштабе. Т.е., что значения ПП, порожденные процессами меньшего масштаба, колеблются около величин, сформированных процессами большего масштаба. Выбор вида тренда зависит от характера наблюдаемого долговременного изменения температуры. В нашем подходе в качестве тренда можно выбирать либо степенную, либо полиномиальную функцию, для оценивания параметров которой используется метод наименьших квадратов. При указанном способе разложения, составляющие исходного временного ряда не коррелированны относительно друг друга.

Дисперсия исходного ряда DT (общая дисперсия) равна сумме дисперсией составляющих.

Второй этап дает возможность определять структуру рассматриваемого поля, выделяя пространственные или временные области (классы) с близким характером эволюции.

Причем, применяя процедуру классификации для каждой из составляющих, мы тем самым можем оценить пространственные (временные) области действия каждого из природных механизмов. В данном случае классификация конкретного ПП преследует несколько целей.

Первая– разбиение исследуемого пространства на отдельные непересекающиеся области – дает возможность проводить анализ как внутри каждого класса, так и изучать взаимодействие между классами. В частности, привязка классов к ландшафтам позволяет понять роль подстилающей поверхности при формировании климата. Вторая цель – нахождение временных структур в метеоданных. Под временной структурой понимается период времени, в течение которого на всех пунктах наблюдения искомая величина изменялась примерно одинаково. Обнаружение таких временных структур является очень важной задачей;

границы выделенных временных интервалов указывают на моменты изменений климата, и в зависимости от выбора исследуемой области можно говорить либо о региональном, либо о глобальном изменении. Разбиение объектов на классы позволяет вычислить статистические характеристики исследуемого признака или признаков для каждого кластера: среднее значение, дисперсия, и т.д. Но кроме этого, каждому кластеру можно приписать и определенные структурные характеристики, зависящие только от отношений между элементами: среднее значение длины связи, ее дисперсия, изолированность и компактность кластера и т.д. Это, безусловно, полезно, т.к. дает возможность количественно сравнивать различные кластеры друг с другом по этим структурным параметрам и оценивать все разбиение в целом по результатам анализа удаленности кластеров друг от друга. В терминах длины связи обычно формулируется и критерий качества всего разбиения, который обычно называется функционалом качества.

Третий этап позволяет из анализа поведения собственных значений каждой из компонент строить типовые поля, характерные для различных сезонов, определять степень связности поля для каждого класса.

Использование предложенного подхода к описанию различных периодических (общее содержание озона (ОСО), температура) и непериодических (ветер) метеорологических полей позволило получить представление о структуре и динамике исследуемых полей. Так, зависимость амплитуды от среднего значения ОСО для периода 1997-2004 гг., изображенная на рис. 6, свидетельствует о том, что с ростом среднего значения амплитуда колебаний возрастает, причем скорость возрастания амплитуды ОСО – параметр экспоненциальной интерполирующей функции – практически не зависит от выбора временного интервала и способа наблюдения.

0,013x y = 0,5592e амплитуда (Ед.Дб) 80 R = 0, 240 290 340 390 среднее значение озона (Ед.Дб) Рис.6. – Зависимость амплитуды от среднего значения ОСО Классификация и анализ поля ОСО в северном полушарии выявили существование хорошо локализованных областей с повышенным и пониженным содержанием озона относительно среднеширотных значений, картографическое изображение которых приводится на рис.7.

- - - - Рис. 7 – Отклонения усредненных значений ОСО в каждой точке наблюдения от среднеширотных значений Появление таких областей и степень контраста, т.е., разность между максимальным и минимальным значениями в указанных областях, можно связать с временным градиентом ОСО. Так, когда ОСО нарастает, а это, в среднем, наблюдается в период с октября по февраль, контраст непрерывно возрастает, а в процессе уменьшения содержания ОСО (март сентябрь) контраст между этими областями постепенно уменьшается и, начиная с мая, практически исчезает. Максимальное значение контраста в декабре достигает довольно большой величины, порядка 160 ед. Дб, что составляет примерно 50% от среднего значения ОСО по всему Северному полушарию.

Результаты проведенных исследований позволяют говорить о существовании устойчивой структуры, состоящей из областей как повышенного, так и пониженного значения ОСО. Надо отметить, что эта закономерность выявлена и для средних значений за все годы, и для каждого года в отдельности, что позволяет высказать предположение о существовании сложного комплекса, скорее всего, природных механизмов, управляющих этим процессом.

В следующем пункте рассматриваются результаты, полученные в ходе исследования структуры ветра, при решении задачи нахождения на основе данных глобальной сети NCEP наиболее информативных районов для измерения в то или иное время года с помощью лидарной установки концентраций вулканических газов около вулкана Этна (о. Сицилия, южная Италия). Решение данной задачи связано с установлением преимущественного или наиболее вероятного направления ветра в районе вулкана на высотах максимального содержания изучаемых газов в разное время года. Фактически, это задача нахождения структуры поля ветра, усредненного за каждый месяц, по данным наблюдения. Сеть NCEP содержит 6-часовые данные основных метеорологических параметров на 17 стандартных высотах в достаточно редкой сетке. Для решения данной задачи использовался подход, сочетающий процедуру выделения структур с интерполяцией.

С применением интерполяционной процедуры Гандина по базовой сетке из 25 точек было сгенерировано дополнительно 625 точек, равномерно распределенных по исследуемой области сети, которая охватывала район примерно 100 x 100. Исследование проводилось для данных, относящихся к стандартной высоте P = 700 мбар, измеряемой в единицах давления, что соответствует обычной высоте, равной примерно 3.5 км (высота вулкана Этна составляет 3340 м). Результат интерполяции для 2003 года иллюстрируется на левом фрагменте рис. 8, где векторы отображают направление и силу ветра в каждой точке получившейся сети. Для сравнения в правой части рис. 8 приведено поведение приземного ветра.

Reference Vectors 3.14 8. Wind at P= Wind at P= April April Рис. 8– Поле, усредненного за год, полного ветра на высоте P=700 мбар (слева) и на высоте P=1000 мбар для апреля 2003 г. (справа) Далее, с применением МВС были выделены районы с приблизительно одинаковым поведением U и V компонент ветра для каждого календарного месяца и в целом для всего года. Для того чтобы выяснить наиболее вероятное направление ветра в то или иное время года были рассчитаны характеристики поля ветра отдельно для каждого месяца. На рис.9 в осях U V помещены средние значения для классов, на территории которых находится Этна, полученных в результате кластерного анализа отдельно U- и V-компонент ветра для каждого месяца (номера точек на рис.9 соответствуют номеру месяца) и для года в целом (точка №13).

Рис.9 – Положение средних значений по классам за каждый месяц в осях U и V компонент ветра Из рис. 9 видно, что в локализации точек в фазовой плоскости наблюдается определенная сезонная закономерность, а именно, точки, относящиеся к осенне-зимнему периоду (с сентября по январь) располагаются широтно в узком секторе 380 со средним значением угла, равным 2650. (За ноль считается направление на север и угол отсчитывается против часовой стрелки). Все остальные месяцы попадают во второй сезон (с февраля по август). В этот, условно «летний» сезон, ветер ориентирован больше к югу, сектор тоже достаточно узкий и составляет 520. Среднее за год значение угла, под которым направлен ветер, таким образом, равно 250.10.

посвящена рассмотрению задачи интерпретации Четвертая глава сверхширокополосного (СШП) электромагнитного сигнала, отраженного от многослойной диэлектрической структуры. Георадары или геолокаторы – получили за последние 30 лет широкое распространение в различных сферах деятельности: геологические и инженерные изыскания, дорожные, в том числе и железнодорожные, строительные работы, археологические исследования. Схематически все георадары работают по одному принципу.

Одна антенна (передающая) испускает радиосигнал, другая (приемная) принимает сигнал, отраженный от исследуемой среды. Таким образом, отраженный сигнал несет в себе информацию как о структуре подповерхностного слоя, объектах или неоднородностях находящихся в нем, так и о состоянии самой среды.

Фиксируются снятые радаром сигналы в виде радарограммы – совокупности записей сигналов, отраженных от среды и пришедших к приемной антенне в интервале времени от посылки зондирующего сигнала до конца интервала записи. На рис.10 изображена типичная радарограмма, полученная геолокатором ОКО-2 с антенной АБ-400. На ней представлены 279 отраженных сигналов, каждый длительностью 100 нс с шагом 10 см.

Рис.10 – Пример радарограммы В идеале интерпретация отраженного сигнала должна позволить восстановить в каждой точке исследуемой среды значения комплексной диэлектрической проницаемости. А зная эту функцию, можно затем высказывать предположение о происхождении той или иной неоднородности. Если создание георадаров сейчас уже не вызывает принципиальных технических трудностей, то интерпретация полученных сигналов по-прежнему является актуальной задачей. Процедура обработки радарограмм практически не автоматизирована и осуществляется интерпретатором. Главная проблема при интерпретации СШП сигнала в общем случае состоит в неоднозначности определения как положения объекта в подповерхностном слое, так и его диэлектрических свойств. Как правило, априорная информация о пространственном поведении комплексной функции диэлектрической проницаемости вмещающей среды отсутствует, и именно с этим связана основная сложность задачи корректной интерпретации отраженного сигнала. В диссертационной работе в этом случае предлагается использовать комплексный самосогласованный подход, включающий в себя:

1. Определение пространственного распределения температуры и влажности в T ( z ), W ( z ) среде с предполагаемыми свойствами при известных внешних климатических условиях и вычисление для этих распределений модельной функции комплексной диэлектрической проницаемости ( z, ). Разработанный с этой целью пакет TWES рассчитывает T ( z ), W ( z ) путем совместного решения одномерной системы нелинейных уравнений теплопроводности и диффузии для любых реальных сочетаний температуры и влажности.

2. Решение задачи обнаружения локальных подповерхностных объектов или задачи профилирования по измеренным отраженным СШП–сигналам. 3. Расчет модельного отраженного сигнала на основе полученной выше информации и сравнение его с реальным;

коррекция интерпретации с учетом всех имеющихся данных. Интерпретация основывается на закономерностях поведения отраженного сигнала (искажение формы и размытие пиков), в зависимости от степени неоднородности распределения влажности.

Для решения задачи обнаружения в случае, когда известны георадарные сигналы в узлах сетки, автором предлагается использовать алгоритмы REVPAT и BINREL.

Наличие под поверхностью объекта с другой, нежели у среды, диэлектрической проницаемостью приводит к искажению отраженного сигнала в области нахождения объекта. Если эти точки расположены компактно или демонстрируют иную пространственную закономерность, то сигналы от этой совокупности точек требуют дальнейшего исследования. Для реализации указанных алгоритмов каждая пространственная рассматривается как объект, а точка xi, i 1,..., N, в которой фиксировался сигнал, последовательность значений сигнала при временах t1, t 2,..., t M – совокупность признаков.

Таким образом, отраженный сигнал представляется в виде вектора размерности М, где М – число временных отсчетов сигнала. В данной задаче под структурой надо понимать совокупность точек, удовлетворяющих следующим требованиям: сигналы в этих точках, во первых, должны быть удалены от точек фона, а во-вторых, быть близкими друг другу.

Иными словами, при классификации точки, относящиеся к объекту, должны попасть в один класс.

Алгоритм REVPAT реализует МВС в варианте, описанном выше, т.е., разбивает все множество точек на классы, используя процедуру выделения компонент связности графа.

Последующий анализ внутриклассовых характеристик и расстояний между классами позволяет ранжировать все полученные кластеры по степени удаленности от фона.

В алгоритме BINREL не применяется процедура выделения компонент связности. В нем для отыскания индивидуальных характеристик объектов используются только бинарные отношения между ними. В результате анализа совокупности отношений каждому объекту k присваивается определенное значение функции сk, которая характеризует степень относительного контраста этого объекта. Данный алгоритм удобно применять, когда сканирование ведется по площади и есть необходимость получить представление о зондируемой среде в целом. Результаты работы BINREL представлены на рис. 11. Каждая клетка таблицы соответствует пространственной точке изучаемой среды (кирпич в сухом песке), а цифры в ячейке указывают значения с k данной точки. Георадарные измерения проводились на прямоугольном стенде, поэтому значения контраста для точек, находящихся на границах стенда, были положены равными нулю. Расстояние между точками в обоих направлениях равно 10 см. На рис. 11 серым помечены девять, компактно расположенных точек, обладающих наибольшими значениями с k. Положение этих точек соответствуют расположению кирпича на стенде.

0 0 0 0 0 0 0 0 0 0 0 11 16 16 5 0 6 9 15 12 0 8 12 10 4 0 5 6 15 15 0 25 8 14 29 30 23 5 5 9 0 25 3 33 75 109 77 35 4 7 0 25 7 44 97 128 89 36 6 8 0 21 17 36 72 98 68 32 9 14 0 49 17 18 29 24 14 8 15 19 0 58 13 8 8 7 4 8 15 17 0 42 3 8 8 7 3 7 12 16 0 0 0 0 0 0 0 0 0 0 Рис. 11 – Значения функции контраста с k для точек стенда.

(Кирпич на поверхности сухого песка) Рис. 12 иллюстрирует применение алгоритма BINREL в модельной задаче построения «радиоизображения» объектов, находящихся за стеной. Определение положения объектов в плоскости, т.е. получение своеобразной фотографии, осуществляется при обработке либо полного сигнала, либо какой-нибудь его части. На этом рисунке изображены контрастные точки, полученные при анализе алгоритмом различных частей сигнала, связанных с отражением от различных объектов, разнесенных в комнате по глубине.

Надо подчеркнуть универсальность предлагаемого подхода к обнаружению объектов и построению их «радиоизображений». При использовании данного метода в задаче обнаружения не требуется никакой информации об объектах, среде, форме и природе излучаемого сигнала.

В задаче профилирования предлагается использовать метод структурного анализа (МSА), который базируется на следующей идее. Отраженный от объекта сигнал несет в себе количественную информацию о пространственном поведении диэлектрической проницаемости и среды и объекта.

Рис 12 - «Радиоизображение» объектов, находящихся в комнате за стеной.

Все это содержится в численных значениях функции, описывающей отраженный сигнал.

При этом структура той части сигнала, которая определяется отражением от объекта или слоя, часто остается неизменной, несмотря на громадное количество возможных сочетаний характеристик среды и объекта. Структура несет в себе качественные отличия объекта и среды. Эти соображения, идеологически близкие к структурным подходам, которые используются в распознавании образов и анализе сцен, лежат в основе предлагаемого метода: отыскивать в сигналах характерные, заранее определенные структуры. В диссертационной работе структура функции задается последовательностью ее максимумов, минимумов и нулей. Для передачи структуры осуществлялась процедура кодирования.

Каждой особой точке по определенному правилу ставился в соответствие некоторый символ, что позволяет записывать функцию-сигнал в виде определенного слова – последовательности букв. Несмотря на разнообразие реальных ситуаций, количество качественных вариантов (своеобразных «генотипов»), отражающих соотношения диэлектрических проницаемостей не так велико. Например, для случая, когда среда может рассматриваться как трехслойная структура, генотипов всего четыре: 1 2 3, 1 2 3, 1 2 3, 1 2 3, где 1, 2 и 3 – диэлектрические проницаемости соответственно 1-ой, 2-ой и 3-ей сред. На рис. 13 изображены фрагменты рассчитанного сигнала, отраженного от объекта с большей диэлектрической проницаемостью, для различных вариантов распределения влажности в первом слое. На нем хорошо просматриваются отражения от передней и задней границ объекта. Ясно, что для малоразмерных объектов, при достаточно большой длительности импульса отражения от границ объекта могут слиться, что приведет к исчезновению некоторых промежуточных особенностей. Это необходимо учитывать. Но самый главный вывод – сигнал, имеющий структуру, как на рис. 13, характеризует отражение от объекта с большей диэлектрической проницаемостью. Следовательно, для широкого круга реальных ситуаций, код отраженного сигнала должен быть неизменным.

Рис. 13 – Отражение от границы с большей диэлектрической проницаемостью.

Теоретический модельный расчет.

В результате применения данного алгоритма интерпретатор получает в автоматическом режиме качественный образ (последовательность «генотипов») исследуемого участка. При этом:

1) «гены», т.е. кодовые слова, могут иметь произвольную длину (количество символов);

2) можно отыскивать только определенный «ген», соответствующий, например, промоине или подкопу;

3) можно закладывать в банк данных «гены» сложных многослойных конструкций.

Особенно удобно использовать данный подход в случае обнаружения вполне определенной неоднородности, например, пустоты. В этом случае обработка данных может проводиться без участия оператора с большой скоростью, что является весьма существенным, т.к. объемы выполняемых работ с помощью георадаров быстро растут, и, тем самым, задача автоматизации процесса обработки сигналов является сейчас необычайно актуальной. Причем, есть задачи, которые не требуют подробного и тщательного изучения исследуемой среды во всех пространственных точках;

достаточно получить только качественный результат. Примером такого типа работ могут служить радиолокационные исследования железнодорожного полотна, проводящиеся в рамках инженерно геологических изысканий с целью обнаружения «больных мест». Описанный выше самосогласованный подход с использованием МSА был применен для обработки результатов георадарного исследования участка железной дороги, которые проводили сотрудники отдела инженерной геологии (начальник отдела Сайковский А.В.) ОАО Томгипротранс Брокон С.А.

и Скворцов В.С. Распределение реальной части диэлектрической проницаемости в точках среды относительно поверхности приведено на рис. 14.

Рис. 14 – Значение реальной части диэлектрической проницаемости в точках среды относительно поверхности, пересчитанные в предположении постоянства диэлектрических проницаемостей в каждом слое Надо заметить, что применение МSА не ограничивается только задачами геолокации.

Этот метод универсален. Он дает возможность находить качественно одинаковое поведение в «количественно» различных процессах. Его можно применять либо для поиска заранее заданных структур в массиве данных, либо при классификации;

каждый класс будет содержать сигналы, обладающие одинаковым качественным поведением. Так, например, временные ряды метеопараметров в различных точках Земли могут сильно отличаться друг от друга, однако, если в какой-то период времени структуры этих «сигналов» будут одинаковыми, то имеет смысл рассматривать гипотезу о существовании общего влияющего фактора.

В пятой главе приводятся результаты исследования биологических объектов. Живые системы необычайно динамичны, обладают высокой степенью индивидуальности, и это обычно проявляется в данных измерений. Обнаруженные закономерности, особенно, если исследования касаются людей, имеют, в основном, характер только качественных тенденций.

Одна из наиболее важных задач современной науки – исследование динамики климатических параметров и прогноз состояния составляющих физико-географической среды. Прогноз климата тесно связан с реконструкцией прошлого состояния биосферы Земли. Наибольшую ценность для такого рода прогнозов имеют объекты, характеристики которых обладают тесной связью с состоянием окружающей среды. В этом плане деревья являются, наверное, наиболее подходящими объектами. Несмотря на сильную зависимость прироста от локальных особенностей, дерево является индикатором ретроспективной информации об изменениях в окружающей среде, и одной из задач дендроклиматологии является получение связи индексов прироста деревьев с климатическими переменными. В связи со значительной изменчивостью ширины годичных колец у разных деревьев выбор модельных деревьев для их дальнейшего исследования достаточно сложен и противоречив.

Обычной процедурой для этого является осреднение ширины годичных колец по нескольким деревьям, но при этом невозможно с уверенностью сказать, что «осредненное модельное дерево» отражает общие черты изменения ширины годичных колец всей совокупности деревьев данного ландшафта. По этой причине разработка метода выбора модельных деревьев для различных микроландшафтов является очень важной задачей дендроклиматологии.

Сущность предлагаемого подхода заключается в классификации с помощью МВС всей совокупности выбранных деревьев, а затем в выявлении характера сопряженности внутри каждого из выделенных классов. Материалом для исследования послужили керны сосны болотной в трех различных микроландшафтах Большого Васюганского болота. Для проведения классификации по принципу выбора наиболее похожих кернов временные ряды ширины годичных колец деревьев с разных микроландшафтов объединялись в одну совокупность (исходный массив), затем производилась стандартизация исходной совокупности. Характеристика проведенной классификации для двух массивов представлена на рисунке 15, где по оси абсцисс отложены названия кернов, по оси ординат – номер класса. Была также проведена классификация, где в качестве объекта использовались годы, а в качестве признаков – керны всех деревьев. В этом варианте выявляются временные структуры, т.е., отрезки времени за период с 1945 по 2005 гг. с близким по характеру радиальным приростом сосны. Классификации подвергались два массива – исходный и стандартизированный, и, согласно рисунку 15, эти периоды полностью совпали. При этом выделились три класса;

первый класс отмечался в течение 10 лет, второй – 22 года, при этом в течение 13 лет непрерывно, а третий класс наблюдался в течение 6 лет, и то в начале временных рядов.

Но мер класса 1945 1950 1955 1960 1965 1970 1975 1980 1985 1990 1995 2000 Годы Исходный ряд Стандартизованный ряд Рис. 15 – Распределение кернов по классам в разных микроландшафтах Реализация данного подхода, т.е., последовательного применения кластерного и компонентного анализов, позволяет устанавливать группы деревьев, характеризующихся близким по характеру развитием, а также выявлять периоды квазиодинакового роста для больших групп деревьев.

Номер класса 1-1 1-2 1-3 1-4 1-5 1-6 2-1 2-2 2-3 2-4 2-5 3-1 3-2 3-3 3-4 3-5 3- Характеристика керна Исходный ряд Стандартизированный ряд Рис.16 – Распределение по времени периодов с характерным изменением ширины годичных колец сосны болотной Следующая часть пятой главы диссертации посвящена решению задачи определения дифференциально-диагностических клинико-лабораторных критериев у больных, перенесших инсульт и имеющих депрессивное расстройство или органическое поражение центральной нервной системы (ЦНС) с психическими нарушениями. Подобные критерии позволят получить более достоверные сведения, что, в свою очередь, облегчит ранний выбор адекватной терапии и прогнозирование течения инсульта.

Инсульты являются важнейшей медико-социальной проблемой, что обусловлено их высокой долей в структуре заболеваемости и смертности населения. Инсульт рассматривается как катастрофическая реакция мозга, неконтролируемый стресс, при котором из-за нарушения взаимодействия нейротрансмиттеров могут развиться депрессивное расстройство и психические нарушения. По данным ВОЗ постинсультная депрессия развивается у 50% больных. Эмоциональные нарушения, возникающие у больного в период инсульта, серьезно сказываются на его физическом и социальном статусе, снижают качество жизни, ведут к суицидальному поведению. Известен способ дифференциальной диагностики депрессивного и психоорганического синдромов у постинсультных больных, основанный на клинической картине, который заключается в сборе анамнестических и клинических признаков и описании их в соответствии с международной классификацией.

Однако данные методы основаны на обработке клинических симптомов и признаков, таких как острое начало болезни, неравномерное течение болезни, острые психотические эпизоды.

Тестирование же больных из группы с органическим поражением ЦНС провести просто невозможно, а адекватная оценка психопатологического состояния зависит во многом от субъективного фактора (знания и опыта врача). По этой причине отсутствуют достаточно достоверные и надежные критерии диагноза степени тяжести состояния больного.

В работе предложен дополнительный способ дифференциальной диагностики депрессивных расстройств и органического поражения ЦНС у постинсультных больных.

Этот способ основан на результатах кластерного анализа и статистической обработки данных о содержании форменных элементов крови в зависимости от степени тяжести состояния больных и наличия или отсутствия у них сопутствующей депрессии. Всего было обследовано около 420 человек, разбитых на 4 группы: Органическое поражение ЦНС (П) с психическими нарушениями наблюдалось у 37 человек. Больные с разной степенью депрессии составили группу из 195 человек, а в летальную группу (Л) вошли 50 человек, умерших в острый период инсульта. Контрольная группа состояла из 137 человек. Средние значения и доверительные интервалы для каждой группы и исследуемых показателей белой крови приведены в таблице. Результаты исследования позволили сформулировать дополнительный составной критерий к оценке психического состояния постинсультных больных. Критерий основан на определении в периферической крови количества эозинофилов, базофилов и палочкоядерных нейтрофилов. При количестве эозинофилов от 1.97 до 2.52 %, базофилов от 0.12 до 0.14%, палочкоядерных нейтрофилов от 0.64 до 0.91% диагностируют депрессивное расстройство, а при количестве эозинофилов менее 1.32%, базофилов от 0.03% и меньше, палочкоядерных нейтрофилов от 1.27% и выше диагностируют органическое поражение ЦНС. Кроме этого, выявленные тенденции в поведении средних значений показателей в зависимости от степени тяжести состояния больного можно использовать для прогнозирования течения инсульта.

Таблица. Средние значения показателей белой крови и доверительные интервалы на уровне 95% надежности Группа Лейкоциты Сегменто- Лимфоциты Базофилы. Палочко- Эозино x109 ядерные % % ядерные филы нейтрофилы нейтрофилы % % %.

5,59±0,40 67,73±1,80 23,95±1,51 0,39±0,17 0,33±0,11 2,11±0, К 6,51±0,58 68,73±2,53 22,35±2,15 0,12±0,11 0,75±0,33 2,23±0, Д 7,85±1,46 68,68±5,26 22,03±5,29 0,03±0,06 1,27±0,73 1,32±0, П 12,53±1,71 78,68±3,79 9,13±1,51 0,04±0,06 6,26±3,25 0,3±0, Л Далее рассматриваются результаты изучения минерального гомеостаза у больных с острой и хронической сосудистой патологией головного мозга. Цель этого исследования – определить область гомеостаза у здоровых людей и найти, какие изменения этой области происходят у перенесших инсульт больных с депрессией и без нее. Существующие методы диагностики являются либо недостаточно информативными и специфическими для диагностики депрессивных расстройств, а также технически сложными и дорогостоящими, либо с ограниченной областью применения. Как известно, ЦНС оказывает регулирующее действие на содержание и распределение микроэлементов в тканях организма, и при возбуждении ЦНС содержание микроэлементов в крови повышается (вследствие распада белков), а при торможении происходит снижение содержания микроэлементов в крови и накопление их в тканях головного мозга. Были использованы данные обследования содержания некоторых микро- и макроэлементов в крови примерно 200 человек. Из них около 100 с депрессией (после инсульта), примерно 30 без депрессии, и в контрольную группу практически здоровых людей вошло около 40 человек. Проводилось изучение содержания в крови у людей таких микроэлементов, как алюминий, магний, свинец, цинк, медь, марганец, железо. Было получено, что у более чем половины больных с цереброваскулярной патологией отмечается снижение количества алюминия в крови:

пределы изменения от 6.67 до 29.6 мкмоль/л, тогда как в контрольной группе эти значения составляют от 20 до 55 мкмоль/л. При наличии сопутствующей депрессии уровень алюминия оказывается еще ниже: от 6.67 до 21.6 мкмоль/л. Этот факт послужил основанием для предложения дополнительного способа диагностики депрессивных расстройств у больных с острой и хронической сосудистой патологией головного мозга. В совокупности с другими методами этот способ позволяет значительно повысить информативность, что дает возможность быстро провести обследование у больных с разной степенью вербальных нарушений, выделить группы риска, назначить адекватную медицинскую коррекцию депрессивных расстройств.

В заключение главы рассматривается метод нахождения контура движущегося объекта из анализа потока изображений и определения положения центра тяжести. Это важная задача, поскольку параметры ходьбы являются индикаторами, позволяющими определить состояния пациента. Метод базируется на МВС и может быть реализован в зависимости от цели с использованием как алгоритма REVPAT, так и BINREL без какой-либо предварительной обработки данных. Результаты определения центра тяжести обоими алгоритмами разнятся незначительно. На рис.17 представлен результат обработки последовательных изображений, полученный с применением алгоритма REVPAT.

Рис. 17 – Оценки положения центра тяжести движущегося человека, полученные с помощью алгоритма REVPAT Шестая глава содержит описание структуры и основных компонент созданных программ.

Все программы написаны на языке Фортран.

Целью программного обеспечения ICCC является создание удобного, практически полностью автоматизированного пакета для проведения процедур многомерного анализа, описанных в главе 1, с массивом экспериментальных данных произвольной природы, представленным в виде таблицы типа «объект-свойство». ICCC (блок-схема на рис. 18) включает в себя следующие основные процедуры.

1. Предварительный анализ исходных данных. Выбирается вариант решения задачи, формируются аксиомы структуры.

2. Интерполяция. Для каждой заданной пользователем пространственной точки проводится интерполяция. Контроль качества интерполяции осуществляется с помощью процедуры взаимной интерполяции базисных станций.

Рис.18 – Структурная блок-схема пакета ICCC 3. Разложение на составляющие. На этом этапе выполняются следующие процедуры:

выделение тренда, заданного полиномом l-ой степени и удаление тренда из исходных временных рядов;

выделение циклической составляющей заданного периода;

образование аномальной составляющей путем удаления из исходного ряда тренда и циклической составляющих.

4. Нахождение структур. С использованием МВС отыскиваются структуры, формируется вариант «оптимального» разбиения.

5. Нахождение сопряженности полей. На этом этапе для получения количественных характеристик связности полей в каждом классе и для всего исходного поля используется метод главных компонент.

В следующем пункте главы описывается комплекс программ для анализа данных TWES_GEO (рис. 19). На этом рисунке ОИ – объект георадиолокационных исследований, БДПС – база данных параметров сред, СТРУКТУРА – структурная модель среды, АНАЛИЗ – сравнение наблюдаемого и теоретического сигналов. Фактически, TWES_GEO состоит из двух программных продуктов: TWES и GEO, которые могут применяться как совместно, так и по отдельности.

Рис. 19 – Обобщенная структурная блок-схема обработки и интерпретации георадарных данных с использованием TWES и GEO TWES предназначена для исследования поведения электромагнитного импульса в GEO слоистой среде с произвольным распределением температуры и влажности, а позволяет решать ряд задач, возникающих при георадиолокационном зондировании. TWES для заданной одномерной среды и определенных граничных условий рассчитывает путем совместного решения нелинейных уравнений теплопроводности и влагопроводности пространственные распределения температуры, влажности, комплексной функции диэлектрической проницаемости, а также отраженного от такой среды электромагнитного импульса. Пакет GEO реализует различные модификации метода выделения структур и метода структурного анализа.

Пакет программ APFLOW обеспечивает выполнение алгоритмов, описанных в главе 2, которые позволяют аппроксимировать входящий поток событий МС-потоком, с использованием только времен прихода событий. Блок-схема пакета APFLOW помещена на рис. 20.

Рис. 20 – Структурная блок-схема процедуры выделения интервалов стационарности во входящем потоке событий Пакет позволяет работать как с экспериментальным потоком, задаваемым массивом данных времен прихода событий, так и проводить исследования потока, построенного с использованием имитационной модели, генерирующей МС-поток с m состояниями ( m 5 ).

ОБЩИЕ ВЫВОДЫ Диссертация посвящена разработке и исследованию методов и алгоритмов, которые могут быть использованы для обнаружения закономерностей в экспериментальных данных геофизической и иной природы, что при изучении и контроле состояний сложных систем является одним из начальных этапов, а также построению на их основе соответствующих программных средств. Проведенные автором исследования позволили сформулировать следующие выводы.

1. Разработанная методика выделения структур (МВС) исходного поля или его компонент, по пространственным (или временным) характеристикам позволяет разбить исследуемое пространство (или период времени) на определенное число областей (интервалов времени), в которых временные ряды обладают схожим поведением.

Предложенные на основе МВС методы анализа многомерных временных рядов обеспечивают необходимую (наперед заданную) точность при их аппроксимации. Это дает возможность построить структурную модель поля метеорологического параметра и, тем самым, сжать первичную информацию без существенной потери точности. Так, структурная модель поля концентрации глобально распределенного СО2. (найденная на основе МВС) включает в себя около сотни регионов, что сокращает необходимый объем дальнейших вычислений в случае сетки [2.50 2.50 ], по крайней мере на 2 порядка.

2. Предлагаемый подход к исследованию периодических и непериодических геофизических полей, состоящий из разложения временных рядов (тренд, сезонная и аномалии) и последующей структуризации каждой из этих составляющих, дает возможность получить разнообразную информацию о системе в виде набора параметров, характеризующих результаты разложения, и параметров, связанных с описанием структуры системы. Такая информация вместе с эмпирическими функциональными зависимостями между параметрами может рассматриваться в качестве обобщенных экспериментальных данных о системе. Кроме того, получаемые закономерности могут служить основой для создания гипотез и моделей о факторах, влияющих на исследуемую величину 3. Показано, что пространственная интерполяция повышает эффективность подхода МВС, при изучении геофизических полей на редкой сетке точек. Определен минимально возможный набор вычислительных процедур (интерполяция, выделение составляющих, структуризация и компонентный анализ) для анализа периодических геофизических данных.

Получаемый в результате набор характеристик изучаемого поля обладает минимально достаточными свойствами для его описания.

4. Создан подход, на основе МВС, позволяющий решать задачи обнаружения закономерностей с непериодическими полями. Созданные в рамках подхода алгоритмы, позволяют обнаруживать структуры в исследуемой среде (отдельные объекты, находящиеся в изучаемом слое, либо располагающиеся за преградой) при георадарном зондировании.

Результаты обработки реальных геолокационных данных при автоматической обработке радарограмм показали эффективность подхода.

5. Предложенный подход выделения структур позволяет аппроксимировать неизвестный поток событий МC-потоком с применением метода нахождения интервалов стационарности, который, в отличие от существующих подходов, использует только времена поступления событий и не требует другой исходной информации о входящем потоке.

6. Показана универсальность МВС при исследовании биологических объектов, которые обладают высокой степенью индивидуальности, что сказывается на пределах изменения каждого изучаемого параметра. Для решения задачи отбора модельных деревьев и описания пространственно-временных характеристик окружающей среды применена методика, в основе которой лежат базисные положения МВС. При нахождении характеристик двигательной активности человека из потока изображений, разработанные алгоритмы позволяют перейти к режиму обработки, близкому к real-time, в отличие от известных, матричных подходов обработки изображений.

Результаты диссертационной работы показывают широкие возможности применения метода выделения структур в различных модификациях и в сочетании с другими известными методами для решения разнообразных практических задач неразрушающего контроля состояний сложных систем. Надо подчеркнуть, что все используемые варианты МВС, в отличие от многих существующих, не требуют априорной информации о природе исследуемых экспериментальных данных, способах их получения, а также о числе отыскиваемых структур. Они могут быть использованы как самостоятельный исследовательский инструмент, так и в качестве одного из блоков при создании математического обеспечения для решения задач мониторинга окружающей среды, медицины, для геолокаторов и другой геофизической аппаратуры, а также при разработке и исследовании систем массового обслуживания.

Содержание работы полностью раскрывается в следующих публикациях Публикации в периодических изданиях из списка ВАК 1. Загоскин В.В., Катаев С.Г., Тюльков Г.И., Чернышов В.Н. Исследование динамики пространственного распределения влажности, температуры и диэлектрических характеристик в капиллярно- пористых средах//Изв. Вузов "Физика".1994. № 14. С. 10-16.

2. Загоскин В.В., Катаев С.Г., Тюльков Г.И., Чернышов В.Н., Лукьянов С.П., Ильюшенко В.Н. Влияние тепловлажностных факторов на пространственное распределение диэлектрических характеристик в капиллярно-пористых средах с проводящим компонентом на сверхвысоких частотах //Изв. вузов "Физика". 1996. № 10. С. 55-62.

3. Катаев С.Г., Кусков А.И. Исследование озоновых полей над территорией России и сопредельных государств. I. Составляющие полей озона и их структура // Вестник ТГПУ.

Сер.: Естественные и точные науки. 1998. Вып. 5. С. 3-9.

4. Катаев С.Г., Кусков А.И. Исследование озоновых полей над территорией России и сопредельных государств. II. Классификация составляющих полей озона // Вестник ТГПУ. Сер.: Естественные и точные науки. 1998. Вып. 5. С. 10-17.

5. Катаев С.Г., Кусков А.И. Проблемы исследования геофизических полей // Вестник ТГПУ. Сер.: Естественные и точные науки. 2000. Вып. 2 (15). С. 21-27.

6. Беккерман Е.Н., Катаев С.Г., Катаева С.С. Об одном алгоритме распознавания МС потока //Вестник ТГУ. 2000. № 271. С. 45-49.

7. Катаев С.Г., Кусков А.И. Внутренняя структура полей температуры в Томской области //Вестник ТГПУ. Сер.: Естественные и точные науки. 2000. Вып. 2 (15). С. 33-39.



Pages:   || 2 |
 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.