авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Хамдан сейф математические модели для анализа многомерных данных в задачах экологического мониторинга

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

_

ТЕХНОЛОГИЧЕСКИЙ ИНСТИТУТ

ЮЖНОГО ФЕДЕРАЛЬНОГО УНИВЕРСИТЕТА в г. Таганроге

На правах рукописи

_ Аль-Дауяни Сауд Хамдан Сейф МАТЕМАТИЧЕСКИЕ МОДЕЛИ ДЛЯ АНАЛИЗА МНОГОМЕРНЫХ ДАННЫХ В ЗАДАЧАХ ЭКОЛОГИЧЕСКОГО МОНИТОРИНГА Специальность: 05.13.18 – Математическое моделирование, численные методы и комплексы программ

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Таганрог – 2007

Работа выполнена на кафедре Высшей математики Технологического института Южного федерального университета в г. Таганроге.

Научный руководитель: доктор физико-математических наук, профессор, Сухинов Александр Иванович (ТТИ ЮФУ, г. Таганрог)

Официальные оппоненты: доктор технических наук, доцент, Боженюк Александр Витальевич (ТТИ ЮФУ, г. Таганрог), кандидат технических наук, доцент, Никифоров Александр Николаевич (ГОУ ВПО ЮРГТУ (НПИ), г. Новочеркасск)

Ведущая организация: НИИ прикладной математики и автоматизации Кабардино-Балкарского Научного Центра РАН, г. Нальчик

Защита состоится «30» октября 2007 г. в 1420 на заседании диссертаци онного совета Д.212.208.22 в Технологическом институте Южного федераль ного университета в г. Таганроге по адресу:

347928, Ростовская обл., г. Таганрог, пер. Некрасовский, 44, ауд. Д-

С диссертацией можно ознакомиться в зональной научной библиотеке ЮФУ по адресу: г. Ростов-на-Дону, ул. Пушкинская, 148.

Отзыв на автореферат, заверенный гербовой печатью организации, просим направлять по адресу:

347928, Ростовская обл., г. Таганрог, ГСП-17А, пер. Некрасовский,

Автореферат разослан «27» сентября 2007 г.

Ученый секретарь диссертационного совета Д.212.208. доктор технических наук, профессор А.Н. Целых

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Одной из важнейших областей внедрения методов и средств автоматизированного анализа и интерпретации многомерных данных является область геоинформационных систем (ГИС) и, особенно, такого важного компонента глобальных ГИС как системы монито ринга окружающей среды. Именно в этой области, благодаря многомерности и значительному объему используемых оцифрованных данных, в полной мере наблюдаются все те недостатки систем анализа, работающих с участием че ловека, которые описаны выше.

Многомерные данные систем экологического мониторинга включают изо бражения, векторные данные, информацию о положении объектов и цифро вые модели поверхности области мониторинга. Формальные подходы к ре шению многих практических задач анализа разнотипных и неполных данных в некоторых предметных областях отсутствуют и в настоящее время, что приводит к необходимости применения методов искусственного интеллекта (ИИ). Ведущую роль в повышении коэффициента интеллектуальности систем анализа данных (Machine IQ, MIQ по L. Zadeh) играет направление, основан ное L. Zadeh и выросшее в настоящее время в теорию информационной гра нуляции (ТИГ). При этом большинство деталей практической реализации ключевых положений ТИГ в настоящее время нуждаются в теоретическом и практическом развитии.

Ведущая роль в разработке идеологической базы ТИГ принадлежит ос нователю этого направления L. Zadeh, заложившему основы ТИГ примени тельно к интеллектуальному анализу лингвистической информации. В России это направление получило развитие в работах научных школ А.Н. Мелихова и Л.С. Берштейна в Таганроге, а также А.Н. Аверкина и В.Б. Тарасова в Мо скве, И.З. Батыршина в Казани и других исследователей. За рубежом эти ис следования активно поддерживаются Y. Yao и W. Pedrycz в США, научными коллективами под руководством U. Grenander в Швеции и J. Baldwin в Вели кобритании. В области нейросетевых интеллектуальных систем базовые зада чи были решены школами А.Н. Горбаня в России и T. Poggio за рубежом. В области анализа изображений основополагающие результаты были заложены в работах школы A. Rosenfeld, а в России – школы В. Сойфера и ряда других исследователей.

Несмотря на значительные успехи в совершенствовании методов тео рии информационной грануляции как важнейшей парадигмы разработки ин теллектуальных систем, в настоящее время в области создания интеллекту альных гранулирующих систем существует ряд нерешенных задач.

Прежде всего, необходимо дальнейшее развитие теоретической базы разработки интеллектуальных систем, работающих в условиях неопределен ности в исходных данных. В задачах ГИС эта неопределенность обуславлива ется действием физических факторов в системе «океан-атмосфера» и может быть введена в проблематику ТИГ путем создания математических моделей возмущающих факторов. С точки зрения современного состояния ТИГ, необ ходимы значительные усилия для распространения имеющихся важнейших результатов в грануляции одномерных данных на случай многомерных дан ных, что приводит к ряду нетривиальных теоретических задач. Наконец, для получения эффективных систем обработки и анализа многомерных данных важнейшую роль играют задачи снижения размерности или интеллектуально го сжатия данных, также решаемые в рамках ТИГ, и создание соответствую щих задаче методов реализации подобных систем –методической базы нейро сетевых интеллектуальных систем, эффективно реализующих все указанные выше теоретические преимущества ТИГ. Для этого следует обеспечить раз работку новых архитектур нейросетевых интеллектуальных систем, бази рующихся на принципе гибридизации методик мягких вычислений в рамках единой нейросетевой структуры.



Целью диссертационной работы является разработка и исследование математических моделей физических процессов в задачах экологического мониторинга, на основе которых разрабатываются интеллектуальные систе мы для обработки и анализа многомерных данных на базе нейросетевых ар хитектур, позволяющих использовать современные результаты теории ин формационной грануляции для повышения эффективности интеллектуальной обработки и анализа многомерных данных экологического мониторинга.

Для достижения поставленной цели необходимо решить следующие задачи:

Разработка математической модели физического процесса пассивно го дистанционного мониторинга состояния поверхности моря по оптически разделимым компонентам;

Разработка математической модели физического процесса получения и предварительной обработки изображений морской поверхности (в условиях помех) с помощью цифровой аппаратуры, установленной на средневысотном спутнике;

Разработка новых типов функций активации нейронов для примене ния в нейросетевых архитектурах интеллектуального анализа многомерных данных (изображений) в условиях неопределенности;

Создание метода построения “прозрачной” для пользователя архи тектуры нейронной сети анализа многомерных данных;

Разработка эффективного алгоритма обучения гибридной сети в за дачах анализа искаженных помехами многомерных данных (низкокачествен ных и искаженных изображений);

Разработка комплекса программ в рамках заданной системы про граммирования для реализации нейросетевой системы анализа многомерных данных.

Объектом исследования в диссертационной работе являются физиче ские модели, описывающие процессы в системах пассивного зондирования морской поверхности и экологического мониторинга, а также гибридные гра нулирующие нейросетевые архитектуры, позволяющие создать эффективные комплексы программ интеллектуальной обработки и анализа изображений различных объектов, получаемых в условиях высокого уровня помех и шу мов.

Методологическую основу работы составляет подход, суть которого состоит в разработке математических моделей физических процессов распро странения и отражения световых волн и использование этих моделей в про цессе проектирования систем интеллектуальной обработки и анализа много мерных данных на основе нейросетевого подхода, а также подход, исполь зующий в процессе моделирования теорию информационной грануляции многомерных данных.

Новыми научными результатами диссертационной работы, выноси мыми на защиту, являются:

Математическая модель процесса пассивного оптического дистанци онного зондирования морской поверхности в условиях различных видов оп тических помех;

Метод интеллектуального анализа многомерных данных в условиях неопределенности, использующий теорию информационной грануляции;

Архитектура гибридной нейронной сети на основе активационных функций нового типа, выполняющей обработку многомерных данных в усло виях неопределенности с использованием грануляции данных;

Алгоритм обучения для гранулирующих гибридных нейронных сетей на основе активационных функций нового типа;

Теоретическая значимость результатов исследований заключается во введении математических моделей физических процессов мониторинга в проблематику построения систем интеллектуального анализа многомерных данных, а также в разработке нового типа гибридной интеллектуальной сис темы (в нейросетевом базисе) для анализа многомерных данных, отличаю щейся от известных тем, что для достижения нечувствительности к неопреде ленности в данных она использует математический аппарат теории информа ционной грануляции. Разработана архитектура нового типа гибридных ней росетевых систем, включающая новый вид функций активации для нейронов рабочего слоя, структуру сети и алгоритм ее обучения с использованием ме тодов теории нечетких множеств, дополняющие и расширяющие сущест вующие разработки в данной области, что подтверждает теоретическую зна чимость работы.

На базе полученных теоретических результатов возможно построение нового класса гибридных нейросетевых интеллектуальных систем, которые позволяют полностью автоматизировать процесс обработки и анализа много мерных данных с целью значительного повышения эффективности их приме нения.





Практическая ценность работы определена разработкой математиче ских моделей процессов дистанционного зондирования и обработки много мерных данных мониторинга морской поверхности в условиях помех, позво ляющих разработать новые эффективные гибридные нейросетевые архитек туры для решения задач интеллектуальной обработки и анализа такого вида данных в условиях помех и искажений. Ожидаемыми преимуществами, полу чаемыми в результате применения подобных интеллектуальных средств яв ляются: значительное уменьшение размера используемых нейронных сетей;

возможность быстрого (в режиме реального времени) переобучения (перена стройки) используемых сетей;

высокая степень понимания пользователем путей получения результатов анализа (“прозрачность” используемых методов и архитектур). Эти результаты приводят к значительному повышению эффек тивности анализа многомерных данных в процессе их оперативной обработ ки.

Реализация результатов. Результаты диссертационной работы были внедрены в Научно-образовательном эколого-аналитическом центре систем ных исследований, математического моделирования и геоэкологической безопасности Юга России в виде программного комплекса для решения задач, связанных с разработкой системы мониторинга экологического состояния Таганрогского залива Азовского моря на основе данных, полученных как не посредственными измерениями, так и с помощью космической фотосъемки региона.

Апробация работы. Научные и практические результаты, полученные в диссертации, изложены в 10 статьях и 2 тезисах докладов на всесоюзных и международных конференциях.

Основные результаты докладывались и обсуждались на следующих на учно-практических конференциях:

Десятой национальной конференции по искусственному интеллекту с международным участием КИИ-2006, Обнинск, 25-28 сентября 2006 г.

Всероссийской научной конференции “Нечеткие системы и мягкие вы числения”, НСМВ-2006, Тверь, 20-22 сентября 2006 г.

Седьмой международной научно технической конференции “Искусст венный интеллект – интеллектуальные и многопроцессорные системы -2006”, Таганрог, 12-15 сентября 2006 г.

Международной научно-технической конференции “Искусственные ин теллектуальные системы” (IEEE AIS’06), Дивноморское, 1-7 сентября 2006 г.

Международной конференции IASTED по искусственному интеллек ту “AIA 2006”, Инсбрук, Австрия, 16-19 февраля 2006 г.

Научной сессии МИФИ-2006, Москва, 23-27 января 2006 г.

Международной конференции “Искусственный интеллект. Интеллек туальные и многопроцессорные системы”, Таганрог, 20-25 сентября 2005 г.

Всероссийской конференции молодых ученых “Измерения, автома тизация и моделирование в промышленности и научных исследованиях”, Бийск, 17-22 июля 2004 г.

На ежегодных конференциях молодых ученых и аспирантов ТРТУ.

Структура диссертации. Диссертация состоит из введения, четырех тематических глав, заключения, списка использованных источников из наименований и приложений. Работа изложена на 147 страницах и содержит 41 рисунок и 12 таблиц.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы диссертации, ее новизна, практическая значимость. Дается обзор основных направлений исследования по изучаемой тематике. Сформулированы цель и задачи исследования, пред ставлены основные положения, выносимые на защиту, охарактеризована структура диссертации.

В первой главе рассматриваются оптические модели распространения света Солнца в атмосфере, которые составляют теоретическую основу моде лирования систем пассивного мониторинга поверхности Земли. Вводятся ос новные предположения и ограничения, позволяющие создать частную мате матическую модель процесса мониторинга состояния морской поверхности (с учетом специфики поведения света над морем – наличие дымки, волнения и т.д.). В результате разрабатывается обобщенная модель искажений много мерных данных пассивного оптического мониторинга (по изображениям мор ской поверхности) в зависимости от типичных метеоусловий района (по справочным данным). Разрабатывается также интеллектуальный метод оцен ки параметров физических моделей обработки многомерных данных с помо щью базы данных по метеорологии и гидрологии Азовского моря.

В работе используется уравнение переноса для восходящего излучения в приближении однократного рассеяния:

L( z, ) cos = k ( z )[ Lo [T ( z )] L( z, )]. (1) z где – зенитный угол визирования;

k ( z ) – показатель поглощения среды в точке среды z;

Lo [T ( z )] – спектральная яркость абсолютно черного тела, а T ( z ) – температура в точке z;

L( z, ) – яркость излучения в точке z. Если поверхность океана имеет коэффициент излучения и температуру T (0), то решение уравнений (1) следует искать при граничных условиях L (0, ) = Lo [T (0)] + (1 ) L (0, ) cos d L (, ) = 0. (2) и В работе используется также уравнение яркости атмосферной дымки, с учетом которого получено следующее выражение для яркости восходящего излучения на верхней границе атмосферы в приближении однократного рас сеяния:

S ( ) cos 1 L (0,, ) = 1 exp 0 + + (3) 4(cos 0 + cos ) cos cos 0 + S cos 0 p( 0, 0,, ) exp 0 + cos cos Уравнение (3) является математической основой для моделирования системы «Океан-атмосфера» (цвета моря и др.) по данным дистанционных оптического зондирования. Данные оптического зондирования представляют ся в виде неотрицательной ограниченной функции яркости, зависящей от про странственных координат источника и длины волны:

0 L ( x1, x2, ) Lmax, (4) где x1, x2 – координаты на картинной плоскости, – длина волны, а Lmax – максимальная яркость изображения. Реальные изображения чаще всего огра ничены прямоугольной областью xi [0, H i ], i = 1, 2. Поскольку все типы датчиков для оптического мониторинга обладают неравномерной спектраль ной чувствительностью S ( ), наблюдаемое изображение получается усред нением яркости (4) по диапазону [min, max ] с весовой функцией S ( ) :

max L ( x, x, ) S ( ) d.

f ( x1, x2 ) = (5) 1 min Процесс искажений изображения в устройствах мониторинга чаще всего описывают в виде реакции линейной пространственно-инвариантной двумер ной динамической системы на функцию изображения:

f (1, 2 )h( x1 1, x2 2 )d 1d 2 + c( x1, x2 ). (6) f ( x1, x2 ) = где f ( x1, x2 ) – искаженное изображение, 1, 2 – координаты на картинной плоскости, h( x1 1, x2 2 ) – функция, описывающая пространственно инвариантные искажения от прохождения через искажающую среду (функция рассеяния точки (ФРТ)). Все дефекты изображения, отличные от идеального искажения (6), объединяются в суммарное искажение, которое мы будем на зывать шумом и обозначать через c ( x1, x2 ).

Модель (6) используется для оценки различных видов искажений и шу мов, типичных для оптического мониторинга, которые возникают в результате действия неустранимых факторов атмосферы (облачность) и поверхности океана (дымка, волнение). Согласно принятой гипотезе, ФРТ чаще всего мож но представить в виде гауссовской функции от разности входных и выходных координат:

( ( x ) + ( x ) ) 2 1 1 2 h( x1 1, x2 2 ) = ae, (7) где a и – параметры искажений. В данной модели предполагается, что искажения по координатным осям не коррелированны. В диссертационной работе для определения параметров ФРТ (7) по экспериментальным данным используется метод, основанный на применении основных положений теории информационной грануляции. Этот метод применен в задаче идентификации параметров модели искажающей ФРТ. Метод основан на введении семанти ческого пространства (СП) на множествах значений параметров. Рассмотрим СП на множестве значений амплитуды a в (8), обозначенном как A, напри мер, A = [0,1], что соответствует изменению значений оптической плотности изображения в зависимости от оценки облачности. Опытные данные опреде ляют некоторое покрытие K множества A системой отрезков {L1,..., Lk }, при этом выполняются условия Li, L1... Lk = A, i = 1,..., k. Из опыта мы получаем промежуточное значение оценки амплитуды в виде некоторого интервала D, который в терминах СП является нечетким подмножеством покрытия K. Для дискретных множеств, относительная функция принадлеж ности для D будет определяться как L D rD ( Li ) = i, (8) Li D где для случая непрерывных множеств означает длину отрезка.

С использованием найденных путем дефаззификации (8) значений па раметров модели возмущений были получены оценки параметров ФРТ (7) оптической плотности облачности, позволяющие для выбранного района Азовского моря моделировать процесс искажения. Полученные в работе оцен ки параметров позволяют оценить тип и уровень мультипликативной помехи (7) в спутниковых изображениях. Для устранения влияния помех необходимо использовать представления изображений, устойчивые к структурным иска жениям. Эта задача может успешно решаться методами ТИГ.

В силу конечности размеров сенсора устройства, воспринимающего изображение, после дискретизации изображение (5) или (6) представляется в виде матрицы с положительными целыми элементами, размер которой опре деляется размерами K и M изображения:

f * [i, j ] = t, i = 1,..., K, j = 1,..., M, t {1,...,W }, (9) где максимальное количество уровней яркости изображения также ограничи вается некоторой величиной W. Важнейшей характеристикой, связывающей непрерывные данные f и их дискретную модель f * является параметр, на зываемый шагом дискретизации h 0, который связывает размеры решетки K и M для f * с размерами физического изображения H1 и H 2 для f H H K = 1 0, M = 2 0. В процессе анализа дискретизированных данных h1 h f * возможно также измерение масштаба данных путем увеличения шага дискретизации на некоторый масштабный коэффициент ( 0,1], при этом hi увеличенный шаг hi можно записать как hi = i, при этом hi hi. Такой процесс называется генерализацией данных в терминологии, принятой в ГИС, или, более широко, грануляцией данных в смысле L. Zadeh.

Введем в рассмотрение дискретную модель (9), зашумленную по (7) f * ( x1, x2 ). В соответствии с (7) будем отображать влияние помехи в виде f * ( x1, x2 ) f * ( x1, x2 ) = ( 1)i + j max, (10) где i, j – индексы текущего узла решетки, max – амплитуда аддитивной по мехи, определяемая условиями нарушения граничных условий (2).

Используя ограничения на hi и i, в работе получены оценки шага дискретизации и допустимого значения в условиях зашумления по (7) в виде:

4 2 f * hi0 max 2 f * xi ( x1, x2 )G max, i min hi0, i = 1, 2. (11) ( x1, x2 )G x 2 i где G – область изображения. Оценки (11) позволяют корректно строить сис темы интеллектуального анализа данных в условиях помех, типичных для задач экологического мониторинга.

Во второй главе рассматривается применение теории информацион ной грануляции (ТИГ) к описанию неопределенности, имеющей место в ре альных многомерных данных экологического мониторинга, формализован ных в Главе I. Для нейросетевых систем анализа многомерных данных разра батываются методики аналитического представления гранулированных мно гомерных данных с помощью операторов агрегирования многомерных дан ных, что позволяет строить новые типы активационных функций в гибридных нейронных сетях. Вводятся энтропийный критерий качества грануляции многомерных данных и на их основе предлагается метод гранулирования данных с контролируемой потерей информации.

В диссертационной работе использован подход к обработке дискретных изображений, который вместо традиционного использования функциональ ных аппроксимаций использует гранулирование в смысле ТИГ. Гранулирова ние выполняется путем выбора масштабного коэффициента по (11). В ра боте допустимые значения с находятся путем решения уравнения, своди мого к диофантову уравнению следующего вида:

h ai i + bi hi0 = d i, i = 1, 2, (12) i где ai, bi, d i – натуральные коэффициенты, а результатом решения является допустимое значение масштабирующего коэффициента. После первичного разделения производится локальная адаптация отдельных гранул к покры ваемому объекту. В результате получен адаптивный метод пространственного гранулирования, результаты которого определяются выбором по (11). Ре зультаты применения метода иллюстрируется рисунком 1.

hi hi (a) (b) Рис. 1. Результаты исходного (a) и адаптивного (b) гранулирования не определенного объекта (огрубление данных при увеличении шага hi ).

Предложенный алгоритм позволяет строить корректные с точки зрения ТИГ гранулированные представления исходных дискретных изображений.

Однако с точки зрения оптимизации представления необходим критерий ка чества гранулирования, выбор которого ранее не рассматривался в работах по применению ТИГ и введен в диссертационной работе.

Обозначим вероятности обнаружения уровней яркостей полутонового изображения (5) f * ( x1, x2 ) как p ( w), w = 0,..., W 1, где W – максимальная яркость изображения. Обозначим также уровень яркости, разделяющий объ ект мониторинга и естественный фон как T, ( T [1,W 1]. Тогда вероятно сти принадлежности пиксела объекту ( f ) или фону ( b ) запишем как G T Pf (T ) = Pf = p( w), Pb (T ) = Pb = p ( w). (13) w=0 w =T + Зависимость шенноновской энтропии для объекта и для фона (13) от параметра разделения T можно записать как G T H f (T ) = p f ( w) log 2 p f ( w), H b (T ) = pb ( w) log 2 pb ( w). (14) w =0 w =T + По (14) полная энтропия дискретного изображения (5), используемая для оценки качества гранулирования, представляется как H (T ) = H f (T ) + H b (T ). (15) Для канонического представления исходного изображения (бинарного изображения) T = 1, тогда по (13)-(15) полная энтропия бинарного изображе ния находится в виде 1 p H = H1 + H 0 = p1 log 2 log 2 (1 p1 ) (16) p Для покрытия, изображенного на рисунке 1, мы можем вычислить эн тропию объекта и фона гранулированного изображения по (16) в виде L L hik hkj K M hik h k j k =1 k = p1 = p0 =, i = 1,..., K, j = 1,..., M, (17), K M K M после чего вычислить общую энтропию гранулированного изображения по (15), (16), где L – число гранул.

Получим оценку полной энтропии H как функции коэффициента.

Количество гранул покрытия L зависит от как L = ( K ) ( M ) = 2 S (будем считать, что 1 = 2 ). Для оценки полной энтропии изображения как функции масштабного коэффициента гранулирования найдем 1 p1 () H () = p1 () log 2 log 2 (1 p1 ()). (18) p1 () Исследование поведения функции (18) показывает, что с увеличением 0.25 суммарная энтропия изображения H ( ) практически не изменяет ся. Следовательно, оценку оптимального шага сетки сверху, в дополнение к оценке снизу (11) можно вычислить как:

h hi i = 4 hi0. (19) 0, Наиболее важным свойством предложенного метода является практи чески линейный рост энтропии при уменьшении параметра. В то же время, объем хранимых данных с уменьшением уменьшается пропорционально N для N -мерных данных. Именно эта особенность предлагаемого метода оптимального гранулирования и обеспечивает значительное сжатие объема хранимых данных при умеренном росте энтропии. Применение разработан ного метода позволяет в дальнейшем значительно уменьшить размеры слоев нейросетвых структур, используемых для обработки и анализа гранулирован ных данных.

В третьей главе рассматриваются вопросы реализации основных ме тодов, полученных в предыдущих главах, в нейросетевом базисе. Обосновы вается выбор нового типа активационных функций для нейросетевых моделей анализа многомерных данных, основанный на полученных аналитических представлений гранулированных многомерных данных. Разрабатывается многослойная гибридная архитектура нейросетевых систем для решения за дач данного класса, включающая структуру сети и алгоритмы обучения как входного гранулирующего слоя, так и рабочих выходных слоев.

В работе предложена архитектура гибридных сетей на основе радиаль но-базисных функций (РБФ) нового типа, изображенная на рисунке 2.

В структуре сети, представленной на рисунке 2, гранулирующий слой обеспечивает гранулирование исходных данных на плоскости, а рабочий слой решает задачи анализа (в данном случае – классификации) и строится на базе традиционной структуры перцептрона. В диссертационной работе в качестве активационных функций используются R -функции, введенные В.Л. Рваче вым. В качестве входных данных используется набор из N пар векторов Z h = [ Ah ] в форме, Ahx = ( ah1, ah 2,…, ahn ), и Ahy = ( ahy1, ahy2,…, ahn ). Согласно x x x y ТИГ, вместо мы классифицируем гранулы с точками минимума и максима, определяемы векторами Ahx и Ahy.

Введя R -операции над векторами признаков (используется операция ) ( x1 + xh ( x1 ) 2 + ( xh ) 2 2 xh xh, где x1 и xh определяются x1 xh 2 2 2 1+ h h h h как x1 = R ( Ahx ) и xh = R ( Ahy ) ), конкретные уравнения операций вычисления h метрик реализуются в системе R1 в виде ( ) 1 max( Ahx ) min( Ahx ) Ahx min( Ahx ) + ( max( Ahx ) min( Ahx ) ), R ( Ahx ) = 2 ( ) 1 max( Ahy ) min( Ahy ) Ahy min( Ahy ) + ( max( Ahy ) min( Ahy ) ) (20) R ( Ahy ) = 2 x j = ( 2 x1j, 2 x2j,, 2 xM )T x j = ( 1 x1j, 1 x2j,, 1 xM )T 2 j 1 j Выходы сети x R1 ( 1 x1, 2 x1 ) x...

x M x M x R2 ( 1 x 2, 2 x 2 ) x...

x M.........

2 xM 1K x RK ( 1 x K, 2 x K ) x1K...

1K x M Скрытый Рабочий слой (гранулирующий) 2 K x слой M Рис. 2. Нормированный гранулирующий гибридный перцептрон.

Поскольку введенные функции (20) обладают метрическими свойства ми, т.е. их значение равно расстоянию от края модели ячейки до очередного пиксела, на их основе введен алгоритм обучения гранулирующего слоя сети, изображенной на рисунке 2:

1) Инициализация: Для гранулы задаются начальные значения векторов минимума и максимума Wh1 = (0, 0) и Wh2 = (, ) ;

2) Вычисление Wh1 = ( wh, why ) и Wh2 = ( wh 2, why 2 ), для чего находим x x Wh1 = (min( Ahx ), min( Ahy )) и Wh2 = (max( Ahx ), max( Ahy )) ;

3) Вычисление метрики R ( Ah, wh, wh ) R ( Ah, wh, wh ) :

x x x2 y y y R ( Ahx, wh, wh 2 ) R ( Ahy, why, why 2 ) = x x 1 x2 x 1 y ( ) ( ) 1 x2 1 y wh wh Ah wh + 2 ( wh wh ) 2 wh wh Ah wh + 2 ( wh wh ) x x x y2 y y y 2 Шаги 1-3 повторяются при ведении новых данных.

Данный алгоритм является конечным и выполняется за 3 шага, при этом каждый R -нейрон использует только собственные данные и не исполь зует никаких данных соседних нейронов. Следующий рисунок иллюстрирует динамику процесса грануляции (или обучения) введенного в диссертацион ной работе R -нейрона и используемую для этого поверхность R -функции (20), обладающей метрическими свойствами.

(a) (b) Рис. 3. Процесс обучения нейрона на базе R -функций – (a) и исполь зуемая для обучения поверхность R -функции (b).

В четвертой главе на основе результатов предыдущих глав разрабаты вается комплекс программ для инженерного пакета MATLAB, реализующий систему анализа спутниковых изображений в целях экологического монито ринга. С помощью разработанного программного комплекса, позволяющего эффективно решать задачи анализа многомерных данных в условиях неопре деленности (в том числе и для эффективного интеллектуального экологиче ского мониторинга поверхности моря) решен ряд практических задач в усло виях различных видов помех и искажений. Проведен ряд экспериментов по количественной оценке показателей разработанной нейросетевой интеллекту альной системы анализа данных при работе с зашумленными и искаженными изображениями, а также сравнение новой системы с известными системами обработки и анализа изображений на примере известных коммерческих про граммных средств, используемых в тех же условиях.

Для экспериментальной части диссертационной работы была выбрана в качестве рабочего слоя классифицирующая сеть представляющая собой мно гослойный перцептрон, который вместе с алгоритмами обучения и возмож ными архитектурами входит в дополнительный пакет MATLAB. Для анализа эффективности разработанной системы в сравнении со стандартными про граммными системами, представленными на рынке ПО нами был проделан ряд опытов по сравнению эффективности распознавания стандартных объек тов (символы текста) в сравнении с популярной системой распознавания тек стов FineReader компании «Бит», поскольку, с одной стороны, в настоящее время не предлагаются готовые программные системы интеллектуального анализа данных экологического мониторинга, а, с другой стороны, FineReader является в России лидером рынка ПО, предназначенного для решения узкого класса задач классификации (символов). Кроме того, FineReader также со держит некоторые подсистемы подавления шумов и обучения на примерах, что позволяет функционально отнести его к тому же классу систем, что и раз работанная система. Сравнение статистики удачных классификаций показы вает, что разработанная система обеспечивает более высокий процент удач ной классификации зашумленных изображений.

Также был проделан ряд экспериментов в сравнении с многослойным перцептроном из пакета MATLAB. Поскольку точные количественные ре зультаты применительно к объектам мониторинга получить невозможно из-за отсутствия у них выраженной формы, а также из-за наличия искажений, но сящих более сложный характер, чем обычно рассматриваемые в задачах об работки изображений, то для сравнительного исследования качества класси фикации обычных и гранулирующих нейросетевых систем была создана база, состоящая из 600 изображений разных размеров с разными уровнями зашум ленности аддитивными шумами. Также были исследованы более 100 изобра жений со структурными искажениями при разных степенях деформации (раз рыв утончения и т.д.). На следующем рисунке изображены некоторые образ цы зашумленных символов для сравнительной классификации.

Рис. 4. Образцы для классификации с помощью гранулирующих нейросете вых моделей.

На основании проделанной серии экспериментов на выборке из изображений удалось установить, что благодаря наличию гранулирующего слоя, сеть успешно решает задачу классификации с эффективностью до 90% при оптимальном выборе разбиения на гранулы. Важнейшей особенностью нового типа сети, введенной в диссертационной работе, является также то, что при изменении размера входных данных не изменяется и не переобучает ся рабочий классифицирующий слой, а качество классификации остается вы соким. При оптимальном гранулировании (которое определяет размеры пер вого, гранулирующего слоя разработанной гибридной сети) эффективность классификации зашумленных данных возрастает от 30% до 76% – это при мерно 450 изображений из 600, т.е. сеть работает примерно в 2,5 раза эффек тивнее, чем стандартный многослойный перцептрон. Благодаря использова нию порогового подхода к гранулированию, связанному с наличием нижней границы размера гранул для зашумленных данных, сеть улучшает качество классификации ещё на 15%.

Эти результаты свидетельствуют о высокой практической эффективно сти предложенных в диссертационной работе гибридных гранулирующих нейросетевых структур и алгоритмов их обучения для работы в условиях за шумления исходных данных.

Разработанный комплекс программ был использован для анализа спут никовых фотографий с целью мониторинга распространения фитопланктона в Таганрогском заливе. Следующий рисунок демонстрирует выделение облас тей концентрации фитопланктона.

(a) (b) Рис. 5. Выделенные районы концентрации планктона (a) и их гранули рованное представление (b).

Рисунок 5 демонстрирует результат оптимальной грануляции изобра жения, приводящей к сжатию объема хранимых данных. Исходное бинарное изображение 4a, полученное в результате отделения областей концентрации фитопланктона от морской воды, содержит 115600 пикселов, а после грану ляции с масштабным коэффициентом = 0, 25 (уменьшение числа ячеек сет ки в 4 раза) гранулированное изображение, представленное на рисунке 4b, содержит 7225 гранул, т.е. сжимается в 16 раз. При этом энтропия изображе ния возросла в 3,4 раза, т.е. практически линейно. Это подтверждает теорети ческие выводы о эффективности информационной грануляции, полученные в диссертационном исследовании.

Сравнение с типовой архитектурой показывает, что основными качест вами разработанных нейросетевых архитектур являются простота их реализа ции, достигаемая за счет аналитической модели реализации функции нейро на, простота настройки, достигаемая за счет раздельной настройки слоев гиб ридной сети, а также эффективность ее применения за счет совмещения в гранулирующем слое нескольких типовых функций обработки изображений.

Заключение содержит выводы о работе.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ В диссертационном исследовании получены следующие новые научные ре зультаты:

1.Математическая модель процесса пассивного оптического дистанционного зондирования морской поверхности в условиях различных видов оптических по мех;

2.Метод интеллектуального анализа многомерных данных в условиях неоп ределенности, использующий теорию информационной грануляции;

3.Архитектура гибридной нейронной сети на основе активационных функций нового типа, выполняющей обработку многомерных данных в условиях неопреде ленности с использованием грануляции данных;

4.Алгоритм обучения для гранулирующих гибридных нейронных сетей на основе активационных функций нового типа.

Основные теоретические и практические результаты работы достаточно полно отражены в следующих печатных работах:

1. С. Х. Аль-Дауяни, С.А. Бутенков, «Синергетический подход в задаче обуче ния нейронных сетей». Межвузовский сборник «Измерения, автоматизация и мо делирование в промышленности и научных исследованиях», Бийск, Алтайский ГТУ, 2004, с. 21-23.

2. С. А. Бутенков, В.В. Кривша, С. Х. Аль-Дауяни, «Оптимальное гранулиро вание многомерной информации». Журнал «Известия ТРТУ», №11, 2005, с. 35-42.

3. С. Х. Аль-Дауяни, С. А. Бутенков, «Синергетический подход к задаче гене рализации при обучении нечетких нейронных сетей для обработки изображений».

«Искусственный интеллект». Научно-теоретический журнал Национальной акаде мии наук Украины, №4, 2005, с. 319-324.

4. С. Х. Аль-Дауяни, С. А. Бутенков, «О динамической интерпретации задачи обучения нейронных сетей». В сб. трудов Научной сессии МИФИ-2006, Москва, 23-27 января 2006, т. 3, с. 78-79.

5. S. H. Al-Dhouyani, S. A. Butenkov,Vitaly V. Krivsha. “Granular Computing in Computer Image Perception: basic issues and Glass Box models”. In Proc. IASTED Conf. In Artificial Intelligence and applications “AIA 2006”, Innsbruk, Austria, February 16-18 2006, pp. 462-467.

6. С. Х. Аль-Доуяни, С. А. Бутенков, «О принципах построения оптимальных нечетких нейронных сетей». В сб. трудов Научной сессии МИФИ-2006, Москва, 23-27 января 2006, т. 3, с. 78-79.

7. С. А. Бутенков, С. Х. Аль-Доуяни, «Применение нейронных сетей для се мантической интеллектуальной сегментации». «Искусственный интеллект». Науч но-теоретический журнал Национальной академии наук Украины, №3, 2006, с. 262 270.

8. В.В. Кривша, С. Х. Аль-Дауяни, С. А. Бутенков, «Построение системы не четких отношений взаимного положения на декартовых гранулах». Сб. трудов ме ждународной научно-технической конференции «Искусственные интеллектуаль ные системы» (IEEE AIS’06), Москва, Физматлит, 2006, т.2, с. 99-105.

9. Д.С. Бутенков, С. Х. Аль-Дауяни, С. А. Бутенков, «Интеллектуальный ана лиз изображений с помощью нечетких отношений на инкапсулирующих грану лах». Сб. трудов Десятой национальной конференции по искусственному интел лекту с международным участием КИИ-2006, Обнинск 25-28 сентября 2006 г., с.

256-265.

10. С. Х. Аль-Дауяни, С. А. Бутенков, «Применение нейронных сетей в задачах гранулированной обработки многомерной информации». В сб. трудов Всероссий ской научной конференции «Нечеткие системы и мягкие вычисления», НСМВ 2006, Тверь, 20-22 сентября 2006 г., с. 216-230.

11. С. А. Бутенков, С. Х. Аль-Дауяни, «Нечеткая иерархическая кластеризация в задаче сегментации изображений с неоднородно окрашенными объектом и фо ном». Искусственный интеллект – интеллектуальные и много процессорные сис темы-2006 // Материалы Седьмой международной научно технической конферен ции Таганрог. Издательство ТРТУ, 2006, т. 3, с.110-114.

12. С. Х. Аль-Дауяни, «Нейросетевой подход в задачах гранулирования много мерной информации». VIII Всероссийская научная конференция студентов и аспи рантов // Техническая кибернетика, радиоэлектроника и системы управления. Та ганрог, 2006.

В работах, опубликованных в соавторстве, лично Аль-Дауяни С.Х.С. при надлежат следующие результаты: в [1] предложена структура гранулирующей нейросети;

в [2] введен метод локальной адаптации гранул;

в [3] разработана сис тема метрик для обучения гранулирующей сети;

в [4] исследованы свойства алго ритма обучения;

в [5] предложена концепция моделей типа «стеклянного ящика»;

в [6] описана структура метода оптимального гранулирования;

в [7] изложены осно вы введения семантического пространства для параметров модели зашумления;

в [8] предложен алгоритм дефазификации значений параметров;

в [9] разработана система операций для активационных функций нейронов, в [10] предложена гиб ридная структура гранулирующей сети, в [11] предложен алгоритм сегментации биообъектов.

Подписано к печати 27.09.07.

Формат 60х84/16. Бумага офсетная.

Офсетная печать. Усл. печ.л. – 1,2.

Тираж 100 экз. Заказ №_ Отпечатано: Издательство Технологического института Южного федерального университета в г. Таганроге ГСП, 17А, Таганрог, 28, Энгельса,

 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.