авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Сравнительный анализ морфологических методов интерпретации изображений

На правах рукописи

Кирнос Эдуард Анатольевич СРАВНИТЕЛЬНЫЙ АНАЛИЗ МОРФОЛОГИЧЕСКИХ МЕТОДОВ ИНТЕРПРЕТАЦИИ ИЗОБРАЖЕНИЙ 05.13.18 Математическое моделирование, численные методы и комплексы про грамм

Автореферат диссертации на соискание ученой степени кандидата физико-математических наук

Москва 2004

Работа выполнена на кафедре компьютерных методов физики физического фа культета Московского государственного университета им. М. В. Ломоносова

Научный консультант: доктор физико-математических наук, профессор Пытьев Юрий Петрович

Официальные оппоненты: доктор физико-математических наук, профессор Голубцов Петр Викторович кандидат физико-математических наук Синько Олег Валентинович

Ведущая организация: МЭИ (технический университет), г. Москва

Защита диссертации состоится “_” 2004 г. в _ час. мин. на заседании Диссертационного совета К 501.001.17 в Московском государственном университете им. М. В. Ломоносова по адресу: 119992, г. Москва, ГСП-2, Ленин ские горы, дом 1, строение 2, МГУ, Физический факультет, аудитория.

С диссертацией можно ознакомиться в библиотеке физического факультета МГУ им. М.В. Ломоносова.

Автореферат разослан “_” 2004 г.

Ученый секретарь диссертационного совета доктор физико-математических наук, профессор Поляков П. А.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность. В последние годы проблема автоматического анализа формы и состояния пространственных объектов, информация о которых представлена в виде изображений (фотографий, видеосигналов и т.д.) является актуальной во многих отраслях человеческой деятельности. Но автоматизация процесса анализа и интерпретации изображений достаточно трудна. Дело не только в том, что для обработки большого объема информации, содержащейся в изображениях, требу ются значительные вычислительные мощности, но и в том, что процессы регист рации изображений достаточно сложны или вообще неизвестны.

Многие из задач анализа формы и состояния пространственных объектов на качественном уровне решает сам человек. По всей видимости, в их основе лежат достаточно представительные модели, среди которых человек производит выбор, основываясь на информации, представленной в изображении и сопоставляет ее со своими знаниями об объекте исследований. Но существуют и задачи, с которыми ЭВМ справляются значительно лучше, чем человек. В их основе лежат простые модели процесса формирования изображений, позволяющие в той или иной мере анализировать информацию о форме объектов, содержащуюся в изображении.

В хорошо известной теории морфологического анализа монохромных изо бражений (монохромной морфологии)1 вводится понятие формы изображения объекта как класса его изображений, отвечающих различным условиям регистра ции (освещения). Форма изображения, определенная таким образом, инвариантна относительно условий регистрации. При таком определении формы, для распо знавания изображений объекта при разных условиях регистрации алгоритм распо знавания, основанный на морфологическом анализе монохромных изображений, необходимо "обучать изображениям объекта", полученным при различных усло виях его регистрации2.

Известно, что изображение объекта зависит как от оптических свойств самого Yu.P.Pyt'ev. Morphological Image Analysis. // Pattern Recognition And Image Analysis, 1993, vol. 3, no. 61, pp. 19-28.

Под обучением алгоритма распознавания следует понимать построение формы объекта по его изображениям.

объекта, так и от условий освещения, при которых происходила регистрация изо бражения. И если учитывать априорную информацию об объекте, то появляется возможность значительно уменьшить число изображений, необходимых для обу чения. Cуществует целый класс так называемых ламбертовых объектов, учет оп тических свойств которых позволяет проводить обучение алгоритма распознава ния трем изображениям объекта (при различных условиях регистрации) для рас познавания изображений объекта, полученных при разных условиях его регистра ции. Эти свойства заложены в основу морфологического анализа ламбертовых изображений3.

Из теории морфологического анализа ламбертовых изображений следует, что ответить на вопрос, являются ли предъявленные изображения изображениями ламбертового объекта, можно решив задачу поиска минимальной размерности линейного подпространства, содержащего все предъявленные изображения объ екта: если искомая размерность не превосходит 3, то предъявленное множество изображений есть множество изображений ламбертова объекта. Это так, если мы имеем дело с изображениями, полученными без ошибки. Но поскольку изображе ния всегда получаются с некоторой ошибкой, то поиск критерия, позволяющего по предъявленным изображениям объекта в шуме сделать заключение о ламбер товости объекта, нетривиален и является актуальной задачей.

Еще одной интересной и актуальной задачей является исследование влияния состава обучающей выборки на качество распознавания объектов в шуме. Хотя вопрос о том, следует ли на обучение подавать данные в шуме при распознавании данных в шуме, стоит давно, изучение такого влияния до сих пор никем не произ водилось ни для алгоритмов распознавания, основанных на морфологическом анализе, ни для так называемых параметрических алгоритмов.

Параметрические алгоритмы хорошо зарекомендовали себя, в частности, в Yu.P.Pyt'ev, A.Yu.Pyt'ev. Effective Dimensionality and Data Compression. // Pattern Recognition And Image Analysis, 1997, vol. 7, no. 4, pp. 393-406.

задачах медицинской диагностики, где необходимо на основе измерений некото рых косвенных характеристик (например, артериального давления, ЭКГ и т.д.) предсказать заболевание, поскольку прямое измерение некоторых характеристик (например, характеристик, которые могут быть получены только при хирургиче ской операции) связано со значительным риском. Все параметрические алгорит мы основаны на анализе эмпирической информации, представленной в виде таб лиц данных. Параметрические алгоритмы производят построение устойчивых представительных наборов для каждого класса объектов таблицы данных. Каж дый объект таких таблиц данных характеризуется значениями признаков X 1,..., X n, где n – количество признаков. Для булевых признаков наиболее извест ным алгоритмом распознавания является алгоритм "Кора"4, предназначенный для определения логических закономерностей в виде конъюнкций значений призна ков. Для разнотипных признаков известны такие алгоритмы распознавания, как "TEMP", "R-метод", "CORAL"5 – эти алгоритмы основаны на построении пред ставительных наборов в виде так называемых деревьев решений.

Цель работы состоит:

1. В поиске критерия ламбертовости, позволяющего по предъявленным изображениям объекта в шуме сделать заключение о ламбертовости объекта.

2. В изучении влияния состава обучающей выборки на качество распозна вания объектов в шуме параметрическими алгоритмами и морфологи ческими алгоритмами.

3. В изучении влияния на качество распознавания параметрическими и Вайнцвайг М.Н. Алгоритм обучения распознаванию образов "Кора". // В кн.: Алгоритмы обучения распознаванию образов. М., 1973, с. 110-115.

Лбов Г.С. Методы обработки разнотипных экспериментальных данных. // Новосибирск: Наука, 1981.

морфологическими алгоритмами зависимости между уровнем шума, добавляемого в обучающую выборку, и уровнем шума, который ожи дается у предъявляемых для распознавания данных.

4. В сравнительном анализе качества распознавания параметрических ал горитмов и морфологических алгоритмов.

Научная новизна работы состоит в том, что впервые:

1. Выведен критерий ламбертовости, позволяющий по предъявленным изображениям объекта в шуме сделать заключение о ламбертовости объекта.

2. Алгоритм ламбертовой морфологии был применен для решения задачи автоматического совмещения изображений одной и той же сцены.

3. Изучено влияние состава обучающей выборки на качество распознава ния объектов в шуме для всех вышеуказанных алгоритмов. Показано, что для всех параметрических алгоритмов и алгоритма ламбертовой морфологии качество распознавания возрастает, если в обучающую вы борку добавляются данные в шуме.

4. Проведен сравнительный анализ качества распознавания всех вышеука занных параметрических и морфологических алгоритмов на примере задачи распознавания искаженных шумом изображений. Показано, что:

• Алгоритм типа "Кора" дает наилучшие результаты при распозна вании данных в шуме в классе всех рассмотренных параметриче ских алгоритмов;

• Качество распознавания алгоритма ламбертовой морфологии лучше при распознавании изображений ламбертовых объектов в классе рассмотренных морфологических алгоритмов;

• При распознавании изображений качество распознавания морфо логических алгоритмов заметно лучше по сравнению с качеством распознавания рассмотренных параметрических алгоритмов.

5. Для всех рассмотренных алгоритмов найдена зависимость между уров нем шума, добавляемого в обучающую выборку, и уровнем шума, ко торый ожидается у предъявляемых на распознавание данных.

Научная и практическая значимость работы. Проведенный сравнительный анализ качества работы алгоритмов распознавания изображений реальных сцен методами ламбертовой и монохромной морфологий показал, что учет свойства ламбертовости исследуемого объекта при построении формы его изображения по зволяет сделать алгоритм распознавания ламбертовых изображений, нечувстви тельным к характеру освещения объекта при условии, что освещение объекта од нородно. Изучение влияния состава обучающей выборки на качество распознава ния объектов в шуме вышеуказанными параметрическими алгоритмами позволяет сделать вывод: при распознавании данных в шуме необходимо включение в со став обучающей выборки данных в шуме.

Апробация работы. Основные результаты диссертации докладывались на: Меж дународной конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-2002", г. Москва;

на семинарах в ВЦ РАН;

на Всероссийских конфе ренциях ММРО'99, ММРО'2000.

Публикации. По теме диссертации опубликовано 5 работ.

Структура и объем диссертации. Диссертация состоит из введения, трех глав основного текста и заключения. Работа изложена на 134 страницах, содержит рисунков и список литературы из 98 наименования.

СОДЕРЖАНИЕ РАБОТЫ

Введение содержит обоснование актуальности рассмотренных в диссертации проблем. Здесь же определяются цель исследования, научная новизна и практиче ское значение.

В первой главе производится обзор двух методов анализа изображений:

морфологического метода интерпретации монохромных изображений6 и морфо логического метода интерпретации ламбертовых изображений7. Методы называ ются "морфологическими" потому, что они дают возможность высказываться о форме изображенных объектов. Эти методы предназначены для решения широко го класса задач, связанных с компьютерным анализом формы изображенных объ ектов и не зависят от условий регистрации изображений объектов. Это следую щие задачи:

1. Распознавание изображений объектов в шуме по признакам их формы.

2. Идентификация объектов по их изображениям, полученным при раз личных неконтролируемых условиях регистрации.

3. Выделение отличий по форме изображений объектов, представленных на различных изображениях, которые получены при неизвестных усло виях регистрации.

4. Выделение изображений неизвестных объектов на изображениях с из вестным фоном (эти изображения получены при неизвестных условиях регистрации).

5. Совмещение изображений, полученных при разных (неизвестных) ус ловиях регистрации.

и т.д. Следует заметить, что методы предназначены для решения только таких за дач, в которых вся доступная информация об объекте заключена в его изображе нии или изображениях, т.е. мы имеем возможность разглядывать объект, но не осязать его.

В главе изложена теория морфологического анализа монохромных изображе ний. Дается определение формы изображения объекта, которая определяется как класс его изображений, полученных при различных условиях Пытьев Ю.П. Морфологический анализ изображений. // Докл. АН СССР, 1983, т. 196, № 5, с. 1062-1064.

Yu.P.Pyt'ev, A.Yu.Pyt'ev. Effective Dimensionality and Data Compression. // Pattern Recognition And Image Analysis, 1997, vol. 7, no. 4, pp. 393-406.

регистрации. Показывается, что в простейшем случае форма изображения объекта определяется как разбиение поля зрения на области, обладающие одинаковой или почти одинаковой яркостью8. Также в первой главе дается определение ламберто вости объекта: объект называется ламбертовым, если яркость в каждой его точке не зависит от направления наблюдения при любом характере освещения. Дается определение формы изображения ламбертового объекта как множества, которое представляет собой выпуклый замкнутый конус в трехмерном подпространстве евклидова пространства. Определяются эффективная размерность для множества "чистых" изображений и множества изображений в шуме. Показывается, что от ветить на вопрос являются ли предъявленные изображения изображениями лам бертового объекта, можно решив задачу поиска минимальной размерности ли нейного подпространства, содержащего все предъявленные изображения объекта:

если искомая размерность не превосходит 3, то предъявленное множество изо бражений есть множество изображений ламбертова объекта. Но поскольку изо бражения всегда получаются с некоторой ошибкой, то решение задачи определе ния фактической размерности предъявленного множества изображений нетриви ально. В главе показано, что в этом случае математически задача сводится к зада че проверки гипотезы о том, что полученные изображения являются изображе ниями ламбертового объекта, а именно, можно ли считать, что полученные изо бражения с точностью до ошибки лежат в трехмерном линейном подпространст ве, и решен вопрос о нахождении этого подпространства9.

Во второй главе дан обзор некоторых существующих подходов к решению задач распознавания. Данные подходы связаны с определением решающего правила из некоторого параметрического класса. Вектор параметров подбирается Yu.P.Pyt'ev. Morphological Image Analysis. // Pattern Recognition And Image Analysis, 1993, vol. 3, no. 61, pp. 19-28.

Yu.P.Pyt'ev, A.Yu.Pyt'ev. Effective Dimensionality and Data Compression. // Pattern Recognition And Image Analysis, 1997, vol. 7, no. 4, pp. 393-406.

таким, чтобы критерий качества распознавания принимал экстремальное значе ние. В зависимости от выбранного класса решающих правил и критерия качества распознавания на данный момент существует большое разнообразие классов ал горитмов. В этой главе рассматриваются только два класса параметрических ал горитмов: алгоритм построения решающих правил с использованием аппарата ал гебры логики для булевых признаков (алгоритм "Кора") и алгоритмы построения решающих правил для разнотипных (номинальных, дискретных, порядковых, не прерывных, булевых) признаков (алгоритмы "TEMP", "R-метод" и "CORAL").

Алгоритм "Кора"10 является наиболее известным алгоритмом распознавания для булевых признаков. Этот алгоритм предназначен для определения логических закономерностей в виде конъюнкций значений признаков и основывается на по строении информативных фрагментов описаний обучающих объектов – предста вительных наборов. Представительными наборами обучающих объектов счита ются те фрагменты описаний обучающих объектов, которые по данному набору признаков достаточно часто встречаются в одном обучающем классе и почти не встречаются в остальных обучающих классах. Множество представительных на боров для алгоритма "Кора" определяется заданием двух целочисленных пара метров. Варьируя эти параметры можно менять множество представительных на боров. Решающее правило задается в виде алгоритмической процедуры: для рас познавания объекта используется голосование по конъюнкциям (представитель ным наборам).

Алгоритмы "TEMP", "R-метод" и "CORAL"11 являются алгоритмами распо знавания, основанными на обнаружении логических закономерностей в Вайнцвайг М.Н. Алгоритм обучения распознаванию образов "Кора". // В кн.: Алгоритмы обучения распознава нию образов. М., 1973, с. 110-115.

Лбов Г.С. Методы обработки разнотипных экспериментальных данных. // Новосибирск: Наука, 1981.

множествах обучающих объектов в случае разнотипных признаков: номинальных, дискретных, порядковых, непрерывных и булевых. Процесс построения логиче ских закономерностей для подобных алгоритмов называется построением логиче ских решающих правил. Для этих трех алгоритмов решающее правило представ ляется в виде дерева решений. Такая форма представления правил позволяет лег ко интерпретировать их на языке функциональных свойств объекта.

В третьей главе производится исследование и сравнение всех вышеуказан ных параметрических алгоритмов и морфологических алгоритмов в задачах рас познавания при ограниченной априорной информации:

1. Дается критерий ламбертовости, позволяющий по предъявленным изо бражениям объекта в шуме сделать заключение о ламбертовости объек та.

2. Изучается влияние состава обучающей выборки на качество распозна вания объектов в шуме параметрическими алгоритмами и морфологи ческими алгоритмами.

3. Изучается влияние на качество распознавания параметрическими и морфологическими алгоритмами зависимости между уровнем шума, добавляемого в обучающую выборку, и уровнем шума, который ожида ется у предъявляемых для распознавания данных.

4. Производится сравнительный анализ качества распознавания парамет рических алгоритмов и морфологических алгоритмов.

Критерий ламбертовости. Напомним, что объект называется ламбертовым, ес ли яркость в каждой точке не зависит от направления наблюдения при любом ха рактере освещения, т.е. яркость может меняться от точки к точке поверхности, но яркость в каждой точке поверхности не будет зависеть от направления наблюде ния. Объекты, поверхность которых способна зеркально отражать падающий на него свет (например, стекло) не могут быть ламбертовыми объектами. На поверх ности таких объектов всегда будут блики от освещающих их источников, т.е. яр кость в каждой точке поверхности таких объектов будет зависеть от направления наблюдения.

Для вывода критерия ламбертовости рассматривается большое число серий изображений различных объектов. На рис. 1 в качестве примера приведены 3 се рии изображений, участвовавших в эксперименте12: ровное поле зрения (рис. 1а) и 2 сцены с предметами, один из которых стеклянный (рис. 1b,c). Для каждой серии изображений проверяется гипотеза о том, что изображения являются изображе ниями ламбертового объекта, а именно, исследуется эффективная размерность каждой серии изображений. Исследование эффективной размерности для каждой серии изображений сводится к решению задачи поиска минимальной размерности линейного подпространства, содержащего все предъявленные изображения объ екта. Для этого производится поиск ортонормированных собственных векторов, образующих ортонормированный базис в пространстве Rm 13, обеспечивающий наименьшую в среднем квадратичном по всем изображениям полную ошибку приблежения изображений по сравнению с любым другим ортонормированным базисом в Rm. Тем самым для каждой серии изображений получают набор собст венных векторов и соответствующих им собственных значений. Далее для каждой серии анализируется зависимость собственных значений, отсортированных по убыванию, от порядковых номеров собственных значений, и изображения собст венных векторов, также отсортированных по убыванию соответствующих им соб ственных значений.

В каждом эксперименте по определению эффективной размерности множества изображений участвовало по изображений каждой сцены. В целях сохранения компактности представления результатов для экспериментов в афтореферате приведены рисунки только 6 изображений из 12. Это касается и рисунков собственных векторов, получаемых при решении задачи поиска минимальной размерности линейного подпространства. Для всех ниже описанных экспериментов графики зависимости собственных значений от порядковых номеров собственных зна чений содержат только первые 9 собственных значений из 12.

i• длиной m в евклидовом пространстве Rm. Здесь m - количество Изображения представляются как векторы точек в изображении.

Рис. 1. Изображения реальных сцен, полученные фотокамерой при разном освещении.

Рис. 2. Собственные векторы в задаче нахождения эффективной размерности множества изображе ний, представленных на рис.1.

Рис. 3. Собственные значения в задаче нахождения эффективной размерности множества изобра жений, представленных на рис.1a и рис.1c:

(a) cобственные значения для рис.1a, (b) cобственные значения для рис.1c.

Рис. 4. Собственные значения в задаче нахождения эффективной размерности множества изобра жений, представленных на рис.1a и рис.1b:

(a) cобственные значения для рис.1a, (b) cобственные значения для рис.1b.

На рис. 2 показаны изображения 6 из 12 собственных векторов, получивших ся при решении задачи поиска минимальной размерности линейного подпро странства для каждой из сцен на рис. 1. На рис. 3 и рис. 4 показаны соответст вующие этим собственным векторам графики зависимости собственных значений, отсортированных по убыванию, от порядковых номеров собственных значений.

Анализируя эти графики, можно заметить, что величина отношения первого соб ственного значения к четвертому составляет величину поряка 10 5 для ровного по ля зрения и величину порядка 10 4 для нестеклянного предмета (рис. 4). Для сце ны со стеклянным предметом величина отношения первого собственного значе ния к четвертому составляет величину порядка 10 2 (рис. 3). Также, анализируя изображения собственных векторов для каждой из сцен (рис. 2), можно заметить, что на изображениях собственных векторов, начиная с четвертого, для сцен с ровным полем зрения и нестеклянным предметом ничего разобрать из деталей сцен нельзя (рис. 2а,b). Для сцены со стеклянным предметом детали сцены про слеживаются на всех без исключения изображениях собственных векторов (рис.

2с). Поскольку ламбертовы объекты всегда лежат в 3х-мерном подпространстве, то первые три собственых значения относятся к изображению, а все остальные к шуму. Если шум белый, то начиная с четвертого собственного вектора не будут просматриваться детали сцены. Критерием ламбертовости объекта является от сутствие деталей сцены, начиная с изображения четвертого собственного вектора сцены.

Влияние состава обучающей выборки на качество распознавания. Для изучения влияние состава обучающей выборки на качество распознавания объек тов в шуме параметрическими алгоритмами и морфологическими алгоритмами в качестве данных для тестирования алгоритмов использовались черно-белые изо бражения цифр размером 20х20 пиксел. Изображения зашумлялись следующим образом. Генератор случайных чисел генерировал целые числа в интервале [0, 100]. Просматривался каждый пиксел изображения и анализировалось число, сге нерированное генератором случайных чисел на очередном шаге. Если число по падало в интервал [0, q ], то пиксел инвертировался. Тем самым, при 0%-ом уров не шума14 (q = 0) получалось чистое изображение, при 50%-ом уровне шума (q = 50) инвертировалось 50% пиксел Назовем уровнем шума q% целое число q, лежащее в интервале [0, 100].

изображения, а при 100%-ом шуме (q = 100) изображение инвертировалось пол ностью. Такими изображениями проводилось обучение и такие изображения по давались на распознавание.

Для всех вышеуказанных параметрических и морфологических алгоритмов изучался вопрос: какие изображения следует включать в обучающую выборку?

Только чистые изображения или чистые изображения и изображения в шуме, или только изображения в шуме?

Для обучения алгоритмов формировались 10 классов изображений, по одному для каждой цифры от 0 до 9. Каждый класс состоял из 11 изображений. Если ал горитмы обучались только чистым изображениям, то на обучение подавались по 11 чистых изображений каждого класса. Если алгоритмы обучались и чистым изображениям и изображениям в шуме, то на обучение подавались по 11 изобра жений каждого класса, в которых шум равномерно возрастал от изображения к изображению, т.е. на обучение подавались изображения со следующими уровня ми шума:

1 2 3 4 5 6 7 8 [0%, q • %, q • %, q • %, q • %, q • %, q • %, q • %, q • %, q • %, q %] 10 10 10 10 10 10 10 10 И наконец, если алгоритмы обучались только изображениям в шуме, то на обучение подавались по 11 изображений каждого класса с определенным уровнем шума q %, q [0,50].

На распознавание для каждого алгоритма предъявлялись серии из 10 изобра жений цифр. Каждая серия содержала изображения одной из цифр с уровнем шу ма q %, q [0,50]. Каждая такая серия из 10 изображений цифр формировалась заново 50 раз и 50 раз предъявлялась для распознавания. Процент правильных решений (процент распознавания) подсчитывался следующим образом:

количество правильных ответов процент распознавания = количество испытаний Здесь количество испытаний – число тестов на распознавание (в нашем слу чае оно равно 50).

Результатом исследования вышепоставленного вопроса стало следущее: если параметрическме алгоритмы "Кора", "R-метод", "TEMP" и "CORAL" использу ются для распознавания изображений без шума, то необходимость в обучении этих алгоритмов изображениям в шуме отпадает. Достаточно их обучить только чистым изображениям. В противном случае, если эти алгоритмы используются для распознавания изображений в шуме, то на обучение необходимо подавать и чистые изображения и изображения в шуме. Этот вывод верен и для алгоритма, основанного на ламбертовой морфологии. Алгоритм, основанный на монохром ной морфологии достаточно обучить только чистым изображениям и он будет способен распознавать как чистые изображения, так и изображения в шуме. Это так, если шум белый. Если шум имеет другую природу, то и этот алгоритм необ ходимо обучать чистым изображениям и изображениям в шуме (Как известно мо нохромная морфология обладает большой помехозащищенностью и если шум бе лый, то подавление шума происходит автоматически).

Влияние состава обучающей выборки и состава распознаваемых данных на качество распознавания. Качество распознавания всех вышеописанных алго ритмов разнится в зависимости от состава обучающей выборки и состава распо знаваемых данных:

1. Алгоритм "Кора":

• Если обучать алгоритм только чистым изображениям, то процент правильных ответов будет не ниже 80% до 20%-ого уровня шума тестирующих изображений цифр (рис. 5a).

• Если обучать алгоритм чистым изображениям и изображениям с шумом до 32%, то процент правильных ответов будет не ниже 80% до 42%-ого уровня шума тестирующих изображений цифр (рис. 6a).

• При обучении алгоритма только изображениям с 10% шумом процент правильных ответов будет не ниже 80% до 21%-ого уровня шума тестирующих изображений цифр. Т.е. немногим лучше, чем при обучении алгоритма только чистым изображени ям.

2. Алгоритм "R-метод":

• Если обучать алгоритм только чистым изображениям, то процент правильных ответов будет не ниже 80% до 20%-ого уровня шума тестирующих изображений цифр (рис. 5b).

• Если обучать алгоритм чистым изображениям и изображениям с шумом до 32%, то процент правильных ответов будет не ниже 80% до 26%-ого уровня шума тестирующих изображений цифр (рис. 6b).

• При обучении алгоритма только изображениям с 10% шумом процент правильных ответов будет не ниже 80% до 20%-ого уровня шума тестирующих изображений цифр. Т.е. сравнимо с результатами, получаемыми при обучении только чистым изо бражениям.

3. Алгоритм "TEMP":

• Если обучать алгоритм только чистым изображениям, то процент правильных ответов будет не ниже 80% до 20%-ого уровня шума тестирующих изображений цифр (рис. 5c).

• Если обучать алгоритм чистым изображениям и изображениям с шумом до 32%, то процент правильных ответов будет не ниже 80% до 25%-ого уровня шума тестирующих изображений цифр (рис. 6c).

• При обучении алгоритма только изображениям с 10% шумом процент правильных ответов будет не ниже 80% до 19%-ого уровня шума тестирующих изображений цифр. Т.е. немногим хуше, чем при обучении алгоритма только чистым изображениям.

4. Алгоритм "CORAL":

• Если обучать алгоритм только чистым изображениям, то процент правильных ответов будет не ниже 80% до 20%-ого уровня шума тестирующих изображений цифр (рис. 5d).

• Если обучать алгоритм чистым изображениям и изображениям с шумом до 32%, то процент правильных ответов будет не ниже 80\% до 23\%-ого уровня шума тестирующих изображений цифр (рис. 6d).

• При обучении алгоритма только изображениям с 10% шумом процент правильных ответов будет не ниже 80% до 18%-ого уровня шума тестирующих изображений цифр. Т.е. немногим хуже, чем при обучении алгоритма только чистым изображениям.

5. Алгоритм, основанный на ламбертовой морфологии:

• Если обучать алгоритм только чистым изображениям, то процент правильных ответов будет не ниже 80% до 26%-ого уровня шума тестирующих изображений цифр (рис. 7a).

• Если обучать алгоритм чистым изображениям и изображениям с шумом до 35%, то процент правильных ответов будет не ниже 80% до 43%-ого уровня шума тестирующих изображений цифр (рис. 7b).

• При обучении алгоритма только изображениям с 10% шумом процент правильных ответов будет не ниже 80% до 27%-ого уровня шума тестирующих изображений цифр. Т.е. немногим лучше, чем при обучении алгоритма только чистым изображени ям.

6. Алгоритм, основанный на монохромной морфологии:

Для распознавания как чистых изображений так и изображений в шуме этот алгоритм достаточно обучить только чистым изображениям.

Процент правильных ответов не ниже 80% наблюдается до 45%-ого уровня шума тестирующих изображений цифр. Когда на яркость Рис. 5. Результаты распознавания при обучении алгоритмов "Кора", "R-метод", "TEMP" и "CORAL" только чистым изображениям цифр: (a) для алгоритма "Кора", (b) для алгоритма "R-метод, (c) для алго ритма "TEMP", (d) для алгоритма "CORAL".

Рис. 6. Результаты распознавания при обучении алгоритмов "Кора", "R-метод", "TEMP" и "CORAL" чистым изображениям цифр и изображениям с уровнем шума до 32%: (a) для алгоритма "Ко ра", (b) для алгоритма "R-метод, (c) для алгоритма "TEMP", (d) для алгоритма "CORAL".

Рис. 7. Результаты распознавания при обучении ламбертовой морфологии: (a) только чистым изо бражениям, (b) чистым изображениям и изображениям с 35%-ым уровнем шума.

изображения цифры накладываются дополнительные ограничения, а именно известно, что яркость символа не может быть меньше яркости фона, процент правильных ответов для алгоритма не ниже 80% наблюдается до 48%-ого уровня шума тестирующих изображений цифр (рис. 8). Т.е. этот алгоритм более помехозащищен, чем все перечисленные выше.

Рис. 8. Результаты распознавания при обучении монохромной морфологии только чистым изобра жениям.

Cравнительный анализ качества распознавания параметрических алго ритмов и морфологических алгоритмов. Для класса рассмотренных параметри ческих алгоритмов при распознавании изображений в шуме лучшим является ал горитм "Кора". Но только в том случае, когда на обучение подаются и чистые изображения и изображения в шуме (рис. 6a). Если параметрические алгоритмы обучать только чистым изображениеям или только изображениям в шуме, то ре зультаты их распознавания примерно одинаковы (рис. 5). Для всех параметриче ских алгоритмов немного разнятся и результаты распознавания при обучении только чистым изображениям и только изображениям в шуме: при обучении ал горитмов только изображениям в шуме результаты распознавания лучше, но не значительно.

Алгоритм, основанный на ламбертовой морфологии превосходит по резуль татам распознавания все параметрические алгоритмы. Это наблюдается при всех вариантах обучения алгоритма (рис. 7). Дело в том, что все вышеописанные пара метрические алгоритмы "Кора", "R-метод", "TEMP" и "CORAL" ориентированны на распознавание информации, представляемой в словесно-цифровом виде. В то время как морфологические алгоритмы ориентированны на распознавание изо бражений. Алгоритм, основанный на монохромной морфологии при распознава нии цифр дает самые лучшие результаты по сравнению со всеми другими описан ными выше алгоритмами, включая и алгоритм, основанный на ламбертовой мор фологии (рис. 8). Но при распознавании по-разному освещенных ламбертовых объектов алгоритм, основанный на ламбертовой морфологии, дает результаты за метно лучшие нежели результаты, которые в этой ситуации дает алгоритм, осно ванный на монохромной морфологии.

Основные результаты 1. Выведен критерий ламбертовости, позволяющий по предъявленным изображениям объекта в шуме сделать заключение о ламбертовости объекта.

2. Алгоритм ламбертовой морфологии был применен для решения задачи автоматического совмещения изображений одной и той же сцены.

3. Изучено влияние состава обучающей выборки на качество распознава ния объектов в шуме для всех вышеуказанных алгоритмов. Показано, что для всех параметрических алгоритмов и алгоритма ламбертовой морфологии качество распознавания возрастает, если в обучающую вы борку добавляются данные в шуме.

4. Проведен сравнительный анализ качества распознавания всех вышеука занных параметрических и морфологических алгоритмов на примере задачи распознавания искаженных шумом изображений. Показано, что:

a. Алгоритм типа "Кора" дает наилучшие результаты при распозна вании данных в шуме в классе всех рассмотренных параметриче ских алгоритмов;

b. Качество распознавания алгоритма ламбертовой морфологии лучше при распознавании изображений ламбертовых объектов в классе рассмотренных морфологических алгоритмов;

c. При распознавании изображений качество распознавания морфо логических алгоритмов заметно лучше по сравнению с качеством распознавания рассмотренных параметрических алгоритмов.

5. Для всех рассмотренных алгоритмов найдена зависимость между уров нем шума, добавляемого в обучающую выборку, и уровнем шума, ко торый ожидается у предъявляемых на распознавание данных.

Основные публикации 1. E. A. Kirnos, Yu. P. Pyt'ev Training the algorithms based on logical deci sion functions. // Pattern Recognition and Image Analysis. 2004, vol. 14, no.3, pp. 394-406.

2. Кирнос Э.А., Пытьев Ю.П. О параметрических алгоритмах распозна вания. // Вестник Московского Университета. Серия 3. Физика, Ас трономия. 2003, № 1, c. 16-18.

3. E. A. Kirnos, Yu. P. Pyt'ev, E. V. Djukova Training the "Kora" Type Algo rithms. // Pattern Recognition and Image Analysis. 2002, vol. 12, no.1, pp.

19-24.

4. Дюкова Е.В., Кирнос Э.А. Сравнение алгоритма распознавания "Кора" и черно-белой морфологии в задаче распознавания черно-белых изо бражений. // Математические методы распознавания образов: доклады IX Всероссийской конференции: Тез. докл., Москва, 1999, с. 79-81.

5.

Пытьев Ю.П., Кирнос Э.А., Логинов О.Е., Смоловик В.В. Сравнение черно-белой и ламбертовой морфологии в задаче распознавания объ ектов. // Распознавание образов и анализ изображений: новые техно логии: III конференция: Тез. докл., Нижний Новгород, ч.2, с. 233-237, 1997.



 




 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.