авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Неравенства гамильтона-якоби в задачах оптимального управления дискретно-непрерывными системами

На правах рукописи

СОРОКИН СТЕПАН ПАВЛОВИЧ

НЕРАВЕНСТВА ГАМИЛЬТОНА-ЯКОБИ

В ЗАДАЧАХ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

ДИСКРЕТНО-НЕПРЕРЫВНЫМИ СИСТЕМАМИ

01.01.02 Дифференциальные уравнения,

динамические системы и оптимальное управление

АВТОРЕФЕРАТ

диссертации на соискание ученой степени

кандидата физико-математических наук

Иркутск – 2012

Работа выполнена в Федеральном государственном бюджетном учре ждении науки Институте динамики систем и теории управления Сибир ского отделения Российской академии наук (ИДСТУ СО РАН).

Научный руководитель: доктор физико-математических наук, профессор Дыхта Владимир Александрович

Официальные оппоненты: доктор физико-математических наук, профессор Арутюнов Арам Владимирович, РУДН, зав. кафедрой;

кандидат физико-математических наук Бутин Александр Алексеевич, ИрГУПС, доцент

Ведущая организация: Институт математики и механики УрО РАН (г. Екатеринбург)

Защита состоится 17 мая 2012 г. в 15:00 ч. на заседании диссертацион ного совета Д 003.021.01 в ИДСТУ СО РАН по адресу: 664033, Иркутск, ул. Лермонтова, 134.

С диссертацией можно ознакомиться в библиотеке и на официальном сайте www.idstu.irk.ru ИДСТУ СО РАН.

Автореферат разослан 16 апреля 2012 г.

Ученый секретарь диссертационного совета д.ф.-м.н. А.А. Щеглова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Диссертация посвящена исследованию задач оп тимального управления дискретно-непрерывными системами (ДНС). Эти системы, часто называемые гибридными, состоят из конечного числа управляемых подсистем, связанных между собой правилами априорно не фиксированного последовательного включения по интервалам времени (возможно перекрывающимся) и общими ограничениями на траектории и управления. Таким образом, ДНС характеризуются переменным фазо вым пространством и переплетением дискретной и непрерывной динами ки. Указанные особенности стимулируют развитие методов вариационно го анализа задач оптимального управления в дискретно-непрерывных си стемах. Дополнительный интерес к этим задачам вызывают прикладные модели оптимизации ДНС, которые встречаются в различных областях механики, робототехники, оптики, экономики, экологии и т.д.

Для вариационного анализа задач оптимального управления ДНС в определенном смысле канонической оказалась задача динамической оп тимизации с промежуточными (многоточечными) фазовыми ограничени ями. На это обстоятельство и связь с задачами оптимального управле ния разрывными системами обратил внимание В.В. Величенко. Наиболее полные необходимые условия оптимальности в форме принципа максиму ма для гладких задач оптимального управления ДНС получены в рабо тах Л.Т. Ащепкова (на пакете игольчатых вариаций), А.В. Дмитрука и А.М. Кагановича (редукцией к классической задаче оптимального управ ления с не разделенными концевыми ограничениями методом размноже ния переменных Ю.М. Волина и Г.М. Островского), А.В. Арутюнова и А.И. Околевича (задачи со смешанными ограничениями) и др. Гибрид ный принцип максимума для различных классов негладких задач опти мального управления ДНС получен в серии работ Ф. Кларка и Р. Винтера, Г. Зуссмана, М. Гаравелло и Б. Пиколли;

на общей области применимости все эти принципы максимума совпадают. Достаточные условия оптималь ности развиты в циклах работ, выполненных под руководством В.И. Гур мана (обобщение условий В.Ф. Кротова), А.Б. Куржанского (метод ди намического программирования с необходимыми условиями оптимально сти синтеза в линейно-выпуклых задачах дискретно-импульсного управ ления), Ж.-П. Обена (квазивариационные неравенства Гамильтона-Якоби, функции типа Ляпунова), а также в работах Л.Т. Ащепкова, С. Хедлунда и А. Рантзера (условия типа Кротова), Р. Винтера и Г. Гелбрайта (квази вариационное неравенство Беллмана с алгоритмом оптимизации) и других авторов.

Однако анализ и примеры показывают, что условия оптимальности в ДНС, связанные с решениями неравенств и уравнений Гамильтона-Якоби, имеют ограниченную область применимости. Традиционных, даже обоб щенных, решений, зависящих только от текущей позиции системы, оказы вается не достаточно при наличии многоточечных фазовых ограничений и функционалов типа Майера от мультинабора концевых значений тра екторий подсистем. В этом случае необходимо введение параметрической зависимости от этого мультинабора. Подобная ситуация имеет место уже в классических задачах оптимального управления с не разделенными кон цевыми ограничениями.

Указанный недостаток известных методов и условий оптимальности обуславливает актуальность данного исследования. В работе развивается каноническая теория оптимальности Гамильтона-Якоби1, 2, адаптирован ная к специфике дискретно-непрерывных задач оптимального управле ния. Особое внимание уделено усилению принципа максимума Понтрягина до достаточного условия оптимальности в невыпуклых задачах оптими зации ДНС.

Цель работы состоит в получении необходимых и достаточных усло вий оптимальности дискретно-непрерывных процессов путем обобщения канонической теории оптимальности Гамильтона-Якоби на новые классы задач.

Объектом исследования являются задачи оптимального управления дискретно-непрерывными системами с включением в анализ базовых со ставляющих: классических и дискретных задач оптимального управления с общими концевыми ограничениями на траекторию.



Методы исследования базируются на свойствах сильной и сла бой монотонности обобщенных решений неравенств Гамильтона-Якоби, оценках множеств соединимых точек управляемых систем, канонической теории оптимальности в оригинальных вариантах, принципе максимума Понтрягина и теории экстремальных задач.

Научная новизна. Для качественного исследования оптимизацион ных и позиционных задач теории управления ДНС введен новый класс Milyutin A.A., Osmolovskii N.P. Calculus of Variations and Optimal Control. Providence, Rhode Island:

Amer. Math. Soc., 1998. 372 pp.

Дыхта В.А. Неравенство Ляпунова-Кротова и достаточные условия в оптимальном управлении // Итоги науки и техники. Совр. математика и ее приложения. 2006. Т. 110. С. 76–108.

бипозиционных решений неравенств (и уравнений) Гамильтона-Якоби, па раметрически зависящих от начальной или финальной позиции управ ляемой системы. Доказано, что этот класс L-функций (типа Ляпунова) необходим для обоснования канонической теории оптимальности уже в классических задачах оптимального управления с не разделенными конце выми ограничениями. Полученные условия локальной и глобальной опти мальности дискретно-непрерывных процессов с множествами бипозицион ных L-функций существенно усиливают известные аналоги. В частности, из них выводятся наиболее общие достаточные условия оптимальности в форме принципа максимума Понтрягина для дискретно-непрерывных за дач оптимизации без априорных предположений выпуклости, нормально сти исследуемой экстремали, единственности соответствующих ей наборов множителей Лагранжа. Представляют интерес необходимые и достаточ ные условия оптимальности, усиливающие принцип максимума для дис кретных задач оптимального управления в линейных системах с управля емыми коэффициентами. Переход к бипозиционным решениям неравенств Гамильтона-Якоби позволил получить способ построения субоптимальных бипозиционных управлений по нижней огибающей разрешающего множе ства L-функций, что невозможно в традиционном классе решений.

Достоверность и обоснованность полученных в диссертационной работе результатов обусловлены строгостью доказательств, применением апробированных методов исследования, сравнением с известными резуль татами, а также обсуждениями на научных конференциях и семинарах.

Теоретическая и практическая значимость работы. Развитые в работе методы могут применяться для качественного анализа и решения различных классов задач оптимального управления и для оценки дости жимых состояний управляемых систем при общих концевых ограничени ях. Исследованные многомерные модели оптимизации перехода экономи ки к новой технологии и распределения ресурсов иллюстрируют эффек тивность предлагаемых методов и условий оптимальности. Конструкция позиционного управления, экстремального к разрешающему множеству бипозиционных решений неравенств Гамильтона-Якоби, близка к тради ционной и вполне реализуема в численных методах решения задач управ ления. Это относится и к необходимым условиям оптимальности с позици онными контруправлениями для задач оптимизации дискретных систем, линейных по состоянию.

Исследования по теме диссертации проводились в рамках проекта по программе СО РАН Нелокальные методы в теории управления динами ческими системами (№ гос. регистрации 01201001345), интеграционного проекта СО–УрО РАН № 85 Качественный и численный анализ эволю ционных уравнений и управляемых систем и грантов РФФИ (проекты 07-01-00741-а, 11-01-00672-а, 09-01-16002-моб_з_рос, 10-01-09370-моб_з).

Соответствие диссертации паспорту научной специальности.

В соответствии с паспортом специальности 01.01.02 в диссертации про ведено теоретическое исследование свойств достижимости и управляемо сти систем нелинейных обыкновенных дифференциальных уравнений и дискретно-непрерывных систем;

предложен и апробирован новый класс негладких бипозиционных решений квазивариационных неравенств (и уравнений) Гамильтона-Якоби для качественного исследования задач оп тимального управления непрерывными, дискретно-непрерывными и дис кретными системами (пп. 3, 11, 12 области исследований).





Апробация работы. Результаты диссертационной работы представ лялись на 22 международных, всероссийских и региональных конферен циях, в частности, на Международной конференции Актуальные про блемы теории устойчивости и управления (Екатеринбург, 2009), Меж дународных конференциях Колмогоровские чтения. Общие проблемы управления и их приложения (Тамбов, 2009, 2011), XI Международной конференции Устойчивость и колебания нелинейных систем управления (конференция Е.С. Пятницкого) (Москва, 2010), V Международном сим позиуме Обобщенные постановки и решения задач управления (Улан Батор, Монголия, 2010), Международной конференции Дифференциаль ные уравнения и смежные вопросы, посвященной памяти И.Г. Петровско го (Москва, 2011), VIII Международном конгрессе ISAAC 2011 (Москва, 2011), V Международной научной конференции PhysCon 2011 (Леон, Ис пания, 2011), XV Байкальской международной школе-семинаре Методы оптимизации и их приложения (Иркутск, 2011), I и II Школах-семинарах Нелинейный анализ и экстремальные задачи (Иркутск, 2008, 2010), 42 ой Всероссийской молодежной конференции Современные проблемы ма тематики (Екатеринбург, 2011).

Результаты работы неоднократно обсуждались на семинарах в Инсти туте динамики систем и теории управления СО РАН.

Публикации и личный вклад автора. По теме диссертации опуб ликовано 11 работ, в том числе статьи [1–6] в журналах, рекомендованных ВАК РФ для опубликования основных научных результатов диссертаций.

На защиту выносятся результаты, полученные автором самостоятельно.

В работах [1, 2, 11] В.А. Дыхтой доказана негладкая версия канонических достаточных условий оптимальности и предложены модификации условий В.Ф. Кротова и К. Каратеодори с множествами L-функций, получено об ращение принципа максимума в достаточное условие оптимальности для невыпуклых задач импульсного управления. Автором диссертации в этих работах получены оценки интегральных воронок управляемых динамиче ских систем, доказаны канонические условия оптимальности с бипозици онными L-функциями и проведен их анализ. Часть статьи [5], написан ная Г.Н. Яковенко, посвящена методам анализа управляемых систем на наличие у них общих групповых свойств. В статьях [5, 6] В.А. Дыхтой введены производящие L-функции, определенные на траекториях кано нической системы из принципа максимума, и указаны их приложения к задачам управления в непрерывных системах. Соискателем эти резуль таты распространены на задачи дискретного оптимального управления и апробированы на примерах.

Структура и объем диссертации. Работа состоит из введения, трех глав, заключения и списка литературы, содержащего 156 наименований.

Общий объем диссертации составляет 154 страницы. Результаты главы опубликованы в работах [1, 2, 5, 8, 11], главы 2 в работах [2, 3, 7, 9], главы 3 в работах [4, 6, 10].

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении приводится обзор и характеристика известных необходи мых и достаточных условий оптимальности для дискретно-непрерывных задач оптимального управления, обосновывается актуальность диссерта ционного исследования.

Для управляемой системы x(t) = f t, x(t), u(t), u(t) U (S) с процессами = (x(t), u(t) | t = [t0, t1 ]) AC(, Rn ) L (, U ), непрерывной функцией f (t, x, u) и компактным множеством U Rm анонсируются необходимые понятия монотонности функций типа Ляпу нова и соответствующие критерии в форме неравенств Гамильтона-Якоби для классических и негладких решений;

указываются апробированные ме тоды их решения и реализация разрывных позиционных управлений по Красовскому-Субботину.

Часть дальнейших результатов (внутренние оценки интегральных во ронок и необходимые условия оптимальности) требует более жестких стан дартных предположений:

1) функция f (t, x, u) непрерывна по совокупности переменных и локаль но липшицева по x равномерно по (t, u) R U ;

2) существует действительное число c 0, такое что |f (t, x, u)| c(1 + |x|) на Rn+1 U ;

3) множество f (t, x, U ) выпукло (t, x) Rn+1 ;

4) множество U компактно.

Пусть G = (a, b)Rn, a b. Непрерывную функцию : G R называ ют сильно возрастающей на G, если она не убывает вдоль всех траекторий системы (S), проходящих по G. Если не убывает вдоль хотя бы одной траектории системы (S), начинающейся в произвольной начальной точ ке из G и проходящей по G, то называется слабо возрастающей на G.

Типы монотонности имеют аналоги для убывающих функций, а также мо гут рассматриваться в обратном времени (относительно системы (S))3.

Множества всех сильно возрастающих и слабо возрастающих в обратном времени функций обозначаются через Ls (G) и L (G) соответственно.

w Положим H(t, x,, u) = · f (t, x, u), h(t, x, ) = min{H(t, x,, u) | u U }, h(t, x, p) = pt + h(t, x, px ), где p = (pt, px ) R Rn. Для гладкой функции (t, x) через (t, x) обозначается ее градиент в точке (t, x), а через P (t, x) и P (t, x) проксимальные суб- и супердифференциа лы3, 4 функции в точке (t, x).

Для локально липшицевой или непрерывной функции включение Ls (G) эквивалентно следующим неравенствам Гамильтона-Якоби соот ветственно:

h t, x, (t, x) 0 (t, x) G, h(t, x, p) 0 p = (pt, px ) P (t, x), (t, x) G. (1) Для гладкой или непрерывной функции включение L (G) экви w валентно следующим неравенствам Гамильтона-Якоби соответственно:

h t, x, (t, x) 0 (t, x) G, h(t, x, p) 0 p = (pt, px ) P (t, x), (t, x) G. (2) Неравенства (1), (2) рассматриваются в точках с непустыми множествами P (t, x) и P (t, x).

Clarke F.H., Ledyaev Yu.S., Stern R.J., Wolenski P.R. Nonsmooth Analysis and Control Theory. New York: Springer-Verlag, 1998. Vol. 178 of Grad. Texts in Math. 276 pp.

Vinter R.B. Optimal Control. Boston: Birkhuser, 2000. 520 pp.

a Приведены и другие инфинитезимальные критерии монотонности, ис пользуемые далее.

Первая глава посвящена условиям оптимальности в следующей клас сической задаче (P ) с не разделенными концевыми ограничением и целе вым функционалом: минимизировать функционал J[] = l(q) на множестве процессов системы (S), удовлетворяющих ограничению q Q.

Здесь функция l непрерывна, множество Q замкнуто, q = q() = t0, x(t0 );

t1, x(t1 ) концевой вектор процесса = (x(t), u(t) | = [t0, t1 ]).

Пусть f и непустые множества всех процессов системы (S) и допу стимых процессов в задаче (P ) соответственно.

Определение 1. Множество R = {q = (t0, x0 ;

t1, x1 ) R2(n+1) | f : x(t0 ) = x0, x(t1 ) = x1 } называется множеством соединимых точек системы (S).

В §1.2 приводится базовый, негладкий вариант канонических достаточ ных условий оптимальности Гамильтона-Якоби1, 2 (K-достаточных усло вий) для задачи (P ), основанный на внешних оценках множества R.

Эти оценки строятся с помощью произвольных семейств непрерывных L функций = { (t, x) | A} Ls. Проведено сравнение K-условий с негладкими модификациями достаточных условий К. Каратеодори и В.Ф. Кротова, также оперирующих множествами сильно возрастающих L-функций. Установлено, что K-условия выполняются каждый раз, ко гда выполнены альтернативные достаточные условия, причем с теми же множествами разрешающих функций. Приведены примеры, показываю щие, что запас разрешающих функций в смысле канонического подхода шире, чем для условий Каратеодори и Кротова. Кроме того, эти приме ры указывают на необходимость введения нового класса бипозиционных L-функций, зависящих не только от текущей позиции (t, x) системы (S), но и от начальной (t0, x0 ) или конечной (t1, x1 ).

Определение 2. Непрерывную функцию V (t, x;

t0, x0 ) : R2n+2 R назо вем а) сильно возрастающей, если (t0, x0 ) Rn+1 V (·, ·;

t0, x0 ) Ls и V (t0, x0 ;

t0, x0 ) = 0;

б) слабо возрастающей в обратном времени, если (t0, x0 ) Rn+ V (·, ·;

t0, x0 ) L и V (t0, x;

t0, x0 ) 0 x = x0.

w Для множеств бипозиционных функций вводятся обозначения типа Vs, Vw и т.д.

В §1.3 получены оценки множества соединимых точек R системы (S) с использованием неравенств с бипозиционными функциями. Для некото рого множества бипозиционных функций V вводятся множества E(V ) = (t0, x0 ;

t1, x1 ) R2(n+1) | V (t1, x1 ;

t0, x0 ) 0, E+ (V) = E(V ) и E (V) = E(V ).

V V V V Теорема 1. а) Если V Vs, то R E+ (V).

б) Если V Vw, то R E (V).

в) Если V Vs Vw, то R = E(V ).

Из этой теоремы вытекают необходимые и достаточные условия опти мальности в задаче (P ), которые формулируются через конечномерные концевые задачи минимизации.

Теорема 2. Пусть для процесса существует такое множество V Vs, что вектор q = q( ) глобально оптимален в задаче l(q) min;

q E+ (V) Q. (A+ (V)) Тогда процесс глобально оптимален в задаче (P ).

Теорема 2 допускает естественную локализацию на случай исследова ния сильного минимума на процессе. Это достигается сужением задачи (P ) на некоторое открытое множество G Rn+1, содержащее график тра ектории x(·). В этом случае монотонность функций из V требуется на G, а в концевую задачу (A+ (V)) следует добавить ограничения (t0, x0 ) G, (t1, x1 ) G.

Теорема 3. Пусть процесс глобально оптимален в задаче (P ). Тогда для любого множества V Vw выполнено неравенство J[ ] inf(A (V)) 5, где справа стоит значение задачи l(q) inf;

q E (V) Q. (A (V)) Из теорем 2, 3 (или утверждения в) теоремы 1) вытекают смыкающие ся необходимые и достаточные условия оптимальности с одним решением уравнения Гамильтона-Якоби из Vs Vw. Однако его нахождение со пряжено с трудностями, неестественными для рассматриваемой задачи в Здесь и далее используются сокращенные обозначения типа min(P ) = min J().

классе программных управлений, поэтому внимание на этой ситуации не акцентируется.

В §1.4 анализируются свойства разрешающего множества V, обеспе чивающего выполнение достаточных условий теоремы 2. Показано, что в случае, когда задача (P ) локально не вырождена в точке (т.е. диффе ренциальная связь существенна), а множество функций V полунепрерыв но снизу в точке q, V содержит элементы, постоянные вдоль траектории x. Отсюда (с использованием результатов Н.Н. Субботиной), в частности, следует, что супердифференциал таких функций V V вдоль x содер жит коэкстремаль решение сопряженной системы, удовлетворяющее вместе с условиям экстремальности из принципа максимума Понтряги на. В конструктивном плане важно, что нижняя огибающая множества V функция V (t, x;

t0, x0 ) = inf V (t, x;

t0, x0 ) V V тоже оказывается разрешающей. Возможность перехода от разрешаю щего множества к одной функции не имеет места в традиционном классе L-функций. Между тем этот переход дает ключ к проверке свойства раз решаемости выбранного множества L-функций V, если достаточные усло вия теоремы 2 рассматривать как метод приближенного решения задачи без априори заданного исследуемого процесса. Для этого можно использо вать естественную модификацию правила экстремального прицеливания Н.Н. Красовского из динамического программирования6, 7 с перебором би позиционных управлений w(t, x;

t0, x0 ), экстремальных к огибающей V.

На выходе эта процедура должна давать допустимый процесс, конце вой вектор которого сколь угодно мало отклоняется от вектора q реше ния концевой задачи (A+ (V)) (в идеале совпадает с q ). В этом случае полученный процесс будет приближенно удовлетворять концевым ограни чениям задачи при малой разности |J[ ] l()|.

q В §1.5 достаточные условия оптимальности с бипозиционными функ циями применены для исследования неклассической линейно-квадратич ной задачи с общей зависимостью терминальной части целевого функци онала от x0, x1 и присутствием линейных слагаемых в интегранте. Эти Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Пер спективы динамической оптимизации. Москва-Ижевск: Институт компьютерных исследований, 2003.

336 с.

Кларк Ф., Ледяев Ю.С., Субботин А.И. Универсальное позиционное управление и проксимальное прицеливание в задачах управления в условиях возмущения и дифференциальных играх // Труды Математического ин-та им. В.А. Стеклова. 1999. Т. 224. С. 165–186.

особенности делают не применимым метод динамического программиро вания в традиционном варианте и порождают новые свойства оптималь ных решений. Получены необходимые и достаточные условия глобальной оптимальности в терминах существования решения матричного диффе ренциального уравнения Риккати и решений ряда линейных систем. Эти решения определяют разрешающую бипозиционную функцию, линейно квадратичную по паре (x, x0 ). Бипозиционное экстремальное управление получено в явном виде.

В §1.6 кратко описывается альтернативное расширение традиционных функций типа Ляпунова до производящих функций S(t, x, ), определен ных на решениях канонической системы из принципа максимума Понт рягина. Это расширение может быть использовано как для развития ка нонического подхода, так и построения обобщенного лагранжиана задачи с последующим переходом к соответствующей задаче сравнения (анало га двойственной). Оперирование производящими функциями иллюстри ровано на примере, а в главах 2, 3 применения таких функций детально изложены для дискретно-непрерывных и дискретных задач оптимизации.

Во второй главе канонические условия оптимальности с бипозицион ными L-функциями обобщаются на задачи управления дискретно-непре рывными (гибридными) системами, а гибридный принцип максимума уси ливается до достаточного условия оптимальности. Основной здесь явля ется следующая задача оптимального управления (Ph ) с общими ограни чением на концы траектории подсистем и целевым функционалом:

x (t) = f t, x (t), u (t), u (t) U, (3) t = [a, b ], = 1,..., N, q Q, (4) J = l(q) min.

Здесь моменты времени a b не фиксированы, размерности x, u равны n, m соответственно, функции f, l непрерывны, множества U произвольны, Q замкнуто, q = {q 1,..., q N } концевой мультивек тор, составленный из концевых векторов подсистем q = a, x, b, x, a b xa = x (a ), xb = x (b ).

Набор процессов подсистем = = (x (t), u (t) | t ), = 1,..., N назван мультипроцессом, а набор функций x(·) = x1 (·),..., xN (·) мультитраекторией. Мультипроцесс допустим в задаче (Ph ), если для него выполнено общее концевое ограничение (4). Фиксированный допусти мый мультипроцесс исследуется как на глобальный, так и на сильный минимум.

Определение 3. Мультипроцесс доставляет сильный минимум в за даче (Ph ), если для каждого найдется такое открытое множество G R Rn, содержащее график траектории x (·), что мультипро цесс глобально оптимален в задаче (Ph ), дополненной ограничениями t, x (t) G t, = 1,..., N. (5) Условия (5) задают сужение (Ph (G)) задачи (Ph ) на множество G := G1 · · · GN. Мультитраектория x(·) допустимого мультипроцесса на зывается допустимой по множеству G, если выполнено условие (5).

Общее концевое ограничение (4), связывающее подсистемы из (3), фор мально выглядит статическим, но является очень емким и может отра жать дискретную динамику гибридной системы. Например, в него вкла дываются ограничения вида x+1 (a+1 ) F a, x (a ), x (b ), = 1,..., N, представляющие собой дискретную систему, а также различные правила переключения подсистем. Поэтому ограничение (4) названо дискретно концевым.

Через R (G ) обозначается множество пар точек (a, x ), (b, x ) из G, a b соединимых траекториями -ой подсистемы из (3), допустимыми по G.

Положим R(G) = R (G ) и назовем R(G) множеством соединимых точек гибридной системы на G.

Определение 4. Набор функций V = {V 1,..., V N } называется состав ной бипозиционной сильно возрастающей L-функцией системы (3) на множестве G, если для каждого = 1,..., N V Vs (G ). Множе h ство всех таких наборов обозначается через Vs (G).

h Аналогичным образом определено множество Vw (G) всех бипозици онных функций гибридной системы (3), слабо возрастающих в обратном времени на множестве G.

В §2.2 с помощью составных бипозиционных функций получены внеш ние и внутренние оценки множества соединимых точек гибридной системы и соответствующие условия оптимальности.

h h Для V+ Vs (G) и V Vw (G) вводятся множества E+ (V+ ) = q = {q 1,..., q N } G G | V V+ V (q ) 0, E (V ) = q = {q 1,..., q N } G G | V V : V (q ) 0.

Тогда справедливы оценочные включения E (V ) R(G) E+ (V+ ), из которых вытекают условия оптимальности в задаче (Ph ).

Теорема 4. Пусть для мультипроцесса существует такое множе h ство V Vs (G), что мультивектор q глобально оптимален в задаче l(q) inf;

q E+ (V) Q. (B+ (V)) Тогда глобально оптимальный мультипроцесс в задаче (Ph (G)), до ставляющий сильный минимум в задаче (Ph ).

Теорема 5. Пусть мультипроцесс глобально оптимален в задаче h (Ph (G)). Тогда для любого множества V Vw (G) J[ ] inf(B (V)), где справа стоит значение задачи l(q) inf;

q E (V) Q. (B (V)) Приведенные условия оптимальности для гибридных задач обладают аналогами свойств K-условий для стандартной задачи (P ), установленных в первой главе.

В §2.3 получено обращение принципа максимума Понтрягина в доста точное условие оптимальности, наиболее общее из известных для задач типа (Ph ).

Предполагается, что функции f, l имеют непрерывные частные произ водные по q, x, t. Вводятся функции H t, x, x, u = x · f (t, x, u ) и H (t, x, x ) = max{H (t, x, x, u ) | u U }.

Процесс называется экстремалью -ой системы на отрезке, если для него существует нетривиальная коэкстремаль (t) = x (t), t (t), t, т.е. решение сопряженной системы x = Hx t, x (t), x, u (t), t = Ht t, x (t), x, u (t), (6) обеспечивающее выполнение условий максимума H t, x (t), x (t), u (t) + t (t) = 0 п.в. на, (7) H t, x (t), x (t), u + t (t) 0 на U.

Тройка =, называется в этом случае биэкстремалью -ой си стемы, набор = 1,..., N биэкстремалью гибридной системы, а 1 N набор =,..., коэкстремалью мультипроцесса.

Пусть G = G1 · · · GN некоторое множество, где все G R Rn связны (но не обязательно открыты). Множество G названо достаточным (для ), если из условия, что глобально оптимальный мультипроцесс в суженной задаче (Ph (G)), следует, что доставляет, по крайней мере, сильный минимум в задаче (Ph ). Биэкстремаль = { 1,..., N } назы вается допускающей продолжение, если найдется такое достаточное мно жество G, что каждую биэкстремаль подсистемы можно продолжить на промежуток времени I = prt G так, чтобы выполнялись условия (6), (7) с заменой в них на I. Тогда соответствующая коэкстремаль мультипроцесса также называется продолженной.

Пусть (, G) = множество продолженных коэкстремалей, соот ветствующих продолженной экстремали гибридной системы, (G )t сечение множества G при фиксированном t. Для, ( ) и достаточ ного множества G определяются следующие расширенные условия макси мума.

Условие M H(, G). = 1,..., N п. в. на I H t, x (t), (t), u (t) + (t) · x (t) = x x = max H t, x, x (t), u + x (t) · x | x (G )t, u U.

Условие M H(, G). = 1,..., N п. в. на I H t, x (t), (t) + (t) · x (t) = x x = max H t, x, x (t) + x (t) · x | x (G )t.

Пусть + (, G) множество всех коэкстремалей, обеспечивающих вы полнение любого из условий M H(, G) или M H(, G). Если это множе ство непусто, то любая + (, G) порождает составную функцию V = V [] = V 1 (t, x1 ;

a1, x1 ),..., V N (t, xN ;

aN, xN ) [] Vs (G), h a a компоненты которой определены равенством V (t, x ;

a, x ) = x (t) · x (t) x x (a ) · x (a ) x, = 1,..., N.

a a Теорема 6. Пусть для мультипроцесса существует такое множе ство коэкстремалей + (, G), что мультивектор q глобально оп тимален в задаче l(q) min;

q Q, V [](q ) 0, (B0 ()) q G G, = 1,..., N.

Тогда глобально оптимальный мультипроцесс в задаче (Ph (G)), до ставляющий сильный минимум в задаче (Ph ).

В §2.4 с помощью достаточных условий в форме принципа максиму ма исследована построенная автором макромодель двухэтапной оптими зации структуры основных фондов экономики в условиях смены техноло гии после переходного периода достижения заданного уровня развития.

Показано, что любая экстремаль Понтрягина в этой модели является ее глобальным решением.

Параграф 2.5 посвящен анализу связи канонических достаточных усло вий оптимальности с гибридным принципом максимума Понтрягина. По казано, что градиенты разрешающих функций V V, порождающих ак тивные в точке q ограничения дискретно-концевой задачи (B+ (V)), явля ются коэкстремалями.

В заключительном параграфе приведены возможные теоретические приложения полученных условий оптимальности к классическим задачам оптимального управления: а) с разрывными по времени правыми частями управляемых систем (сложными для вариационного анализа8 );

б) к ис следованию экстремалей с разрывным управлением (иллюстрируется на модели гармонического осциллятора с ограничением на управление). До казаны необходимые условия оптимальности для двухэтапной линейной по состоянию невыпуклой задачи оптимизации. Эти условия основаны на конструкции модифицированного лагранжиана с билинейными произво дящими функциями.

В третьей главе метод неравенств Гамильтона-Якоби и канонические условия оптимальности распространяются на задачи управления дискрет ными и некоторыми дискретно-импульсными системами. Помимо того, что результаты главы имеют самостоятельный интерес, они служат есте ственным дополнением к предыдущей главе, поскольку вспомогательные дискретно-концевые экстремальные задачи (B+ (V)), (B (V)), (B0 ()) в условиях оптимальности гибридных систем могут относиться к исследуе мым здесь классам задач.

Рассматривается дискретная управляемая динамическая система x( + 1) = f, x(), u(), u() U, = 0, N 1, (8) где N заданное натуральное число, функция f конечна на ZN 1 Rn Rm, Z := {0, 1,..., }, множества U Rm непусты.

Траектории и управления системы (8) это любые конечные после N N довательности = {x()}=0 и v = {u()}=0, удовлетворяющие системе Арутюнов А.В. Условия экстремума. Анормальные и вырожденные задачи. М.: Изд-во Факто риал, 1997. 256 с.

(8). Пары = (, v) образуют процессы системы (8). Через |s (s ZN ) обозначаются подпоследовательности отрезки траекторий, а через Ts () множество отрезков с начальным условием x(s) =.

Для системы (8) естественным образом вводятся сильно и слабо моно тонные L-функции (, x), критериями для которых являются дискрет ные аналоги неравенств Гамильтона-Якоби. Например, функция (, x) :

ZN Rn R сильно возрастает относительно системы (8), если (s, ) ZN 1 Rn |s Ts () :

( + 1, x( + 1)) (, x()), = s, N 1.

Множество всех сильно возрастающих функций обозначается через Ld.s В §3.2 с применением функций из Ld получены внешние оценки мно s жества соединимых точек системы (8) и достаточные условиям оптималь ности в задаче (Pd ) оптимального управления системой (8) с концевым ограничением на траекторию q := x(0), x(N ) Q и целевой функцией J[] = l(q) min.

Здесь множество Q R2n замкнуто, а функция l : R2n R непрерывна.

Теорема 7. Пусть для допустимого процесса найдется такое множе d ство Ls, что вектор q глобально оптимален в задаче l(x0, xN ) inf;

(N, xN ) (0, x0 ) 0, (x0, xN ) Q.

Тогда процесс глобально оптимален в задаче (Pd ).

В §3.3 показано, что разрешающее множество для этих условий об ладает свойствами, аналогичными установленным в главе 1.

Параграф 3.4 посвящен доказательству достаточных условий опти мальности в форме дискретного принципа максимума без предположений выпуклости задачи (Pd ) и локальной выпуклости вектограммы системы (8).

В §3.5 описываются приложения слабо монотонных L-функций. До казано новое необходимое условие оптимальности принцип минимума с контрстратегиями для задач дискретного оптимального управления со свободным правым концом. Этот критерий формулируется в терминах множеств слабо монотонных функций и экстремальных к ним позици онных управлений. В теоретическом плане он смыкается с достаточны ми условиями оптимальности. Здесь же установлена нестандартная двой ственность для задач оптимизации линейных систем с управляемыми ко эффициентами. Эта двойственность основана на использовании модифи цированного лагранжиана с билинейными производящими функциями и приводит к необходимым и достаточным условиям оптимальности, допус кающим естественную численную алгоритмизацию9.

В последнем параграфе главы рассмотрена задача дискретно-импульс ного оптимального управления в нелинейной системе с толчками в апри орно не фиксированные моменты времени. При выполнении так называ емого условия согласования применение к этой задаче канонической тео рии естественным образом приводит к дискретному аналогу нелинейного преобразования Гоха2, существенно упрощающему задачу. Это преобразо вание иллюстрировано на многомерной дискретной динамической модели оптимального распределения ресурсов, которая преобразуется к почти статической задаче оптимального управления.

РЕЗУЛЬТАТЫ, ВЫНОСИМЫЕ НА ЗАЩИТУ 1. Доказаны достаточные условия сильного и глобального экстремума с бипозиционными решениями неравенств Гамильтона-Якоби для клас сических, дискретных и дискретно-непрерывных задач оптимального управления с общими концевыми ограничениями и целевыми функ ционалами.

2. Получены достаточные условия оптимальности в форме принципа максимума Понтрягина для невыпуклых задач оптимального управ ления дискретными и дискретно-непрерывными системами.

3. Доказаны необходимые условия глобальной оптимальности с бипози ционными и производящими функциями для классических, дискрет ных и дискретно-непрерывных задач оптимального управления.

ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ 1. Дыхта В.А., Сорокин С.П. Неравенства Гамильтона-Якоби и условия оптимальности в задачах управления с общими концевыми ограниче ниями // Автоматика и телемеханика. 2011. № 9. С. 13–27.

2. Дыхта В.А., Сорокин С.П. Позиционные решения неравенств Гамильтона-Якоби в задачах управления дискретно-непрерывными системами // Автоматика и телемеханика. 2011. № 6. С. 48–63.

Эти результаты являются дискретными аналогами принципа минимума с контрстратегиями и нестандратной двойственности, установленными научным руководителем для непрерывных задач.

3. Сорокин С.П. Достаточные условия оптимальности в форме принци па максимума Понтрягина для задач управления гибридными систе мами // Сибирский журнал индустриальной математики. 2011. Т. 14, № 1. С. 102–113.

4. Сорокин С.П. Монотонные функции типа Ляпунова и условия гло бальной оптимальности для задач управления дискретными система ми // Известия Иркутского гос. ун-та. Сер. Математика. 2011. Т. 4, № 3. С. 132–145.

5. Дыхта В.А., Сорокин С.П., Яковенко Г.Н. Управляемые системы:

условия экстремальности, оптимальности и идентификация алгебра ической структуры // Труды МФТИ. 2011. Т. 3, № 3. С. 122–131.

6. Дыхта В.А., Сорокин С.П. О реализации нестандартной двойствен ности в задачах оптимального управления // Вестник Тамбовско го ун-та. Сер. Естественные и технические науки. 2011. Т. 16, № 4.

С. 1071–1073.

7. Сорокин, С.П. Достаточность гибридного принципа максимума // Известия Иркутского гос. ун-та. Сер. Математика. 2009. Т. 2, № 2.

С. 37–40.

8. Сорокин С.П. Монотонные решения неравенств Гамильтона-Якоби в оптимальном управлении // Вестник Тамбовского ун-та. Сер. Есте ственные и технические науки. 2009. Т. 14, № 4. С. 800–802.

9. Сорокин С.П. Достаточные условия оптимальности для задач опти мального управления дискретно-непрерывными системами // Приме нение математических методов и информационных технологий в эко номике: сб. науч. тр. Иркутск: Изд-во БГУЭП, 2009. Вып. 8. С. 43–50.

10. Сорокин С.П. Слабо монотонные L-функции и улучшение управле ния в задачах оптимизации дискретных динамических систем // Тру ды XV Байкальской междунар. школы-семинара Методы оптимиза ции и их приложения. Т. 3: Оптимальное управление. Иркутск: РИО ИДСТУ СО РАН, 2011. С. 121–126.

11. Дыхта В.А., Сорокин С.П. Каноническая теория Гамильтона-Якоби в задачах с общими концевыми и многоточечными ограничениями на траектории // Proc. V Int. Symposium Generalized Statements and Solutions of Control Problems-2010. Ulaanbaatar, Mongolia: MUST, 2010. С. 94–98.

Редакционно-издательский отдел Федерального государственного бюджетного учреждения науки Института динамики систем и теории управления СО РАН 664033, Иркутск, ул. Лермонтова, д. E-mail: rio@icc.ru Подписано к печати 09.04.2012 г.

Формат бумаги 6084 1/16, объем 1,2 п.л.

Заказ 5. Тираж 130 экз.

Отпечатано в ИДСТУ СО РАН

 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.