авторефераты диссертаций БЕСПЛАТНАЯ  БИБЛИОТЕКА

АВТОРЕФЕРАТЫ КАНДИДАТСКИХ, ДОКТОРСКИХ ДИССЕРТАЦИЙ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ

Обобщенный метод характеристик в решении задач оптимального управления с фиксированным моментом окончания

РОССИЙСКАЯ АКАДЕМИЯ НАУК УРАЛЬСКОЕ ОТДЕЛЕНИЕ ИНСТИТУТ МАТЕМАТИКИ И МЕХАНИКИ

На правах рукописи

ТОКМАНЦЕВ Тимофей Борисович Обобщенный метод характеристик в решении задач оптимального управления с фиксированным моментом окончания 01.01.02 – дифференциальные уравнения, динамические системы и оптимальное управление

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата физико-математических наук

Екатеринбург – 2011

Работа выполнена в отделе динамических систем Института математики и механики Уральского отделения РАН.

Научный консультант: доктор физико-математических наук Субботина Нина Николаевна

Официальные оппоненты: доктор физико–математических наук Гусев Михаил Иванович, кандидат физико–математических наук Вахрушев Виктор Александрович

Ведущая организация: Московский государственный универси тет им. М.В. Ломоносова, ВМиК

Защита состоится 27 апреля 2011 г. в 13 часов на заседании специализиро ванного диссертационного совета Д 004.006.01 по защите диссертаций на со искание ученой степени доктора наук при Институте математики и механики Уральского отделения РАН, расположенном по адресу: 620990, г. Екатерин бург, ул. С. Ковалевской, 16.

С диссертацией можно ознакомиться в библиотеке Института математики и механики УрО РАН.

Автореферат разослан 2011 г.

Ученый секретарь диссертационного совета, доктор физико–математических наук Н.Ю. Лукоянов

Общая характеристика работы

Актуальность работы. Работа посвящена исследованию свойств зада чи оптимального управления с фиксированным моментом окончания и роли характеристик уравнения Гамильтона–Якоби–Беллмана в численном реше нии этой задачи. Предлагается конструкция сеточного оптимального синте за и исследуется ее эффективность. Разработаны и протестированы на ряде модельных задач оптимального управления программные реализации пред ложенных алгоритмов. Рассмотрено приложение конструкции сеточного оп тимального синтеза к исследованию макроэкономической модели.

Истоки теории оптимального управления восходят к работам Л. С. Понт рягина1, R. Bellman2, Н. Н. Красовского3, R. Isaacs, W. H. Fleming, A. Fridman.

Фундаментальный вклад в развитие теории оптимального управления внесли В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко, Б.Н. Пшеничный, Н.Н. Моисеев, Ф.Л. Черноусько, В.А. Якубович, Ю.Г. Евтушенко, L.D. Berkovitz, A.E. Bryson, F.H. Clarke, G. Leitmann, Y.-C. Ho, R. Olsder, E.O. Roxin, J. Warga, R.J. Elliott, N.J. Kalton.

Существенное развитие теория получила в работах В.И. Зубова, Ф.М. Кирилловой, Р.Ф. Габасова, В.Ф. Кротова, А.А. Меликяна, А.А. Чи крия, С.М. Асеева, А.А. Аграчева, Л.Д. Акуленко, А.В. Арутюнова, В.И. Бла годатских, Н.Л. Григоренко, А.Я. Дубовицкого, А.В. Дмитрука, В.А. Дыхты, В.И. Жуковского, М.И. Зеликина, А.Д. Иоффе, Ю.С. Ледяева, А.А. Милюти на, М.С. Никольского, Г.К. Пожарицкого, Е.С. Половинкина, Н.Н. Петрова, Л.А. Петросяна, В.М. Тихомирова, Е.Л. Тонкова, В.И. Ухоботова, С.В. Чи стякова.

Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. Москва: Наука, Bellman R. Dynamic Programming. Princeton: Univ. Press, Красовский Н.Н. Теория управления движением. М.: Наука, Настоящая работа лежит в рамках концепции оптимального позицион ного управления, предложенной и развитой в работах Н.Н. Красовского4.

Фундаментальный вклад в развитие теории позиционного управления, наблюдения, оценивания и динамической реконструкции внесли работы Ю.С. Осипова, А.Б. Куржанского, А.И. Субботина, А.В. Кряжимского, А.Г. Ченцова, В.Н. Ушакова, В.Е. Третьякова.

Большую роль в развитии теории оптимального позиционного управле ния сыграли работы Э.Г. Альбрехта, М.И. Гусева, С.Т. Завалищина, А.Ф. Клейменова, А.И. Короткого, Е.К. Костоусовой, А.Н. Красовского, Н.Ю. Лукоянова, В.И. Максимова, О.И. Никонова, В.С. Пацко, В.Г. Пиме нова, А.Н. Сесекина, Н.Н. Субботиной, А.М. Тарасьева, Т.Ф. Филипповой, А.Ф. Шорикова, В.Я. Джафарова, Х.Г. Гусейнова и их учеников.

Ключевым понятием в теории оптимального позиционного управления является функция цены, которая начальному состоянию управляемой си стемы ставит в соответствие оптимальный гарантированный результат. Эта функция лежит в основе конструкции оптимального синтеза оптимального управления по принципу обратной связи.

Как правило, функция цены в рассматриваемых задачах оптимального управления является негладкой. Хорошо известно, что в точках дифферен цируемости она удовлетворяет уравнению в частных производных первого порядка (уравнению Гамильтона–Якоби–Беллмана), связанному с изучаемой задачей управления. В современной теории обобщенных решений уравнений Гамильтона–Якоби доказано, что функция цены для задачи управления сов падает с единственным минимаксным5 /вязкостным6 решением соответствую Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры. Москва: Наука, Субботин А. И. Обобщенные решения уравнений в частных производных первого порядка. Пер спективы динамической оптимизации. Москва;

Ижевск: Институт компьютерных исследований, Crandall M. G., Lions P. L. Viscosity solutions of Hamiltion–Jacobi equations // Trans. Amer. Math.

Soc. 1983. Vol. 277. Pp. 1–42.

щей краевой задачи Коши для уравнения Гамильтона–Якоби–Беллмана.



В случае, когда существует классическое (гладкое) решение задачи Ко ши для уравнения Гамильтона–Якоби–Беллмана, оно может быть построено с помощью классического метода характеристик Коши7. Этот метод сводит интегрирование уравнения в частных производных первого порядка к инте грированию системы обыкновенных дифференциальных уравнений, решения которой называются характеристиками. Как доказано в работах F.H. Clarke, N. Barron, S. Mirica, Н.Н. Субботиной8, использование классических характе ристик уравнения Гамильтона–Якоби–Беллмана обеспечивает исследователя необходимыми и достаточными условиями оптимальности в классе программ ных управлений.

В современной теории обобщенных решений уравнений Гамильтона–Яко би и соответствующих задач динамической оптимизации рассматриваются различные обобщения понятия характеристики. Новые подходы к опреде лению обобщенных характеристик предложены в работах А.И. Субботина, А.Б. Куржанского, Ю.С. Ледяева, А.А. Меликяна, В.И. Благодатских, А.А. Толстоногова, А.Ф. Филиппова, А.И. Булгакова, J.P. Aubin, A. Cellina, H. Frankowska, G. Haddad.

Тем не менее, актуальной задачей остается использование классических характеристик для конструирования обобщенных решений и построения оп тимального синтеза в соответствующих задачах оптимального управления.

К настоящему времени разработано большое количество численных мето дов решения задач оптимального управления. Среди них можно выделить две группы методов. К первой относятся методы, нацеленные на построение оп тимального программного управления: методы, основывающиеся на решении Курант Р. Уравнения с частными производными. Москва: Мир, 1964.

Subbotina N. N. The method of characteristics for Hamilton–Jacobi equations and applications to dynamical optimization. NY: Springer, двухточечной краевой задачи, следующей из принципа максимума Л.С. Понт рягина;

методы последовательных приближений;

градиентные методы в про странстве управлений, методы, опирающиеся на конструирование областей достижимости. Разработке этих методов посвящены работы Ф.П. Васильева, В.Л. Гасилова, В.Б. Костоусова, Ю.И. Бердышева, Ю.Н. Киселева, Н.Н. Бо лотника, И.М. Ананьевского, Б.Н. Соколова, Н.В. Баничука, Д.В. Камзолки на и многих других известных математиков.

Вторую группу составляют методы, нацеленные на построение оптималь ного синтеза, основанные на методе динамического программирования и свя занные с решением уравнения Гамильтона–Якоби. Существенный вклад в раз витие этого направления внесли работы В.Н. Ушакова, В.С. Пацко, А.М. Тарасьева, А.Г. Пашкова, С.И. Кумкова, А.А. Успенского, P. Souganidis, M. Falcone. Численные алгоритмы конструкций позиционного оптимального управления успешно разрабатывались в работах В.А. Вахрушева, В.Л. Туро вой, С.С. Кумкова, Д.А. Серкова, Л.Г. Шагаловой, А.П. Хрипунова.

Несмотря на обилие предложенных методов, исследование роли класси ческих характеристик в конструкциях эффективных методов оптимального позиционного управления остается актуальной задачей.

Цели диссертационной работы. Исследование свойств функции цены задачи оптимального управления с непрерывными по времени и дифференци руемыми по фазовой переменной входными данными;

разработка и обоснова ние численных методов аппроксимации функции цены и построения сеточно го оптимального синтеза в рассматриваемой задаче оптимального управления на базе классических характеристик уравнения Гамильтона–Якоби–Беллма на;

программная реализация численных методов и решение модельных задач теории оптимального управления;





приложение конструкций сеточного опти мального синтеза к анализу модели макроэкономической системы.

Методы исследования. Основным методом исследований является обобщение классического метода характеристик Коши. Для анализа мини максных решений уравнений Гамильтона-Якоби применяются методы и ап парат негладкого анализа.

Для доказательства оптимальности предлагаемых конструкций сеточно го синтеза применяются необходимое условие принцип максимума Л.С. Понтрягина в гамильтоновой форме, и достаточное условие в терминах супердифференциала функции цены, предложенное Н.Н. Субботиной.

При выводе оценки скорости сходимости процедуры построения аппрок симации функции цены были использованы методы теории рекурсии9. При этом для получения констант применялся пакет Matlab.

Предложенные численные алгоритмы реализованы автором в виде про граммы на языке C++ c использованием методов вычислительной геометрии.

Научная новизна. Предложен новый метод решения задачи оптималь ного управления с фиксированным моментом окончания, при котором для нахождения оптимальных траекторий решается краевая задача Коши, где краевые условия для фазовой и сопряженной переменных заданы в один и тот же конечный момент времени (в отличие от стандартной двухточечной краевой задачи в принципе максимума Л.С. Понтрягина). Предложены но вые конструкции численной аппроксимации функции цены и сеточного оп тимального синтеза, определенные в узлах адаптивных сеток, лежащих на численных решениях характеристической системы.

Получена оценка точности аппроксимации функции цены, которая ли нейно зависит от шага интегрирования (в отличие от сеточных методов, ис пользующих равномерные сетки, где оценка точности линейно зависит от корня квадратного из шага интегрирования).

Получена оценка качества управления с помощью сеточного оптималь Грин Д., Кнут Д. Математические методы анализа алгоритмов. Москва: Мир, 1987.

ного синтеза (оценка эффективности), которая линейно зависит от шага ин тегрирования. При оценке эффективности сеточного оптимального синтеза применяется оригинальный подход на базе теории рекурсии.

Новым приложением конструкций сеточного оптимального синтеза яв ляется использование их для анализа динамики макроэкономической модели на основе накопленной дискретной статистики.

Теоретическая и практическая ценность. Предложенные методы могут применяться при решении достаточно широкого класса задач управ ления с терминально–интегральным функционалом, где обеспечены условия существования, единственности и продолжимости классических характери стик соответствующего уравнения Гамильтона–Якоби–Беллмана.

Основные результаты диссертации.

• Для задачи оптимального управления с фиксированным моментом окончания доказаны теоремы о структуре функции цены и супердиффе ренциала функции цены в терминах классических характеристик урав нения Гамильтона–Якоби–Беллмана.

• Предложены численные методы аппроксимации функции цены и опти мального синтеза. Получены оценки численных аппроксимаций.

• Программные реализации численных алгоритмов разработаны и проте стированы на решении модельных задач оптимального управления, а также применены к решению задачи идентификации макроэкономиче ской модели.

Апробация работы Основные результаты диссертации докладывались на следующих конференциях: 37-ой, 38-ой региональных молодежных кон ференциях “Проблемы теоретической и прикладной математики” (Екатерин бург, 2006, 2007);

научной конференции “Демидовские чтения на Урале” (Ека теринбург, 2006);

научной конференции “Теория управления и математиче ское моделирование” (Ижевск, 2006);

9–ом Всероссийском съезде по теоре тической и прикладной механике (Нижний Новгород, 2006);

Всероссийской научной конференции “Математика. Механика. Информатика”, посвященной 30–летию Челябинского государственного университета (Челябинск, 2006);

3–ей Международной конференции “Параллельные вычисления и задачи управления” памяти И.В. Прангишвили (Москва, 2006);

Международном на учной семинаре “Математическая теория оптимального управления и теория дифференциальных включений”, посвященный 60-летию В.И. Благодатских (Москва, 2006);

14–ой Международной конференции по динамике и управ лению (Москва Звенигород, 2007);

Международной конференции “Диф ференциальные уравнения и смежные вопросы”, посвященная памяти И.Г.

Петровского (Москва, 2007);

9–ой Международной Четаевская конференции “Аналитическая механика, устойчивость и управление движением” (Иркутск, 2007);

Международной конференции “Колмогоровские чтения. Общие про блемы управления и их приложения. Проблемы преподавания математики” (Тамбов, 2007);

конференции SIAM по оптимизации (Бостон, США, 2008);

13–ом Международном Симпозиуме по динамическим играм и приложени ям (Вроцлав, Польша, 2008);

Международной конференции “Дифференци альные уравнения и топология”, посвященной 100–летию Л.С. Понтрягина (Москва, 2008);

Международной конференции “Дифференциальные уравне ния. Функциональные пространства. Теория приближений”, посвященной 100–летию С.Л. Соболева (Новосибирск, 2008);

10–ом Международном се минаре “Устойчивость и колебания нелинейных систем управления” имени Е.C. Пятницкого (Москва, 2008);

Международной конференции “Алгорит мический анализ неустойчивых задач”, посвященной 100–летию В.К. Ива нова (Екатеринбург, 2008);

4–ой Международной конференции по физике и управлению (Катания, Италия, 2009);

Международной конференции “Управ ление динамическими системами” (Москва, 2009);

конференции, посвященной 60-летию А.В. Кряжимского (Москва, 2009);

Международной конференции “Актуальные проблемы устойчивости и теории управления” (Екатеринбург, 2009);

3–ей и 4–ой Международных конференциях “Теория игр и менедж мент” (Санкт–Петербург, 2009, 2010);

3–ей Международной конференции “Ма тематическое моделирование социальной и экономической динамики”, Россий ский Государственный Социальный Университет (Москва, 2010);

Всероссий ской конференции “Устойчивость и процессы управления” (Санкт–Петербург, 2010);

семинаре отдела динамических систем ИММ УрО РАН;

семинаре кафедры оптимального управления ВМК МГУ им. М.В. Ло моносова.

Список публикаций автора по теме диссертации. Материалы дис сертации опубликованы в 30 печатных работах, из них 5 статей в журналах из списка ВАК ([1–5]), 2 статьи в иностранных журналах ([6, 7]), 7 статей в ре цензируемых журналах и сборниках трудов конференций([8–14]) и 16 тезисов докладов. Список основных публикаций приведен в конце автореферата.

Структура, объем и краткое содержание диссертации. Диссерта ция состоит из введения, 5 глав и библиографии. Общий объем диссертации 110 страниц, включая 28 рисунков. Библиография включает 56 наименова ний.

Известные результаты, использующиеся в данной работе, называются “утверждениями”, в отличие от “теорем” результатов автора.

Содержание работы Во введении раскрываются цели и задачи работы, ее актуальность, а также кратко описываются основные результаты, полученные в диссертации.

В первой главе вводится задача оптимального управления, которая является основной задачей для глав с первой по четвертую, приводятся из вестные утверждения, которые использованы в диссертации. Глава состоит из шести параграфов.

В первом параграфе приводится постановка задачи. Рассматривается ди намическая управляемая система dx(t) = f (t, x, u), (1) dt на фиксированном отрезке времени t [0, T ], фазовый вектор системы x Rn, на управление наложены геометрические ограничения u P, P Rm компакт. Символы T и cl T обозначают полосы в пространстве Rn+1 :

T = (0, T ) Rn, cl T = [0, T ] Rn.

Символ U (t0, T ), t0 [0, T ], обозначает множество допустимых управле ний измеримых функций u(·) : [t0, T ] P, называемых программами.

Траектория динамической системы (1), выходящая из начальной точки (t0, x0 ) cl T под воздействием управления u(·) U (t0, T ), обозначается символом x(·) = x ·;

t0, x0, u(·) : [t0, T ] Rn.

Качество управления u(·) оценивается с помощью функционала Больца T I t0, x0 ;

u(·) = x T ;

t0, x0, u(·) + g t, x(t), u(t) dt. (2) t Оптимальный программный результат (цена) V (t0, x0 ) для произвольной начальной точки (t0, x0 ) cl T имеет вид:

V (t0, x0 ) = inf I t0, x0 ;

u(·). (3) u(·)U (t0,T ) Функцией цены в задаче (1)–(2) называется отображение V : (t0, x0 ) V (t0, x0 ) : cl T R. (4) Во втором параграфе приведены стандартные требования A1 –A4 на вход ные данные задачи оптимального управления (1)–(2).

В третьем параграфе введена эквивалентная задаче оптимального управ ления (1)–(2) задача Коши для уравнения Беллмана:

v(t, x) + H t, x, Dx v(t, x) = 0, (t, x) T, (5) t H(t, x, p) = min p, f (t, x, u) + g(t, x, u), (6) uP v(t, x) v(t, x) Dx v(t, x) =,...,, x1 xn где краевое условие имеет вид x Rn.

v(T, x) = (x), (7) В четвертом параграфе вводится характеристическая система задачи (5)–(7):

dx = D H(t, x, p), dt p dp (8) = Dx H(t, x, p), dt dz = p, Dp H(t, x, p) H(t, x, p), dt с граничными условиями y Rn.

x(T, y) = y, p(T, y) = D(y), z(T, y) = (y), (9) Решения x(·, y), p(·, y), z(·, y) системы (8) называются характеристика ми задачи (5) (7). Приведен классический метод характеристик Коши для построения гладкого решения в задаче (5) (7).

В пятом параграфе приводится определение минимаксного (негладко го) решения задачи Коши для уравнения Беллмана. Приводится утвержде ние о совпадении функции цены задачи оптимального управления (1)–(2) с единственным минимаксным решением задачи (5) (7). Приводится репре зентативная формула функции цены в терминах классических характери стик. Формулируется утверждение о необходимых и достаточных условиях оптимальности в гамильтоновой форме, дополняющих принцип максимума Л.С. Понтрягина. Приводится определение оптимального синтеза согласно формализации Н.Н. Красовского и сформулировано утверждение о конструк ции оптимального синтеза в задаче оптимального управления (1)–(2) Шестой параграф содержит полезные сведения из негладкого анализа.

Во второй главе приводятся результаты исследования задачи опти мального управления (1)–(2) при условиях A1 –A4 на входные данные.

В первом параграфе формулируются предположения.

A1. Функции f (t, x, u) и g(t, x, u) в (1), (2) определены и непрерывны на cl T P, существуют непрерывные по (t, x, u) T P частные производные fi (t,x,u) g(t,x,u), xj, i 1, n, j 1, n, ограниченные константой L1 0.

xj A2. Терминальная функция платы (x) в (2) определена и непрерывна на Rn вместе со своими частными производными, i 1, n.

xi A3. Для любой точки (t, x) cl T и вектора p Rn множество Arg min p, f + g : (f, g) f (t, x, u), g(t, x, u) : u P, состоит из единственного элемента f 0 (t, x, p), g 0 (t, x, p).

A4. Существуют непрерывные по совокупности переменных и ограни fi0 (t,x,p) fi0 (t,x,p) ченные в области (t, x, p) T Rn частные производные, pj, xj g 0 (t,x,p) g 0 (t,x,p), pj, i 1, n, j 1, n.

xj Условия A1 –A4 обеспечивают существование, единственность и продол жимость решений характеристической системы (8)–(9).

Во втором параграфе доказываются теоремы о свойствах функции цены.

Теорема 1. Пусть в задаче (1)–(4) выполнены условия A1 –A4. Функция цены V (t, x) может быть представлена в виде V (t, x) = min (t, x, ), A где параметр принимает значения из метрического компакта A, функ ция (t, x, ) непрерывна на множестве cl T A, существуют частные (t, x, ) производные, i 1, n, непрерывные на множестве cl T A.

xi Теорема 2. Пусть в задаче (1)–(4) выполнены условия A1 –A4. Функция цены V (t, x) (4) задачи имеет следующее представление Y (t, x) = {y Rn : x(t, y) = x}, V (t, x) = min z(t, y), (10) yY (t,x) где x(·, y), z(·, y) характеристики (8), (9) уравнения Беллмана (5).

Для произвольного компактного множества G0 cl T введены в рас смотрение множество G(G0 ) cl T и множество P (G0 ) такие, что G(G0 ) = {(t, x) cl T | x(·, y) – решения (8), (9), (t0, x0 ) G0 : (11) x(t0, y) = x0, x(t, y) = x}, P (G0 ) = {p = p(t, y) Rn : (t, x(t, y)) G(G0 )}. (12) Символ Bk = {y Rk : y } обозначает шар радиуса 0. Рассмат риваются множества G (G0 ) = G(G0 ) +Bn+1 и P (G0 ) = P (G0 ) + Bn.

Символом (·) обозначен модуль непрерывности для функций f 0 (·), g 0 (·), fi0 (t,x,p) g 0 (t,x,p) i 1, n, j 1, n, на множестве G (G0 ) P (G0 ).

, xj, xj Теорема 3. При выполнении условий A1 – A4 функция цены V (t, x) зада чи (1)–(4) непрерывна по совокупности переменных. Для любой компакт ной области G0 cl T и любого 0 существуют такие константы L (G0 ) 0, 1 (G0 ) 0, 2 (G0 ) 0, что имеет место оценка |V (t, x ) V (t, x )| L (G0 ) x x + 1 (G0 )|t t | + 2 (G0 )(|t t |) для всех (t, x ), (t, x ) G (G0 ) T.

В третьем параграфе доказывается теорема 4 о структуре супердиффе ренциала + V (t, x) функции цены:

+ V (t, x) = {(, p) R Rn :

V (t + t, x + x) V (t, x) t + p, x + o( x + |t|) (t + t, x + x) Bn+1 (t, x)}, где 0, Bn+1 (y0 ) = {y Rn+1 : y y0 }.

Теорема 4. Если в задаче (1) – (4) выполнены условия A1 –A4, то супердиф ференциал + V (t, x) функции цены V (t, x) задачи (1)–(2) не пуст при всех (t, x) cl T и имеет вид + V (t, x) = co H t, x(t, y), p(t, y), p(t, y) : x(t, y) = x, z(t, y) = V (t, x) где x(·, y), p(·, y), z(·, y) решения характеристической системы (8)–(9).

В третьей главе предложен и обоснован алгоритм построения аппрок симации функции цены, основанный на теоретических результатах главы 2.

В первом параграфе описываются алгоритм, который опирается на по пятную процедуру численного интегрирования системы (8)–(9).

Рассмотрено разбиение = {ti, i = 0, 1,..., N } отрезка времени [t0, T ] с шагом t. В момент t = t0 рассмотрено компактное множество G0 Rn на чальных фазовых значений. Построено компактное множество G({t0 } G0 ) (11). Его сечение в момент t = tN обозначено символом GN.

На GN определена равномерная сетка QN = {xj }, j = (j1,..., jn ), с N шагом по осям x. Через Qi Rn обозначена сетка в момент t = ti. Узлами сетки Qi являются точки xj, лежащие в момент t = ti на характеристиках i x(·), которые в момент t = T стартуют из точек xj QN.

N Процедура численного интегрирования характеристической системы стартует в момент времени t = T с краевыми условиями xj (T ) = xj, pj (T ) = N D(xj ), z j (T ) = (xj ), учитывая достаточные условия оптимальности. Точ N N ные решения системы (оптимали) обозначены символом x0 (·), p0 (·), zj (·), а j j символом xj (·), pj (·), z j (·).

их численные аппроксимации В момент времени t = tN 1 конструируется сетка QN 1 и аппроксима ция функции цены V (tN 1, xj 1 ) для каждого фиксированного индекса j N согласно теореме 2 и аппроксимационной формуле:

ti+ V (ti, xj ) = V (ti+1, xj ) + g 0, xj ( ), pj ( ) d, min (13) i i+ xj xj j: x i i ti где i = N 1, x 0 параметр аппроксимации.

В узлах xj 1 сетки QN 1 строятся оптимальные направления:

N 0 0 0 0 0 fN 1 = f 0 (tN 1, xj 1, pj 1 ), j gN 1 = g 0 (tN 1, xj 1, pj 1 ), j (14) N N N N j 0 где pN 1 = pj (tN 1 ) : z j (tN 1 ) = V (tN 1, xj (tN 1 ) = z j (tN 1 ).

Далее эта процедура рекуррентно повторяется на интервалах [ti, ti+1 ].

0 Строятся сетки Qi, i = N 1,..., 0 с узлами xj. Выбираются pj = pj (ti ) :

i i 0 0 zij = V (ti, xj ) = zij. Если таких индексов j находится несколько, то выби i рается любой из них.

Узлы xj сетки Qi, i = N 1,..., 0, в совокупности с pj, zij являются i i краевыми условиями для интегрирования характеристической системы в об ратном времени на интервале [ti1, ti ]. Результатом работы алгоритма при каждом t = ti является совокупность Si = {(xj, zij, fij, gi )}, где zij = V (ti, xj ), j i i вектора (fij, gi ) определены в (14).

j Во втором параграфе получена оценка точности аппроксимации функ ции цены. В дополнение к условиям A1 –A4 вводится предположение:

A5. Модуль непрерывности в области G (G0 ) P (G0 ) удовлетворяет условию 0 0 : () M, (0, 0 ], где константа M = M (G0 ) (0, L1 ), константа L1 определена в условии A1.

Теорема 5. В задаче (1)–(2) при выполнении условий A1 –A5 для любой компактной области G0 cl T и любого параметра 0 существу ет константа R (G0 ) 0 такая, что для произвольного узла (ti, xj ) G (G0 ) (11), ti, xj Qi, справедлива оценка:

|V (ti, xj ) V (ti, xj )| R (G0 )t.

В третьем параграфе приводятся примеры использования программной реализации алгоритма для решения модельных задач в случае одномерного и двумерного фазового пространства. В качестве результата работы алгоритма приведены графики аппроксимации функции цены.

В четвертой главе предложен и обоснован алгоритм построения сеточ ного оптимального синтеза.

В первом параграфе при ti, в узлах сеток xj Qi определен се i точный оптимальный синтез u0 (ti, xj ). При этом используются оптимальные i направления fij, gi, построенные в узлах сеток:

j u0 (ti, xj ) Arg min{ f (ti, xj, u) fij + |g(ti, xj, u) gi |}.

j i i i uP Далее описан алгоритм применения сеточного оптимального синтеза для произвольной начальной точки (t, x ) G0 cl T, t (t0, t1 ). Пользуясь произвольным постоянным управлением u P находятся точки x1 = x + (t1 t )f (t, x, u ) и x2 Q1, ближайшая к точке x1 :

d0 = x1 x2 = min x1 x. (15) xQ На интервале [t1, T ] строится траектория x2 (t) = x2 (t;

t1, x2 ) системы (1), стартующая из точки (t1, x2 ) и порождаемая сеточным синтезом u0 (·), то есть кусочно-линейное движение по оптимальным направлениям 0 fij = f (ti, x2 (ti ), u0 (ti, x2 (ti ))), j gi = g(ti, x2 (ti ), u0 (ti, x2 (ti ))).

Из начальной точки (t, x ) строится пошаговое движение x1 (·), порож даемое управлением u0 (·) с помощью сеточного оптимального синтеза u0 (ti ) согласно правилу u, t [t, t ], u (t) = u0 (ti ), при t [ti, ti+1 ), i 0, N 1, 0 u0 (ti ) Arg min{ f (ti, x1 (ti ), u) fij j + |g(ti, x1 (ti ), u) gi )|}, uP Во втором параграфе доказывается теорема об оценке точности алгорит ма. Определяется результат реализации сеточного оптимального синтеза T C t0, x0 ;

u0 (·) x0 (T ) g, x0 ( ), u0 ( ), = + t, =t совпадающий с численной аппроксимацией функционала I t0, x0 ;

u0 (·) (2).

Теорема 6. В задаче (1)–(4) при выполнении условий A1 –A5 для любой компактной области G0 cl T и любого параметра 0 существуют константы H1 (G0 ) 0, H2 (G0 ) 0 такие, что для произвольной точки (t, x ) G (G0 ) (11) справедлива оценка |C t, x ;

u0 (·) V (t, x )| tH1 (G0 ) + d0 H2 (G0 ).

Здесь d0 определено в (15).

В третьем параграфе приводятся примеры решения модельных задач оптимального управления с помощью сеточного оптимального синтеза.

В пятой главе исследуется модель макроэкономической системы, пред ложенная Э.Г. Альбрехтом10.

В первом параграфе описывается модель Э.Г. Альбрехта. Символ p обо значает конечный валовый продукт, q обозначает материальные затраты.

Альбрехт Э. Г. Методика построения и идентификации математических моделей макроэкономи ческих процессов // Электронный журнал "Исследовано в России". 2002. Т. 5. С. 54– Предполагается, что прибыль h зависит только от валового продукта и ма териальных затрат, т.е. h = G(p, q). Функция G(p, q) называется макроэконо мическим потенциалом системы.

Динамика рассматриваемая модели имеет следующий вид:

dp G(p, q) dq G(p, q) = u1, = u2 (16) dt p dt q на временном интервале [0, T ]. Здесь u1, u2 управляющие параметры, удо влетворяющие геометрическим ограничениям |u1 | U1, |u2 | U2, (17) где U1 0, U2 0 константы.

Имеются статистические данные, а именно, таблица значений величин p, q, h, измеренных в моменты ti [0, T ], i = 0, 1,..., N, t0 = 0, tN = T :

p, p,..., p, h, h,..., h.

q0, q 1,..., qN, 0 1 N 0 1 N Статистические данные (p, qi ) измерены с ошибками и известны оценки оши i бок измерения |p p | p, |q qi | q.

i Символами p (·), q (·) обозначаются линейные интерполяции статистических данных на отрезке [0, T ]. Вводится область допустимых движений D:

D = {(t, p, q) R3 : t [0, T ], |p p (t)| p, |q q (t)| q}. (18) Предполагается, что структура функции G(p, q) имеет вид многочлена G(p, q) = pq[a0 + a1 p + a2 q]. (19) Во втором параграфе ставится задача восстановления динамики системы по заданным статистическим данным.

Первым шагом является определение параметров макроэкономического потенциала, наилучшим образом соответствующим статистическим данным.

Рассматривается задача идентификации параметров a0, a1, a2, определяющих вид макроэкономического потенциала G(p, q) (19). Для получения наилуч шего соответствия статистическим данным применяется метод наименьших квадратов:

N [h G(p, qi )]2 min.

i i j (a ) i= Далее ставится вспомогательная задача оптимального управления дина микой модели (16), где множество допустимых управлений определяется сле дующим образом U (0, T ) = {u(·) : [0, T ] P измерима}, а функционал платы имеет вид:

I t0, p0, q0 ;

u(·) = ( (T ) p(T ))2 + ( (T ) q(T ))2 + p q T (u2 (t) + u2 (t)) ( (t) p(t)) + ( (t) q(t)) + 1 2 + p q dt, (20) t 2 параметр регуляризации. Величина (u1 (t)+u2 (t)) вводится для где 0 того, чтобы обеспечить выполнение условия A3 для рассматриваемой задачи оптимального управления. Функции p (·), q (·) линейные интерполяции статистических данных.

Ставится задача о нахождении оптимального синтеза универсального позиционного управления, оптимального для всех заданных начальных состо яний. Траектории, порождаемые оптимальным синтезом и содержащиеся в области допустимых движений, являются решением задачи о восстановлении динамики системы по заданным статистическим данным.

В третьем параграфе описывается алгоритм численного решения задачи о восстановлении движений модели.

В момент t = tN = T задается область GN R2 вида GN = {(p, q) R2 : |p p | p, |q qN | q}, N на области GN задается сетка Q(tN ) с шагом N. Для узлов (pN, qj ) Q(tN ) N i в обратном времени строятся траектории p(·;

pN ), q(·;

qj ) N оптимали систе i мы (16), выходящие в момент tN = T из состояний p(tN ) = pN, N q(tN ) = qj.

i Построенные траектории p(·;

pN ), q(·;

qj ) используются для построения N i оптимального сеточного синтеза u0 (·) в узлах сеток Q(tk ), k = N,..., 1.

В момент t = 0 рассматриваются сечение G0 R2 области допустимых движение D (18) и сетка с шагом 0. Для узлов (p0, qj ) G0 как для на i чальных состояний в прямом времени строятся траектории p(·;

p0 ), q(·;

qj ) i под управлением сеточного оптимального синтеза.

Затем среди движений p(·;

p0 ), q(·;

qj ) выбираются те, для которых вы i полняется условие tk, p(tk ;

p0 ), q(tk ;

qj ) D, k = 0,..., N.

i Таких движений может быть несколько (если таких нет, то расширяем об ласть допустимых движений D). Из них выбираются окончательно те, на которых функционал (20) достигает минимума. Эти функции p(·;

p0 ), q(·;

qj ) i называются решениями задачи о восстановлении движений модели.

В четвертом параграфе задача численно решается при конкретных ста тистических данных.

Список основных публикаций 1. Субботина Н. Н., Токманцев Т. Б. Алгоритм построения минимаксного решения уравнения Беллмана в задаче Коши с дополнительными огра ничениями // Тр. Ин-та математики и механики УрО РАН. 2006. Т. 12, № 1. С. 208–215.

2. Субботина Н. Н., Токманцев Т. Б. Оптимальный синтез в задаче управ ления с липшицевыми входными данными // Тр. МИАН. 2008. Т. 262, № 1. С. 240–252.

3. Субботина Н. Н., Токманцев Т. Б. Об эффективности сеточного опти мального синтеза в задачах оптимального управления с фиксированным моментом окончания // Дифференц. уравнения. 2009. Т. 45, № 11.

С. 1651–1662.

4. Субботина Н. Н., Токманцев Т. Б. Оценка погрешности сеточного опти мального синтеза в нелинейных задачах оптимального управления пред писанной продолжительности // Автоматика и телемеханика. 2009. Т. 9.

С. 141–156.

5. Субботина Н. Н., Токманцев Т. Б. Классические характеристики урав нения Беллмана в конструкциях сеточного оптимального синтеза // Тр.

МИАН. 2010. Т. 271. С. 259–277.

6. Subbotina N. N., Tokmantsev T. B. On Solutions of Optimal Control Prob lems of Prescribed Duration on the Plane // Advances in Mechanics. Dynam ics and Control: Proceedings of the 14th International Workshop on Dynamics and Control. Moscow: Nauka, 2008. P. 281–288.

7. Subbotina N. N., Tokmantsev T. B. On Grid Optimal Feedbacks to Con trol Problems of Prescribed Duration on the Plane // Advances in Dynamic Games. Vol. 11 of Annals of the ISDG. 2011. P. 133–147.

8. Субботина Н. Н., Токманцев Т. Б. О вычислении оптимального результа та в задачах управления на заданном отрезке времени // Тр. III Между народ. конф. “Параллельные вычисления и задачи управления”. Москва:

ИПУ, 2006. С. 101–112.

9. Токманцев Т. Б. О построении оптимального синтеза в задаче управле ния механической системой на фиксированном отрезке времени // Тр. IX Международ. Четаевской конф. “Аналитическая механика, устойчивость и управление движением”. Т. 3. Иркутск: ИДСТУ, 2007. С. 231–239.

10. Субботина Н. Н., Токманцев Т. Б. Численная аппроксимация минимакс ного решения уравнения Беллмана в задаче Коши с дополнительными ограничениями // Тр. 37–й Региональной молодежной конф. Екатерин бург: УрО РАН, 2006. С. 357–361.

11. Токманцев Т. Б. О некоторых способах обработки и хранения информа ции при решении задач динамической оптимизации на заданном отрезке времени // Тр. 38–й Региональной молодежной конф. Екатеринбург: УрО РАН, 2007. С. 311–315.

12. Токманцев Т. Б. О численном решении задач оптимального управления предписанной продолжительности // Вестник Тамбовского Университе та: Естественные и технические науки. 2007. Т. 12(4). С. 534–535.

13. Субботина Н. Н., Токманцев Т. Б. Метод обобщенных характеристик в задаче оптимального управления с липшицевыми входными данными // Известия Института математики и информатики. 2006. С. 141–142.

14. Subbotina N. N., Tokmantsev T. B. The Method of Characteristics in Macroe conomic Modeling // Contributions to Game Theory and Management. Vol. 3.

St. Petersburg: Graduated School of Management, 2009. Pp. 399–408.

Токманцев Тимофей Борисович ОБОБЩЕННЫЙ МЕТОД ХАРАКТЕРИСТИК В РЕШЕНИИ ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ С ФИКСИРОВАННЫМ МОМЕНТОМ ОКОНЧАНИЯ Автореферат Подписано в печать Формат 60x84 1/16. Объем 1 п.л.

Тираж 150 экз. Заказ №

 

Похожие работы:





 
2013 www.netess.ru - «Бесплатная библиотека авторефератов кандидатских и докторских диссертаций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.