Аналитическое и численное исследование некоторых нелинейных задач оптимального управления, допускающих особые режимы тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат наук Орлов Сергей Михайлович
- Специальность ВАК РФ01.01.02
- Количество страниц 168
Оглавление диссертации кандидат наук Орлов Сергей Михайлович
Введение
1 Исследование некоторых классов нелинейных одномерных задач оптимального управления с особыми режимами
1.1 Модифицированная модель Рамсея с постоянной эластичностью
1.1.1 Решение задачи на основе специального интегрального представления функционала
1.1.2 Классификация типов оптимальных решений задачи
1.1.3 Решение задачи с помощью принципа максимума Понтрягина и достаточных условий оптимальности
1.1.4 Решение задачи с помощью метода динамического программирования Беллмана
1.1.5 Исследование характера зависимости оптимального значения функционала от параметров задачи
1.2 Модифицированная модель Рамсея с переменной эластичностью
1.2.1 Случай кусочно-гладкой непрерывной функции £(•)
1.2.2 Случай кусочно-постоянной функции £(•) с одним переключением
1.3 Модифицированная модель экономического роста
1.3.1 Постановка задачи
1.3.2 Вилка для допустимых траекторий
1.3.3 Задача на конечном промежутке времени
1.3.4 Задача на бесконечном горизонте планирования
2 Исследование ряда нелинейных двумерных и трёхмерных задач оптимального управления
2.1 Модель двухсекторной экономики на конечном горизонте планирования
2.1.1 Каноническая форма задачи
2.1.2 Сведение более общей задачи управления к канонической форме
2.1.3 Анализ задачи с помощью принципа максимума Понтрягина
2.1.4 Анализ дифференциальных уравнений движения и сопряжённой системы при различных режимах управления
2.1.5 Анализ финального участка времени [в,Т]
2.1.6 Построение экстремального решения в случае ^ > 0. Обоснование его оптимальности
2.1.7 Численные эксперименты
2.2 Модель двухсекторной экономики на бесконечном горизонте планирования
2.2.1 Постановка задачи
2.2.2 Краевая задача принципа максимума
2.2.3 Нахождение максимизатора функции Гамильтона-Понтрягина
2.2.4 Вычисление возможного особого режима задачи
2.2.5 Решение краевой задачи (2.94) в случае, когда начальная точка лежит
на особом луче
2.2.6 Решение задачи (2.94) в случае, когда начальная точка лежит ниже особого луча
2.2.7 Обоснование оптимальности экстремального решения в случае, когда начальная точка лежит ниже особого луча
2.2.8 Формулировка основного утверждения
2.2.9 Оценка роста фазовых переменных задачи
2.2.10 Метод прогонки для решения краевой задачи (2.117)
2.2.11 Численные эксперименты
2.3 Модель распространения вируса гриппа
2.3.1 Постановка задачи
2.3.2 Исходная модель
2.3.3 Исследование системы дифференциальных уравнений модели
2.3.4 Краевая задача принципа максимума
2.3.5 Численные эксперименты
Заключение
Список литературы
Список рисунков
Список таблиц
Л Постановка задачи оптимального управления
А.1 Задача на конечном промежутке времени
А.2 Задача на бесконечном горизонте планирования
Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Исследование некоторых нелинейных управляемых процессов на конечном и бесконечном промежутках времени2013 год, кандидат физико-математических наук Пучкова, Алёна Игоревна
Конечномерные методы в прикладных задачах оптимального управления2013 год, кандидат физико-математических наук Бондаренко, Наталия Валерьевна
Исследование свойств гамильтоновых систем и функций цены в динамических моделях роста2012 год, кандидат физико-математических наук Усова, Анастасия Александровна
Достаточные условия оптимальности импульсных процессов и их приложения2003 год, кандидат физико-математических наук Антипина, Наталья Валерьевна
Оптимизация переключений непрерывно-дискретных управляемых процессов2022 год, кандидат наук Урюпин Илья Вадимович
Введение диссертации (часть автореферата) на тему «Аналитическое и численное исследование некоторых нелинейных задач оптимального управления, допускающих особые режимы»
Введение
Актуальность темы. Во второй половине XX века в связи с появлением новых прикладных задач, исследование которых методами классического вариационного исчисления испытывало значительные трудности, начала формироваться теория оптимального управления. Основополагающий результат теории оптимального управления, а именно принцип максимума Понтрягина [1], был разработан в пятидесятые годы группой выдающихся советских учёных во главе со Львом Семёновичем Понтрягиным. Большой вклад в развитие теории оптимального управления и её приложений внесли учёные Н.Н. Красовский, Ю.С. Осипов, А.В. Кряжимский, А.Б. Куржанский, Ф.П. Васильев, В.И. Благодатских, С.М. Асеев, М.И. Зеликин, В.М. Тихомиров, Ф.Л. Черноусько, Р. Габасов, Ф.М. Кириллова, М. Атанс, П. Фалб, Р. Беллман, Ф. Кларк, А. Брайсон, Хо Ю-ши, Э. Ли, Л. Маркус и многие другие.
Рассмотрим возможные постановки задач оптимального управления. Пусть x = f (t,x,u) — система дифференциальных уравнений, описывающая процесс изменения состояния x некоторого объекта. Процессом изменения состояния объекта можно управлять с помощью изменения параметра u — управления — в каждый момент времени t. Целью управления является перевод объекта из состояния Хо в момент времени t = t0 в состояние ti в момент времени t = t1, минимизируя при этом некоторый критерий качества процесса управления J (что равносильно максимизации — J). При этом параметры t0 и x0 обычно фиксированы, а параметры t1 и x1 могут быть как фиксированы, так и свободны. Критерий качества управления J может быть задан, например, интегральным функционалом J = J^1 f0(t,x,u) dt (важным является случай f0 = 1 — задача оптимального быстродействия) или терминальным функционалом J = ^(x(t1)) (здесь t1 фиксирован, а x1 свободен). Всегда можно перейти от задачи оптимального управления с интегральным функционалом к задаче оптимального управления с терминальным функционалом и наоборот. Отметим, что в задаче оптимального управления возможны фазовые ограничения, то есть условия типа неравенства на переменную x.
Таким образом, теория оптимального управления охватывает широкий спектр математических задач, которые, в свою очередь, могут описывать процессы и задачи из различных областей науки, например, задачу перевода механического объекта из одного состояния в другое за минимальное время [2], задачу о мягкой посадке на Луну с минимальным расходом топлива [3], задачу вакцинации населения при эпидемии вируса гриппа A(H1N1) [4], задачу оптимального ведения рыбного хозяйства [5], задачу оптимального управления процессом лечения рака [6, стр. 103-111], задачу оптимального управления температурой в реакто-
ре [7], задачу оптимального распределения ресурсов в колонии микроорганизмов [8], задачу оптимального потребления и накопления [9, стр. 13-14] и многие другие. Таким образом, в связи с богатыми возможностями моделирования различных процессов и с появлением мощного инструмента исследования этих задач, после открытия принципа максимума Понтряги-на теория оптимального управления переживала стремительное развитие и нашла широкое применение в различных приложениях: экономика и финансы; эпидемиология, медицина и иммунология; биология, экология и климатология; физика, механика и робототехника и другие. В настоящее время исследования нелинейных задач оптимального управления актуальны ещё и в связи с растущим применением математического моделирования для изучения сложных процессов различной природы, а полученные выводы могут быть интересны для тех, кто принимает решения.
Принцип максимума Понтрягина является, вообще говоря, необходимым условием оптимальности, и не всегда можно получить решение задачи только с его помощью. Например, в конкретной задаче может быть широкое множество экстремалей (траекторий, удовлетворяющих принципу максимума), из которых нужно выделить оптимальную траекторию, или, если найдена некоторая экстремаль, то необходимо обосновать её оптимальность. Поэтому получение достаточных условий оптимальности является важной частью развития математических методов теории оптимального управления, много работ посвящено этому направлению исследований (см., например, [10-15]). В диссертационной работе активно используются достаточные условия оптимальности [14], сформулированные в терминах конструкций принципа максимума Понтрягина. Следует отметить, что для исследования различных задач оптимального управления популярен метод динамического программирования Беллмана [16].
Изначально задачи оптимального управления рассматривались на конечном промежутке времени, так как большинство из них имело приложение в физике и механике. Появление новых задач, вытекающих, в том числе, из экономических приложений, обусловило развитие теории оптимального управления для задач на бесконечном горизонте планирования (термин из экономики, который в данном контексте обозначает бесконечный промежуток времени). Сложность задач в новой постановке, связанная с неограниченностью времени управления, повлекла новые трудности и свойства по сравнению с задачами на конечном промежутке времени: обоснование существования оптимального управления, различные определения оптимальности, сходимость траекторий системы и функционала, условия трансверсальности. Важные теоретические результаты отражены, например, в работах [1,9,17-21].
Применение принципа максимума Понтрягина для изучения задач оптимального управления является популярным способом их исследования. Эффективность применения метода зависит от конкретной задачи: часто кажущиеся на первый взгляд простые нелинейные задачи требуют больших усилий для их решения и не всегда могут быть решены только с помощью принципа максимума. Тогда в силу могут вступить некоторые математические методы и приёмы, позволяющие решить задачу. Если и они не помогают в решении, то в этом случае можно провести численное исследование.
В диссертационной работе развиваются методы, позволяющие исследовать аналитически и численно некоторые прикладные нелинейные задачи оптимального управления. Постановки задач включают задачи на конечном и на бесконечном промежутках времени. Предлагаемые методы работают с использованием принципа максимума Понтрягина или на основе прямого сравнения функционалов. Кроме того, в диссертации разрабатываются алгоритмы численного построения решений задач оптимального управления.
Данная диссертационная работа примыкает к исследованиям в области развития методов теории оптимального управления, а также к области исследования конкретных прикладных задач, интересных для приложений в теории экономического роста и эпидемиологии.
Цели диссертационной работы. В проводимых в диссертации исследованиях ставились следующие цели:
— Разработка методов исследования нелинейных задач оптимального управления, позволяющих получить оптимальные решения, и изучение на основе предложенных методов определённых задач и классов нелинейных задач оптимального управления различных размерностей, представляющих интерес для приложений.
— Разработка численных алгоритмов построения оптимальных решений на основе исследования специальной краевой задачи принципа максимума и их применение для исследования ряда конкретных моделей.
Методы исследования. Основными методами, используемыми в диссертационной работе, являются математические методы теории оптимального управления, включающие принцип максимума Понтрягина и достаточные условия оптимальности. В работе также используется метод динамического программирования Беллмана.
Научная новизна работы. В диссертационной работе предложены новые методы исследования одного класса задач оптимального управления с разрывной правой частью и для некоторых моделей двухсекторной экономики. На основе предложенных методов впервые получен аналитический вид оптимальных решений в модифицированной модели экономического роста на конечном и бесконечном горизонтах планирования, в модифицированной модели Рамсея с переменной эластичностью производства и в задачах двухсекторной экономики на конечном и бесконечном горизонтах планирования. Предложен численный алгоритм решения одной специальной краевой задачи принципа максимума для нахождения оптимального решения в модели двухсекторной экономики, а также проведён сравнительный анализ двух допустимых режимов управления, интересных для приложений, в модели из области эпидемиологии.
Теоретическая и практическая значимость. Диссертационная работа носит теоретический характер. Результаты работы можно применять для теоретического и численного исследования как конкретных задач из изученных классов задач оптимального управления, так и некоторых смежных классов задач оптимального управления.
Апробация результатов работы. Основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях и семинарах:
— Научные семинары кафедры оптимального управления «Качественные вопросы теории оптимального управления» под руководством Киселёва Ю.Н., Аввакумова С.Н. и Орлова М.В. (факультет ВМК МГУ)
— Научная конференция «Ломоносов — 2011» (Москва, апрель 2011)
— Научная конференция «Ломоносов — 2012» (Москва, апрель 2012)
— Научная конференция «Ломоносов — 2013» (Москва, апрель 2013)
— Научная конференция «Тихоновские чтения — 2013» (Москва, октябрь 2013)
— Научная конференция «Ломоносовские чтения — 2014» (Москва, апрель 2014)
— Научная конференция «Тихоновские чтения — 2014» (Москва, октябрь 2014)
— II Международный семинар, посвящённый 70-летию со дня рождения академика А.И. Субботина (Екатеринбург, апрель 2015)
— 13th Viennese Workshop on Optimal Control and Dynamic Games (Вена, май 2015)
Публикации. Основные результаты по теме диссертации изложены в 18 печатных изданиях, 5 из которых изданы в журналах, рекомендованных ВАК [22-26], 3 — в сборниках [27-29], 10 — в тезисах докладов [30-39].
Личный вклад. Личный вклад автора заключается в формулировке и обосновании основных теоретических результатов и проведении численных экспериментов. Вклад соавторов заключается в следующем. Научный руководитель Ю.Н. Киселёв является автором постановок задач и предложения по использованию подходов к их исследованию. В работах [22,24] М.В. Орловым предложен, на основе анализа экономической литературы по моделям, выбор нового типа функционала, а в работе [26] им был подготовлен обзор экономической литературы.
Объём и структура работы. Диссертация состоит из введения, двух глав, заключения и приложения. Полный объём диссертации составляет 168 страниц с 67 рисунками и 3 таблицами. Список литературы содержит 70 наименований.
Благодарности. Автор глубоко благодарен своему научному руководителю Ю.Н. Киселёву за всестороннюю многолетнюю поддержку и постоянное внимание к работе.
Автор выражает благодарность С.Н. Аввакумову, С.М. Асееву, В.В. Баландину, А.В. Кря-жимскому и Е.А. Ровенской за плодотворные беседы и советы по теме диссертации, а также всему коллективу кафедры оптимального управления ВМК МГУ за поддержку и помощь в различных вопросах.
Автор очень признателен маме Т.В. Орловой и Е.С. Анисимовой за понимание и неоценимую моральную поддержку на всех этапах работы над диссертацией.
Глава 1
Исследование некоторых классов нелинейных одномерных задач оптимального управления с особыми режимами
В этой главе исследуются некоторые нелинейные одномерные задачи и классы нелинейных одномерных задач оптимального управления, имеющие приложения в теории экономического роста. Важной особенностью исследуемых задач, осложняющей поиск оптимального решения, является наличие особых режимов [40], а именно таких режимов управления, для которых принцип максимума обращается в тождество на некотором интервале времени на некотором подмножестве области управления (подмножество состоит более, чем из одного элемента). Эффективным методом решения этих задач является метод специального интегрального представления функционала [41,42], который может быть применён для исследования некоторых одномерных задач оптимального управления на бесконечном горизонте планирования. В работе он был обобщён для случая неавтономной разрывной правой части в дифференциальном уравнении.
В первом разделе главы рассматривается модифицированная модель Рамсея с постоянной эластичностью производства. Она исследуется с помощью трёх различных подходов: первый основан на методе специального интегрального представления функционала, второй — на основе принципа максимума Понтрягина и достаточных условий оптимальности (см. работу [14]), третий — метод динамического программирования Беллмана. В диссертации подробно излагается решение задачи с помощью каждого из указанных способов, что представляет методический интерес и является базой для дальнейших исследований усложнённых версий этой задачи. Кроме того, в работе находится оптимальное значение функционала в зависимости от параметров задачи, проводится исследование этой зависимости и
указывается возможное приложение полученного результата к задаче с неопределённостью в параметрах.
Далее во втором разделе модифицированная модель Рамсея обобщается на два класса задач оптимального управления с переменной эластичностью производства. Здесь термин «класс» считается применимым, потому что в постановке задачи фигурирует произвольная функция из некоторого функционального класса, удовлетворяющая некоторым дополнительным ограничениям. Первый класс — это задачи с кусочно-гладкой непрерывной функцией эластичности и ограниченной производной, второй класс — задачи с кусочно-постоянной функцией эластичности с одним переключением.
Оказывается, что для первого класса решение задачи остаётся качественно тем же самым, а во втором классе возникают некоторые технические трудности за счёт разрыва в правой части дифференциального уравнения, которые преодолеваются специальным подходом к решению задачи, состоящим в разбиении задачи на две по временному интервалу, решения каждой из полученных задач, а затем «склейки» оптимальных решений. Обсуждаются возможности обобщения предложенного подхода для задач с кусочно-постоянной функцией эластичности с конечным или бесконечным числом изолированных переключений.
В последнем разделе главы исследуется одномерная экономическая модель на конечном и на бесконечном горизонтах планирования. Для нахождения оптимального решения этой задачи используется метод специального интегрального представления функционала, причём в случае конечного промежутка времени метод используется в совокупности с принципом максимума Понтрягина. Большое внимание уделяется проблеме поиска численного решения нелинейного уравнения для особого режима задачи.
1.1 Модифицированная модель Рамсея с постоянной эластичностью
Рассмотрим задачу оптимального управления
ж = — ^ж, ж(0) = ж0,
7 (1.1)
3м = / е ^(1 - м)ж£ ^ ->• тах , 7 ОеУи
0
где одномерная фазовая переменная ж(-) играет роль фондовооружённости, управление и(-) — доля инвестиций от производственного выпуска — принадлежит классу кусочно-непрерывных управлений (см. приложение А.2) и подчинено геометрическому ограничению и(Ь) € и = [0,1], Ь ^ 0, параметр ^ > 0 — коэффициент амортизации производственных фондов (случай ^ = 0 может быть рассмотрен по такой же схеме), параметр V > 0 — коэффициент дисконтирования, параметр е € (0,1) — коэффициент эластичности по производственным
фондам. Функция Г (х) = х£, встречающаяся в дифференциальном уравнении и в функционале, является масштабированной производственной функцией Кобба-Дугласа. Функционал качества 3(и) играет роль дисконтированного удельного потребления на бесконечном промежутке времени 0 ^ £ < Задача состоит в поиске такого допустимого управления и(-) из класса допустимых управлений У и, которое максимизирует значение функционала 3 (и) по всем допустимым управлениям из класса допустимых управлений. Задача (1.1) с произвольной производственной функцией неоклассического типа и на конечном промежутке времени, 0 ^ £ ^ Т, исследовалась в работах [43, стр. 159-170], [44].
Для задачи (1.1) даётся полная классификация типов оптимальных решений, рассматриваются три подхода к её решению: на основе специального интегрального представления функционала (см. также [41]), с помощью принципа максимума Понтрягина [1] с привлечением теоремы [14] о достаточных условиях оптимальности в терминах конструкций принципа максимума, а также на основе метода динамического программирования Беллмана [16,45].
В работе получена явная зависимость оптимального значения функционала 3) от параметров задачи и исследован характер этой зависимости. Рассмотрен пример приложения этого подхода к задаче (1.1) с неопределённостью в параметрах задачи.
1.1.1 Решение задачи на основе специального интегрального представления функционала
Понятие допустимой траектории, соответствующей допустимому управлению, описано в приложении А.2.
Лемма 1.1.1. Любая допустимая траектория х(£) в задаче (1.1) допускает следующую двустороннюю оценку
х-(£) ^ х(£) ^ х+(£), £ ^ 0, (1.2)
где нижняя граница х-(£) вилки (1.2), получаемая при управлении и(£) = 0, определяется формулой
х_(£) = х0е-^, (1.3)
а верхняя граница х+(£) вилки (1.2), получаемая при управлении и(£) = 1, определяется формулой
1
1-Е
. (1.4)
Множеством достижимости X(Т) в момент времени Т ^ 0 является отрезок, концами которого служат границы вилки (1.2) в момент времени Т:
х+(£)
х1
Я
+
Я
1
1
X (Т ) = [х_ (Т), х+(Т)].
(1.5)
Доказательство. Перепишем дифференциальное уравнение задачи (1.1) в виде
х £х = и(Ь) — £, х(0) = хо,
и, полагая у = ж1 £, уо = х^ £, получим линейное неоднородное дифференциальное уравнение
у = —— е)У +(1 — ФСО, У(0) = Уо-
(1.6)
Решение задачи Коши (1.6) запишем в виде
у(Ь) = е - - £)ь
уо + / е^(1-£)*(1 — е)и(в) ^
(1.7)
Из (1.7), в силу неравенств 0 ^ и(Ь) ^ 1, Ь ^ 0, следуют неравенства
у(Ь) ^ уое-^(1-£)ь, Ь ^ 0,
V V/ V
(1.8)
(1.9)
Справедливость неравенства (1.8) очевидна. Обоснование неравенства (1.9) следует из цепочки соотношений
у(Ь) ^ е-^(1-£)ь = е-М1-Ф
Уо + / е^(1-£)*(1 — е)1 ^
0
Уо
«=0
Уо +
V
е^(1-е)4 _ 1
= [Уо~ - ) е"*1"^ + -
V
Двойное неравенство (1.2) следует из полученных неравенств (1.8), (1.9). Действительно,
х{г) = ^ = = о,
х(г) = [у (г)]— ^
V* ~ V е-«1-* + ±
1
1-Е
= х+(Ь), Ь ^ 0.
Для проверки утверждения (1.5) установим включения
X(Т) С [х- (Т),х+(Т)],
X(Т) э [х-(Т),х+(Т)].
(1.10) (1.11)
г
г
Включение (1.10) следует из неравенства (1.2). Проверим включение (1.11). Очевидно, х-(Т) Е X(Т),х+(Т) € X(Т). Остаётся проверить аналогичное включение для любой внутренней точки отрезка [х-(Т),х+(Т)]. При постоянном управлении и(£) = V Е [0,1] соответствующая траектория х(^) в момент времени £ = Т допускает представление
х(Т^)
»1-е _ ^ \ , ^
- - ' +
= ВД.
Функция Л^) непрерывно зависит от аргумента V Е [0,1], причём Л(0) = х-(Т), Л(1) = х+ (Т). Следовательно, для любого £ Е [х-(Т),х+ (Т)] существует такое V Е [0,1], что х(Т^) = Л^) = = £, следовательно, верно включение (1.11). Включения (1.10), (1.11) влекут равенство (1.5).
Лемма 1.1.2 (основная лемма). Функционал 3 в задаче (1.1) допускает представление
3[х(-)] = хо + [ (х(£)) (1.12)
о
где функция Ш(х) определяется равенством
W(х) = хЕ - (^ + V)х, х ^ 0. (1.13)
Доказательство. Из дифференциального уравнения задачи (1.1) управление и можно выразить через х и х:
и = (1.14)
хЕ
Подстановка (1.14) в функционал 3 задачи (1.1) даёт
VÍ Г £
3[х] = / е [хЕ - х - ^х] (1.15)
или
3[х(-)]=у е"Нх£ - ^х] ^ - I, (1.16)
о
VI -¡1\ 7, I —VI
I = у ^ = у е"^х(£), (1.17)
о о
С помощью формулы интегрирования по частям получаем
I = е-^х
- I х(£)(^)е-^ ^ = —х0 + / (1.18)
о
1
1-Е
Формулы (1.16)—(1.18) приводят к доказательству утверждений (1.12), (1.13) леммы 1.1.2. В
/ 1
Введём обозначение а = - . Несложно показать, что справедлива следующая
+
лемма о свойствах функции Ш(ж).
Лемма 1.1.3. Функция Ш(ж) обладает следующими свойствами: Ш(0) = 0, Ш(а) = 0, Ш(+то) = -то; Ш(ж) > 0, ж € (0,а); Ш(ж) < 0, ж € (а, + то); Ш'(ж) > 0, ж € (0,ж*); Ш'(ж*) = 0; Ш'(ж) < 0, ж € (ж*, + то), где ж* — единственный максимизатор функции Ш(■):
ж* = а^шах Ш (ж) = argmax Ш (ж), (1.19)
0<х<ст
который вычисляется по формуле ж*
1
1 — £
^ + V,
Сформулируем основной результат для задачи (1.1). Теорема 1.1.4. Оптимальная траектория жор (Ь) в задаче (1.1) определяется равенством
жор^) = а^шахШ(ж), Ь ^ 0. (1.20)
хех (4)
Оптимальное управление иор^Ь) в задаче (1.13) имеет вид
иорь (¿) = (1.21)
в точках дифференцируемости траектории (1.20) и удовлетворяет в этих точках включению Иор1;(Ь) € [0,1].
Доказательство. Утверждения теоремы 1.1.4 вытекают из лемм 1.1.1-1.1.3. Действительно, рассмотрим траекторию (1.20) и возьмём любую допустимую траекторию ж(Ь) € X(Ь). На основе представления (1.12) запишем следующее выражение для приращения функционала
Д3 = 3[ж] - 3Ы = У (ж(Ь)) - Ш(жор^))] (1.22)
0
Из определения функции (1.20) имеем неравенство Ш (ж(Ь)) — Ш (жо^(Ь)) ^ 0, справедливое для любого Ь ^ 0, а следовательно, для (1.22) верна оценка Д3 ^ 0 для приращения функционала, что доказывает оптимальность траектории (1.20). Таким образом, траектория (1.20) максимизирует функционал 3 в задаче (1.1). Соотношение (1.21) вытекает из дифференциального уравнения задачи (1.1). Докажем справедливость включения (¿) € [0,1] в точках дифференцируемости функции (1.20). В силу леммы 1.1.1 множество достижимости X(Т) в каждый момент времени Т представляет собой отрезок [ж-(Ь),ж+ (Ь)]. Тогда для оптимальной
£
траектории хор(Ь), с учётом (1.5), (1.19), (1.20) верно следующее представление
Жор! (Ь) = <
х+(Ь), X* > х+(Ь), х*, X* £ [х-(Ь),х+(Ь)], х_(Ь), х* < х_(Ь).
Следовательно, в точках дифференцируемости хор (Ь) по формуле (1.21) получаем
1, х* > х+ (¿),
= = -т- е (од), х* е [х-(г),х+(г)],
/Л + ^
0, х* < х_(Ь).
V
Теорема 1.1.4 доказана. ■
Замечание 1.1.4.1. Имеет место свойство единственности оптимальной траектории задачи (1.1).
Замечание 1.1.4.2. Формулу для оптимальной траектории (1.20) можно переписать в виде хор!(Ь) = х±(Ь) + Дх(фа1((х* - х±(Ь))/Дх(Ь)), Ь > 0,
И ^ 1,
где ва^з) = ^ — функция насыщения, х±(Ь) = (х+(Ь) + х_(Ь))/2,
sign(s), |з| > 1,
Дх(Ь) = (х+(Ь) - х_(Ь))/2. 1.1.2 Классификация типов оптимальных решений задачи
В зависимости от начального состояния х(0) = хо > 0 рассмотрим три случая: «малые» начальные значения 0 < х0 < х* (случай I); особое начальное значение х0 = х* (случай II); «большие» начальные значения х0 > х* (случай III).
В случае I имеется один особый участок [т[, + то), где т — точка излома оптимальной траектории,
(х+ (Ь), 0 ^ Ь<п, (1, 0 ^ Ь<п,
хор! (Ь) = \ «ор!^) = <
I х*, Т1 ^ Ь < I ^х*_£, Т1 ^ Ь <
причём точка переключения т определяется из уравнения х* = х+ (т) равенством
М1 - е) 1/^ -
х
В случае II особый участок распространяется на весь интервал [0, + то): xopt(t) = ж*,
Uopt(t) = ^ж*-£.
В случае III имеется один особый участок [тщ, + то), где тщ — точка излома оптимальной траектории,
(x-(i), 0 ^ t < тщ, io, 0 ^ t < tiii,
uopt(t) = \
x*, tiii ^ t < +то, I ^x*-£, тш ^ t < +то,
причём точка переключения тщ определяется из уравнения ж* = ж- (тщ) равенством
1 1 ^ п
Тщ = — In — >0.
x %
Итак, рассмотрены все возможные случаи и дана полная классификация типов оптимальных решений задачи (1.1). Выяснено, что оптимальное решение может иметь не более одной точки переключения (излома) и не более одного особого участка, а особый участок может быть только бесконечным.
В качестве иллюстрации полученной выше классификации были рассмотрены три набора параметров, отвечающие, соответственно, каждому из случаев:
3
I : £ = -, ж0 = 10, ß = 0.2, v = 0.1; II : е = ж0 = ж* w 0.78, fi = 0.2, и = 0.1; III: £ = ж0 = 2, ц = 0.2, v = 0.1.
Для каждого набора параметров была решена задача оптимального управления (1.1) указанным выше способом, найдены соответствующие особые режимы управления и оптимальные процессы. На рисунках 1.1-1.3 представлены оптимальные траектории xopt(t) для каждого из наборов параметров, лежащие в каждый момент времени T > 0 внутри множества достижимости X (T), которое представлено на графиках в виде пунктирных линий x+(t) и ж-(t).
1.1.3 Решение задачи с помощью принципа максимума Понтрягина и достаточных условий оптимальности
Составим функцию Гамильтона-Понтрягина K(t,x,0,u) = e-vt(1 — u)x£ + 0(ux£ — ^ж), сопряжённое уравнение
0 = — K'x(t,x,0,u) = —£((1 — u)e vt + 0u)x£ 1 +
и функцию переключения п = х £К'и(¿,х,ф,м) = —е 1гЬ + ф = п(Ь,ф) (здесь мы избавляемся от знакопостоянного члена х£). Тождество п = 0 равносильно тождеству
__-vt
ф = e
(1.23)
а тождество п = 0 — тождеству ф = — ^е , которое в силу основного и сопряжённого уравнений принимает вид
—е((1 - u)e-vt + фи)ж£-1 + ^ф = — ve-vt
или с учётом (1.23)
—е((1 — u)e-vt + e-vtu)x£-1 + ße-vt = — ve
vt
Отсюда, после взаимного уничтожения двух членов, содержащих управление, и почленного умножения на положительный множитель е^, получаем равенство
£— 1 |
— еж + ß = —v.
(1.24)
Так как ж > 0, то из (1.24) находим ж =
1
1-Е
4ß + v
особого режима траектория сохраняет постоянное значение
Таким образом, вдоль возможного
sng,
(1.25)
где xsng
ß + v
1
1-Е
ж*, здесь ж* — максимизатор (1.19) функции W(ж) (см. лемму 1.1.3).
Дифференцирование соотношения (1.25) по времени даёт х = 0, откуда в силу дифференциального уравнения задачи (1.1) определяется особое управление
U Usng, Usng ^^^^
1- £
ße ß + v
e (0,1).
ж(£)
ж(£)
-1-1-1-г
О 4 8 12 16 20 о
rt
0 2 4 6 8 10 12 14 16 0 2 4 6 8 10 12 14 16
Рисунок 1.1: Оптимальная Рисунок 1.2: Оптимальная Рисунок 1.3: Оптимальная траектория в I случае траектория во II случае траектория в III случае
е
е
*
С учётом проделанного выше исследования имеет место следующее выражение для мак-симизатора функции Гамильтона-Понтрягина:
и*(Ь,ф)
1, п(Ь,ф) > 0
м8П§, п(Ь,ф) = 0, (1.26)
0, п(Ь,ф) < 0.
Тогда краевая задача принципа максимума принимает вид:
х = м*х£ — ^х, х(0) = х0,
ф = —е^(п)пх£_1 - ее_^х£_1 + ^ф, ф(+то) = 0,
(1.27)
1, 0,
где Л,(з) = ^ — функция Хевисайда. Заметим, что краевое условие ф(+то) =
0, 5 ^ 0,
0 не является необходимым условием оптимальности. Ниже будет показано, что решение задачи (1.27) с таким условием существует и будет указано в явном виде. Предположим, что найдено решение
(хор^),Иор!(Ь)), 0 ^ Ь< (1.28)
краевой задачи (1.27). Тогда в соответствии с методологией обоснования оптимальности экстремального решения, предложенной в [14], рассмотрим любой допустимый процесс
Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Неравенства Гамильтона-Якоби в задачах оптимального управления дискретно-непрерывными системами2012 год, кандидат физико-математических наук Сорокин, Степан Павлович
Методы и алгоритмы оптимизации динамических систем, описываемых линейными уравнениями с управляемыми коэффициентами2013 год, кандидат наук Батурина, Ольга Владимировна
Методы решения некоторых классов задач оптимального управления и дифференциальных игр2005 год, кандидат физико-математических наук Камзолкин, Дмитрий Владимирович
Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности2012 год, кандидат физико-математических наук Пегачкова, Елена Александровна
Методы решения задач оптимального управления с бесконечным горизонтом2008 год, кандидат физико-математических наук Красовский, Андрей Андреевич
Список литературы диссертационного исследования кандидат наук Орлов Сергей Михайлович, 2016 год
Список литературы
1. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. Г. Болтянский, Р. В. Гамкрелидзе, Е. Ф. Мищенко. — Москва: Наука, 1961. — 391 с.
2. Chitsaz H., LaValle S. M. Time-optimal paths for a Dubins airplane // Decision and Control, 2007 46th IEEE Conference on. — 2007. — Dec. — Pp. 2379-2384.
3. Meditch J. S. On the problem of optimal thrust programming for a lunar soft landing // Automatic Control, IEEE Transactions on. — 1964. — Oct. — Vol. 9, no. 4. — Pp. 477-484.
4. Optimal Control Applied to the Spread of Influenza A(H1N1) / M. El hia, O. Balatif, J. Bouyaghroumni et al. // Applied Mathematical Sciences. — 2012. — Vol. 6, no. 82. -Pp. 4057-4065.
5. Orlov M. V., Puchkova A. I. Optimal Harvest Strategies in a Fisheries Management Model // Computational Mathematics and Modeling. — 2014. — Vol. 25, no. 1. — Pp. 57-71. — (Перевод статьи: Орлов М. В., Пучкова А. И. Оптимальные стратегии вылова в модели ведения рыбного хозяйства // Прикладная математика и информатика. — 2013. — № 42.
- С. 62-75).
6. Krabs W., Pickl S. W. Modelling, Analysis and Optimization of Biosystems. — Springer Berlin Heidelberg, 2007. — 203 pp.
7. Multi-objective optimal control of chemical processes using {ACADO} toolkit / F. Logist, M. Vallerio, B. Houska et al. // Computers & Chemical Engineering. — 2012. — Vol. 37. — Pp. 191-199.
8. van den Berg H., Kiselev Yu. N., Orlov M. V. Studying Mathematical Models of Resource Allocation Among a Cell's Assimilator Mechanisms // Journal of Mathematical Sciences. — 2003. — Vol. 116, no. 6. — Pp. 3683-3732.
9. Seierstad A., Sydsœter K. Optimal Control Theory with Economic Applications. — North-Holland, 1987. — 462 pp.
10. Mangasarian O. L. Sufficient conditions for the optimal control of nonlinear systems // SIAM Journal on Control. — 1966. — Vol. 4, no. 1. — Pp. 139-152.
11. Arrow K. J. Applications of control theory to economic growth // Math. Decision Sci., Proc. 5th Summer Semin. Stanford 1967, Part 2, (Lectures Appl. Math., 12). — Amer. Math. Soc., Providence, RI, 1968. — Pp. 85-119.
12. Maurer H. First and second order sufficient optimality conditions in mathematical programming and optimal control // Mathematical Programming Study. — 1981. — Vol. 12. -Pp. 163-177.
13. Milyutin A. A., Osmolovskii N. P. Calculus of Variations and Optimal Control. — Providence, Rhode Island: American Mathematical Society, 1998. — 372 pp.
14. Киселёв Ю. Н. Достаточные условия оптимальности в терминах конструкций принципа максимума Понтрягина // Математические модели в экономике и биологии. Материалы научного семинара. Планерное Москов. обл. — МАКС Пресс Москва, 2003. — С. 57-67.
15. Bonnans J. F., Hermant A. Second-order analysis for optimal control problems with pure state constraints and mixed control-state constraints // Annales de l'Institut Henri Poincare. Annales: Analyse Non Lineaire/Nonlinear Analysis. — 2009. — Vol. 26, no. 2. — Pp. 561-598.
16. Беллман Р. Динамическое программирование. — Москва: Издательство иностранной литературы, 1960. — 400 с.
17. Halkin H. Necessary Conditions for Optimal Control Problems with Infinite Horizons // Econometrica. — 1974. — Vol. 42, no. 2. — Pp. 267-272.
18. Carlson D. A., Haurie A. B., Leizarowitz A. Infinite Horizon Optimal Control: Deterministic and Stochastic Systems. — Berlin Heidelberg: Springer-Verlag, 1991. — 332 pp.
19. Асеев С. М., Кряжимский А. В. Принцип максимума Понтрягина и задачи оптимального экономического роста // Тр. МИАН. — 2007. — Т. 257. — С. 3-271.
20. Aseev S. M. Infinite-Horizon Optimal Control with Applications in Growth Theory. — Moscow: MSU CMC Publications Department: MAKS Press, 2009. — 148 pp.
21. Асеев С. М., Бесов К. О., Кряжимский А. В. Задачи оптимального управления на бесконечном интервале времени в экономике // УМН. — 2012. — Т. 67, № 2(404). — С. 3-64.
22. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Исследование двухсекторной экономической модели с функционалом интегрального типа // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. — 2013. — № 4. — С. 27-37.
23. Kiselev Yu. N., Orlov S. M. A Class of Models Describing the Dynamics of Production and Infrastructure-Planning Indicators // Computational Mathematics and Modeling. — 2015.
Vol. 26, no. 2. — Pp. 213-243. — (Перевод статьи: Киселёв Ю.Н., Орлов С. М.
Исследование модифицированной модели "РОСТ" с особыми режимами // Прикладная математика и информатика. — 2014. — № 45. — С. 93-122).
24. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Оптимальная программа распределения ресурсов в двухсекторной экономической модели с функционалом интегрального типа при различных коэффициентах амортизации // Дифференциальные уравнения. — 2015. -Т. 51, № 5. — С. 671-687.
25. Киселёв Ю. Н., Орлов С. М. Исследование модифицированной модели Рамсея с переменной эластичностью производства // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. — 2015. — № 3. — С. 35-42.
26. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Исследование краевой задачи принципа максимума Понтрягина в модели двухсекторной экономики с интегральной функцией полезности // Журнал вычислительной математики и математической физики. — 2015. — Т. 55, № 11. — С. 1812-1826.
27. Орлов С. М. Задача оптимального управления в модели распространения вируса гриппа A(H1N1) // Сборник статей молодых ученых факультета ВМК МГУ. — Т. 10. — МАКС Пресс Москва, 2013. — С. 150-166.
28. Орлов С. М. Поиск оптимальных решений модифицированных версий модели "РОСТ" // Сборник научных трудов ф-та ВМК МГУ имени М.В. Ломоносова «Проблемы динамического управления> под редакцией Ю.С. Осипова, А.В. Кряжимского. — Т. 6. — МАКС Пресс Москва, 2012. — С. 78-101.
29. Киселёв Ю. Н., Орлов С. М., Орлов М. В. Исследование одной нелинейной задачи оптимального управления с особыми режимами // Сборник научных трудов ф-та ВМК МГУ имени М.В. Ломоносова «Проблемы динамического управления> под редакцией Ю.С. Осипова, А.В. Кряжимского. — Т. 5. — МАКС Пресс Москва, 2010. — С. 113-126.
30. Orlov M. V., Kiselev Yu. N., Orlov S. M. Optimal control problem for two-sector economic model with Cobb-Douglas production function // 13th Viennese Workshop on Optimal Control and Dynamic Games. Book of Abstracts. — Research Unit ORCOS Vienna, 2015. — P. 135.
31. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Модель Рамсея: три подхода к решению // Тезисы докладов II Международного семинара, посвященного 70-летию со дня рождения академика А.И.Субботина. — ИММ УрО РАН, УРФУ Екатеринбург, 2015. — С. 70-71.
32. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Исследование модели двухсекторной экономики с интегральным функционалом качества при различных коэффициентах амортизации // Тезисы конференции "Ломоносовские чтения - 2014". Секция вычислительной математики и кибернетики. МГУ имени М.В. Ломоносова. — 2014. — С. 24-25.
33. Киселёв Ю. Н., Орлов С. М. Упрощённая модель Рамсея с переменной эластичностью производства // Тихоновские чтения: Научная конференция, Москва, МГУ имени М.В. Ломоносова, 27-31 октября 2014г.: Тезисы докладов. — МАКС Пресс Москва, 2014. -С. 36.
34. Киселёв Ю. Н., Орлов М. В., Орлов С. М. Исследование модели двухсекторной экономики с интегральным функционалом качества при одинаковых коэффициентах амортизации // Тихоновские чтения: Научная конференция, Москва, МГУ имени М.В.Ломоносова, 28 октября - 1 ноября 2013 г.: Тезисы докладов. — МАКС Пресс Москва, 2013. — С. 29-30.
35. Орлов С. М. Особые режимы в модифицированной версии модели "РОСТ" // Современные методы теории функций и смежные проблемы: материалы Воронежской зимней матем. школы. — ИПЦ ВГУ Воронеж, 2013. — С. 171-172.
36. Орлов С. М. Управляемая модель распространения вируса гриппа A(H1N1) // Сборник тезисов XX Международной научной конференции студентов, аспирантов и молодых ученых <Ломоносов-2013>, секция Вычислительная математика и кибернетика. — Издательский отдел факультета ВМК МГУ имени М.В. Ломоносова, Москва, 2013. — С. 144-145.
37. Орлов С. М. Исследование некоторых нелинейных задач оптимального управления // Сборник тезисов лучших дипломных работ. — МАКС Пресс Москва, 2012. — С. 62-64.
38. Орлов С. М. Поиск оптимального решения в модели экономического роста специального вида // Сборник тезисов XIX Международной научной конференции студентов, аспирантов и молодых ученых <Ломоносов-2012>, секция Вычислительная математика и кибернетика. — Издательский отдел факультета ВМК МГУ имени М.В. Ломоносова, Москва, 2012. — С. 64-65.
39. Орлов С. М. Максимизация уровня развития технологий в одной модели экономического роста // Сборник тезисов XVIII Международной научной конференции студентов, аспирантов и молодых учёных <Ломоносов-2011>. — Издательский отдел ВМК МГУ имени М.В. Ломоносова, Москва, 2011. — С. 42-43.
40. Габасов Р., Кириллова Ф.М. Особые оптимальные управления. — Москва: URSS, 2013.
- 256 с.
41. Киселёв Ю. Н., Орлов М. В. Исследование одномерных оптимизационных моделей в случае бесконечного горизонта // Дифференциальные уравнения. — 2004. — Т. 40, № 12.
- С. 1615-1628.
42. Kiselev Yu. N., Orlov M. V. Investigation of One-Dimensional Resource Allocation Problems on an Infinite Time Interval // Computational Mathematics and Modeling.
2014. - Vol. 25, no. 2. - Pp. 231-238. - (Перевод статьи: Киселёв Ю.Н., Орлов М. В. Исследование одномерных задач распределения ресурсов на бесконечном промежутке времени // Сборник научных трудов ф-та ВМК МГУ имени М.В. Ломоносова «Проблемы динамического управления» под редакцией Ю.С. Осипова, А.В. Кряжимского. - МАКС Пресс, Москва 2005. - № 1. - С. 183-191). http://dx.doi.org/10.1007/s10598-014-9222-5.
43. Ашманов С. А. Математические модели и методы в экономике. — Москва: Издательство Московского университета, 1980. — 199 с.
44. Митягин Б. С. Заметки по математической экономике // УМН. — 1972. — Т. 27, № 3(165). - С. 3-19.
45. Киселёв Ю. Н. Метод динамического программирования в непрерывных управляемых системах (2 лекции). — http://lib.mexmat.ru/books/14710, 2006. — 33 с.
46. Кряжимский А. В., Тарасьев А. М. Краткосрочная адаптация и долгосрочная инвестиционная политика в моделях экономического роста // Материалы научной конференции "Тихоновские чтения 2013". — 2013. — С. 10.
47. Ulveling E. F., Fletcher L. B. A Cobb-Douglas Production Function with Variable Returns to Scale // American Journal of Agricultural Economics. — 1970. — May. — Vol. 52, no. 2.
- Pp. 322-326.
48. Ватанабе Ч., Решмин С. А., Тарасьев А. М. Динамическая модель процесса инвестиций в научно-технические разработки // Прикладная математика и механика. — 2001. -Т. 65, № 3. - С. 408-425.
49. Tarasyev A. M., Watanabe C. Optimal Dynamics of Innovation in Models of Economic Growth // Journal of Optimization Theory and Applications. — 2001. — Vol. 108, no. 1.
- Pp. 175-203.
50. Аввакумов С. Н., Киселёв Ю. Н. Численный метод поиска оптимального решения: модель "РОСТ" // Математические модели в экономике и биологии. Материалы научного семинара. Планерное Москов. обл. — МАКС Пресс Москва, 2003. — С. 1-15.
51. Построение оптимального решения и множеств достижимости в одной задаче распределения ресурсов / Ю. Н. Киселёв, В. Ю. Решетов, С. Н. Аввакумов, М. В. Орлов // Сборник научных трудов ф-та ВМК МГУ имени М.В. Ломоносова «Проблемы динамического управления» под редакцией Ю.С. Осипова, А.В. Кряжимского. — Т. 2. — МАКС Пресс Москва, 2007. - С. 106-120.
52. Avvakumov S. N., Kiselev Yu. N. Optimal control laws for the model of information diffusion in a social group // Computational Mathematics and Modeling. — 2011. — Vol. 22, no. 3. — Pp. 288-341.
53. Киселёв Ю. Н., Аввакумов С. Н., Орлов М. В. Задача оптимального распределения ресурсов в двухсекторной экономической модели с особыми режимами // Прикладная математика и информатика: Труды факультета ВМиК МГУ имени Ломоносова. — 2009.
- № 33. — С. 13-68.
54. On the LambertW function / R. M. Corless, G. H. Gonnet, D. E. G. Hare et al. // Advances in Computational Mathematics. — 1996. — Vol. 5, no. 1. — Pp. 329-359.
55. Самарский А. А., Гулин А. В. Численные методы. — Москва: Наука, 1989. — 432 с.
56. Чeбышёв П. Л. Полное собрание сочинений. Т. 5: Прочие сочинения. Биографические материалы. — Москва: Изд-во АН СССР, 1951. — 490 с.
57. Березин И. С., Жидков Н. П. Методы вычислений (том 2). — Москва: Физматгиз, 1959. — 620 с.
58. Аввакумов С. Н., Киселёв Ю. Н. Решение систем нелинейных уравнений на основе ряда Чебышёва // Проблемы математической физики. М.: ДИАЛОГ-МГУ. — 1998. — С. 5-27.
59. Давиденко Д. Ф. Об одном новом методе численного решения систем нелинейных уравнений // Доклады АН СССР. — 1953. — Т. 88, № 4. — С. 601-602.
60. Шалашилин В. И., Кузнецов Е. Б. Метод продолжения решения по параметру и наилучшая параметризация. — Москва: Эдиториал УРСС, 1999. — 224 с.
61. Киселёв Ю. Н., Аввакумов С. Н., Орлов М. В. Оптимальное управление. Линейная теория и приложения. — Москва: МАКС Пресс, 2007. — 270 с.
62. Аввакумов С. Н., Киселёв Ю. Н. Некоторые алгоритмы оптимального управления // Труды Института математики и механики УрО РАН. — 2006. — Т. 12, № 2. — С. 3-17.
63. Тарасьев А. М., Усова А. А. Построение регулятора для гамильтоновой системы двухсек-торной модели экономического роста // Дифференциальные уравнения и топология. II, Сборник статей. К 100-летию со дня рождения академика Льва Семеновича Понтрягина, Труды МИАН. — Т. 271. — МАИК Москва, 2010. — С. 278-298.
64. Iwasa Y., Roughgarden J. Shoot/root balance of plants: Optimal growth of a system with many vegetative organs // Theoretical Population Biology. — 1984. — Vol. 25, no. 1. — Pp. 78-105.
65. Киселёв Ю. Н., Орлов М. В. Оптимальная программа распределения ресурсов в двух-секторной экономической модели с производственной функцией Кобба-Дугласа при различных коэффициентах амортизации // Дифференциальные уравнения. — 2012. — Т. 48, № 12. - С. 1642-1657.
66. Киселёв Ю. Н., Орлов М. В. Исследование одной двухсекторной модели экономического роста с производственной функцией Кобба-Дугласа // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. — 2010. — № 2. -С. 21-28.
67. Киселёв Ю. Н., Орлов М. В. Оптимальная программа распределения ресурсов в двух-секторной экономической модели с производственной функцией Кобба-Дугласа // Дифференциальные уравнения. — 2010. — Т. 46, № 12. — С. 1749-1765.
68. Hattaf K., Yousfi N. Mathematical Model of the Influenza A(H1N1) Infection // Advanced Studies in Biology. - 2009. - Vol. 1, no. 8. - Pp. 383-390.
69. Андерсон Р., Мэй Р. Инфекционные болезни человека. Динамика и контроль (пер. с англ. А. А. Романюхи и С. Г. Руднева под ред. Г. И. Марчука). — Москва: Мир, Научный мир, 2004. - 768 с.
70. Ascher U. M., Petzold L. R. Computer Methods for Ordinary Differential Equations and Differential-Algebraic Equations. — Philadelphia, PA, USA: Society for Industrial and Applied Mathematics, 1998. — 314 pp.
Список рисунков
1.1 Оптимальная траектория в I случае..................................................16
1.2 Оптимальная траектория во II случае ..............................................16
1.3 Оптимальная траектория в III случае................................................16
1.4 График функции v(x0) ................................................................23
1.5 График функции Jx0(x0) = J(x0..............................................28
1.6 График функции J£(е) = J(ж0,е,Д,//)..................................................28
1.7 График функции JM(p) = J(x0................................................29
1.8 График функции Jv( v) = J(ж0,е,Д,v) ................................................30
1.9 Оптимальная траектория ..............................................................34
1.10 Функция usng (t) ........................................................................34
1.11 Оптимальная траектория ..............................................................35
1.12 Функция usng (t) ........................................................................35
1.13 Траектория из теоремы 1' ............................................................35
1.14 Функция usng (t) ........................................................................35
1.15 Оптимальная траектория xopt(t)......................................................44
1.16 Оптимальная траектория xopt(t)......................................................44
1.17 График нижней границы вилки......................................................47
1.18 Графики верхней границы вилки....................................................47
1.19 Множество достижимости Z(t) при z0 £ (0,1) ......................................47
1.20 Множество достижимости Z(t) при z0 = 1..........................................47
1.21 Множество достижимости Z(t) при z0 > 1..........................................48
1.22 График функции g(z,\)................................................................50
1.23 График функции zsng(Y) ..............................................................53
1.24 Графики функций <£m(z) при m =1, 2, 3, 4..........................................55
1.25 График функции W (z)................................................................58
1.26 Вид множества X(t,zi) ................................................................59
1.27 Оптимальная траектория z^t) при z0 = zsng........................................61
1.28 Оптимальная траектория z^t) при z0 > zsng........................................61
1.29 Оптимальная траектория z^t) при 0 < z0 < zsng..................................62
1.30 График функции h(0)..................................................................65
1.31 Оптимальная траектория z^t) при z0 = zsng........................................66
1.32 Оптимальная траектория z^t) при z0 > zsng ......................................66
1.33 Оптимальная траектория Zop (t) при 0 < zo < zsng..............67
1.34 Оптимальная траектория zop(t) при z0 = zsng ......................................70
1.35 Оптимальная траектория zop(t) при z0 > zsng ......................................70
1.36 Оптимальная траектория zop(t) при 0 < zo < zsng............71
1.37 Графики V(z) при различных параметрах ш2......................................72
1.38 Вид поверхности zsng(v,u2)............................................................73
1.39 Области в пространстве v и ш2 ......................................................73
2.1 Зависимость zsng от параметра ß......................................................84
2.2 Зависимость zsng от параметра е = е1................................................84
2.3 Оптимальная траектория на фазовой плоскости....................................110
2.4 Зависимость координат xi(t), x2(t) оптимальной траектории от времени .... 110
2.5 Зависимость координат u1(t), u2(t) оптимального управления от времени ... 110
2.6 Оптимальная траектория и выбранная допустимая траектория X(t) в фазовой плоскости ................................................................................111
2.7 Характер зависимости от времени функции J(t) ..................................112
2.8 Графики функций J(t), J(t)..........................................................112
2.9 Графики функций pAt.) = ; -¿=1,2..............................................113
2.10 График функции ^¿у, 0 ^ у ^ Т. На особом участке времени [т,в] эта функция равна е2/е1 = 1/3 ......................................................................113
2.11 Поведение вектора p(t) = (j^fy^ при 0 ^ t ^ T: на особом участке p1(t) = p2(t),
т ^ t ^ 9, вектор p(t) перпендикулярен гипотенузе треугольника U ............113
2.12 Оптимальная траектория на фазовой плоскости....................................140
2.13 Зависимость координат x1(t), x2(t) оптимальной траектории от времени .... 140
2.14 Зависимость координат u1(t), u2(t) оптимального управления от времени ... 141
2.15 Характер зависимости от времени функции J(t) ..................................141
2.16 Графики функций pAt) = г = 1,2..............................................142
2.17 Поведение вектора p(t) при 0 ^ t < ............................................142
2.18 Функция xo(t) ..........................................................................150
2.19 Управление u*(t)........................................................................150
2.20 Траектории x1(t), x3(t) ................................................................150
2.21 Траектория x2(t)........................................................................150
2.22 График функции 11(т) на отрезке [0,0.4]............................................151
2.23 График функции 11(т) на отрезке [0.4,1]............................................151
2.24 График функции 11(т) на отрезке [1,250]............................................152
2.25 График функции I3(u0) на отрезке [0,0.03]..........................................153
2.26 График функции I3(u0) на отрезке [0.03,0.06] ......................................153
2.27 График функции I3(u0) на отрезке [0.06,0.9]........................................153
2.28 График функции 12(т,щ) в окрестности точки (т2*,u0) ............................153
Список таблиц
1.1 Таблица значений функции 28Пё(7) ......................... 53
1.2 Оценки ошибок вычислений при 7 = |....................... 55
1.3 Оценки ошибок вычислений при 7 = I....................... 56
Приложение Л
Постановка задачи оптимального управления
Приложение подготовлено с использованием материалов из книги [1].
Л.1 Задача на конечном промежутке времени
Рассмотрим задачу оптимального управления
ж = f (ж,и), ж(0) = ж0,
Т 0 (А.1)
3[и(-)] = / f (£,ж,и) ^ ^ тах .
3 ОеУи
о
Здесь ж = (жь ... ) € X С Ега — фазовый вектор (X — область), и Е и С — управление, 3[и(-)] — функционал, подлежащий максимизации по всем допустимым управлениям из класса допустимых управлений. Вектор-функция f (ж,и) = ^:(ж,и),... ^га(ж,и)) определена и непрерывна по совокупности переменных на декартовом произведении X х и, и определены и непрерывны чаетнвге производив^ = 1, • • • ,п на X х II. Заметим,
что постановка задачи (А.1) включает в себя задачи (1.76), (2.1), (2.136), рассматриваемые в диссертации.
Допустимыми управлениями будем считать произвольные кусочно-непрерывные функции и = и(£), 0 ^ £ ^ Т со значениями из области управления и, а именно такие управления и = и(£), каждое из которых непрерывно для всех рассматриваемых £ Е [0,Т] за исключением лишь конечного числа моментов времени, где функция и(£) может терпеть разрывы первого рода. Для определённости будем считать, что во всякой точке разрыва функция и(£) непрерывна слева (и(т) = и(т — 0)), а также непрерывна в концах отрезка [0,Т].
Если выбрано некоторое допустимое управление и = и(£),£ Е [0,Т], тогда однозначно определяется закон движения х = х(£) из системы
х = f (х,и(г)), х(0) = хо, (А.2)
то есть решение задачи Коши (А.2), определённое на некотором отрезке времени. Именно, если управление и = и(£) имеет разрывы первого рода в точках т\,т2,... ,тк, где 0 < т\ < < т2 < ••• < тк < Т, то рассмотрим задачу Коши (А.2) на отрезке [0,71], где уравнение х = f (х,и(Ь)) имеет непрерывную правую часть. Обозначим через х(£) решение этого уравнения с начальным условием х(0) = х0. Если это решение определено на всём отрезке [0,71] и имеет в точке т\ значение х(т\), то мы можем рассмотреть уравнение х = f (х,и(Ь)) на отрезке [т\,т2] с начальным значением х(т\). Это решение также обозначим х(£). Таким образом, построенное решение х(Ь) непрерывно во всех точках своего определения и, в частности, в точке «сопряжения» т\. Если теперь решение х(Ь) определено на всём отрезке [0,т2] и имеет в точке т2 значение х(т2) то мы можем рассмотреть уравнение х = f (х,и(Ь)) на отрезке [т2,т3] с начальным значением х(т2) и т.д. Полученное таким образом решение х(Ь) задачи Коши (А.2) является непрерывным и кусочно-дифференцируемым, а именно во всех точках, кроме т\,т2,...,тк, решение х(£) (там, где оно определено) является непрерывно дифференцируемым. Построенное решение х(Ь) будем называть решением задачи Коши (А.2), соответствующим управлению и(Ь).
Допустимой траекторией, соответствующей допустимому управлению и = и(Ь), будем называть решение задачи Коши х = f (х,и(£)),х(0) = х0, определённое на отрезке [0,Т] и соответствующее управлению и(Ь).
Класс У и допустимых управлений состоит из произвольных допустимых управлений, определённых выше.
Значение функционала определено только для таких допустимых управлений, которым соответствует решение на всём отрезке [0 ,Т].
Задача состоит в поиске такого допустимого управления и(Ь) из класса Уи допустимых управлений, которое максимизирует значение функционала 3[и(-)] по всем допустимым управлениям из класса Уи допустимых управлений, для которых определено значение функционала.
Л.2 Задача на бесконечном горизонте планирования
Рассмотрим задачу оптимального управления
х = f (х,и), х(0) = х0,
+оо
С 0 (А.3)
3[и(-)] = / f (Ь,х,и) & ^ тах .
3 и()&Уи
Здесь ж = (ж1,... ,жп) € X С Ега — фазовый вектор (X — область), и € и С — управление, 3[и(-)] — функционал, подлежащий максимизации по всем допустимым управлениям из класса допустимых управлений. Вектор-функция f (ж,и) = ^ 1(ж,и),... ^га(ж,и)) определена и непрерывна по совокупности переменных на декартовом произведении X х и, и определены и непрерывны частнвге производив^ = 1, • • • ,п на X х II. Заметим,
что постановка задачи (А.3) включает в себя задачи (1.1), (1.44), (1.75), (2.90), рассматриваемые в диссертации.
Допустимыми управлениями будем считать произвольные кусочно-непрерывные функции и = и(£), 0 ^ £ < +то со значениями из области управления и, а именно такие управления и = и(£), каждое из которых непрерывно на любом конечном отрезке £ Е [0,Т],Т > 0 за исключением конечного числа моментов времени, где функция и(£) может терпеть разрывы первого рода. Для определённости будем считать, что во всякой точке разрыва функция и(£) непрерывна слева (и(т) = и(т — 0)), а также непрерывна в концах отрезка [0,Т].
Аналогичным образом строится решение ж(£), соответствующее управлению и(£), как это было показано в пункте А.1.
Допустимой траекторией, соответствующей допустимому управлению и = и(£), будем называть решение задачи Коши ж = f(ж,и(£)), ж(0) = ж0, определённое на луче [0, + то) и соответствующее управлению и(£).
Класс допустимых управлений состоит из произвольных допустимых управлений и(£), определённых выше, для которых соответствующее решение ж(£) определено на всём луче
[0, + то) и несобственный интеграл 3[и(-)] = / f0(£,ж,и) ^ сходится.
0
Задача состоит в поиске такого допустимого управления и(£) из класса допустимых управлений, которое максимизирует значение функционала 3[и(-)] по всем допустимым управлениям из класса допустимых управлений.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.