Методы гамильтонова формализма в задачах нелинейного синтеза управлений тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Рублев, Илья Вадимович
- Специальность ВАК РФ01.01.02
- Количество страниц 98
Оглавление диссертации кандидат физико-математических наук Рублев, Илья Вадимович
Содержание и
Введение
Список обозначений
1 Связь между понятиями минимаксного решения и обобщенного слабого решения, основанного на идемпотентном анализе
1.1 Введение.
1.2 Основы минимаксных решений
1.3 Обобщенная линейность уравнения Гамильтона-Якоби.
1.4 Формула представления минимаксных решений.
1.5 Эквивалентность минимаксных и обобщенных слабых решений
1.6 Некоторые вспомогательные результаты.
2 Свойства областей достижимости для каскадных управляемых систем
2.1 Введение.
2.2 Представление области достижимости.
2.3 Топологические свойства области достижимости каскадной управляемой системы
2.4 Область достижимости каскадных управляемых систем при эллипсоидальных ограничениях
3 Области достижимости трехмерной каскадной управляемой системы и двумерной билинейной управляемой системы в
3.1 Введение.
3.2 Внешняя оценка границы области достижимости трехмерной каскадной управляемой системы.
3.3 Точная область достижимости для трехмерной каскадной управляемой системы и задача о быстродействии.
3.4 Область достижимости для двумерной билинейной управляемой системы.
3.5 Иллюстрации.
Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Аналитические и вычислительные модели некоторых управляемых процессов с неопределенностью1997 год, доктор физико-математических наук Гусейнов, Халик Гаракиши оглы
Уравнение эволюции невыпуклых множеств в задаче достижимости и управление потоками2012 год, кандидат физико-математических наук Мазуренко, Станислав Сергеевич
Вычислительные методы для задач достижимости и синтеза управлений в условиях нелинейности2016 год, кандидат наук Синяков Владимир Владимирович
Обобщенные вариационные принципы и метод исчезающей вязкости для некоторых квазилинейных уравнений и систем уравнений1999 год, кандидат физико-математических наук Соболевский, Андрей Николаевич
Неравенства Гамильтона-Якоби в задачах оптимального управления дискретно-непрерывными системами2012 год, кандидат физико-математических наук Сорокин, Степан Павлович
Введение диссертации (часть автореферата) на тему «Методы гамильтонова формализма в задачах нелинейного синтеза управлений»
Математическая теория процессов управления была мотивирована потребностями прикладных наук, в том числе задачами управления движением, автоматики, робототехники и т.д. В дальнейшем она нашла применения в таких областях как экономика, финансовая инженерия и моделирование медикобиологических процессов. Последнее время задачи управления стали возникать при изучении квантовых процессов в физике, при конструировании коммуникационных систем и т.п.
Центральной в теории оптимального управления является задача синтеза управления. Цель данной задачи состоит в том, чтобы построить управляющие воздействия, переводящие систему, описываемую уравнениями динамики, в предписанное конечное состояние. При этом управление в задаче синтеза является позиционным, то есть является функцией как времени, так и фазовой переменной. Последнее обусловлено решением практических задач в условиях неполной или неточной информации при наличии возмущений.
Большой вклад в решение задач синтеза управлений внесли J1.C. Понтрягин, H.H. Красовский, В.Г. Болтянский, Р.В. Гамкрелидзе, М.И. Зеликин, В.Ф. Кротов, А.Б. Куржанский, Е.Ф. Мищенко, Ю.С. Осипов, Б.Н. Пшеничный, А.И. Субботин, Ф.Л. Черноусько, R. Bellman, R. Brockett, A.I. Bryson, Ch.I. Byrnes, R. Isaacs, A. Isidori, A. Krener, P. Kokotovic, G. Leitmann, S. Mitter, S. Sastry, E. Sonntag, H. Sussman, P. Varaiya и другие.
Одним из методов решения задач программного управления (то есть когда управление является функцией лишь времени, но не фазовой переменной) опирается на принцип максимума Понтрягина [22], в рамках которого изучаются необходимые условия оптимальности управления. Этот метод используется при решении задачи синтеза, причем последняя решается с точки зрения некоторого критерия оптимальности, например, в быстродействии перехода управляемой системы из одного состояния в другое.
Подчеркнем, что в условиях отсутствия возмущений (которые приняты в данной диссертации и выполнение которых подразумевается везде ниже) значение критерия оптимальности при синтезированных позиционных стратегиях такое же, как и при программных управлениях. Однако особенно важно решать задачи синтеза при наличии возмущений, являющиеся предметом игровых задач динамики, то есть теории дифференциальных игр. В последнем случае для этих задач программных управлений недостаточно.
Наряду с принципом максимума Понтрягина, обобщая подходы классического вариационного исчисления [5, 18, 37], рассматривается метод динамического программирования Р. Беллмана [1], посвященный достаточным условиям оптимальности и восходящий к формализму уравнений Гамильтона-Якоби. Таким способом оказывается также возможным изучать эволюцию по времени областей достижимости управляемых систем. Под областью достижимости в данный момент времени подразумевается множество всевозможных состояний системы, в которые можно перейти при помощи соответствующего допустимого управляющего воздействия из фиксированного в заданный начальный момент времени состояния (или множества состояний) [10, 17, 53, 63]. Эволюцию областей достижимости в прямом времени описывает трубка достижимости, а в об]мтном времени — трубка разрешимости. Теории трубок траекторий посвящена работа [49].
Задача синтеза состоит в поиске позиционного управления, переводящего систему в предписанное конечное состояние (или мгюжество), которое для этого должно удерживать траекторию внутри соответствующей трубки разрешимости (или моста) иа заданном отрезке времени. Это составляет существо "правила экстремального прицеливания", введенного H.H. Красовским [10, 11].
При данном подходе основные этапы решения задачи синтеза управления сосредоточены в нахождении областей достижимости. При этом в нелинейном случае, когда решение найти трудно, полезным является изучение различных качественных свойств областей достижимости, таких как ограниченность, замкнутость, выпуклость, непрерывная зависимость от параметров (см., например, [2, 17, 33, 34, 35]).
Эволюция по времени области достижимости в фазовом пространстве исследуемой системы может быть охарактеризована при помощи следующих способов: поточечное представление, описание при помощи параметрического задания границы, использование аппарата опорных функций (в том случае, если области выпуклые) и представление в виде множеств уровня локально липшицевых функций.
В рамках последнего представления было показано, что для описания динамики областей достижимости можно использовать задачи динамической оптимизации [51]. А именно, вводилась функция цены
V(t, х) = min d2(x(t0), Ло), где минимум берется по всем допустимым траекториям системы х(>), выпущенным в обратном времени из позиции {t,x}. Здесь ci2(x(fo),^о) — квадрат эвклидова расстояния от левого конца траектории x(to) до выпуклого компактного множества начальных состояний Как показано в [51], область достижимости в момент времени t совпадает с множеством {х: V(t,x) < 0}. Отметим, что для функции V(t, х) справедливо полугрупповое свойство
V(t, x) = V(t, x\t0, V(t0, •)) = V(t, x\r, V(t, .|í0) V{tQ, •))), h<r<t, определяющее для введенного семейства задач оптимального управления принцип оптимальности в рамках метода динамического программирования [1]. Как следствие, функция х) удовлетворяет задаче Коши для уравнения Га-мильтона-Якоби-Беллмана следующего вида:
Для линейно-выпуклых управляемых систем (то есть систем с линейными уравнениями динамики и жесткими "мгновенными" геометрическими ограничениями на управление в виде выпуклых компактов) функция цены У(£, х) вычислялась средствами выпуклого анализа [9, 16, 50, 51, 58]. Также были вычислены и опорные функции областей достижимости, являющихся в данном случае выпуклыми компактами, при этом было показано, что функция У{Ь,х) представляет собой классическое решение задачи (1) [50, 51].
Однако для нелинейных управляемых систем функция х) является, вообще говоря, дифференцируемой лишь для почти всех значений аргументов. Поэтому У{Ь,х) является решением (1) лишь в обобщенном смысле. Отметим, что мы не можем определить решение просто как функцию, удовлетворяющую уравнению Гамильтона-Якоби почти всюду, ибо данному условию может удовлетворять бесконечно много функций (см., например, [44]). Для того, чтобы отвечающее заданному краевому условию решение было единственно, необходимо наложить на него дополнительные условия, приводящие к различным понятиям обобщенного решения.
Обобщенные решения уравнений в частных производных первого порядка играют исключительно важную роль не только в теории оптимального управления,
1)
V(to,x) = d2(x, Xq). но и во многих теоретических и прикладных областях. Рассмотрим некоторые понятия обобщенного решения уравнения Гамильтона-Якоби, не претендуя на полный обзор. Для гамильтониана H(t,x,s), выпуклого по импульсной переменной s, что характерно для задач оптимального управления, понятие обобщенного решения было введено С.Н. Кружковым [13]. При помощи метода исчезающей вязкости были построены вязкие решения [14, 20, 43]. В отсутствии предположения о выпуклости гамильтониана было предложено несколько понятий обобщенного решения уравнения Гамильтона-Якоби. М.Дж. Крэндалл и П.-Л. Лионе ввели понятие вязкостного решения [38, 39, 44, 54], использующее суб- и супердифференциалы в качестве обобщения понятия производной. Эквивалентное ему понятие минимаксного решения было предложено А.И. Субботиным [29, 30, 62]. Понятие минимаксного решения по сути основывается на обобщении метода характеристик Коши [30, 62] и также, как и понятие вязкостного решения, может быть определено в инфинитезимальной форме при помощи различных средств негладкого анализа, таких как производные по направлениям, конусы касательных направлений и т.д.
В.П. Маслов и его сотрудники исследовали уравнение Гамильтона-Якоби с точки зрения идемпотентного анализа. При условии выпуклости гамильтониана ими была предложена концепция обобщенного решения, введенного по аналогии с классической теорией распределений [8]. В идемпотентном анализе традиционная структура поля над R с операциями а + Ьна-Ь заменяется структурой полукольца А = RU{+oo} с операциями афЬ = min{a, b} и а©6 = а + Ь. В [8] понятие обобщенного слабого решения определялось через оператор, сопряженный к эволюционному оператору, разрешающего задачу Коши (1) для подходящего класса краевых условий. Сопряжение понимается по отношению к "скалярному произведению" функций (/,д)д = infх(/(я) + Все обобщенные слабые решения имеют представление, сводящееся в случае, когда H(t,x,s) = H(s), к формуле
Лакса-Олейник [20, 46, 52, 54]. Кроме того, в [19] для гамильтониана 5), уже не обязательно выпуклого по й, опять же на основе идемпотентного анализа слабое решение определено подобно другому классическому подходу, принятому в математической физике, который использует понятие слабой сходимости.
В силу разнообразия способов формализации понятия обобщенного решения важным является исследование вопроса об структурных взаимоотношениях между различными его определениями. Эквивалентность большинства определений, данных в инфинитезимальной форме и использующих конструкции негладкого анализа, доказана в [29, 62]. Эквивалентность идемпотентных решений из [19], введенных при помощи слабой сходимости, и вязкостных решений исследовалась в [45]. Кроме того, в [41] было показано, что для специального случая задач оптимального управления, формализованных при помощи введенных в [40] процессов Беллмана-Маркова, понятия обобщенного слабого решения из [8] и вязкостного решения совпадают.
Цель данной работы состоит в исследовании связи между обобщенными решениями уравнения Гамильтона-Якоби, основанными на негладком анализе, и идемпотентными решениями, введенными по аналогии с классической теорией распределений, а также в изучении применимости обобщенных решений уравнения Гамильтона-Якоби и обобщенных уравнений Гамильтона, описывающих характеристики этого уравнения, к задачам достижимости и синтеза управления в конкретных билинейных управляемых системах каскадного типа.
Перейдем к описанию основных результатов диссертации.
Первая глава посвящена прямому доказательству эквивалентности понятия минимаксного решения и обобщенного слабого решения из [8], введенного при помощи идемпотентного анализа, для задачи Коши о, (1,()6<г = МхЕ., {2)
У(Т,х) = (р(х), хеЕп в случае гамильтониана в), вогнутого и глобально липшицевого по 5 (последнее условие влечет за собой линейный рост гамильтониана по импульсной переменной). Отметим, что краевое условие здесь задано, в отличие от (1), на правом конце, что сделано лишь для совместимости с определениями минимаксного решения, данными в [29, 30, 62]. Чтобы рассмотреть задачу Коши на левом конце, надо сделать замену времени £ = £о + Т — т, т > 10.
Отметим основную трудность доказательства эквивалентности решений, введенных при помощи идемпотентного анализа, и других обобщенных решений. Как уже было отмечено выше, многие обобщенные решения, как, например, вязкостные и минимаксные, могут быть определены инфинитезимально, подобно классическим решениям. Это означает, что в определении фиксируется, в каком смысле данное решение удовлетворяет уравнению Гамильтона-Якоби в данной точке. Таким образом, некоторая функция является решением уравнения тогда и только тогда, когда она удовлетворяет этому уравнению во всех точках. В отличие от этого, идемпотентные обобщенные слабые решения определены при помощи эволюционного оператора, разрешающего уравнение. Следовательно, этот оператор должен быть сконструирован, хотя и для достаточно хороших краевых условий, перед тем, как становится возможно ввести идемпотентные решения. Значит, эволюционный оператор должен быть построен, основываясь на другом понятии обобщенного решения. В диссертации для этого использовано понятие минимаксного решения.
Первая глава состоит из шести разделов. В первом из них формулируется исследуемая задача Коши.
Во втором разделе все необходимые определения и результаты, касающиеся вещественнозначных минимаксных решений, естественным образом распространены на случай минимаксных решений, принимающих значение в полукольце А = Е и {+оо}, которые являются либо непрерывными в метрике р(а,Ь) = | ехр(—а) — ехр(—6)|, либо полунепрерывными снизу по отношению к естественному порядку А. Это необходимо для рассматриваемого в главе доказательства эквивалентности, так как идемпотентные обобщенные слабые решения могут принимать в некоторых точках значение +оо. Для того, чтобы проиллюстрировать это расширение, рассмотрим следующий пример. Пусть п = 1 и в) = — |в|.
Последовательность функций = <рк(х + Т — £), к = 1,2,., сходится при к —> оо равномерно относительно метрики р(а, Ь) к функции х) = (р(х+Т—£), где
Так как для любого натурального числа к функция 14(f,x) является классическим решением уравнения Гамильтона-Якоби, то функцию V(i, х) можно интре-претировать как решение задачи (2).
В третьем разделе первой главы гамильтониан, удовлетворяющий основным предположениям из [29] и, кроме того, вогнутый по импульсной переменной, представлен двумя способами в виде, характерном для задач оптимального управления. На основе этих формул представления в рамках А-значных минимаксных решений показана линейность уравнения Гамильтона-Якоби по отношению к операциям ф = min и О = +. Это является основным результатом данной главы.
В четвертом разделе на основе идемпотентного анализа, используя полученную обобщенную линейность уравнения Гамильтона-Якоби, для А-значных минимаксных решений задачи Коши получена следующая формула представления: 0 + ^(0). (3)
Здесь 6(г,а:,£) — некоторая Л-значная функция, которая ограничена снизу и полунепрерыва снизу по переменной Необходимо отметить, что для случая, когда гамильтониан #(£, х, в) вогнут по 5 и стремится к — оо при ||5|| —> оо, а также когда функция <р равномерно ограничена и равномерно непрерывна, соответствующее вязкостное решение задачи Коши (2) удовлетворяет формуле представления того же вида [39].
В пятом разделе на основе (3) показано, что минимаксные решения эквивалентны идемпотентным слабым решениям в том случае, когда гамильтониан Н(Ь,х, з) = #(¿,5), а функция <р такова, что оба вида обобщенных решений определены. А именно, <р является Л-значной ограниченной снизу и полунепрерывной снизу по отношению к порядку Л функцией. Отмечено, что для любой Е-значной ограниченной снизу непрерывной функции <р соответствующее вязкостное решение, а также обобщенное решение в смысле С.Н. Кружкова задачи Коши (2) совпадают с ее идемпотентным слабым решением. Кроме того, при помощи формулы Хопфа для неавтономного уравнения Гамильтона-Якоби [24, 61] представление (3) приведено к явному виду, обобщающему классическую формулу Лакса-Олейник [20, 46, 52, 54].
В шестом разделе первой главы приведены доказательства некоторых вспомогательных результатов.
Во второй главе исследуется каскадная управляемая система, уравнения которой возникают в робототехнике [57]. А именно, рассматривается система следующего вида:
XI ¿2 ¿3 п-1 п > 3. Здесь измеримое управление и(-) = («!(•), М2(*)>., и„1(-))' удовлетворяет мгновенным "жестким" ограничениями вида и{1) €■ V, I € [0,Т]. Множество V является непустым выпуклым компактом из Кп1. Центральная задача данной главы — изучение свойств области достижимости системы (4).
Глава состоит из четырех разделов. В первом разделе формулируется задача достижимости для системы (4).
Во втором разделе на основе [51] для класса систем, аффинных по управляющим параметрам, к которому относится и система (4), получена формула, представляющая область достижимости через характеристики Коши уравнения Гамильтона-Якоби со сглаженным гамильтонианом. Опишем подробнее это представление.
Исходный гамильтониан управляемой системы, вообще говоря, негладкий. Значит, характеристики исходного уравнения Гамильтона-Якоби-Беллмана вида (1) описываются уравнениями с разрывной правой частью. Следовательно, эти уравнения Гамильтона (являющиеся уравнениями принципа максимума Понтря-гина [44]) в общем случае не выделяют единственную характеристику по заданным начальным значениям фазовой и сопряженной переменной. При сглаживании исходного гамильтониана характеристики соответствующего возмущенного уравнения Гамильтона-Якоби определяются однозначно начальными условиями,
XI х2 щ, и3,
2 ' ип-1»
4) так как задающие их уравнения Гамильтона имеют непрерывную правую часть (удовлетворяющую также условиям Липшица для указанного в разделе сглаживания). Обозначим эти характеристики через = хл(Мо.я°,50). Здесь Л > 0 есть параметр сглаживания, £0 — начальный момент времени, а х° и в0 — начальные значения фазовой и сопряженной переменной, соответственно. В разделе показано, что при определенном сглаживании исходного гамильтониана системы область достижимости Ьа,х°) из позиции {¿о» я0} имеет следующее представление:
Формула (5) имеет лишь теоретический характер, т.к. й0 должно пробегать все пространство Еп. При этом наиболее существенными для структуры области достижимости являются точки Г(£,£о,х°), которые потенциально могут быть получены в (5) при помощи операции замыкания с1, то есть предельные точки ха(£,<0|£°>з0) при ||5°|| —» со. Все это делает (5) неприменимой непосредственно для реальных вычислений. Тем не менее, представление (5) использовано в главе при получении свойств областей достижимости каскадных управляемых систем.
Кроме того, в данном разделе проанализирована связь (5) с принципом максимума Понтрягина. Показано, что в простейшем случае, когда у управляемой системы отсутствуют особые режимы (то есть вдоль траектории оптимальное управление однозначно определяется значениями фазовой и сопряженной переменной), а также в случае линейной управляемой системы множество Г(£, ¿о. в точности определяется уравнениями принципа максимума Понтрягина (22, с. 26]. При этом Г(£,£о>я°) является внешней оценкой границы области достижимости.
В третьем разделе при помощи дифференциально-геометрических методов, приведенных в [48], исследуется топологическая структура области достижимости системы (4) при управлениях, близких к фиксированному гладкому управлению. Показано, что область достижимости имеет непустую внутренность, то есть система (4) локально вполне управляема.
В четвертом разделе на основании результатов второго и третьего раздела данной главы доказано, что для каскадной управляемой системы (4) при эллипсоидальных ограничениях на управление область достижимости имеет полную размерность. Таким образом, граница области достижимости представляет из себя (п — 1)-мерную поверхность. Далее, в результате проведенного в разделе анализа системы (4) показано, что множество точек получаемых при помощи особых режимов принципа максимума Понтрягина, лежит в (п — 2)-мерном линейном многообразии. Коротко поясним значимость этих результатов.
Для многих задач оптимального управления характерны системы, оптимальный синтез для которых содержит особые режимы управления (см., например, [4, 12]). Однако вычисление особых режимов доставляет дополнительные трудности, так как принцип максимума Понтрягина дает о них недостаточно информации. Следовательно, требуются некоторые добавочные исследования каждого особого управления в отдельности. При этом семейство особых режимов не описывается при помощи конечного числа параметров. Некоторым аспектам, связанным с вычислением особых режимов, посвящена работа [55].
Однако ситуация с особыми режимами может значительно упроститься. В случае системы (4) с эллипсоидальными ограничениями на управление вследствие разницы размерностей границы области достижимости и многообразия, содержащего 2(£,£о>я°)> точки 2(1,1 о,х°), входящие в могут быть сколь угодно точно аппроксимированы точками, отвечающими неособым режимам управления, то есть точками, которые определяются однозначно начальным значением сопряженной переменной. Таким образом, внешняя оценка границы области достижимости Г(£,<0>я°) с точностью до замыкания имеет описание при помощи конечного числа параметров. Следовательно, полученные во второй главе результаты дают основу для численной схемы, так как особые режимы можно не учитывать при вычислениях. Эта схема приведена в конце данной главы.
Третья глава диссертации посвящена дальнейшему исследованию трехмерной каскадной управляемой системы (4) в случае эллипсоидальных ограничений на управление, а также двумерной билинейной системы iil = "ь № ¿2 = ' U2 и состоит состоит из пяти разделов. В первом из них формулируются решаемые далее задачи.
Во втором разделе множество T(t, to, х°) вычислено аналитически. При этом показано, что у трехмерной каскадной управляемой системы имеется целое семейство особых режимов, порождающее одномерное множество ее конечных состояний. Среди последних присутствуют точки, входящие в границу области достижимости. Однако, в работе показано, что все граничные точки достигаются при пеособых режимах управления, то есть особые режимы могут быть исключены из процесса вычисления.
В третьем разделе при помощи T(t,to,x°) граница области достижимости представлена в аналитическом виде. Она является двумерной поверхностью, го-меоморфной сфере, и имеет две особенности. Особенности связаны с аналогом понятия точки обрыва (cut locus), известного из вариационного исчисления. Здесь также решены задача о быстродействии перехода из одного состояния системы в другое и задача синтеза позиционного управления.
В четвертом разделе для билинейной системы (6) решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма.
В пятом разделе содержатся иллюстрации к третьей главе.
В заключении сформулированы основные результаты, которые получены в диссертации.
Результаты диссертации отражены в публикациях [25, 26, 27, 60], а также представлены в виде докладов на следующих конференциях:
• международная конференция студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" (Москва, МГУ, апрель 2000 г.)
• школа-семинар молодых ученых факультета ВМиК МГУ им. М.В. Ломоносова (Дубна, октябрь 2001 г.)
• международная конференция "Обобщенные решения в задачах управления" (Переславль-Залесский, август 2002 г.)
• совместный французско-русский семинар "Control Under Uncertainty and Differential Games" (Москва, МГУ, январь 2003 г.)
• международный симпозиум "Idempotent Mathematics and Mathematical Physics" (Вена, Австрия, февраль 2003 г.)
Кроме того, работа [28] принята к печати.
Автор приносит глубокую благодарность своему научному руководителю Александру Борисовичу Куржанскому за постановку задач и полезные замечания.
Список обозначений
• В = {5бГ: ||*|| < 1}, S={se Rn: ||s|| = 1}
• В = {(5,г) € R" х R: Ц5Ц2 + г2 < 1}
• B+ = {(s,r)emn xR: ||s||2 + r2 < l,r > 0}
• S+ = {(s,r) 6 R" x R: ||s|[2 + r2 = l,r > 0}
• Br(s0) = {s G R": ||s - so|| < R} — шар с центром в точке s0 € R" и радиусом R> 0
• £(р,Р) = {z 6 Rm: (z — p, P~\z - p)) < 1} — эллипсоид с центром в точке р € Rm и матрицей Р € Rmxm, Р = Р' > 0
• comp(Rm) — пространство непустых компактных подмножеств Rm
• conv(Rm) — пространство непустых выпуклых компактов из Rm
• d(z,Z) = inf{||z — | £ € .2} — эвклидово расстояние от точки z G Rm до множества Z С Rm
• h(ZuZ2) = max(sup{ci(Ci,^) | Сг € Zi},sup{cf(C2, Zx) | C2 € Z2}) — расстояние по Хаусдорфу между двумя множествами Zi,Z2 G comp(Rm)
• lin Z — линейная оболочка множества Z С Rm со Z — выпуклая оболочка множества Z С Rm el Z — замыкание множества Z С Rm int Z — внутренность множества Z С Rm dZ — граница множества Z С Rm
А = R U {+оо}, © = min, 0 = +, р(а, b) = | ехр(—а) — ехр(—Ь)|) — метрическое идемпотентное полукольцо epi^ = {(z,а) е Rm х R: а > ip(z)} — надграфик функции ф : Rm А hypoф = a) G Rm х R: а < ф(г)} — подграфик функции ф : Rm -»• А
C(R",R) — класс непрерывных конечнозначных (т.е. R-значных) функций, определенных на Rn
C(Rn, А) — класс Л-значных функций, определенных на Rn и непрерывных по отношению к метрике р(а,Ь).
LSC(Rn, А) — класс Л-значных функций с областью определения R", полунепрерывных снизу по отношению к естественному порядку в А
Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Задачи достижимости и синтеза управлений для гибридных систем2008 год, кандидат физико-математических наук Точилин, Павел Александрович
Аналитические и численные процедуры построения решений некоторых задач управления2009 год, кандидат физико-математических наук Лебедев, Павел Дмитриевич
Структура обобщенных решений уравнений Гамильтона-Якоби-Беллмана и квазилинейных уравнений2011 год, кандидат физико-математических наук Колпакова, Екатерина Алексеевна
Эллипсоидальные методы для задач управления при неэллипсоидальных ограничениях2005 год, кандидат физико-математических наук Кирилин, Михаил Николаевич
Метод характеристик в теории уравнений Гамильтона-Якоби и его приложения в теории управления2003 год, доктор физико-математических наук Субботина, Нина Николаевна
Заключение диссертации по теме «Дифференциальные уравнения», Рублев, Илья Вадимович
Итак, основные результаты данной диссертации следующие:
• Проведено прямое доказательство эквивалентности минимаксных решений и обобщенных слабых решений уравнения Гамильтона-Якоби, основанных на идемпотентном анализе.
• Уравнение Гамильтона-Якоби-Беллмана, рассмотренное в рамках теории обобщенных решений, и уравнения Гамильтона, описывающие его характеристики, применены для получения свойств множеств достижимости каскадных управляемых систем, представляющих основу для численной схемы.
• Для трехмерной каскадной системы области достижимости представлены в аналитическом виде, решены задача быстродействия перехода из одного состояния в другое и задача синтеза управления. Для двумерной билинейной системы решения аналогичных задач, а также построение областей достижимости доведены до простейшего численного алгоритма.
Заключение
Список литературы диссертационного исследования кандидат физико-математических наук Рублев, Илья Вадимович, 2004 год
1. Беллмап Р. Динамическое программирование. М., Изд-во иностр. литературы, 19G0.
2. Благодатских В.И., Филиппов А.Ф. Дифференциальные включения и оптимальное управление // Труды МИАН СССР. 1985. т. 169. С.194-252.
3. Васильев Ф.П. Методы оптимизации. М., Факториал, 2002.
4. Габасов Р.Ф., Кириллова Ф.М. Особые оптимальные управления. М., Наука, 1973.
5. Гельфанд И.М., Фомин C.B. Вариационное исчисление. М., Физматгиз, 1958.
6. Голыитейп Е.Г. Теория двойственности в математическом программировании и ее приложения. М., Наука, 1971.
7. Колоколъцов В.Н., Маслов В.П. Общий вид эндоморфизмов в пространстве непрерывных функций со значениями в числовом коммутативном полукольце (с операцией © = шах) // Докл. АН СССР. 1987. т. 295, N2. С.283-287.
8. Колоколъцов В.Н., Маслов В.П. Идемпотентный анализ и его применение в оптимальном управлении. М., Наука, 1994.
9. Красовский H.H. Теория управления движением. М., Наука, 1968.
10. Красовский H.H. Игровые задачи о встрече движений. М., Наука, 1970.
11. Красовский H.H. Управление динамической системой. Задача о минимизации гарантированного результата. М., Наука, 1985.
12. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М., Наука, 1973.
13. Кружков С.Н. Обобщенные решения нелинейных уравнений со многими независимыми переменными, 1 // Мат. сборник. 19G6. т. 70, N3. C.394-41G.
14. Крылов Н.В. Управляемые процессы диффузионного типа. М., Наука, 1977.
15. Курант Р., Гильберт Д. Методы математической физики, т.2. M.-JI., 1945.1С. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М., Наука, 1977.
16. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М., Наука, 1972.
17. Лаврентьев М.А., Люстерник Л.А. Курс вариационного исчисления. M.-JI., ГИТТЛ, 1950.
18. Маслов В.П., Самборский С.Н. Существование и единственность решений стационарных уравнений Гамильтона-Якоби и Беллмана. Новый подход // Докл. РАН. 1992. т. 324, N6. С.1143-1148.
19. Олейпик O.A. Разрывные решения нелинейных дифференциальных уравнений // Успехи мат. наук. 1957. т. 12, N3. С.3-73.
20. Половинкин Е.С. Сильно выпуклый анализ // Матем. сборник. 199С. т. 187, N2. С.103-130.
21. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., 1961.
22. Рокафеллар Р.Т. Выпуклый анализ. М., Мир, 1973.
23. Рублев И.В. Обобщенные формулы Хопфа для неавтономного уравнения Гамильтона-Якоби // Прикладная математика и информатика: Тр. фак-та ВМиК МГУ им. М.В. Ломоносова. 1999. N3. С.81-89.
24. Рублев И.В. Об обобщенной формуле Лакса для неавтономного уравнения Гамильтона-Якоби // Материалы Междунар. конференции студентов и аспирантов по фундаментальным наукам "Ломоносов-2000" секция "Вычислительная математика и кибернетика", Москва, 2000.
25. Рублев И.В. О связи между двумя понятиями обобщенного решения уравнения Гамильтона-Якоби // Дифференциальные уравнения. 2002. т. 38, N6. С.818-825.
26. Рублев И.В. О двух понятиях обобщенного решения уравнения Гамильтона-Якоби // Тезисы Междунар. симпозиума "Обобщенные решения в задачах управления", Переславль-Залесский, 2002.
27. Рублев И.В. Множества достижимости в каскадных управляемых системах // (принято к печати в журнале "Дифференциальные уравнения").
28. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М., Наука, 1991.
29. Субботин А.И. Минимаксные решения уравнений с частными производными первого порядка // Успехи мат. наук. 1996. т. 51, вып. 2. С.105-138.
30. Субботина H.H. Построение обобщенного решения уравнения Гамильтона-Якоби-Беллмана с помощью метода характеристик Коши // Свердловск, ИММ УрО АН СССР, 1991. Деп. в ВИНИТИ No. 2571-В91. С.1-53.
31. Субботина H.H. Метод характеристик Коши и обобщенные решения уравнений Гамильтона-Якоби-Беллмана // Докл. АН СССР. 1991. т. 320, N 3, С.556-561.
32. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М., 1985.
33. Черпоусъко Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М., Наука, 1988.
34. АиЫп J.-P., Cellina A. Differential Inclusions. Springer-Verlag, Berlin-Heidelberg, 1984.
35. Benton, Jr. S.H. The Hamilton-Jacobi Equation: A Global Approach. Academic Press, 1977.
36. Caratheodory C. Calculus of variations and partial differential equations of the first order. Chelsea Publ. Company, New York, 1989.
37. Crandall M.G., Lions P.-L. Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Amer. Math. Soc. 1983. Vol.277. P. 1-42.
38. Crandall M.G., Evans L.C., Lions P.-L. Some Properties of Viscosity Solutions of Hamilton-Jacobi Equations // Trans. Amer. Math. Soc. 1984. Vol.282. P.487-502.
39. Del Moral P., Doisy M. Maslov idempotent probability calculus I // Theor. Prob. Appl. 1999. Vol.43, N4. P.562-576.
40. Del Moral P., Doisy M. Maslov idempotent probability calculus II // Theor. Prob. Appl. 2000. Vol.44, N2. P.319-332.
41. Evans L.C., Souganidis P.E. Differential games and representation formulas for solutions of Hamilton-Jacobi-Isaacs equations // Indiana Univ. Math. J. 1984. Vol.33. P.773-797.
42. Fleming W.H. The Cauchy problem for a nonlinear first-order partial differential equation // J. Differential Equations. 1969. Vol.5, N3. P.515-536.
43. Fleming W.H., Soner Ü.M. Controlled Markov Processes and Viscosity Solutions. Springer-Verlag, New York, 1993.
44. Gondran M. Analyse MINPLUS // C. R. Acad. Sei. Paris. 1990. t. 323, Série I. P.371-375.
45. Hopf E. Generalized solutions of nonlinear equations of first order //J. Math. Mech. 1965. Vol.14. P.951-973.
46. Ishii H. Representation of solutions of Hamilton-Jacobi equations // Nonlinear Anal. T. M. A. 1988. Vol.12. P.121-146.
47. Isidori A. Nonlinear Control Systems, 3 ed. Springer-Verlag, New York, 1995.
48. Kurzhanski A.B., Filippova T.F. The theory of trajectory tubes — a mathematical formalism for uncertain dynamics, viability and control // In: Advances in
49. Nonlinear Dynamics, Viability and Control: a Report from Russia, Birkhauser, Boston, ser. PSCT, 1993. P.122-188.
50. Kurzhanski A.B., Valyi I. Ellipsoidal Calculus for Estimation and Control. Birkhauser, Boston-Basel-Berlin, 1997.
51. Kurzhanski A.D., Varaiya P. Dynamic Optimization for Reachability Problems 11 JOTA. 2001. Vol.108, N2, P.227-251.
52. Lax P.D. Hyperbolic systems of conservation laws II // Comm. on Pure k Appl. Math. 1957. Vol.10. P.537-5G6.
53. Leitmann G. Optimality and Reachability via Feedback Controls // In: Dynamic Systems and Microphysics, A. Blaquiere and G. Leitmann (eds.), Academic Press, New York, 1982.
54. Lions P.-L. Generalized solutions of Hamilton-Jacobi equations. London, 1982.
55. Melikyan A.A. Generalized characteristics of first order PDEs: Applications in optimal control and differential games. Birkhauser, Boston, 1998.
56. Michael E. Continuous selections III // Ann. of Math. 1957. Vol.65. P.375-390.
57. Murray R.M., Li Z., Sastry S.S. A Mathematical Introduction to Robotic Manipulation. CRC Press, 1994.
58. Rockafellar R.T. State Constraints in Convex Problems of Bolza // SIAM Journ. on Control and Optimization. 1972. Vol.10. P.691-715.
59. Rockafellar R. Т., Wets R.J.-B. Variational Analysis. Springer-Verlag, New York, 1998.
60. Roublev I. V. On two notions of generalized solution to the Hamilton-Ja-cobi equation // Proc. Intern. Workshop on Idempotent Mathematics and Math. Physics, Vienna, 2003.
61. Varaiya P. Reach Set Computation Using Optimal Control // Proc. of the KIT Workshop on Verification of Hybrid Systems, Verimag, Grenoble, France, 1998.
62. Zelikin M.I., Borisov V.F. Theory of chattering control. With applications to astronautics, robotics, economics and engineering. Birkhauser, Boston, 1994.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.