Условия оптимальности и управляемости для вырожденных управляемых систем тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Павлова, Наталья Геннадьевна
- Специальность ВАК РФ01.01.02
- Количество страниц 139
Оглавление диссертации кандидат физико-математических наук Павлова, Наталья Геннадьевна
Введение
1 Условия 2-регулярности и 2-нормальности
1.1 Условия 2-регулярности и 2-нормальности.
1.2 Условия 2-регулярности и 2-нормальности для систем с импульсными управлениями.
1.2.1 Постановка задачи.
1.2.2 Условие 2-регулярности.
1.2.3 Условие 2-нормалыюсти
2 Управляемость
2.1 Локальная управляемость нелинейных систем.
2.1.1 Постановка задачи.
2.1.2 2-регулярность и управляемость.
2.1.3 2-нормальность и управляемость
2.2 Локальная управляемость линейных систем.
2.3 Локальная управляемость систем с импульсными управлениями
3 Необходимые и достаточные условия экстремума для 2-нормальных процессов
3.1 Необходимые условия экстремума.
3.2 Близость необходимых и достаточных условий экстремума для 2-нормальных процессов.
4 Условия оптимальности второго порядка
4.1 Необходимые условия экстремума для нелинейных систем
4.1.1 Постановка задачи.
4.1.2 Решение соответствующей абстрактной задачи
4.1.3 Необходимое условие локального минимума.
4.2 Необходимые условия экстремума для задач с импульсными управлениями
4.2.1 Постановка задачи.
4.2.2 Решение соответствующей абстрактной задачи
4.2.3 Необходимое условие локального минимума.
Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Математическая теория субоптимального управления распределенными системами2000 год, доктор физико-математических наук Сумин, Михаил Иосифович
Исследование нелинейных анормальных задач и динамических управляемых систем2015 год, кандидат наук Жуковская, Зухра Тагировна
Математические модели и методы исследования локальной оптимальности нелинейных систем управления2013 год, кандидат наук Кузнецов, Алексей Викторович
О некоторых задачах управляемости нелинейных систем1999 год, кандидат физико-математических наук Мастерков, Юрий Викторович
Достаточные условия оптимальности импульсных процессов и их приложения2003 год, кандидат физико-математических наук Антипина, Наталья Валерьевна
Введение диссертации (часть автореферата) на тему «Условия оптимальности и управляемости для вырожденных управляемых систем»
В настоящее время математический аппарат теории оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями, разработан достаточно полно. Фундаментальным результатом, полученным в этой области является принцип максимума JI.C. Понтрягина.
Одним из важных разделов теории оптимального управления является исследование задач оптимального импульсного управления, где изучаются динамические процессы с разрывными траекториями и обобщенными управлениями импульсного типа - векторными мерами. Это обусловлено в частности тем, что многие задачи оптимального управления, первоначально поставленные как классические, не имеют решения в традиционном классе абсолютно непрерывных траекторий и измеримых ограниченных управлений. Если в классической задаче оптимального управления множество допустимых значений управления неограни-чено, то в общем случае нельзя ожидать, что эта задача имеет решение в классе обычных управлений с разрывными траекториями.
Первые прикладные задачи, имеющие подобные особенности, возникли в ракетодинамике. Наиболее ярким примером является широко известная задача Лоудена о переводе космического корабля с одной орбиты на другую при минимальном расходе топлива. Следующий пример (см. [21]) в упрощенной форме моделирует особенности этой задачи.
Пример В.1. Требуется минимизировать критерий качества
Здесь и интерпретируется как скорость сжигания топлива, за счет которого создается сила тяги, а х - положение движущейся материальной точки. Задача состоит в переводе системы из точки ж(0) = 0 в точку :/;(Т) = 1 с минимумом расхода топлива. Заметим, что существуют ракетные двигатели, способные расходовать топливо с очень высокой скоростью, развивая громадную тягу в течение коротких отрезков времени. Поэтому допущение о неограниченности управления сверху достаточно реалистично.
В. 1) о при ограничениях u(t) > О, х = х + и, ж(0) = 0, ж(1) = 1.
В. 2)
Покажем, что в этой задаче обычное оптимальное управление не существует.
Для этого преобразуем критерий (В.1), используя дифференциальное уравнение и концевые условия из (В.2):
1 1 J (и) = j (£(t) - x{t))dt = 1 - J x(t)dt. о 0
Ясно, что задача минимизации J{u) равносильна максимизации критерия
Ми) = и) = j x(t)dt. о
Таким образом, дело сводится к поиску допустимой траектории, график которой ограничивает максимальную площадь над осью t.
Рассмотрим траекторию x(t), которая исходит из конечной точки (Т;х(Т)) = (1; 1) с управлением й = 0. Тогда x(t) = et1, ж(0) = е~х, так что x(t) не является допустимой траекторией. Однако, пара (х,й) задает границы возможного: для нее расход топлива "идеален— J(u) = 0, а ограничиваемая траекторией х площадь Ji(u) — 1 — е-1, как нетрудно увидеть, является верхней оценкой J\. J-[(u) < ./] (и) для любого допустимого управления u(t).
Убедимся, что к этой оценке можно приблизиться сколь угодно близко. Для этого построим следующую последовательность допустимых управлений и траекторий. ) I о, te[i/n,i], (Л - I nte^r, te[0,l/n), te[l/n,l).
Нетрудно подсчитать, что при п —> оо
J(un) = l(2-^je1^L (В. 3)
Jiun = 1 - J(un) 1 - е-1 = Ji(tt).
Отсюда следует, что оптимального управления не существует: мы не можем получить значение критерия J\ = 1 — е-1, так как оно достигается только на недопустимой траектории х, и в то же время это число является точной верхней гранью Ji(it) в силу (В.З).
Минимизирующая для J {и) последовательность обычных управлений {«„} неограничена по амплитуде вблизи точки t = 0, но интегралы от ип сходятся (см. В.З). Интуиция подсказывает, что ип — это некоторая аппроксимация импульсного воздействия в момент t = 0. В то же время последовательность траекторий {а;п} поточечно сходится к разрывной функции для которой критерий ,1\ в точности равен 1-е-1. Поскольку функция ж» "хорошо"аппроксимируется допустимыми траекториями, то ее естественно назвать обобщенной оптимальной траекторией в дайной задаче. Соответствующее импульсное управление представляет собой функцию е-1<5(0). Предельная картина (при п оо) оказывается такой: в начальный момент t = 0 мгновенно сжигается 1/е единиц топлива и управляемая материальная точка скачком перебрасывается на "магистраль":*;^) = et1, по которой движется в пассивном режиме до конечной точки.
Наглядным примером импульсного воздействия в макроэкономике могут служить так называемые монетарные импульсы — резкие изменения денежной массы в обращении. Они вызывают скачкообразное изменение ценовых уровней — важнейших показателей функционирования экономической системы. При попытке описать динамику цен с учетом монетарных импульсов мы вновь сталкиваемся с необходимостью рассматривать разрывные траектории (см. [60], [58]).
Многочисленные примеры моделирования скачкообразных процессов возникают при решении технических задач (см. [26, 35, 62]). Например, реакция опоры при ударном столкновении с нею ног шагающего робота или лазерное излучение в квантовой электронике являются импульсными по своей природе. Поэтому их моделирование также невозможно без введения обобщенных траекторий.
Траекторные компоненты минимизирующих последовательностей в таких нерегулярных, вырожденных задачах сводятся к разрывным функциям, а управляющие функции характеризуются наличием дельтообразных составляющих и сходятся в смысле распределений. Поэтому возникает проблема расширения этого класса задач, направленная на включение предельных элементов в множество допустимых процессов. На этом пути и возникают задачи импульсного управления.
В становление и развитие теории оптимального импульсного управления важнейший вклад внесли работы [20, 22-24, 26-34, 48, 51]. Вопросам оптимизации динамических систем, описываемых дифференциальными уравнениями с управляющими функциями импульсного типа, посвящено большое число исследований, в том числе работы [14, 27-29, 45]. Нелинейные управляемые системы являются важной и актуальной темой исследования. Ими описываются реальные процессы, многие прикладные задачи (в области экономики и техники). Несмотря на то, что исследования в этой области ведутся давно, до сих пор остаются малоизученными многие аспекты.
Для получения достаточных условий локальной управляемости динамической системы, а также при выводе необходимых условий первого и второго порядка для задачи оптимального управления, заключающейся в минимизации некоторого функционала на множестве допустимых процессов управляемой системы, большую роль играют понятия регулярности, 2-регулярности и 2-нормальности в рассматриваемой точке. Поясним суть этих определений для абстрактного отображения Ф, действующего из заданного банахова пространства Z в K.fc.
Пусть z — заданная точка из Z, и отображение Ф дважды непрерывно дифференцируемо в окрестности z.
Определение В.1. Отображение Ф называется регулярным (нормальным) в точке z, если ппФ'(г) = Rh, (В Л) где im— образ линейного оператора.
Известно, что если отображение Ф регулярно в точке z, то для него справедлива теорема об обратной функции. Кроме того, для задачи минимизации ip(z) ->• mm, Ф(г) = О, (В.5) где ip — заданная гладкая функция, справедлив принцип Лагранжа (при А0 = 1), а также необходимые условия второго порядка. Если же точка z является анормальной, то есть ппФ'^) Ф Жк, то утверждение классической теоремы о неявной функции, как известно, может не выполняться. Аналогично, в задаче минимизации (В.5) принцип Лагранжа является неинформативным, то есть выполняется при До = 0 (независимо от минимизируемой функции ср), а классические необходимые условия второго порядка могут не выполняться.
Таким образом возникает проблема нахождения условий, более тонких, чем условие (В.4), но которые бы гарантировали локальную разрешимость уравнения Ф(г) = у для всех 2, близких к точке у = Ф(£), а также наличие содержательных необходимых условий первого и второго порядка в задаче (В.5). Эти условия известны и называются условиями
2-регулярности (они были получены в [1]) и 2-нормальности ([б]). Приведем эти условия.
Положим
T(z) = {heZ: <b'(z)h = О, Ф "(z)[h, h] € 1шФ'(г)} .
Возьмем h G T(z). Определим линейный оператор G(z, h) : ZxKei^'(z) —> Rk по формуле
Определение В.2. Отображение Ф называется 2-регулярным в точке z по направлению h, если imG(z,h) =Шк. (В.6)
Как известно ([1]), существование вектора h 6 вдоль которого отображение Ф 2-регулярно в точке z, гарантирует разрешимость уравнения Ф(г) = у для всех у, достаточно близких к у = Ф(2). Кроме того, в задаче (В.5) для любого такого h справедливы некоторые необходимые условия первого и второго порядка, содержательные и в анормальном случае (то есть когда 1тФ'(,г) ф М.к).
Обозначим через конус, состоящий из таких А € Шк, А ф 0, что
Ф'(£)*А = 0 и в Z существует линейное подпространство П = П(А):
П С КегФ'(г), codimn < к; ^ <А,Ф(5)> [г,г]>0У2еП.
Сразу же отметим, что конус F2(z) может оказаться пустым. Он, например, заведомо пуст, ести отображение Ф нормально в точке В, т.к. из (В.4) вытекает, что Ф'(£)*А ф О V А ф 0. Кроме того, после присоединения к этому конусу нуля он становится замкнутым, но вовсе не обязан стать выпуклым.
Определение В.З. [8] Отображение Ф называется 2-нормальным в точке z, если конус convF2(z) является острым, т.е. не содержит ненулевых подпространств (случай F'j(5) = 0 не исключается, т.к. пустой конус острый по определению).
В настоящей работе условия 2-регулярности и 2-нормальности расшифровываются применительно к управляемым системам.
Перейдем к изложению результатов работы. Диссертация состоит из четырех глав, каждая из которых разделена на параграфы. Нумерация теорем, предложений, лемм, определений, замечаний, а также ссылок на формулы сквозная в пределах каждой главы.
В первой главе диссертации рассматривается управляемая динамическая система dx(t) = f(x{t),u{t),t)dt + G{L)dfi{t), t G [ti,t2], (В.7) x{t{) = хъ х(t2) = х2, (В.8)
W(xux2) = 0, fi G К. (В.9)
Здесь t G [<1,^2] — время, ti < t2 заданы, х — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве Мп, и = (щ, и2, ■ • •, ит) eRm - управление, / — н-мерная, G —п х ^-мерная, а W — ги-мерная вектор-функции (n, т, w — натуральные числа). Функция W предполагается дважды непрерывно дифференцируемой, а функция / — кусочно-гладкой, т.е. отрезок [ii, £г] представим в виде конечного числа отрезков [Ti,Tj+i] так, что сужение / на М" х Rm х [тг-,7*+1] бесконечно дифференцируемо.
Положим
К = \ !1 G С* ([^,i2];Rfc) : V непрер. (р : (p{t) G К* V t, L ip(t)dn > О V борел. В С [tut2] где К С. Шк — заданный острый выпуклый замкнутый конус, К* — его сопряженный. Другими словами, ц — А>мерная мера Бореля, такая, что fJ-(B) С К для любого борелевского множества В.
В качестве класса допустимых управлений рассматривается множество пар (и, fj.) : /i G К, и G L™[ti, t2].
Тройка (x(t),u(t),/j,(t)), t G [ii,i2]i называется допустимым процессом, если (w(-), /х(-)) — допустимое управление, а ж(-) — соответствующее ему решение уравнения (В.7), удовлетворяющее концевым ограничениям (В.8), (В.9): t x{t) = x{t1) + J f(x(r),u(r),T)dT+ J G(t)h(t) vte[tut2]. tl [h,t]
В работе расшифрованы условия 2-регулярности и 2-нормальности для управляемой системы (В.7)- (В.9), а также для соответсвующей ей классической управляемой системы. Кроме того, получены необходимые и достаточные условия 2-рсгулярности и достаточные условия 2-нормальности.
Для решения поставленной задачи система (В.7)-(В.9) была представлена в абстрактном виде. Была фиксирована точка й(-), /!(■)) Е Mn хК, такая, что (х, й, р,) — допустимый процесс, и x(ti) = х\.
Для произвольных (xi,u(-), ц(-)) 6 Kn х L™[ti,t2] х К, достаточно близких к (xi,u(-), /!(■)), в силу теорем о существовании и непрерывной зависимости решения задачи Копти от начальных условий и правой части существует единственное решение х(-) задачи Коши dx(t) = f(x(t),u{t),t)dt + G(t)dn(t),x(tx) = xu te[tut2], (В.10)
Для указанных {х\, и(-), ц(-)) было определено отображение Ф : Rn х L™[tu t2] хСМР по формуле
Здесь x(t; х\, w(-), д(-)), t Е [ti,t2] — решение задачи Коши (В.10).
Для расшифровки понятия 2-регулярности и 2-нормальности применительно к системе (В.7)-(В.9), были получены формулы для вычисления производных отображения Ф по (и(-),/л(-)).
Глава 2 посвящена исследованию локальной управляемости динамических систем.
Рассматривается управляемая динамическая система
Здесь t Е [ti,t2] — время, ti < t2 заданы, х — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве К™, и = (щ, «2, •. -, um) GMm — управление (n, то — натуральные числа). n-мерная вектор-функция / удовлетворяет следующим предположениям: при почти всех фиксированных t f(x,u,t) — дважды непрерывно дифференцируемая по (х, и) функция; для любых фиксированных (х, и) функции f(x,u,t), df{x,u,t)/d{x,u), d2f(x,u,t)/d(x,u)2 измеримы по t и на любом ограниченном множестве ограничены и непрерывны по (х, и) равномерно по t.
В качестве класса допустимых управлений рассматривается множество измеримых существенно ограниченных функций и G L™[ti,t2], Рассматривается допустимое управление й(-) и предполагается, что соответствующее ему решение задачи (В.11), (В.12) существует на [ti,t2]. Согласно теореме единственности, это решение, которое обозначаем через
Ф(хь«(•),/*(•)) - W{xux(t2-хи и(-), //(■))). х = f{x,u,t), t G [ti,t2], Xi.
B. 11) (Б.12) x(t), t G [ii, t2], единственно и в силу теоремы существования для каждого допустимого управления и(-), близкого к й(-) в метрике пространства L™[£i,£2], решение задачи (В.11), (В.12) существует.
Пара вектор-функций (x(t),u(t)),t G \ti,t2], называется допустимым процессом, если и(-) — допустимое управление, а х{-) — соответствующее ему решение уравнения (В. 11), удовлетворяющее начальному условию (В.12).
Фиксируем точку (£i,u(-)) gR"x L™[ti,i2], такую, что (х,й) — допустимый процесс, и x(ti) — х\.
Для заданного £(•) G L™[ti,i2] через обозначим решение системы уравнений в вариациях ^(x(t),Ht),t)5lX^ + ^(x(t),u(t),t)at) (В. 13) с начальным условием
S&zih) = 0. (5.14)
Для заданных £,(•),г](-) 6 L™[ti,t2] через 52х^(-) обозначим решение системы уравнений в вариациях d df d2f
-(<W/)W = x(t), u{t), t)S2x^(t)dt+^{x{t),u(t)tt)[Six^t), 5^)}+ d2f d2f
5.15) d2f с начальным условием О- (B-1Q)
Положим Т(хг,й(-)) = {he L™[tlft2] : SlXh(t 2) = 0, 3g G : faxhhfo) = hxg{t2)}.
Определение B.4. Пусть h G Т(хг, «(■)). Процесс (£(•), й(-)) 2-регулярен (для задачи (В.11), (В.12) в точке (£1, й(-)) выполнено условие 2-регулярности) по направлению h, если
VyG Е" 36, £2GL™M2]:
8гх^ (t2) + S2xhb (t2) = у, 6ixb(t2) = 0.
Обозначим через Pi и Р2 операторы ортогонального проектирования R" на подпространство {у G М" : G L™[ti,t2] : у = Six^fe)} и его ортогональное дополнение соответственно.
Показано, что 2-регулярный по некоторому направлению процесс является локально управляемым.
Теорема 2.1. Если для задачи (В.11), (В.12) в точке (жьй(-)) выполнено условие 2-регулярности по некоторому направлению h, то процесс (.£(•),&(•)) является локально управляемым из точки х\ € К" в точке x(t2), т.е. существуют константы Ki, к2 такие, что
Vz : \z — x(t2) | < кг 3uz e L™[tut2] : x(t2) = z, где x(-) — решение задачи Коши x = f{x, uz(t), t), t e [ti,t2], = x(ti), II uz-u \\ьш< K2(\x(t2) -z\ + \Р2{х(Ь) - z)\1'2).
Для допустимого процесса (x, й) обозначим через 3~(х, й) = 3" множество тех у G R", у ф 0, для которых существует абсолютно непрерывная вектор-функция ф = фу{-), являющаяся решением задачи Коши ф= ~dH(x(t),u(t),t,ip(t))/dx, = 0, такая, что ip(t2) = -у, dH(x(t)^(t),t,^(t))/du = 0 для п.вЛ € [tut2].
Предположим, что 5F ф 0. Для у 6 CF определим на пространстве квадратичную форму формулой h
В Н й, t, ф) £), 0] dt. h
Через ^2>п(ж, й) = 3~2iU обозначим множество тех у € 3", для которых индекс формы Qy не превышает п.
Определение В.5. Процесс (£(•), й(-)) 2-нормален (для задачи (В. 11), (В.12) в точке (xi,u(')) выполнено условие 2-нормальности), если конус сопуЗ^пО^м) является острым.
Получено условие, при котором локально управляем 2-нормальный процесс.
Теорема 2.2. Пусть процесс (ж, й) 2-нормален. Тогда процесс (х,й) локально управляем в точке x(t2), т.е. существуют константы к\. к2 такие, что
Vz : \z- x{t2)| < ку 3uz в L™[tut2] : x(t2) = z, где ж(-) — решение задачи Коши
X = f{x,uz(t),t), t е [ti,t2],,x(tl) = x(ti),
II uz - й ||is< K^P^xih) - z)| + |P2(x(t2) - z)\1'2), тогда и только тогда, когда существует такое £ G L™ [Zi, t2]1 что 0 Vy g Э-2,п(х,й).
Проведено исследование локальной управляемости систем с импульсными управлениями.
Рассматривается управляемая динамическая система сix(t) = f(x(t),u(t),t)dt + G(t)dfM(t), t G [ti,t2], {В. 17) x(ti) =xu ц G K. (5.18)
Здесь t G [h,t2] ~~ время, t\ < t2 заданы, x — фазовая переменная, принимающая значения в n-мерном арифметическом пространстве R", и = (щ,и2,., ит) GKm - управление, / — n-мерная, G— пх к- мерная, а W — ги-мерная вектор-функции (к, п, m,w — натуральные числа). Функция W предполагается дважды непрерывно дифференцируемой, функция f — дважды дифференцируемой по ж и и для п.в. t G [^1,^2], а функция G — непрерывной.
К = G С* ([ti,t2];Kfc) : V непрер. tp : <p(t) 6 К* V t, J (p(t)dfj, > О V борел. В С [t\, i2] j , где К С - заданный острый выпуклый замкнутый конус.
В качестве класса допустимых управлений рассматривается множество пар (ы,/л) : ц G К, и е
Тройка {x(t), u(t), fJ-{t)), t G [t\,t2], называется допустимым процессом, если (?/(•),//(•)) — допустимое управление, а х(-) — соответствующее ему решение уравнения (В.17), удовлетворяющее условию (В.18): t x(t)=x{t1) + J f{x{r),u{r),T)dT+ J G{r)d,i{r) V t € [ti,t2\. ti [tut]
Фиксируем точку (xu й(-), Д(-)) G Шп x L™[ti,t2] x К., такую, что (ж,w, fx) — допустимый процесс, и x(ti) = х\.
Для заданных £(■) £ L™[ti,t2], и Е ТК(Д) через обозначим решение системы уравнений в вариациях d{5iX(:j){t) = ~{x{t),u{t),t)81x^{t)dt + ^{x{t),u{t),t)£{t)d1. + G{t)dv{t) с начальным условием
5\Xtv(ti) = 0.
Для заданных £(•),??(•) £ L™[tut2], и, в £ Тк(р) через 62х^в(-) обозначим решение системы уравнений в вариациях df d2f <92 f d2f с начальным условием 0.
Положим С = {у е Rn : 3£ € £ Тк(£) + Lin{£} : у}.
Обозначим через Р2 линейный непрерывный оператор, проектирующий Кп на какое-нибудь подпространство, дополняющее LinC.
Положим Т{хи й(-),А(0) = ((М) е L™[lut2] х (TK(/i) + Lin{/i}) : 5ixhg(t2) = 0, 3(h, g) <= b™[tx,t2] x (ТК(Д) + Lin{£}) : -J2xhhgg(t2) =
Определение В.6. Пусть (h,g) £ T(xi, u(-), £(■)). Для задачи (В.17), (В.18) в точке (хх, й(-), £(•)) выполнено условие 2-регулярности относительно К по направлению (h,g), если
VyelT' 3 31/х, глг е ТГк(А) Ч- Lin{A> :
Six^Ul(t2) + 52xhbgU2(t2) = у, 5ixb„2(t2) = 0.
Теорема 2.6. Пусть для задачи (В.17), (В.18) в точке (жх,й(-),£(•)) выполнено условие 2-регулярности относительно К по некоторому направлению (h,g). Тогда процесс й(-), £(■)) является локально управляемым из точки Xi £ R" в точке x(t2), т.е. для произвольного / £ riC существуют константы к2, такие, что z : |z - < К! 3u2 е L™[tbt2], G К(Тк(£) + Lin{£}) : где яг(-) — решение задачи Коши dx{t) = f{x(t), uz(t),t)dt + G{t)dpz(t), x{ti) = i(ti),
II (uz,pz) - («,£) IU-xC*< (|s(i2) ~ z\+ p{x(t2) - z,CK3)1/2)) .
Здесь p— расстояние от точки до множества и СКз = cone(BKS(l))r\LinC.
Получено условие, при котором локально управляем 2-нормальный процесс.
В третьей главе диссертации получены необходимые и достаточные условия экстремума для 2-нормальных задач оптимального импульсного управления.
Рассмотривается задача оптимального импульсного управления ti
J = J(xuu,p) =W0(x1,x2) + J f°(x(t),u(t),t)dt+ J g°(t)dp(t) —>■ min, h [ЧМ
В.Щ dx(t) = f(x(t),u{t),t)dt + G{t)dfi(t), t G [h,t2], {B.20) x{ti) = x1,x{t2)=x2, {B. 21)
W(xux2) = 0, peK. (B.22)
Определение В.7. Допустимый процесс (х, й, р) называется конечномерным минимумом, если для любого содержащего точку й конечномерного подпространства R С L™[ti,t2] процесс (х,й,р) является локальным минимумом в задаче (В.19)-(В.22) с дополнительным ограничением и(-) G R.
Определим на множествах Г х Р х I1 х Г х I1 и K2n х R1+w гамильтониан и малый лагранжиан по формулам
Н(х, и, t, ф, А0) = {f(x, и, t),iP)~ X°f(x, и, t), l(xих2, А) = ХЖЫ,х2) + (A1, W{xux2)) , А = (А0, А1).
Здесь A0 G К1, A1 G а ф — тг-мерный вектор-столбец. Пусть (х, й, р)— заданный допустимый процесс.
Определение В.8. Процесс (х, й, р) удовлетворяет уравнению Эйлера-Лагранжа, если существует такой вектор А ^ 0, что А0 > 0 и для вектор-функции -0, являющейся решением задачи Коши ф = -дН(х{г),й(г),г,ф$))/дх, ф(Ь) = dl(xux2, \)/дхх, (В.23) имеет место dH{x{t),u(t),t,ijj(t),X0)/du = 0 для п.в. t G ф(12) = -д1{хих2,\)/дх2, (Б.24) rf>{t),G{t)v) - a0 (g°(t),v) < 0 VveK,Vte [tuh], ij>(t),G(t)v(t)) - А° (g°{t),v(t)) = 0 для р, - п.в. t в [tut2].
Здесь v(t) = — производная Радона-Никодима, |/2| — полная вариация Д, xi = x(ti), х2 = x(t2).
Обозначим через А(.т, й, Д) множество всех векторов Л, которые отвечают заданной экстремали (х, й, fi) в силу уравнений Эйлера-Лагранжа.
Если конус А не содержит элемент вида (О, А1) (т.е. элемент с А0 = 0), то задача называется нормальной. В противном случае задачу называют анормальной и для нее необходимые условия первого порядка выполняются тривиально.
Для формулировки условий второго порядка для процесса (x,u,jl) введем в рассмотрение систему уравнений в вариациях d(5x) = ?f(x{t),u{t),t)Sxdt+ ^f{x(t),u(t),t)Su{t)dt + G{t)d{6Li){t). а/ с/ сь
Б.25)
Здесь 5и G L™[ti,t2], Sfi G Тк(Д), а решение уравнения в вариациях должно удовлетворять условию dW dW {хи x2)6x(t!) = 0, — {хг, x2)5x{t2) = 0. (В.26)
ОХ 1 ох2
Пусть A G А(ж, й, Д). На пространстве V = Rn х L™[£bt2] пар ((,5и) определим квадратичную форму Г2д формулой д21 а 2 гт й, i, [(Sx(t), Su(i)), (Sx(t), Su(t))] dt. h
Здесь и далее 5x — соответствующее (5u, 8(л) решение системы уравнений в вариациях (В.25) с начальным условием 5x{t\) — С
Через X обозначим линейное подпространство X = Rn х L™[ibi2] х С*, состоящее из всех тех (С, 5и, 5/х), что решение системы (В.25) 5х удовлетворяет граничным условиям (В.26). Для произвольного целого неотрицательного числа г через Аг = А.г(х,й,р) обозначим множество тех
Л £ Л (:r, u, /),), для которых индекс сужения формы Г2А на подпространство X не превышает г.
Пусть Ф — фундаментальная матрица системы уравнений в вариациях (В.25), т.е. Ф является решением однородной системы где I—единичная матрица. Обозначим через d размерность ядра блочной матрицы (ZfZ2), где dW dW ti ti
X<$>(t2) — {XUX2).
Теорема 3.1.(см. [58]). Пусть допустимый процесс (x,u,fi) является конечномерным минимумом в задаче (В.19)-(В.22). Тогда Л^ ф 0 и для ((, 8и, 8ji) G X, таких, что
J ^6x(ty?£(x(t),u(t),t)\ + /su(t),?£(£(t),u(t),t) dt+ i J (g°(t),6fl) + (хъ sa), (5x(t,), fa(*2))T) < 0, tl,<2] имеет место max ftA(C,<b)>0. IB.27)
Пусть экстремаль (ж, й, Д) анормальна (т.е. d> 0). Тогда если conv A(i — выпуклая оболочка конуса Ad — содержит ненулевое подпространство, то условие (В.27) выполняется автоматически, так как максимум зависящей от переменной Л линейной функции по множеству, содержащему одновременно два вектора Л и (—А), неотрицателен. Таким образом, если конус conv Л^ не является острым, то условие (В.27) содержательной информации не несет. Приведенная ниже теорема показывает, что в 2-нормальном случае это не так. Оказывается, что в этом случае "за-зор"между необходимыми условиями из теоремы 3.1 и достаточными условиями локального минимума в некотором смысле неулучшаем: t2
J (f°(x(t),u(L),'t) + e\x(t)-x(t)\2)dt + J g°(t)dfj,(t) —»■ min,
Предположим, что концевые ограничения регулярны, т.е. rank w.
Теорема 3.2. Предположим, что допустимый процесс (ж, й, р) является 2-нормальным для задачи (В.19)-(В.22) и для него выполняются необходимые условия второго порядка из теоремы 3.1.
Предположим также, что матрица df(x(t),u(t),t)/du имеет ранг ш при почти всех t и существует непрерывная ?г-мерная функция £ такая, что £(t)G(t) = 0 и t(t)%L(x(t),u(t),t) = 0 для n.B.t е [£i, -Тогда существуют такие вектор v Е Mw и вектор-функция f3(t) Е что для любого £ > 0 тройка (ж, й, fi) доставляет строгий конечномерный минимум в следующей возмущенной задаче:
W0{xux2) +е|(жь.г-2) - (жьж2)|2+ t2 ti [tiM dx(t) = f(x(t),u(i),t)dt + ep(t)\x{t) - x{t)\2dt + G(t)d/i(t), £ E [ti,t2], W(xl,x2) +ev\(xux2) - (&i,x2)\2 = 0, p EK.
В четвертой главе получены необходимые условия оптимальности второго порядка для задачи (В.19)-(В.22) , основанные на модифицированной функции Лагранжа.
Обозначим через L\ = Li(t,x,x,u,dfJ.,ip) функцию
Lx = {ф,х- /(ж, и, t) - G{t)dfi{t)), Lj : КхГхГхГх^хГ-il, а через L2 = L2(t, х, х, и, d(i,p, гр, А0, 5iXgp, д) функцию
L2 = До (f(x, и, £) + g°(t)dfi(t)) + (р,х- f(x, и, t) - G(t)dp(t))
- (Ф, fx(x, и, t)Sixhgp + fu(x, и, t)g) , ^:1хГхГхГх1'хГхГх1хГхГ4К.
Для заданных h Е R", g(-) E L™[£b£2], p E Тк(р) через 5\Xhgp(-) обозначим решение системы уравнений в вариациях d(6ix*p)(t) = ^(x(t),u(t),t)5lxf;p(t)dt + ^(x(t),u(t),t)g{t)dt + G(t)dp(t) с начальным условием
61х*м = h.
Теорема 4.3. Для того, чтобы процесс (£(•),£(•),/}(•)) доставлял локальный минимум в задаче (В.19)-(В.22), необходимо, чтобы для любой тройки (h, </(•), р(-)) G T(xi, й(-), //(•)) нашлись такие вектор I G М'", вектор-функция р(-) : [ii, t2] —> R™ и не равные одновременно нулю число Ао, вектор s G Шк1 и вектор-функция ф(-) : [ti,t2] ~* что выполнены следующие соотношения: где
1) { + Llx
О, x(t),u(t))
LiiU(u) = )*, 3 = 1,2, li«l(£(t),«(0) = о для п.в.г g [tut2],
2) {— -^L2± + L2x dW, g k®(£); 0, x(t),u(t)) aw (-l^fAo-^OcbXa) + — (жьж2)/ + dxj
L.
2«l(x(0,fi(0) 0 для n.B.t g [ti, t2]
JM»kx(t)Mt),P)
0,
5.28)
5.29)
5.30)
5.31) dW
T(.*b £(•),£(•)) = \ (h,g(-),p(-)) G RnxL™[t1}t2] : ^ z^^) =
2=1
Vs : Бф(-), удовл. (5.28) - (5.31), i,j=1 1 2
Я2 f d2 f d2f -^(x(t),u(t),t)[g(t),g(t)] ) dt = 0
КФ(£) = <peC([ti,f2];Rfc) : f ip(t)(dp, — d^)(t) > 0 V/л g ik i. L J[tiM J
Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
О некоторых задачах устойчивой управляемости нестационарных систем в критическом случае2001 год, кандидат физико-математических наук Родина, Людмила Ивановна
Решение задачи управляемости систем с фазовыми ограничениями2002 год, кандидат физико-математических наук Шарафеев, Даниэль Робертович
Разработка математической теории и численных методов для решения некоторых классов негладких задач оптимизации1998 год, доктор физико-математических наук Полякова, Людмила Николаевна
Методы решения задачи о локальной управляемости в классе нелинейных дифференциальных уравнений с неуправляемыми системами линейного приближения2006 год, кандидат физико-математических наук Зудашкина, Оксана Валентиновна
Необходимые условия экстремума в задачах оптимального управления с промежуточными ограничениями1995 год, кандидат физико-математических наук Окулевич, А. И.
Список литературы диссертационного исследования кандидат физико-математических наук Павлова, Наталья Геннадьевна, 2008 год
1. Арутюнов А.В. Теорема о неявной функции и анормальные точки. Доклады Академии наук. Т. 368, е 5, с. 586-589. (1999)
2. Арутюнов А.В., Павлова Н.Г. О топологических свойствах множества достижимости линейных систем. Дифференциальные уравнения, 2004, том 40, N. 11, с.1564-1566.
3. А.В. Арутюнов, В.Н. Розова. Регулярные нули квадратичного отображения и локальная управляемость нелинейных систем. Дифференциальные уравнения. 1999 - Т. 35, N 6. - С.723-728
4. Арутюнов А.В., Ячимович В. 2-нормальные процессы управляемых динамических систем. Дифференциальные уравнения. 2002. Т. 38. N 8. С. 1017-1029.
5. Васильев Ф.П. Методы оптимизации. М., 2002
6. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. - 624 с.
7. Гурман В.И. Вырожденные задачи оптимального управления. М.: Наука, 1977. - 304с.
8. Гурман В.И. Об оптимальных процессах особого управления // Автоматика и телемеханика. 1965. -Т.26, N5. -С.782-791.
9. Гурман В.И. Принцип расширения в задачах оптимального управления. М.: Наука, 1985. - 288с.
10. Гурман В.И., Дыхта В.А. Вырожденные задачи оптимального управления и метод кратных максимумов // Автоматика и телемеханика. -1977.- N3. С.53-59.
11. Гурман В.И., Дыхта В.А. Достаточные условия сильного минимума для вырожденных задач оптимального управления // Дифференциальные уравнения. -1976 Т.12, N12. - С.1229-1239.
12. Гурман В.И., Дыхта В.А., Колокольникова Г.А. Нелокальные преобразования вырожденных задач оптимального управления и импульсные режимы. Деп. в ВИНИТИ 15.06.90, N3455 - В90. - 75с.
13. Гурман В.И., Дыхта В.А., Колокольникова Г.А. и др. Принцип расширения в задачах оптимального управления // Изв. АН СССР. Техн. кибернетика. -1983 N2. - С.200-213.
14. Гурман В.И., Колокольникова Г.А. Условия оптимальности импульсных режимов. Деп. в ВИНИТИ 14.10.84, N6259-84 - 58с.
15. Дыхта В.А. Вариационный принцип максимума для импульсных и особых режимов в задаче оптимизации, линейной по управлению // Изв. вузов. Математика. 1991. - N11. - С.89-91.
16. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных процессов. Иркутск: Изд-во ИГЭА, 1995. - 186с.
17. Дыхта В.А. Вариационный принцип максимума и квадратичные условия оптимальности импульсных и особых процессов // Сиб. матем. ж. 1994. - Т.35 - N1. - С.70-82.
18. Дыхта В.А. Импульсное оптимальное управление в моделях экономики и квантовой электроники // Автоматика и телемеханика -1999. N11. - С.100-113.
19. Дыхта В.А. Импульсно-траекторное расширение задач оптимального управления // Развитие и применение метода функций Ляпунова. -Новосибирск: Наука. Сиб. отд-ие, 1992. С.170-182.
20. Дыхта В.А. Качественное исследование моделей экономики // Тр. Вост.-Сибирской зональной межвуз. конф. по математике и проблемам ее преподавания в вузе. Иркутск, Изд-во Иркут. гос. пед. ун-та, 1999 - С.125-132.
21. Дыхта В.А. Необходимые условия оптимальности импульсных процессов при ограничениях на образ управляющей меры // Изв. вузов: Математика. 1996. - N12. - С.1-9.
22. Дыхта В.А. Принцип максимума для оптимальных импульсных процессов при ограничениях на образ управляющей меры // Оптимизация, управление, интелект. Журн. Всерос. ассоц. матем. программирования и АНН. - 1995. - N1. - С. 100-109.
23. Дыхта В.А. Принцип расширения в качественной теории управления // Методы решения задач теории управления на основе принципа расширения / В.А. Батерин, В.А. Дыхта, А.И. Москаленко и др. Новосибирск: Наука. СО, 1990. - Гл.1. - С.5-48.
24. Дыхта В.А. Условия локального минимума для особых режимов в системах с линейным управлением // Автоматика и телемеханика. 1981. - N12. - С.5-10.
25. Дыхта В.А., Колокольникова Г.А. Условия минимума на множестве последовательностей в вырожденной вариационной задаче // Математические заметки. 1983. - N5. - С.735-744.
26. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. М.: Физматлит, 2000. - 255 с.
27. Дыхта В.А., Самсонюк О.Н. Принцип максимума для импульсных процессов при ограничениях на образ и полную вариацию управляющей меры // Краевые задачи: Сб. науч. тр. Иркутск: Изд-во Иркут. ун-та - 1997. - С.122-138.
28. Завалищин С.Т. Специальные нелинейные уравнения в обобщенных функциях // Дифференц. уравнения. 1990. - Т.26, N8. -С.1316-1323.
29. Завалищин С.Т., Ревенко В.В., Сесекин А.Н. Нелинейные дифференциальные уравнения в обобщенных функциях: Препринт. УрО АН СССР. Свердловск, 1989. -67с.
30. Завалищин С.Т., Сесекин А.Н. Импульсные процессы: Модели и приложения. М.: Наука, 1991. - 256 с.
31. Завалищин С.Т., Сесекин А.Н., Дрозденко С.Е. Динамические системы с импульсной структурой. Свердловск: СреднеУральское изд-во, 1983. - 112с.
32. Колокольникова Г.А. Вариационный принцип максимума для разрывных траекторий неограниченных, асимптотически линейных управляемых систем // Дифференц. уравнения. 1997. - Т.ЗЗ, N12.- С.1631-1638.
33. Колокольникова Г.А. Импульсные режимы в нелинейных управляемых динамических системах и условия их оптимальности: Дис. . канд. физ.-матем. наук. Иркутск, 1985. - 157с.
34. Колокольникова Г.А. Исследование обобщенных решений задач оптимального управления с линейными неограниченными управлениями на основе кратных преобразований // Дифференц. уравнения.- 1992. Т.28, N11. - С.1919-1932.
35. Красовский Н.Н. Теория управления движением. Линейные системы. М.: Наука, 1968. - 475 с.
36. Красовский Н.Н. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука, 1985. - 516 с.
37. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. - 446 с.
38. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. - 392 с.
39. Ли Э.Б., Маркус Л. Основы теории оптимального управления. -М.: Наука, 1972. 574 с.
40. Павлова Н.Г. Множество достижимости линейных систем. Современные методы теории краевых задач: Материалы весенней математической школы "Понтрягинские чтения -XVI". Воронеж: ВГУ, 2005, с.120-121.
41. Павлова Н.Г. Условие 2-регулярности для управляемых систем. XLII Всероссийская конференция по проблемам математики, информатики, физики и химии. Москва: РУДН, 2006, с.71.
42. Павлова Н.Г. Необходимые и достаточные условия экстремума для задач оптимального импульсного управления. Вестник ВГУ, Серия: Физика. Математика, 2007, N. 1, с. 105-111.
43. Павлова Н.Г. Условие 2-регулярности для систем с импульсными управлениями. XLIV Всероссийская конференция по проблемам математики, информатики, физики и химии. Москва: РУДН, 2008.
44. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М., 1961
45. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1978
46. Рокафеллар Р. Выпуклый анализ. М.: Наука, 1973
47. Рудин У.Функциональный анализ. М.: Наука, 1975
48. Arutyunov A., Dykhta V., Pereira F. Necessary Conditions for Impulsive Nonlinear Optimal Control Problems without a priori Normality Assumptions. Journal of optimization theory and appl. vol. 124, e 1, pp. 55-77 (2005).
49. Arutyunov A., Jacimovic V., Pereira F. Second order necessary conditions for optimal impulsive control problems. J. on Dynamical, and Control Systems., vol. 9 (2003), No. 1 , pp. 131 153.
50. Arutyunov A., Karamzin D., Pereira F. A nondegenerate maximum principle for the optimal control problem with state constraints. SI AM J.Control Optim. V.43, e5, p.1812-1843 (2005).
51. Kamien M.I., Schwartz N.L. The calculus of Variation and Optimal Control in Economics and Management // North Holland, NY -Oxford, 1981. -331p.
52. McShane E.J. Amer. J. Math. 1941. V. 63. P. 516-530.
53. Pavlova N. 2-regularity and 2-normality conditions for systems with impulsive controls. Yugoslav Journal of Operations Research, 2007, Volume 17, No 2, 149-164.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.