Свойства функции быстродействия и позиционное управление линейной нестационарной системой тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Николаев, Сергей Федорович
- Специальность ВАК РФ01.01.02
- Количество страниц 119
Оглавление диссертации кандидат физико-математических наук Николаев, Сергей Федорович
Оглавление
Введение
Глава 1. Докритические системы
§ 1. Основные определения и вспомогательные утверждения
§2. Докритичность и неосцилляция
§ 3. Свойства функции ег(£)
§ 4. Численный алгоритм построения функции сг(^)
Глава 2. Структура множества управляемости докритических систем и вектор быстродействия
§ 5. Структура множества управляемости
§ 6. Структура расширенного множества управляемости
§ 8. Вектор быстродействия
Глава 3. Позиционное управление докритической системой
§ 9. Постановка задачи и пример П. Бруновского
§ 10. Позиционное управление докритической системой,
оптимальное в смысле быстродействия
§11. Уравнение Беллмана
§ 12. Позиционное управление нелинейной системой, близкой к докритической
Литература
Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Структура множества управляемости и позиционное управление линейной нестационарной системой2000 год, кандидат физико-математических наук Милич, Николай Владимирович
Структура множества управляемости линейной нестационарной системы с векторным управлением2015 год, кандидат наук Лукьянов, Владимир Викторович
О некоторых задачах управляемости нелинейных систем1999 год, кандидат физико-математических наук Мастерков, Юрий Викторович
О некоторых задачах устойчивой управляемости нестационарных систем в критическом случае2001 год, кандидат физико-математических наук Родина, Людмила Ивановна
К теории стабилизации управляемых систем2016 год, доктор наук Зайцев Василий Александрович
Введение диссертации (часть автореферата) на тему «Свойства функции быстродействия и позиционное управление линейной нестационарной системой»
Введение
Теория оптимального быстродействия, основу которой составляет принцип максимума JI.C. Понтрягина [1]—[4], предоставляет принципиальную возможность построения оптимальных процессов во многих прикладных задачах. Наиболее полно изучена задача быстродействия для линейных стационарных систем (см. [2]-[7] и библиографию в [8]), для которых в ряде случаев удается построить позиционное управление [2, гл. 1, § 5], [5]. Если же изучаемая система оказывается нестационарной, то для таких систем, как правило, строится программное управление [9]-[12]. Вопросы существования и построения позиционного управления достаточно изучены для автономных систем [13] (в том числе для автономных систем с возмущением [14]), тогда как для неавтономных систем эти вопросы изучены достаточно мало [15, гл. 5, § 20], [16].
Рассмотрим задачу быстродействия для управляемой нестационарной системы
x = v(t,x,u), (t,x)eR1+n, и Elf, (0.1)
где U — компакт вГ, 0 £ U и v(t, 0,0) = 0. Пусть D = Rx D(t) — некоторая фиксированная область в пространстве М1+п, 0 £ intD(i).
Определение 0.1. Функцию u(t,x), определенную в области D и принимающую значения в U будем называть устойчивым к внешним возмущениям позиционным управлением, оптимальным в смысле быстродействия, если выполнены следующие четыре условия.
1. Для всякой точки (¿о, xq) £ © решение x(t;to,XQ) (понимаемое в смысле А.Ф. Филиппова [17, с. 40]) замкнутой системы
х — v(t, х, u(t, х)) определено и единственно при всех t ^ tq.
= 0.
2. Найдется такой момент времени что
x(t;tQ,x0)
3. Программное управление
u(t;to,xo) =u(t,x(t;to,xo)) является оптимальным для задачи быстродействия
$(«(•)) —>■ min, x = v(t,x,u), и G U, (0.2)
x(t0) = х0, x(t 0 + #)=0.
Время быстродействия для задачи (0.2) обозначим rn(to,xo).
4. Для всякого е > 0 найдется такое $ > 0, что каждой функции w(t,x) G О£(0), (t,x) G D, и любому rj > 0 отвечает функция w^t^x) G 0™(w(t,x)), (t,x) G 2), для которой любое решение xv(t;tQ,xo) (в смысле А.Ф. Филиппова) системы
X = v(t, X,u(t, х)) + Wq(t, х), (t,x)eD, (to,Xo) G 5), (0.3)
удовлетворяет равенству x^t; to, xo) |i=i = 0 при некотором -д^ = ^r,(to,xo) > 0, причём |^(i0,£o) - Tn(t0,x0)\ < e.
Последнее условие обычно не включается в определение позиционного управления, оптимального в смысле быстродействия, но это условие является важным с точки зрения приложений, поскольку обеспечивает непрерывную зависимость времени быстродействия от возмущений основной системы (0.1). Это условие близко к требованию универсальности стратегии в теории дифференциальных игр, которое впервые введенно H.H. Красовским [18] и подробно изучалось в работах H.H. Красовского и его учеников [19], [20].
Замечание 0.1. Поскольку всюду в этой работе рассматривается лишь устойчивое к внешним возмущениям позиционное управление, оптимальное в смысле быстродействия, то для краткости это управление будет называться позиционным управлением, оптимальным в смысле быстродействия или просто позиционным управлением.
Замечание 0.2. Для некоторых систем функция го(£,ж) может быть «большой». Как следует из сформулированной ниже теоремы 0.10, для класса систем, рассматриваемых в данной работе, эта функция должна удовлетворять лишь «односторонним» ограничениям. Так, для скалярного уравнения
х = и + IV(х), |и| ^ 1
управление
( 1, х<0
ЩХ) = <
[-1, я>0
является позиционным управлением, оптимальным в смысле быстродействия, если, например, и)(х) = —ж3 +втж.
Замечание 0.3. Предположим, что для нестационарной возмущенной системы вида (0.3) существует позиционное управление и(Ь,х), оптимальное в смысле быстродействия. Сложность синтеза такого, управления заключается в следующем. Для построения поверхностей переключения (которые обозначим Мп) необходимо решить при каждом фиксированном Ц задачу синтеза программного управления о5^о) Для £ ^(¿о)- Иными словами, для решения задачи синтеза необходима информация о состоянии системы в будущем, что не всегда возможно (например, в случае случайных возмущений «;(£,х)). Если же для позиционного управления я), оптимального в смысле быстродействия, основной (невозмущенной) системой и для возмущений этой системы выполнено четвертое условие определения 0.1, то, решив один раз задачу синтеза для основной системы, можно обеспечить (под действием полученного управления) ^-оптимальное поведение возмущенной системы.
В этой работе изучен класс линейных нестационарных систем вида
х = А(г)х + &(*)«, жеК", (0.4)
с одним входом, для которых существует позиционное управление, оптимальное в смысле быстродействия. Также изучается структура
множества управляемости и свойства функции быстродействия таких систем. Все результаты получены в предположении неосцилляции решений сопряженной системы
ф = -фА{г) (0.5)
относительно гиперплоскости, определяемой нормальным вектором &(£). Системы (0.4), для которых выполнено это условие, названы в [21] докритическими. Термин «докритичность» введен в 50-е годы Н.В. Азбелевым в работах, посвященных краевым задачам и дифференциальным неравенствам: так назывался максимальный интервал разрешимости фиксированного класса задач Валле-Пуссена. Оказалось, что вопрос о существовании оптимального в смысле быстродействия позиционного управления для системы (0.4) тесно связан с вопросом о разрешимости некоторого класса п-точечных задач.
Показано, что, независимо от гладкости А и 6, в любой окрестности нуля пространства (¿, ж)-переменных существуют (отличные от нуля) точки, в которых функция быстродействия теряет гладкость, но таких точек «достаточно мало». Более точно, в работе показано, что, в предположении докритичности, в расширенном фазовом пространстве (пространстве (¿, ж)-переменных) существует слабо инвариантное гладкое многообразие Мп размерности п, содержащее нуль и обладающее тем свойством, что в каждой точке (¿, х) £ Мп функция быстродействия не имеет производной. Далее, во всех точках (¿, х) множества £) = {(£,х) : ^ £ 1, тп^,х) < сг(£)} (ст(£) определяет интервал докритичности), не лежащих на многообразии Л/"", функция быстродействия имеет гладкость на единицу больше гладкости функции £ —> (А(£), &(£)), задающей систему (0.4).
Оказывается, что аналогичным образом функция быстродействия ведет себя на многообразии Л/'™: во всех точках многообразия ЛГ", за исключением точек, находящихся на некотором (слабо инвариантном) подмногообразии ЛЛ1-1 размерности п — 1, функция тп{Ь, х) непрерывно дифференцируема при (¿, х) Е И в направлении любого
вектора, лежащего в пространстве, касательном к Мп в точке х).
Многообразия Мк, к = 1 ,...,п, обладают тем свойством, что на них оптимальное в смысле быстродействия управление разрывно (управление переключается с +1 на — 1 или с —1 на +1), а конус допустимых векторов скоростей (который направляет оптимальное движение, если понимать такое движение в смысле определения А.Ф. Филиппова) касается одного из многообразий Мк (т. е. конус находится по одну сторону от касательного пространства и имеет с этим пространством общий вектор). Это обстоятельство позволяет корректно определить позиционное управление, оптимальное в смысле быстродействия. При этом позиционное управление достаточно задать только на многообразии М1+п максимальной размерности, так как движения (¿, ж(£)) (в смысле Филиппова) системы с разрывной по фазовым координатам правой частью не зависят от того, как определена правая часть на множествах, мера Лебега которых (в М1+п) равна нулю. Таким образом, наличие докритичности (факторизации Полиа-Маммана) влечет существование позиционного управления, оптимального в смысле быстродействия.
В работе описан класс таких допустимых возмущений основной докритической системы (0.4), что оптимальное в смысле быстродействия позиционное управление для основной системы доставляет в нуль каждое решение возмущенной системы (не обязательно за минимальное, но за конечное время), начинающееся в точках расширенного множества управляемости £).
Сконструированы и реализованы численные алгоритмы оценки интервала докритичности и моделирования многообразий Д^, к = 1,..., п — 1 и Мк, к = 1,..., п, приведены численные примеры и иллюстрации.
Результаты, представленные в диссертации, опубликованы в работах [21]—[25].
Ниже приведены формулировки основных результатов работы. Диссертация состоит из введения, трех глав, двенадцати параграфов
(нумерация параграфов сквозная), 31 рисунка и списка литературы. Объём диссертации 117 страниц.
В первом параграфе диссертации введены основные определения и понятия, используемые в работе.
Функцией быстродействия (t,x) —> rn(t,x) системы (0.4) называется функция, значение которой в каждой точке (¿о, ^о) определяется равенством
rn(tо, х0) = min {■& > 0 : x(t0 + £0, х0, «(•)) = 0},
и(-)еи
где U — совокупность измеримых функций со значениями в [—1,1], x{t\ ¿о, #0? и(')) — решение системы (0.4) при управлении и = u(t) и начальном условии х(¿о) = ^о- Если для некоторой точки (¿сь^о) не существует допустимого управления, переводящего решение в нуль за конечное время, то полагаем т„(£о,£о) = оо.
Множеством управляемости системы (0.4) на отрезке [¿о, ¿о + называется множество D$(to) = {х G rn(tQ,x) ^ Множеством управляемости системы (0.4) называется множество
D{tQ) = у Д,(*0).
Пусть ^i(i),... )ipn(t) — произвольная фундаментальная система решений сопряженной системы (0.5). Обозначим через <т(£о) точную верхнюю грань таких и > 0, что на полуинтервале [¿о,¿о + с) совокупность функций
6 M = Wt)b(t),... = ФпШг)
является чебышевской системой (Т-системой).
Определение 0.2. Система (0.4) называется докритиче-ской на интервале J, если для всех t £ J выполнено неравенство a(t) > 0.
Второй параграф посвящен исследованию условий докритичности системы (0.4). Доказаны следующие утверждения.
Теорема 0.1. Всякая система вида (0.4); приводимая невырожденным преобразованием = Ь(Ь)х (!/(£) непрерывно дифференцируема и йеЬЬ^) ф 0, I £ «/) к канонической системе
z = F(t)z + g(t)u,
докритична. Здесь
(fu(t) f12(t)
-т /22 w
F(t) = 0 -/ЗД
hn-\{t) hn{t)\
hn-\(t) hn(t)
/3,-1 W hn(t)
9(t) =
fm\
0 0
V о
\ о 0 ... -pn(t) fnn(t)J
причем функции fik(t), Pi(t) непрерывны и f3{(t) > 0 при всех t E J и i = 1,..., n.
Введем в рассмотрение следующие два условия. Условие 0.1. Для каждого % — 1,..., п + 1 функции t —>• qi(t), определенные равенствами
qi(f) = b(t),..., qi{t) = &_!(*) -
непрерывны, ограничены на некотором интервале J, и det Q(t) ф 0 при всех tej, где Q(t) = (qi(t),.. .,qn(t)).
Условие 0.2. Найдутся числа ..., vn_\ такие, что v\ ^ ^ ■ •• < i/n-i, и для корней Ai(i),..., Лn(t) уравнения det(AQ(t) — H(t)) = 0, где H(t) = (q2(t),..., qn+i(t)), при всех t выполнены неравенства
Ai(t) < i/i ^ X2(t) < ■ • • < i/„-i < An(t).
(0.6)
Теорема 0.2. Условие 0.1 достаточно (а в случае аналитичности функции £ —> (А(£),Ь(£)); задающей систему (0.4) гд необходимо) для докритичности системы (0.4) на интервале 3.
Формулируемая ниже теорема существенно использует результат работы [26].
Теорема 0.3. Если выполнены условие 0.1 на всей числовой оси и условие 0.2, то cr(t) = оо для всех t G M. Далее, если найдутся такие константы е > 0 и 6 ^ 0; что дополнительно к (0.6) при всех достаточно больших t выполнены неравенства 8 ^ Ai [t), 1/г_i + £ ^ Аг'(i) ^ Vi — е, % — 2,..., п — 1, то при всех t G Ш множество управляемости D(t) системы (0.4) совпадает с ]Rn.
В третьем параграфе исследованы некоторые свойства функции ¿о —> с (¿о) ? введено понятие минимальной линейной комбинации функций £i(£),..., £n(t) (см- СТР- 37) и приведены численные примеры, иллюстрирующие различные варианты поведения функции t0 o-(io).
В четвертом параграфе диссертации сформулированы два алгоритма численной оценки функции cr(i). Приведены некоторые результаты использования этих алгоритмов и иллюстрации.
Пятый параграф посвящен описанию структуры множества управляемости Dtf(to) докритической системы (0.4). В формулируемой ниже теореме показано, что в предположении докритичности граница множества управляемости есть объединение непересекающихся гладких многообразий N+(to,ê) и (гладкость на единицу выше гладкости функции t (A(t),b(t))), размерность к которых понижается с п — 1 до нуля, причём объединение многообразий, размерность которых повышается от нуля до к — 1, является общим краем замыкания объединения многообразий, размерность которых понижается с п — 1 до к. Многообразия определены следующим образом: iV* (i0,состоит из всех таких точек xq G для каждой из которых найдётся такая точка t(£q, ^o) G Mk('â), где
M\û) = {0},
MV) ={t = (r„_i) G M: 0 < rn_i < tf},
M\ê) = {t = (rn_k,..., r„_i) G^:0<r„4<-< < tf}, к = 1,... ,n — 1, что оптимальное управление жо), ¿о ^ t ^ ¿0 +
переводит точку x(to) = xq в точку x(tQ-\-$) = 0, имеет переключения только в моменты времени t = to + Ti(io,#o) и до первого момента переключения u(t,xо) = +1 (для многообразия Nt^o,^) до первого момента переключения u{t,xо) = —1).
Пусть функция t —> (A(t),b(t)), задающая систему (0.4), является функцией класса Сг.
Теорема 0.4. Пусть система (0.4) докритическая на М. Тогда для каждого $ ^ о"(£о) множество управляемости является строго выпуклым телом в R" (m. е. int D^(to) ф 0 и для любых x,xq Е dD$(to) и любого А Е (0,1) точка Хх + (1 — Л)^о Е int D#(to)). Граница dD$(to) множества D^(to) есть объединение непересекающихся гладких (класса Cr+1) многообразий и Nt_(to,$), к = 0,1,... , п — I, и объединение
/к—1 \ /к—1
U Jivi(to^)
\t=0 / \г=0
является общим краем многообразий cl iV*(io, г?) и cl Ntfo, Далее, всякой точке xq Е iV*(£o,$) отвечает единственное управление, переводящее точку х(tg) = Xq в точку x(to + $) — 0; причем программное управление u(t;to,xo) имеет ровно к переключений на интервале
В шестом параграфе диссертации доказана теорема о представимости расширенного множества управляемости 0 = Мх Ат(г) (0 в виде замыкания объединения слабо инвариантных многообразий и
9tL+n (которые, в свою очередь, являются объединениями слабо инвариантных гладких многообразий А±, размерность к которых понижается от n + 1 до единицы, причём многообразие размерности к служит краем замыкания многообразия размерности к + 1), описаны свойства этих многообразий, приведены примеры и иллюстрации.
Для каждого к = 0,1,... ,п и любого i € 1 определим многообра-
зия Mk(t), где M\t) = {0},
M\t) = {т = (rn_jfe+i,..., r„) : 0 < Tn^k+i <■ <тп< <r(i)}
и многообразия М1+к = R x Mk(t). Всякой точке (£,r) G М1+к поставим в соответствие точку (t,x), где х = 0 при к = 0, а при & ^ 1
п-1 ^^
ж = х(р) = - (-1 У'п+к J x(t, s)b(s) ds, = 0.
i=n~k t+n
Таким образом, для каждого к = 0,..., п задана функция (£, г) —>• F(i,r) = (t,x) с областью определения М.1л~к и областью значений = F(M1+k) (аналогично Л/2+* = -F(A41+*). Кроме того, в силу построения имеет место представление Л/2+А = M х Л/*± (i).
Теорема 0.5. Пусть система (0.4) докритическая. Тогда расширенное множество управляемости D = М. х (0 представимо в виде D = cl U ; где
K\+k = Я1+к U Як (J Як+'1 U • • ■ и ЛГ\
vt+k = лл^ил^у^и-.-ил^1,
к — 0,..., п. Многообразия слабо инвариантны, и для ка-
ждого к = 0,... , п, многообразие <У1к+ [J Vit является общим краем многообразий сШ^ и cl -
В седьмом параграфе сформулированы два алгоритма численного моделирования границы множества управляемости и алгоритм численного моделирования границы расширенного множества управляемости. Приведены численные примеры и иллюстрации. Восьмой параграф. Обозначим вектор
т
(t,x) = (п(£,ж),... ,г„(£,ж)), (0.7)
где £ + гг(£,ж) — моменты переключения программного управления, оптимального в смысле быстродействия для задачи управления в нуль системой (0.4).
В следующей теореме показано, что для каждого г = 1,..., п, число гг(£о,^о) является временем быстродействия в задаче о переводе точки £о £ А/*" (¿о) на многообразие ЛЛ^г(£о +
0(м(-))-> тт, и(-)еЫ, (0.8)
ж = А(£)ж + £0 < ^ < ¿о + (0.9)
х(*о) = + #) е + (°-10)
где вместо у{г) надо поставить знак «плюс», если г — четное и знак «минус», если г — нечетное число. Поэтому вектор (0.7) естественно называть вектором быстродействия.
Теорема 0.6. Пусть система (0.4) докритическая. Обозначим (и°(-),ж°(-)) — оптимальный процесс задачи (0.8)—(0.10) при некотором фиксированном % £ {1 Тогда = тг-(£о5^о) и на
интервале (¿о,¿о + т^о, ^о)) оптимальное управление и°(£) и отвечающее ему оптимальное решение ж°(£) системы (0.9) совпадают с оптимальными управлением и решением задачи быстродействия в нуль (т. е. задачи (0.8)-(0.10) при г = п).
Производной ¿т(д0) функции т : Л/* —>• М. на многообразии Я в точке до £ N вдоль направления, заданного вектором ш Е Т^ЛГ, называется линейное отображение ¿г(до) : —»• М, определенное
равенством
е=о'
¿е
где д(г) — класс эквивалентности гладких кривых д: (—1,1)—» Л/, обладающих следующими свойствами:
М£)
9(0) = 90,
= ги.
е=0
Аналогично определяется производная сРг, 5^2:
¿•гЫ^.....=
¿г6
е=0
где д: (—1,1) —>■ Л/" — класс эквивалентности гладких кривых вида
/ ч £2,Ш2 / 54
Я{е) = Яо + еи>1 + + • ■ • + + о(е ).
Функция д -> т(д) является функцией класса С5 на многообразии ЛГ, если для всякой С5-кривой д: (—1,1) —> Л/* функция £ —> т(д(е)) является функцией класса С5.
Теорема 0.7. Пусть система (0.4) докритическая, и функции А : М. —> Еп<1(К.п); Ъ : Е —>■ Мп принадлежат классу Сг. Тогда для каждого к = 0,..., п функции г,-: ЛГ++к и —> М, г = 1, •.., п,
принадлежат классу Сг+1 на многообразиях У Л/!"1"*. В част-
ности, Т[ непрерывно дифференцируемы г + 1 раз на Л/*++п У Л/"1+п.
В девятом параграфе работы сформулирована проблема построения позиционного управления ж) (управления по принципу обратной связи) в задаче быстродействия для динамической системы, поведение которой описывается уравнением (0.1). Приведен пример линейной по фазовым координатам и управлению стационарной системы на плоскости (построенный впервые П. Бруновским [27], [28]), у которой отсутствует внутренняя устойчивость по отношению к изменениям на множестве нулевой меры. Также сформулирована проблема построения позиционного управления в нуль (не обязательно за минимальное, но за конечное время) семейства УУ уравнений «близких» к основному уравнению (0.4).
В десятом параграфе доказано существование позиционного управления для докритической системы (0.4) и построено такое управление. Суперпозиционно измеримую функцию ис : ® II будем называть оптимальным в смысле быстродействия позиционным С-управлением (сокращенно оптимальным С-управлением), если для любой точки (¿о?^о) £ С-решение (решение в смысле Карате-
одори) задачи
х = А(Ь)х + Ь(£)и, х^о) = хо, (0-11)
при и = uc(t,x), существует на полуоси [¿о,оо), единственно, обращается в нуль в точке t = ¿о + rn(to,xo) и %(t',to,xo) = 0 для
t > tQ + Tn(to,Xo).
Аналогично определяется оптимальное в смысле быстродействия позиционное Т-управление (сокращенно оптимальное ^-управление). В этом случае функция (t,x) —> uyr(t,x) должна быть определена для почти всех (в смысле меры Лебега в точек (t, х) G int D
и обеспечивать следующее свойство: каждому (îq,£o) £ int 2) отвечает единственное jF-решение (решение в смысле А.Ф. Филиппова) x(t;tQ,xo) задачи (0.11) с управлением и = ujr{t,x) и x(t;to,£o) = 0 для t ^ ¿о + Tn(t0,X0).
Теорема 0.8. Функция
1, если (t, х) G Nl+h при некотором k G {1,..., п} uc(t,x) = < 0, если к = 0
[ — 1, если (t, х) G М]_+к при некотором k G {1,... , п}
доставляет оптимальное С-управление, а функция u?(t,x) =
1, если (t,х) G
— 1, если (t,x) G
— оптимальное J7-управление для докритической системы (0.4).
В одиннадцатом параграфе диссертации доказана теорема о том, что координаты тг-(£о, xq), г Е {1,..., п} вектора быстродействия являются решениями соответствующих уравнений Беллмана.
Теорема 0.9. Пусть система (0.4) докритическая, и функции А : М. —> End(M"); Ъ : К. —¥ М" принадлежат классу Сг. Тогда каждая координата гг-(£, ж), г = 1,..., п, вектора быстродействия:
(a) непрерывна в int ;
(b) непрерывно дифференцируема г + 1 раз в Л/'1+п;
(c) является функцией класса Cr+1 на многообразиях J\fl+k, k G {1,..., п — 1};
(d) является решением задачи
dO{t,x)h(t,x) = -1, 9{t,x)
(t,x)
где d6{t,x)h(t,x) — производная функции 9{t,x) на многообразиях Ml+k, k = 1 + n — i,... , n, в точке (£, ж) вдоль направления, заданного вектором h(t, х) = (1 ,A(t)x + x)b{t)),
1, если
z/(£, ж) = 0, если (t,x) eAf1,
-1, если (t,x) eAf2[J---ljAfl+n;
(е) б частности, при (£, ж) Е функция т,(£, ж) удовлетворяет
уравнению
а при (i, х) Е ЛЛ"1"™ — уравнению
Двенадцатый параграф работы посвящен описанию класса таких допустимых возмущений основной докритической системы (0.4), что оптимальное в смысле быстродействия позиционное управление u(t,x) для основной системы переводит в нуль каждое решение возмущенной системы (не обязательно за минимальное, но за конечное время), начинающееся в точках расширенного множества управляемости £).
Рассмотрим систему уравнений
х
= A(t)x + b(t)u + w(t,x), (£,ж)ее1+", 1, (0.12)
где функции А : К. -» End(En), Ъ : К. —Е71 непрерывны, функция т : Е1+п —у Е" удовлетворяет условиям Каратеодори, = 0, и
существует такое г > 0, что для линейной системы (0.4) при всех £ Е Е выполнено неравенство сг(£) ^ г.
Обозначим
Ог = 1х{а;6 Е": |ж| < г},
Э = I х — расширенное множество управляемости систе-
мы (0.4). Построим многозначные функции
{ и{Ь,х), если и.х) G Я1+п, и{г,х) = { v
Ц-1,+1], если (¿,ж)е9Г,
и х) = А(£)х + &(£)£/(£, х) + и>(£, х). Тогда решения задачи
х е ж), ж (¿о) = хо, (¿0,х0)еЮ, называются решениями (в смысле А.Ф. Филиппова [17]) задачи
х = А^)х + х) + «;(£, х), х(^) = хо-
Здесь ЛГ1+п = ЛГ|+П У АЛ+Г
-п и
, 1, если (t.x) G Л/1+п
Ш,ж) = 4 1,7 + (0-13)
-1, если (t,x) G Обозначим 0£(УГ) = {q G 2): p0(q,mn) < е}.
Теорема 0.10. Пусть существует открытое множество Х>о такое, что Ог С Эо С £) и при некотором а > 0 выполнено неравенство
drn(t,x) sup —^--w(t,x) < 1 — а.
(t,x)es) o\vin vx
Тогда для всякого г) > 0 найдется непрерывная функция wv{t,x), (i, ж) G Do, такая, что:
1) wv(t,x) = w(t,x) при (t, ж) G Эо\0^(Щп);
2) -ги(£,ж)| < г) при (t,x) G O^pt™);
управление u(t,x), определенное равенством (0.13), служит позиционным управлением для системы
х = A(t)x+ b(t)u + Wr,(t,x) (0.14)
в области ©О; т.е. для любой точки (£о?жо) £ найдется момент времени $^(¿0,^0) < оо такой, что любое решение ^(¿¡¿о^о) системы (0.14) существует и ж^о+^^о? ¿о5 хо) — 0- Далее, для всякого £ > 0 найдется 8 > 0 такое, что если |ги(£, ж)| ^ с) при (£,ж) £ £>о, то |гп(£, ж) — ж)| ^ е.
На протяжении всей работы в качестве модельной рассматривается задача об остановке маятника с подвижной точкой подвеса, для которого уравнение движения имеет следующий вид
В работе построено позиционное управление, оптимальное в смысле быстродействия, для маятника, на который не действуют неучтённые внешние возмущения и показано, что если маятник возмущается неизвестными малыми случайными колебаниями, то выбранное позиционное управление по прежнему успокаивает маятник за конечное время.
Работа поддержана Российским фондом фундаментальных исследований (грант 97-01-00413), Конкурсным центром фундаментального естествознания (грант 97-0-1.9), Конкурсным центром Удмуртского госуниверситета (грант 97-04).
Список основных обозначений
/у» % ryt Ои lAJ •
В работе используются следующие обозначения: М" — евклидово пространство размерности п с нормой |ж| S"-1 = {х G Mn: \х\ = 1}.
О"(ж) == {?/ 6 : — у\ < е} — шар радиуса г размерности п с центром в точке х.
* — операция транспонирования.
col(ai, «2,..., oin) — вектор-столбец с координатами cvi, «2,. • •, oin-Если не оговорено другое, векторы-столбцы обозначаются латинскими буквами, векторы-строки — греческими (таким образом, запись означает скалярное произведение векторов (их).
End(IRn) — пространство линейных отображений в Ш.п с нормой \А\ = тах{|Аж|: \х\ ^ 1}.
Нот(Мт,М") — пространство линейных отображений из Rm в М" с естественной нормой.
int D — внутренность множества D относительно Ш.п. 8D — граница множества D. cl D — замыкание D в W1.
с(£, D) = зирж{^ж: х £ D} — опорная функция множества D. TqN — пространство, касательное к многообразию Л/* в точке q. Производной rfr(go) функции т : jV ^ 1 на многообразии J\f в точке qo € J\f вдоль направления, заданного вектором w Е ТдоЛГ, называется линейное отображение dr(go) : Tq0J\f М, определенное равенством
. dr(q(e)) dr(q0)w =
£=0
йе
где q(кe) — класс эквивалентности гладких кривых q: (—1,1)—» Л/", обладающих следующими свойствами:
q( 0) = до,
de
= w.
£—0
Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Интеграл Понтрягина и уравнение Гамильтона-Якоби в задачах оптимального синтеза2002 год, кандидат физико-математических наук Мельников, Николай Борисович
Нестационарная задача группового преследования2012 год, кандидат физико-математических наук Банников, Александр Сергеевич
Управление асимптотическими инвариантами линейных систем2004 год, доктор физико-математических наук Попова, Светлана Николаевна
Численный метод решения дифференциальных игр быстродействия с линией жизни2023 год, кандидат наук Мунц Наталья Владимировна
Методы решения некоторых классов задач оптимального управления и дифференциальных игр2005 год, кандидат физико-математических наук Камзолкин, Дмитрий Владимирович
Список литературы диссертационного исследования кандидат физико-математических наук Николаев, Сергей Федорович, 1998 год
Литература
1. Понтрягин Л. С. Оптимальные процессы регулирования // Успехи матем. наук. 1959. Т. 14, Вып. 1(85). С. 3-20.
2. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969, С. 384.
3. Гамкрелидзе Р. В. Теория оптимальных по быстродействию процессов в линейных системах // Изв. АН СССР. Сер. матем. 1958. Т. 22, № 4. С. 449-474.
4. Болтянский В. Г. Достаточные условия оптимальности и обоснование метода динамического программирования // Изв. АН СССР. Сер. матем. 3(1968), Т. 28, С. 481-514.
5. Черноусько Ф.Л., Шматков A.M. Оптимальное по быстродействию управление в одной системе третьего порядка. // Прикл. матем. и мех. 1997. Т. 61, Вып. 5. С. 723-731.
6. Киселев Ю.Н. Оптимальный синтез в гладкой линейной задаче быстродействия // Дифференциальные уравнения. 1990. Т. 26, № 2. С. 232-237.
7. Благодатских В.И. Линейная теория оптимального управления. М.: Наука, 1978.
8. Аввакумов С.П., Киселев Ю.П., Орлов М.В. Методы решения задач оптимального управления на основе принципа максимума Понтрягина // Тр. Матем. ин-та РАН. 1995. Т. 211. С. 3-31.
9. Тонкое Е.Л. Неосцилляция и число переключений в линейной системе, оптимальной по быстродействию // Дифференц. уравнения. 1973. Т. 9. № 12. С. 2180-2185.
10. Тонкое Е.Л. О множестве управляемости линейного уравнения // Дифференц. уравнения. 1983. Т. 19. № 2. С. 269-278.
11. Сатимов Е.Я., Азамов А. О числе переключений в линейных системах //Изв. АНУзССР. Сер. физ.-мат. наук. 1982. № 2. С. 20-23.
12. Тонкое Е.Л. Неосцилляция и структура множества управляемости линейного уравнения // Успехи матем. наук. 1983. Т. 38. Вып. 5 (233). С. 131.
13. Габасов Р., Кириллова Ф.М., Прищепова C.B. Синтез оптимальной по быстродействию дискретной системы // Автомат, и теле-мех., 1991, № 12, С. 92-99.
14. Габасов Р., Кириллова Ф.М., Костюкова О.И. Оптимизация линейной системы управления в режиме реального времени. // Техническая кибернетика, 1992, № 4, С. 3-19.
15. Тонкое Е.Л. К теории линейных управляемых систем // Дис. д.ф.-м.н., ИММ УНЦ АН СССР, Свердловск, 1983, С. 267.
16. Альбрехт Э.Г., Ермоленко Е.А. Синтез оптимального по быстродействию управления в линейных системах // Дифференц. уравнения. 1977. Т. 33, № 11. С. 1443-1450.
17. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985, С. 223.
18. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
19. Красовский H.H. Управление динамической системой. М.: Наука, 1985, С. 518.
20. Субботина H.H. Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифференц. уравнения, 1983. Т. 19. № 11. С. 1890-1896.
21. Николаев С.Ф., Тонкое Е.Л. Дифференцируемость функции быстродействия и позиционное управление линейной нестационарной системой // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1996, m 2(8), С. 47-68.
22. Николаев С.Ф. Функция быстродействия и позиционное управление // Тезисы докладов международгой математической конференции «Еругинские чтения-IV», Витебск, 20-22 мая 1997 г. — С. 77-78.
23. Николаев С.Ф. Численная оценка интервала докритичности // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1998. № 1(12). С.81-88.
24. Nickolayev S.F., Tonkov E.h. Differentiability of Speed Function and Positional Control of Linear Nonstationary System // Nonsmooth and discontin. probl. of contr. and optimiz. (NDPCO 98). June 1998: Proceedings of the Internat. Workshop, Chelyabinsk, 1998. P. 163165.
25. Николаев С.Ф., Тонкое E.JI. Позиционное управление нелинейной системой близкой к докритической // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1998, № 2(13), С. 3-26.
26. Левин А.Ю. Неосцилляция решений уравнения х
■..+pn(t)x = 0 // Успехи матем. наук. 1969. Т. 24, № 2(146), С. 4396.
27. Brunovski P. Regular synthesis and singular extremas // Lect. Contr. and Inform. Sei. 1980, V. 22, P. 280-284.
28. Brunovski P. Existence of regular synthesis for general control // J. Different. Equat., 1980, V. 38, № 3, P. 317-343.
29. Лейхтвейс К. Выпуклые множества. М., 1985.
30. Палис Ж., ди Мелу В. Геометрическая теория динамических систем. М., 1986.
31. Родионова А.Г., Тонкое Е.Л. О непрерывности функции быстродействия линейной системы в критическом случае // Изв. ВУЗов. Математика. 1993, № 5(372), С. 101-111.
32. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М., 1974.
33. Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи. М., 1973.
34. Красовский Н.Н. Теория управления движением. М., 1968. С. 475.
35. Chang A. An algebraic characterization of controllability // IEEE Trans. Automat. Control, 1965, Vol. 10, № 1.
36. Боднер В.А. Теория автоматического управления полетом. М., 1964.
37. Азбелев Н.В., Цалюк З.В. К вопросу о распределении нулей решений линейного дифференциального уравнения третьего порядка. // Математический сборник. 1960, Т. 51(93), № 4, С. 475-486.
38. Антонов И.Л. Случайные колебания. Свойства траекторий. М.: Изд-во механико-математич. факультета МГУ, 1993, С. 176.
39. Bressan Aldo, Motta Monica. On minimum time problems for a pendulum with variable length and a conjecture based on a law of Galilei // Atti. 1st. veneto sci., lett. ed arti. CI. sci. fis., mat. e.natur. 1993-1994(1995). 152, № 3. P. 305-314.
40. Брусин B.A. Глобальная стабилизация системы «обращенный маятник на тележке» при действии на маятник неизмеряемых возмущений // Изв. АН. Техн. кибернет. (Россия). 1993. № 3. С. 30-39.
41. Lawson J.D. Generalized Runge-Kutta processes for stable systems with large Lipschitz constants // SIAM Journal on Numerical Ana-lisys, 1967, V. 4, № 3.
42. Субботин А.И. Минимаксные решения уравнений с частными производными первого порядка // Успехи матем. наук, 1996. Т. 51. Вып. 2(308). С. 105-138.
43. Aubin J.-P. Mutational and Morphological Analysis. Tools for Shape Regulation and Optimization. 1998. 352 p.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.