Свойства функции быстродействия и позиционное управление линейной нестационарной системой тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Николаев, Сергей Федорович

  • Николаев, Сергей Федорович
  • кандидат физико-математических науккандидат физико-математических наук
  • 1998, Ижевск
  • Специальность ВАК РФ01.01.02
  • Количество страниц 119
Николаев, Сергей Федорович. Свойства функции быстродействия и позиционное управление линейной нестационарной системой: дис. кандидат физико-математических наук: 01.01.02 - Дифференциальные уравнения. Ижевск. 1998. 119 с.

Оглавление диссертации кандидат физико-математических наук Николаев, Сергей Федорович

Оглавление

Введение

Глава 1. Докритические системы

§ 1. Основные определения и вспомогательные утверждения

§2. Докритичность и неосцилляция

§ 3. Свойства функции ег(£)

§ 4. Численный алгоритм построения функции сг(^)

Глава 2. Структура множества управляемости докритических систем и вектор быстродействия

§ 5. Структура множества управляемости

§ 6. Структура расширенного множества управляемости

§ 8. Вектор быстродействия

Глава 3. Позиционное управление докритической системой

§ 9. Постановка задачи и пример П. Бруновского

§ 10. Позиционное управление докритической системой,

оптимальное в смысле быстродействия

§11. Уравнение Беллмана

§ 12. Позиционное управление нелинейной системой, близкой к докритической

Литература

Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Свойства функции быстродействия и позиционное управление линейной нестационарной системой»

Введение

Теория оптимального быстродействия, основу которой составляет принцип максимума JI.C. Понтрягина [1]—[4], предоставляет принципиальную возможность построения оптимальных процессов во многих прикладных задачах. Наиболее полно изучена задача быстродействия для линейных стационарных систем (см. [2]-[7] и библиографию в [8]), для которых в ряде случаев удается построить позиционное управление [2, гл. 1, § 5], [5]. Если же изучаемая система оказывается нестационарной, то для таких систем, как правило, строится программное управление [9]-[12]. Вопросы существования и построения позиционного управления достаточно изучены для автономных систем [13] (в том числе для автономных систем с возмущением [14]), тогда как для неавтономных систем эти вопросы изучены достаточно мало [15, гл. 5, § 20], [16].

Рассмотрим задачу быстродействия для управляемой нестационарной системы

x = v(t,x,u), (t,x)eR1+n, и Elf, (0.1)

где U — компакт вГ, 0 £ U и v(t, 0,0) = 0. Пусть D = Rx D(t) — некоторая фиксированная область в пространстве М1+п, 0 £ intD(i).

Определение 0.1. Функцию u(t,x), определенную в области D и принимающую значения в U будем называть устойчивым к внешним возмущениям позиционным управлением, оптимальным в смысле быстродействия, если выполнены следующие четыре условия.

1. Для всякой точки (¿о, xq) £ © решение x(t;to,XQ) (понимаемое в смысле А.Ф. Филиппова [17, с. 40]) замкнутой системы

х — v(t, х, u(t, х)) определено и единственно при всех t ^ tq.

= 0.

2. Найдется такой момент времени что

x(t;tQ,x0)

3. Программное управление

u(t;to,xo) =u(t,x(t;to,xo)) является оптимальным для задачи быстродействия

$(«(•)) —>■ min, x = v(t,x,u), и G U, (0.2)

x(t0) = х0, x(t 0 + #)=0.

Время быстродействия для задачи (0.2) обозначим rn(to,xo).

4. Для всякого е > 0 найдется такое $ > 0, что каждой функции w(t,x) G О£(0), (t,x) G D, и любому rj > 0 отвечает функция w^t^x) G 0™(w(t,x)), (t,x) G 2), для которой любое решение xv(t;tQ,xo) (в смысле А.Ф. Филиппова) системы

X = v(t, X,u(t, х)) + Wq(t, х), (t,x)eD, (to,Xo) G 5), (0.3)

удовлетворяет равенству x^t; to, xo) |i=i = 0 при некотором -д^ = ^r,(to,xo) > 0, причём |^(i0,£o) - Tn(t0,x0)\ < e.

Последнее условие обычно не включается в определение позиционного управления, оптимального в смысле быстродействия, но это условие является важным с точки зрения приложений, поскольку обеспечивает непрерывную зависимость времени быстродействия от возмущений основной системы (0.1). Это условие близко к требованию универсальности стратегии в теории дифференциальных игр, которое впервые введенно H.H. Красовским [18] и подробно изучалось в работах H.H. Красовского и его учеников [19], [20].

Замечание 0.1. Поскольку всюду в этой работе рассматривается лишь устойчивое к внешним возмущениям позиционное управление, оптимальное в смысле быстродействия, то для краткости это управление будет называться позиционным управлением, оптимальным в смысле быстродействия или просто позиционным управлением.

Замечание 0.2. Для некоторых систем функция го(£,ж) может быть «большой». Как следует из сформулированной ниже теоремы 0.10, для класса систем, рассматриваемых в данной работе, эта функция должна удовлетворять лишь «односторонним» ограничениям. Так, для скалярного уравнения

х = и + IV(х), |и| ^ 1

управление

( 1, х<0

ЩХ) = <

[-1, я>0

является позиционным управлением, оптимальным в смысле быстродействия, если, например, и)(х) = —ж3 +втж.

Замечание 0.3. Предположим, что для нестационарной возмущенной системы вида (0.3) существует позиционное управление и(Ь,х), оптимальное в смысле быстродействия. Сложность синтеза такого, управления заключается в следующем. Для построения поверхностей переключения (которые обозначим Мп) необходимо решить при каждом фиксированном Ц задачу синтеза программного управления о5^о) Для £ ^(¿о)- Иными словами, для решения задачи синтеза необходима информация о состоянии системы в будущем, что не всегда возможно (например, в случае случайных возмущений «;(£,х)). Если же для позиционного управления я), оптимального в смысле быстродействия, основной (невозмущенной) системой и для возмущений этой системы выполнено четвертое условие определения 0.1, то, решив один раз задачу синтеза для основной системы, можно обеспечить (под действием полученного управления) ^-оптимальное поведение возмущенной системы.

В этой работе изучен класс линейных нестационарных систем вида

х = А(г)х + &(*)«, жеК", (0.4)

с одним входом, для которых существует позиционное управление, оптимальное в смысле быстродействия. Также изучается структура

множества управляемости и свойства функции быстродействия таких систем. Все результаты получены в предположении неосцилляции решений сопряженной системы

ф = -фА{г) (0.5)

относительно гиперплоскости, определяемой нормальным вектором &(£). Системы (0.4), для которых выполнено это условие, названы в [21] докритическими. Термин «докритичность» введен в 50-е годы Н.В. Азбелевым в работах, посвященных краевым задачам и дифференциальным неравенствам: так назывался максимальный интервал разрешимости фиксированного класса задач Валле-Пуссена. Оказалось, что вопрос о существовании оптимального в смысле быстродействия позиционного управления для системы (0.4) тесно связан с вопросом о разрешимости некоторого класса п-точечных задач.

Показано, что, независимо от гладкости А и 6, в любой окрестности нуля пространства (¿, ж)-переменных существуют (отличные от нуля) точки, в которых функция быстродействия теряет гладкость, но таких точек «достаточно мало». Более точно, в работе показано, что, в предположении докритичности, в расширенном фазовом пространстве (пространстве (¿, ж)-переменных) существует слабо инвариантное гладкое многообразие Мп размерности п, содержащее нуль и обладающее тем свойством, что в каждой точке (¿, х) £ Мп функция быстродействия не имеет производной. Далее, во всех точках (¿, х) множества £) = {(£,х) : ^ £ 1, тп^,х) < сг(£)} (ст(£) определяет интервал докритичности), не лежащих на многообразии Л/"", функция быстродействия имеет гладкость на единицу больше гладкости функции £ —> (А(£), &(£)), задающей систему (0.4).

Оказывается, что аналогичным образом функция быстродействия ведет себя на многообразии Л/'™: во всех точках многообразия ЛГ", за исключением точек, находящихся на некотором (слабо инвариантном) подмногообразии ЛЛ1-1 размерности п — 1, функция тп{Ь, х) непрерывно дифференцируема при (¿, х) Е И в направлении любого

вектора, лежащего в пространстве, касательном к Мп в точке х).

Многообразия Мк, к = 1 ,...,п, обладают тем свойством, что на них оптимальное в смысле быстродействия управление разрывно (управление переключается с +1 на — 1 или с —1 на +1), а конус допустимых векторов скоростей (который направляет оптимальное движение, если понимать такое движение в смысле определения А.Ф. Филиппова) касается одного из многообразий Мк (т. е. конус находится по одну сторону от касательного пространства и имеет с этим пространством общий вектор). Это обстоятельство позволяет корректно определить позиционное управление, оптимальное в смысле быстродействия. При этом позиционное управление достаточно задать только на многообразии М1+п максимальной размерности, так как движения (¿, ж(£)) (в смысле Филиппова) системы с разрывной по фазовым координатам правой частью не зависят от того, как определена правая часть на множествах, мера Лебега которых (в М1+п) равна нулю. Таким образом, наличие докритичности (факторизации Полиа-Маммана) влечет существование позиционного управления, оптимального в смысле быстродействия.

В работе описан класс таких допустимых возмущений основной докритической системы (0.4), что оптимальное в смысле быстродействия позиционное управление для основной системы доставляет в нуль каждое решение возмущенной системы (не обязательно за минимальное, но за конечное время), начинающееся в точках расширенного множества управляемости £).

Сконструированы и реализованы численные алгоритмы оценки интервала докритичности и моделирования многообразий Д^, к = 1,..., п — 1 и Мк, к = 1,..., п, приведены численные примеры и иллюстрации.

Результаты, представленные в диссертации, опубликованы в работах [21]—[25].

Ниже приведены формулировки основных результатов работы. Диссертация состоит из введения, трех глав, двенадцати параграфов

(нумерация параграфов сквозная), 31 рисунка и списка литературы. Объём диссертации 117 страниц.

В первом параграфе диссертации введены основные определения и понятия, используемые в работе.

Функцией быстродействия (t,x) —> rn(t,x) системы (0.4) называется функция, значение которой в каждой точке (¿о, ^о) определяется равенством

rn(tо, х0) = min {■& > 0 : x(t0 + £0, х0, «(•)) = 0},

и(-)еи

где U — совокупность измеримых функций со значениями в [—1,1], x{t\ ¿о, #0? и(')) — решение системы (0.4) при управлении и = u(t) и начальном условии х(¿о) = ^о- Если для некоторой точки (¿сь^о) не существует допустимого управления, переводящего решение в нуль за конечное время, то полагаем т„(£о,£о) = оо.

Множеством управляемости системы (0.4) на отрезке [¿о, ¿о + называется множество D$(to) = {х G rn(tQ,x) ^ Множеством управляемости системы (0.4) называется множество

D{tQ) = у Д,(*0).

Пусть ^i(i),... )ipn(t) — произвольная фундаментальная система решений сопряженной системы (0.5). Обозначим через <т(£о) точную верхнюю грань таких и > 0, что на полуинтервале [¿о,¿о + с) совокупность функций

6 M = Wt)b(t),... = ФпШг)

является чебышевской системой (Т-системой).

Определение 0.2. Система (0.4) называется докритиче-ской на интервале J, если для всех t £ J выполнено неравенство a(t) > 0.

Второй параграф посвящен исследованию условий докритичности системы (0.4). Доказаны следующие утверждения.

Теорема 0.1. Всякая система вида (0.4); приводимая невырожденным преобразованием = Ь(Ь)х (!/(£) непрерывно дифференцируема и йеЬЬ^) ф 0, I £ «/) к канонической системе

z = F(t)z + g(t)u,

докритична. Здесь

(fu(t) f12(t)

-т /22 w

F(t) = 0 -/ЗД

hn-\{t) hn{t)\

hn-\(t) hn(t)

/3,-1 W hn(t)

9(t) =

fm\

0 0

V о

\ о 0 ... -pn(t) fnn(t)J

причем функции fik(t), Pi(t) непрерывны и f3{(t) > 0 при всех t E J и i = 1,..., n.

Введем в рассмотрение следующие два условия. Условие 0.1. Для каждого % — 1,..., п + 1 функции t —>• qi(t), определенные равенствами

qi(f) = b(t),..., qi{t) = &_!(*) -

непрерывны, ограничены на некотором интервале J, и det Q(t) ф 0 при всех tej, где Q(t) = (qi(t),.. .,qn(t)).

Условие 0.2. Найдутся числа ..., vn_\ такие, что v\ ^ ^ ■ •• < i/n-i, и для корней Ai(i),..., Лn(t) уравнения det(AQ(t) — H(t)) = 0, где H(t) = (q2(t),..., qn+i(t)), при всех t выполнены неравенства

Ai(t) < i/i ^ X2(t) < ■ • • < i/„-i < An(t).

(0.6)

Теорема 0.2. Условие 0.1 достаточно (а в случае аналитичности функции £ —> (А(£),Ь(£)); задающей систему (0.4) гд необходимо) для докритичности системы (0.4) на интервале 3.

Формулируемая ниже теорема существенно использует результат работы [26].

Теорема 0.3. Если выполнены условие 0.1 на всей числовой оси и условие 0.2, то cr(t) = оо для всех t G M. Далее, если найдутся такие константы е > 0 и 6 ^ 0; что дополнительно к (0.6) при всех достаточно больших t выполнены неравенства 8 ^ Ai [t), 1/г_i + £ ^ Аг'(i) ^ Vi — е, % — 2,..., п — 1, то при всех t G Ш множество управляемости D(t) системы (0.4) совпадает с ]Rn.

В третьем параграфе исследованы некоторые свойства функции ¿о —> с (¿о) ? введено понятие минимальной линейной комбинации функций £i(£),..., £n(t) (см- СТР- 37) и приведены численные примеры, иллюстрирующие различные варианты поведения функции t0 o-(io).

В четвертом параграфе диссертации сформулированы два алгоритма численной оценки функции cr(i). Приведены некоторые результаты использования этих алгоритмов и иллюстрации.

Пятый параграф посвящен описанию структуры множества управляемости Dtf(to) докритической системы (0.4). В формулируемой ниже теореме показано, что в предположении докритичности граница множества управляемости есть объединение непересекающихся гладких многообразий N+(to,ê) и (гладкость на единицу выше гладкости функции t (A(t),b(t))), размерность к которых понижается с п — 1 до нуля, причём объединение многообразий, размерность которых повышается от нуля до к — 1, является общим краем замыкания объединения многообразий, размерность которых понижается с п — 1 до к. Многообразия определены следующим образом: iV* (i0,состоит из всех таких точек xq G для каждой из которых найдётся такая точка t(£q, ^o) G Mk('â), где

M\û) = {0},

MV) ={t = (r„_i) G M: 0 < rn_i < tf},

M\ê) = {t = (rn_k,..., r„_i) G^:0<r„4<-< < tf}, к = 1,... ,n — 1, что оптимальное управление жо), ¿о ^ t ^ ¿0 +

переводит точку x(to) = xq в точку x(tQ-\-$) = 0, имеет переключения только в моменты времени t = to + Ti(io,#o) и до первого момента переключения u(t,xо) = +1 (для многообразия Nt^o,^) до первого момента переключения u{t,xо) = —1).

Пусть функция t —> (A(t),b(t)), задающая систему (0.4), является функцией класса Сг.

Теорема 0.4. Пусть система (0.4) докритическая на М. Тогда для каждого $ ^ о"(£о) множество управляемости является строго выпуклым телом в R" (m. е. int D^(to) ф 0 и для любых x,xq Е dD$(to) и любого А Е (0,1) точка Хх + (1 — Л)^о Е int D#(to)). Граница dD$(to) множества D^(to) есть объединение непересекающихся гладких (класса Cr+1) многообразий и Nt_(to,$), к = 0,1,... , п — I, и объединение

/к—1 \ /к—1

U Jivi(to^)

\t=0 / \г=0

является общим краем многообразий cl iV*(io, г?) и cl Ntfo, Далее, всякой точке xq Е iV*(£o,$) отвечает единственное управление, переводящее точку х(tg) = Xq в точку x(to + $) — 0; причем программное управление u(t;to,xo) имеет ровно к переключений на интервале

В шестом параграфе диссертации доказана теорема о представимости расширенного множества управляемости 0 = Мх Ат(г) (0 в виде замыкания объединения слабо инвариантных многообразий и

9tL+n (которые, в свою очередь, являются объединениями слабо инвариантных гладких многообразий А±, размерность к которых понижается от n + 1 до единицы, причём многообразие размерности к служит краем замыкания многообразия размерности к + 1), описаны свойства этих многообразий, приведены примеры и иллюстрации.

Для каждого к = 0,1,... ,п и любого i € 1 определим многообра-

зия Mk(t), где M\t) = {0},

M\t) = {т = (rn_jfe+i,..., r„) : 0 < Tn^k+i <■ <тп< <r(i)}

и многообразия М1+к = R x Mk(t). Всякой точке (£,r) G М1+к поставим в соответствие точку (t,x), где х = 0 при к = 0, а при & ^ 1

п-1 ^^

ж = х(р) = - (-1 У'п+к J x(t, s)b(s) ds, = 0.

i=n~k t+n

Таким образом, для каждого к = 0,..., п задана функция (£, г) —>• F(i,r) = (t,x) с областью определения М.1л~к и областью значений = F(M1+k) (аналогично Л/2+* = -F(A41+*). Кроме того, в силу построения имеет место представление Л/2+А = M х Л/*± (i).

Теорема 0.5. Пусть система (0.4) докритическая. Тогда расширенное множество управляемости D = М. х (0 представимо в виде D = cl U ; где

K\+k = Я1+к U Як (J Як+'1 U • • ■ и ЛГ\

vt+k = лл^ил^у^и-.-ил^1,

к — 0,..., п. Многообразия слабо инвариантны, и для ка-

ждого к = 0,... , п, многообразие <У1к+ [J Vit является общим краем многообразий сШ^ и cl -

В седьмом параграфе сформулированы два алгоритма численного моделирования границы множества управляемости и алгоритм численного моделирования границы расширенного множества управляемости. Приведены численные примеры и иллюстрации. Восьмой параграф. Обозначим вектор

т

(t,x) = (п(£,ж),... ,г„(£,ж)), (0.7)

где £ + гг(£,ж) — моменты переключения программного управления, оптимального в смысле быстродействия для задачи управления в нуль системой (0.4).

В следующей теореме показано, что для каждого г = 1,..., п, число гг(£о,^о) является временем быстродействия в задаче о переводе точки £о £ А/*" (¿о) на многообразие ЛЛ^г(£о +

0(м(-))-> тт, и(-)еЫ, (0.8)

ж = А(£)ж + £0 < ^ < ¿о + (0.9)

х(*о) = + #) е + (°-10)

где вместо у{г) надо поставить знак «плюс», если г — четное и знак «минус», если г — нечетное число. Поэтому вектор (0.7) естественно называть вектором быстродействия.

Теорема 0.6. Пусть система (0.4) докритическая. Обозначим (и°(-),ж°(-)) — оптимальный процесс задачи (0.8)—(0.10) при некотором фиксированном % £ {1 Тогда = тг-(£о5^о) и на

интервале (¿о,¿о + т^о, ^о)) оптимальное управление и°(£) и отвечающее ему оптимальное решение ж°(£) системы (0.9) совпадают с оптимальными управлением и решением задачи быстродействия в нуль (т. е. задачи (0.8)-(0.10) при г = п).

Производной ¿т(д0) функции т : Л/* —>• М. на многообразии Я в точке до £ N вдоль направления, заданного вектором ш Е Т^ЛГ, называется линейное отображение ¿г(до) : —»• М, определенное

равенством

е=о'

¿е

где д(г) — класс эквивалентности гладких кривых д: (—1,1)—» Л/, обладающих следующими свойствами:

М£)

9(0) = 90,

= ги.

е=0

Аналогично определяется производная сРг, 5^2:

¿•гЫ^.....=

¿г6

е=0

где д: (—1,1) —>■ Л/" — класс эквивалентности гладких кривых вида

/ ч £2,Ш2 / 54

Я{е) = Яо + еи>1 + + • ■ • + + о(е ).

Функция д -> т(д) является функцией класса С5 на многообразии ЛГ, если для всякой С5-кривой д: (—1,1) —> Л/* функция £ —> т(д(е)) является функцией класса С5.

Теорема 0.7. Пусть система (0.4) докритическая, и функции А : М. —> Еп<1(К.п); Ъ : Е —>■ Мп принадлежат классу Сг. Тогда для каждого к = 0,..., п функции г,-: ЛГ++к и —> М, г = 1, •.., п,

принадлежат классу Сг+1 на многообразиях У Л/!"1"*. В част-

ности, Т[ непрерывно дифференцируемы г + 1 раз на Л/*++п У Л/"1+п.

В девятом параграфе работы сформулирована проблема построения позиционного управления ж) (управления по принципу обратной связи) в задаче быстродействия для динамической системы, поведение которой описывается уравнением (0.1). Приведен пример линейной по фазовым координатам и управлению стационарной системы на плоскости (построенный впервые П. Бруновским [27], [28]), у которой отсутствует внутренняя устойчивость по отношению к изменениям на множестве нулевой меры. Также сформулирована проблема построения позиционного управления в нуль (не обязательно за минимальное, но за конечное время) семейства УУ уравнений «близких» к основному уравнению (0.4).

В десятом параграфе доказано существование позиционного управления для докритической системы (0.4) и построено такое управление. Суперпозиционно измеримую функцию ис : ® II будем называть оптимальным в смысле быстродействия позиционным С-управлением (сокращенно оптимальным С-управлением), если для любой точки (¿о?^о) £ С-решение (решение в смысле Карате-

одори) задачи

х = А(Ь)х + Ь(£)и, х^о) = хо, (0-11)

при и = uc(t,x), существует на полуоси [¿о,оо), единственно, обращается в нуль в точке t = ¿о + rn(to,xo) и %(t',to,xo) = 0 для

t > tQ + Tn(to,Xo).

Аналогично определяется оптимальное в смысле быстродействия позиционное Т-управление (сокращенно оптимальное ^-управление). В этом случае функция (t,x) —> uyr(t,x) должна быть определена для почти всех (в смысле меры Лебега в точек (t, х) G int D

и обеспечивать следующее свойство: каждому (îq,£o) £ int 2) отвечает единственное jF-решение (решение в смысле А.Ф. Филиппова) x(t;tQ,xo) задачи (0.11) с управлением и = ujr{t,x) и x(t;to,£o) = 0 для t ^ ¿о + Tn(t0,X0).

Теорема 0.8. Функция

1, если (t, х) G Nl+h при некотором k G {1,..., п} uc(t,x) = < 0, если к = 0

[ — 1, если (t, х) G М]_+к при некотором k G {1,... , п}

доставляет оптимальное С-управление, а функция u?(t,x) =

1, если (t,х) G

— 1, если (t,x) G

— оптимальное J7-управление для докритической системы (0.4).

В одиннадцатом параграфе диссертации доказана теорема о том, что координаты тг-(£о, xq), г Е {1,..., п} вектора быстродействия являются решениями соответствующих уравнений Беллмана.

Теорема 0.9. Пусть система (0.4) докритическая, и функции А : М. —> End(M"); Ъ : К. —¥ М" принадлежат классу Сг. Тогда каждая координата гг-(£, ж), г = 1,..., п, вектора быстродействия:

(a) непрерывна в int ;

(b) непрерывно дифференцируема г + 1 раз в Л/'1+п;

(c) является функцией класса Cr+1 на многообразиях J\fl+k, k G {1,..., п — 1};

(d) является решением задачи

dO{t,x)h(t,x) = -1, 9{t,x)

(t,x)

где d6{t,x)h(t,x) — производная функции 9{t,x) на многообразиях Ml+k, k = 1 + n — i,... , n, в точке (£, ж) вдоль направления, заданного вектором h(t, х) = (1 ,A(t)x + x)b{t)),

1, если

z/(£, ж) = 0, если (t,x) eAf1,

-1, если (t,x) eAf2[J---ljAfl+n;

(е) б частности, при (£, ж) Е функция т,(£, ж) удовлетворяет

уравнению

а при (i, х) Е ЛЛ"1"™ — уравнению

Двенадцатый параграф работы посвящен описанию класса таких допустимых возмущений основной докритической системы (0.4), что оптимальное в смысле быстродействия позиционное управление u(t,x) для основной системы переводит в нуль каждое решение возмущенной системы (не обязательно за минимальное, но за конечное время), начинающееся в точках расширенного множества управляемости £).

Рассмотрим систему уравнений

х

= A(t)x + b(t)u + w(t,x), (£,ж)ее1+", 1, (0.12)

где функции А : К. -» End(En), Ъ : К. —Е71 непрерывны, функция т : Е1+п —у Е" удовлетворяет условиям Каратеодори, = 0, и

существует такое г > 0, что для линейной системы (0.4) при всех £ Е Е выполнено неравенство сг(£) ^ г.

Обозначим

Ог = 1х{а;6 Е": |ж| < г},

Э = I х — расширенное множество управляемости систе-

мы (0.4). Построим многозначные функции

{ и{Ь,х), если и.х) G Я1+п, и{г,х) = { v

Ц-1,+1], если (¿,ж)е9Г,

и х) = А(£)х + &(£)£/(£, х) + и>(£, х). Тогда решения задачи

х е ж), ж (¿о) = хо, (¿0,х0)еЮ, называются решениями (в смысле А.Ф. Филиппова [17]) задачи

х = А^)х + х) + «;(£, х), х(^) = хо-

Здесь ЛГ1+п = ЛГ|+П У АЛ+Г

-п и

, 1, если (t.x) G Л/1+п

Ш,ж) = 4 1,7 + (0-13)

-1, если (t,x) G Обозначим 0£(УГ) = {q G 2): p0(q,mn) < е}.

Теорема 0.10. Пусть существует открытое множество Х>о такое, что Ог С Эо С £) и при некотором а > 0 выполнено неравенство

drn(t,x) sup —^--w(t,x) < 1 — а.

(t,x)es) o\vin vx

Тогда для всякого г) > 0 найдется непрерывная функция wv{t,x), (i, ж) G Do, такая, что:

1) wv(t,x) = w(t,x) при (t, ж) G Эо\0^(Щп);

2) -ги(£,ж)| < г) при (t,x) G O^pt™);

управление u(t,x), определенное равенством (0.13), служит позиционным управлением для системы

х = A(t)x+ b(t)u + Wr,(t,x) (0.14)

в области ©О; т.е. для любой точки (£о?жо) £ найдется момент времени $^(¿0,^0) < оо такой, что любое решение ^(¿¡¿о^о) системы (0.14) существует и ж^о+^^о? ¿о5 хо) — 0- Далее, для всякого £ > 0 найдется 8 > 0 такое, что если |ги(£, ж)| ^ с) при (£,ж) £ £>о, то |гп(£, ж) — ж)| ^ е.

На протяжении всей работы в качестве модельной рассматривается задача об остановке маятника с подвижной точкой подвеса, для которого уравнение движения имеет следующий вид

В работе построено позиционное управление, оптимальное в смысле быстродействия, для маятника, на который не действуют неучтённые внешние возмущения и показано, что если маятник возмущается неизвестными малыми случайными колебаниями, то выбранное позиционное управление по прежнему успокаивает маятник за конечное время.

Работа поддержана Российским фондом фундаментальных исследований (грант 97-01-00413), Конкурсным центром фундаментального естествознания (грант 97-0-1.9), Конкурсным центром Удмуртского госуниверситета (грант 97-04).

Список основных обозначений

/у» % ryt Ои lAJ •

В работе используются следующие обозначения: М" — евклидово пространство размерности п с нормой |ж| S"-1 = {х G Mn: \х\ = 1}.

О"(ж) == {?/ 6 : — у\ < е} — шар радиуса г размерности п с центром в точке х.

* — операция транспонирования.

col(ai, «2,..., oin) — вектор-столбец с координатами cvi, «2,. • •, oin-Если не оговорено другое, векторы-столбцы обозначаются латинскими буквами, векторы-строки — греческими (таким образом, запись означает скалярное произведение векторов (их).

End(IRn) — пространство линейных отображений в Ш.п с нормой \А\ = тах{|Аж|: \х\ ^ 1}.

Нот(Мт,М") — пространство линейных отображений из Rm в М" с естественной нормой.

int D — внутренность множества D относительно Ш.п. 8D — граница множества D. cl D — замыкание D в W1.

с(£, D) = зирж{^ж: х £ D} — опорная функция множества D. TqN — пространство, касательное к многообразию Л/* в точке q. Производной rfr(go) функции т : jV ^ 1 на многообразии J\f в точке qo € J\f вдоль направления, заданного вектором w Е ТдоЛГ, называется линейное отображение dr(go) : Tq0J\f М, определенное равенством

. dr(q(e)) dr(q0)w =

£=0

йе

где q(кe) — класс эквивалентности гладких кривых q: (—1,1)—» Л/", обладающих следующими свойствами:

q( 0) = до,

de

= w.

£—0

Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Список литературы диссертационного исследования кандидат физико-математических наук Николаев, Сергей Федорович, 1998 год

Литература

1. Понтрягин Л. С. Оптимальные процессы регулирования // Успехи матем. наук. 1959. Т. 14, Вып. 1(85). С. 3-20.

2. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука, 1969, С. 384.

3. Гамкрелидзе Р. В. Теория оптимальных по быстродействию процессов в линейных системах // Изв. АН СССР. Сер. матем. 1958. Т. 22, № 4. С. 449-474.

4. Болтянский В. Г. Достаточные условия оптимальности и обоснование метода динамического программирования // Изв. АН СССР. Сер. матем. 3(1968), Т. 28, С. 481-514.

5. Черноусько Ф.Л., Шматков A.M. Оптимальное по быстродействию управление в одной системе третьего порядка. // Прикл. матем. и мех. 1997. Т. 61, Вып. 5. С. 723-731.

6. Киселев Ю.Н. Оптимальный синтез в гладкой линейной задаче быстродействия // Дифференциальные уравнения. 1990. Т. 26, № 2. С. 232-237.

7. Благодатских В.И. Линейная теория оптимального управления. М.: Наука, 1978.

8. Аввакумов С.П., Киселев Ю.П., Орлов М.В. Методы решения задач оптимального управления на основе принципа максимума Понтрягина // Тр. Матем. ин-та РАН. 1995. Т. 211. С. 3-31.

9. Тонкое Е.Л. Неосцилляция и число переключений в линейной системе, оптимальной по быстродействию // Дифференц. уравнения. 1973. Т. 9. № 12. С. 2180-2185.

10. Тонкое Е.Л. О множестве управляемости линейного уравнения // Дифференц. уравнения. 1983. Т. 19. № 2. С. 269-278.

11. Сатимов Е.Я., Азамов А. О числе переключений в линейных системах //Изв. АНУзССР. Сер. физ.-мат. наук. 1982. № 2. С. 20-23.

12. Тонкое Е.Л. Неосцилляция и структура множества управляемости линейного уравнения // Успехи матем. наук. 1983. Т. 38. Вып. 5 (233). С. 131.

13. Габасов Р., Кириллова Ф.М., Прищепова C.B. Синтез оптимальной по быстродействию дискретной системы // Автомат, и теле-мех., 1991, № 12, С. 92-99.

14. Габасов Р., Кириллова Ф.М., Костюкова О.И. Оптимизация линейной системы управления в режиме реального времени. // Техническая кибернетика, 1992, № 4, С. 3-19.

15. Тонкое Е.Л. К теории линейных управляемых систем // Дис. д.ф.-м.н., ИММ УНЦ АН СССР, Свердловск, 1983, С. 267.

16. Альбрехт Э.Г., Ермоленко Е.А. Синтез оптимального по быстродействию управления в линейных системах // Дифференц. уравнения. 1977. Т. 33, № 11. С. 1443-1450.

17. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985, С. 223.

18. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

19. Красовский H.H. Управление динамической системой. М.: Наука, 1985, С. 518.

20. Субботина H.H. Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифференц. уравнения, 1983. Т. 19. № 11. С. 1890-1896.

21. Николаев С.Ф., Тонкое Е.Л. Дифференцируемость функции быстродействия и позиционное управление линейной нестационарной системой // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1996, m 2(8), С. 47-68.

22. Николаев С.Ф. Функция быстродействия и позиционное управление // Тезисы докладов международгой математической конференции «Еругинские чтения-IV», Витебск, 20-22 мая 1997 г. — С. 77-78.

23. Николаев С.Ф. Численная оценка интервала докритичности // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1998. № 1(12). С.81-88.

24. Nickolayev S.F., Tonkov E.h. Differentiability of Speed Function and Positional Control of Linear Nonstationary System // Nonsmooth and discontin. probl. of contr. and optimiz. (NDPCO 98). June 1998: Proceedings of the Internat. Workshop, Chelyabinsk, 1998. P. 163165.

25. Николаев С.Ф., Тонкое E.JI. Позиционное управление нелинейной системой близкой к докритической // Изв. Ин-та матем. и информ. УдГУ. Ижевск, 1998, № 2(13), С. 3-26.

26. Левин А.Ю. Неосцилляция решений уравнения х

■..+pn(t)x = 0 // Успехи матем. наук. 1969. Т. 24, № 2(146), С. 4396.

27. Brunovski P. Regular synthesis and singular extremas // Lect. Contr. and Inform. Sei. 1980, V. 22, P. 280-284.

28. Brunovski P. Existence of regular synthesis for general control // J. Different. Equat., 1980, V. 38, № 3, P. 317-343.

29. Лейхтвейс К. Выпуклые множества. М., 1985.

30. Палис Ж., ди Мелу В. Геометрическая теория динамических систем. М., 1986.

31. Родионова А.Г., Тонкое Е.Л. О непрерывности функции быстродействия линейной системы в критическом случае // Изв. ВУЗов. Математика. 1993, № 5(372), С. 101-111.

32. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М., 1974.

33. Крейн М.Г., Нудельман А.А. Проблема моментов Маркова и экстремальные задачи. М., 1973.

34. Красовский Н.Н. Теория управления движением. М., 1968. С. 475.

35. Chang A. An algebraic characterization of controllability // IEEE Trans. Automat. Control, 1965, Vol. 10, № 1.

36. Боднер В.А. Теория автоматического управления полетом. М., 1964.

37. Азбелев Н.В., Цалюк З.В. К вопросу о распределении нулей решений линейного дифференциального уравнения третьего порядка. // Математический сборник. 1960, Т. 51(93), № 4, С. 475-486.

38. Антонов И.Л. Случайные колебания. Свойства траекторий. М.: Изд-во механико-математич. факультета МГУ, 1993, С. 176.

39. Bressan Aldo, Motta Monica. On minimum time problems for a pendulum with variable length and a conjecture based on a law of Galilei // Atti. 1st. veneto sci., lett. ed arti. CI. sci. fis., mat. e.natur. 1993-1994(1995). 152, № 3. P. 305-314.

40. Брусин B.A. Глобальная стабилизация системы «обращенный маятник на тележке» при действии на маятник неизмеряемых возмущений // Изв. АН. Техн. кибернет. (Россия). 1993. № 3. С. 30-39.

41. Lawson J.D. Generalized Runge-Kutta processes for stable systems with large Lipschitz constants // SIAM Journal on Numerical Ana-lisys, 1967, V. 4, № 3.

42. Субботин А.И. Минимаксные решения уравнений с частными производными первого порядка // Успехи матем. наук, 1996. Т. 51. Вып. 2(308). С. 105-138.

43. Aubin J.-P. Mutational and Morphological Analysis. Tools for Shape Regulation and Optimization. 1998. 352 p.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.