Оптимальное управление логико-динамическими системами тема диссертации и автореферата по ВАК РФ 05.13.01, доктор физико-математических наук Бортаковский, Александр Сергеевич
- Специальность ВАК РФ05.13.01
- Количество страниц 169
Оглавление диссертации доктор физико-математических наук Бортаковский, Александр Сергеевич
Введение.
1. Необходимые условия оптимальности ЛДС.
1.1. Постановка задачи
1.2. Необходимые условия оптимальности.
1.3. Примеры применения необходимых условий.
1.4. Активная стабилизация спутника с учетом неэффективных затрат топлива.
1.5. Необходимые условия оптимальности ЛДС при мгновенных многократных переключениях автоматной части.
1.6. Выводы.
2. Достаточные условия оптимальности ЛДС.
2.1. Постановки задач.
2.2. Достаточные условия оптимальности.
2.3. Примеры применения достаточных условий
2.4. Достаточные условия оптимальности ЛДС при мгновенных многократных переключениях автоматной части.
2.5. Синтез оптимального управления линейными ЛДС с квадратичным критерием качества.
2.6. Выводы.
3. Оптимальное и субоптимальное управления пучками траекторий ЛДС.
3.1. Постановки задач.
3.2. Достаточные условия субоптимальности.
3.3. Достаточные условия оптимальности управления пучками траекторий линейных ЛДС с квадратичным критерием качества.
3.4. Выводы.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Приближенный синтез логико-динамических систем на основе необходимых и достаточных условий оптимальности2012 год, кандидат физико-математических наук Пегачкова, Елена Александровна
Достаточные условия оптимальности управления дискретными системами автоматного типа2014 год, кандидат наук Коновалова, Анна Александровна
Оптимизация переключений непрерывно-дискретных управляемых процессов2022 год, кандидат наук Урюпин Илья Вадимович
Моделирование и синтез субоптимальных переключаемых систем при наличии дискретных неточных измерений2019 год, кандидат наук Немыченков Григорий Игоревич
Алгоритмическое обеспечение численного моделирования линейных процессов оптимального управления2001 год, доктор физико-математических наук Александров, Владимир Михайлович
Введение диссертации (часть автореферата) на тему «Оптимальное управление логико-динамическими системами»
Стремительное развитие математической теории оптимального управления началось с монографии [103]. Сейчас трудно даже оценить количество теоретических работ в этой области, хотя некоторое представление о современном состоянии математической теории дают материалы Международной конференции, посвященной 100-летию со дня рождения Л.С.Понтрягина (Москва, 2008). Приложения этой теории в технике, экономике и других областях невозможно перечислить. Только в области авиации и космонавтики Московский авиационный институт ежегодно проводит несколько конференций, включающих указанную тематику. Поэтому необходимо уточнить предмет исследования настоящей работы.
В монографии [103] была поставлена задача оптимального управления непрерывными системами, которые описываются обыкновенными дифференциальными уравнениями (дифференциальными включениями), и получен основной классический результат этой теории -принцип максимума Понтрягина. Наряду с непрерывными системами аналогичные задачи были сформулированы и решены для дискретных систем управления [14,104], движение которых описывается рекуррентными (разностными) уравнениями. Затем появились работы [37,56,126], в которых поведение объекта управления описывалось как непрерывными, так и дискретными переменными. Например, в непрерывно-дискретных системах (НДС) изменение состояния непрерывной части происходит непрерывно, согласно дифференциальным уравнениям, а изменение состояния дискретной части происходит дискретно, согласно рекуррентным (разностным) уравнениям. В дискретно-непрерывных или импульсных системах [60,63,78,89,131,148,149] вектор состояния изменяется либо непрерывно, в соответствии с дифференциальным уравнением, либо дискретным образом, совершая скачки, описываемые разностными уравнениями [14,67,95,104,131].
Наличие в одной системе управления процессов с разными характеристиками, которые реализуются непрерывными и дискретными сигналами, относит рассматриваемые системы к классу гибридных систем (hybrid systems). Следует признать, что в настоящее время термин "гибридные системы" перегружен [88]. Первоначально [140,145-147,151,153] модели таких систем включали непрерывные и дискретные (или логические) переменные (компоненты вектора состояния), причем непрерывные служили для описания, как правило, физических законов и принципов, а дискретные - для описания логических устройств, коммутаторов, цифровых автоматов и т.п. В настоящее время термин гибридные системы используется значительно шире, включая вопросы преобразования и обработки сигналов, хранения и передачи информации, а также вопросы формирования программного обеспечения.
К гибридным относятся логико-динамические системы (ЛДС), в которых дискретная часть описывается логическими переменными [62,111-115]. Логическая часть системы представляет собой автомат с памятью, управляющий динамической частью. Именно в таком узком смысле понимается рассматриваемая в диссертации модель логико-динамической системы. Многие работы, относящиеся к гибридным системам, посвящены разработке именно "логической составляющей" этого автомата: представление знаний, системы вывода теорем и т.п., вплоть до создания интеллектных компонентов системы управления (см. например, International Journal of Hybrid Intelligent Systems, материалы [152] Конгресса IF AC (Иркутск, 2003), а также [46]). Эти направления в диссертации не рассматриваются. Здесь термин "логическая часть" ЛДС используется примитивно, только в "автоматном" смысле, а именно: ЛДС - это динамическая система с автоматной частью (это название используют для классификации рассматриваемых систем акад. С.Н. Васильев, акад. А.Б. Куржанский). Причем переменные, описывающие состояние автоматной части будут необязательно булевы. Как правило, рассматриваются два случая: целочисленные переменные, либо переменные, принимающие действительные значения.
Для описания широкого класса дискретно-непрерывных систем используются динамические системы с импульсными управлениями [63,78,89,131]. Основой этого служат дифференциальные уравнения с мерами. Они задают универсальную форму описания траекторий как непрерывной, так и дискретной компонент системы. Наиболее полное отражение работ в этом направлении представлено в [89], где помимо необходимых и достаточных условий оптимальности рассмотрен также ряд других вопросов, например, существование решений и их устойчивости. Дискретная, импульсная составляющая ДНС описывает "сильные" воздействия на динамическую часть системы, приводящие к разрыву траектории движения. Напротив, логическая, автоматная часть ЛДС описывает работу бортового компьютера, управляющие сигналы которого оказывают "слабое" воздействие на динамическую часть, оставляя ее траекторию непрерывной. Траектории логической части — кусочно-постоянные. Конечно, для их описания можно применять дифференциальные уравнения с мерой. Однако это вряд ли целесообразно. Помимо усложнения математического аппарата для представления решений и вывода необходимых условия, из-за расширения класса управлений возникают проблемы существования и корректности решения оптимизационной задачи [89].
Важной составляющей гибридных систем являются переключательные системы switched systems), в частности, системы с переменной структурой [61]. В работах [132,149,
150] рассматриваются разные задачи стабилизации таких систем. Движение динамической части задается системой линейных дифференциальных уравнений, матрица коэффициентов которой зависит от дискретного параметра. Придавая различные значения этому параметру в 4 зависимости от текущего состояния объекта управления, получаем разные системы уравнений и, следовательно, разные траектории движения объекта. Статья [111], видимо, была первой работой, в которой рассматривалась задача оптимального управления переключательной системой. Объект управления описывается системой нелинейных дифференциальных уравнений, а логическая часть определяет ее правую часть, причем правая часть выбирается из некоторого конечного множества. Другими словами, автомат управляет движением объекта, выбирая ту или иную траекторию из конечного множества допустимых типовых траекторий. При этом оптимальная траектория составляется по кусочкам из набора типовых траекторий. Полученные в [111] достаточные условия оптимальности в диссертации уточняются и обобщаются. Однако, понимание логической части как модели автомата с памятью остается тем же самым [112—115]. В отличие от логико-динамической системы [111] движение системы с переменной структурой [67] описывается автоматом без памяти.
Разработанная автором математическая модель ЛДС применима для описания широкого круга многорежимных систем автоматического управления техническими комплексами, технологическими и экономическими процессами, а также бортовых оперативно-советующих систем управления движением летательных аппаратов [15,17-40,46,61,62,67,80,85,86,89,1-11115,119]. Поведение динамической части ЛДС описывается дифференциальными'уравнениями, а работа логической части, моделирующей автомат с памятью, — рекуррентными включениями или уравнениями или включениями. Логическая (автоматная) часть ЛДС характеризует операционную ситуацию, в которой происходит управляемое движение динамической части ЛДС, и может меняться дискретным образом в рамках одной операционной ситуации, либо изменять саму операционную ситуацию. В частности, такими соотношениями описывается движение летательных аппаратов, управляемых с помощью бортовых вычислительных комплексов [15,119]. Сформулируем кратко математическую постановку задачи [17] и приведем обзор методов, применяемых для ее решения.
Поведение модели объекта управления описывается соотношениями где х — вектор состояния динамической части системы, х е М"; у — вектор состояния логической (автоматной) части, у е Е"' (или у е Ът в зависимости от модели автомата); и — вектор управления, и е U с Шр; t - время, t е Т = [¿o^i] - промежуток времени функционирования системы. Для краткости изложения ограничения, накладываемые на уравнения (В.1),(В.2), а также некоторые дополнительные предположения во введении опускаются. Отметим только, что эти условия типичные для задач оптимального управления. В системе 5 x(t) = f{t,x{t),y(t\u(t)), y(t)eY{t,x{t\yit-0)),
B.l) (B.2)
В.1),(В.2): управление и(-) - измеримая ограниченная функция, траектория х(-) динамической части - абсолютно непрерывная, а траектория логической (автоматной) части - кусочно-постоянная, непрерывная справа функция, точки разрыва которой образуют конечное множество ¿Г тактовых моментов времени. Начальное состояние системы определяется условиями о) = *о> .У('о-0) = Л)- (В-3)
На траекториях системы задан функционал h
1= \f\t,x(t),y(t),u(t))dt+ Y, + (В.4) о теГ
Суммирование в выражении (В.4) производится по всем точкам xei разрыва функции у(-) это множество ¿Г конечное).
Требуется найти минимальное значение функционала (В.4) и оптимальный процесс d* = (х*(•), у*{•), "*(•)) > на котором это наименьшее значение достигается: = min/. (В.5)
Если оптимального процесса d* не существует, то ставится задача нахождения минимизирующей последовательности di = (*;(■)> >7 (•)»"/(')): lim I(di) = MI. (В.6)
-»СО
В задаче (В.1)-(В.5) логическая часть системы описывает работу автомата с памятью. Множество состояний автомата может быть неограниченно. Сигналы, протекающие в логической части системы, на самом деле, могут не иметь логической природы. Они необязательно описываются булевыми переменными. Поэтому логическую часть системы будем называть также автоматной частью (как в [46]), что точнее, а модель (В.1)-(В.2) - динамической системой с автоматной частью.
По сравнению с классической задачей оптимального управления непрерывными системами [103], здесь имеется дополнительное кусочно-постоянное управление >>(•), которое удовлетворяет рекуррентному включению. Если в правой части (В.2) отбросить зависимость от y(t — 0): y(t)eY(t,x(t)), (В.7) то получим обычное геометрическое ограничение на допустимые значения управления. Заметим, что включение (В.7) служит описанием автомата без памяти. Такая модель автомата соответствует системам управления с переменной структурой [61,62] и гибридным системам в работах [145-147,158].
Функционал (В.4) качества управления отличается от классического функционала Больца наличием суммы по точкам т разрыва функции у('). В частности, это могут быть
КаЧКИ ¿Г ° (т, Ф), у (у- 0), Я т)) = | у(х) - у(х - 0) | функции у(-). Эту величину можно рассматривать как "штраф" за переключение автоматной части. Если не учитывать эти штрафы, положив в (В.4) g0 = 0, получим обычный функционал качества [3,13,44,45,49,68,75,76,81,82,95,103].
Таким образом, задача (В.1)-(В.5) будет совпадать с классической задачей оптимального управления [103], если в (В.2) исключить зависимость от предшествующего состояния у(( - 0) логической части, т.е. использовать ограничение (В.7), соответствующее модели автомата без памяти, а в функционале (В.4) опустить сумму штрафов за переключение автоматной части.
Представляет интерес случай, когда в уравнении движения (В.1) отсутствует управление и(-): х(0 = /М0,Я0)- (В.8)
В этом случае управление динамической частью осуществляется исключительно выбором состояния >>(/) автоматной части. Заметим, что уже в [103] класс кусочно-постоянных управлений отмечался как вполне приемлемый. Действительно, задачу (В.6) поиска минимизирующей последовательности достаточно решать в классе кусочно-постоянных функций, поскольку любую измеримую функцию можно представить как предел последовательности кусочно-постоянных. Поэтому задача (В.8),(В.2)-(В.4),(В.6) также является обобщением классической задачи [103] из-за наличия рекуррентного ограничения на управление (если управлением считать у(-)), а также из-за учета в функционале штрафов за переключение управления.
Уравнение (В.8) в случае конечного множества состояний автоматной части: у(0 е {1,2,., /V} используется для описания переключательных систем. Поведение такой системы определяется выбором правой части уравнения движения. В задачах устойчивости и стабилизации, как правило, пространство состояний динамической части разбивается на n областей, в каждой из которых правая часть фиксирована. Во многих работах (например, в [147,150,158]) правая часть линейна, и поэтому каждой области фактически соответствует своя матрица коэффициентов системы уравнений. Применяются разные способы разбиения, отражающие техническую постановку задачи, например, при помощи линейных неравенств [158]. В [153] рассматриваются задачи робастного управления и стабилизации линейными переключательными системами.
Для описания автоматной части ЛДС вместо включения (В.2) можно использовать рекуррентное уравнение вида y(t) = g(t,x(0,y(t-0),v(t)), (В.9) где v - вектор управления автоматной частью, veFcl^. Штраф (t, x(t), y(t - 0), v(7)) в функционале (В.4) также зависит от управления v. Полагаем, что управление почти всюду равно нейтральному элементу ( v(/) = о ) и отлично от него только в точках разрыва функции у(-) (т.е. на ¿Г), при этом g(t,x,y,o) = у, g°(t,x,y,o) = 0. Модель (В.1), (В.9) эквивалентна модели (В.1),(В.2), а ее части становятся "симметричными": динамическая и логическая части имеют входные сигналы (управления и(-) и v(-) ) и выходные сигналы (траектории х(-) и у(-) ), которые действуют на соответствующие блоки. Функциональная схема такой системы изображена на рис.В.1: непрерывные сигналы изображены сплошными линиями (стрелками), дискретные - штриховыми, элемент "ключ" замкнут только в тактовые моменты времени теГ).
Заметим, что включение (В.2) определяет только возможные выходные сигналы автоматной части, не определяя самого автомата, а уравнение (В.9) кроме выходных сигналов фиксирует также и некоторую конструкцию автоматной части. На практике нужны обе модели в зависимости от наличия исходных данных об автоматной части.
Рис.В.1.
Постановка задачи (В.1),(В.9),(В.З)-(В.5) похожа на задачу оптимального управления непрерывно-дискретной системой [37]. Однако, в отличие от непрерывно-дискретных систем, изменение состояний дискретной части которых происходит в заранее заданные (тактовые) моменты времени, переключения логической (автоматной) части ЛДС может быть в произвольные моменты времени. Более того, выбор моментов, когда переключается автоматная часть, считается ресурсом управления и подлежит оптимизации. Если же в задаче управления ЛДС тактовые моменты зафиксировать, то получим задачу управления непрерывно-дискретной системой.
ЛДС можно рассматривать как дискретную [104] или многошаговую [55,56] систему, если в качестве дискретного времени взять номер переключения автоматной части (указано проф. М.М.Хрусталевым). При этом получается задача со свободным дискретным временем и подвижным (но не свободным) правым концом траектории, к которой известные необходимые условия [104] непосредственно неприменимы. Кроме того, в монографии [104] не рассматривается случай, когда множество допустимых значений управления конечное (как в переключательных системах) или является подмножеством Ът. Предлагаемый переход к многошаговой системе [55] скрывает движение динамической части, заменяя ее описание оператором. При этом достаточные условия теряют конструктивность.
Рассмотрим подробнее работы, наиболее близкие к диссертационной. Сначала приведем постановку задачи и результаты работы В.В. Семенова [111], который инициировал исследования автора диссертации в области ЛДС. Постановка задачи в [111] следующая:
1 х Дх, М) + g(x, и, t) % (?), а(0 = <р(*,и,0» я(0 = ВД0,<*('),v(0L X(i + Ai) = A(x(0,<y(0,v(i)], t\
J = G[x(tl),x(tl),tl]+ jFWT),u(x),x(T),v(T),T]^T->min, (B.10) o где 7t,a ,%,v — столбцы булевых переменных: % - внутреннее состояние конечного автомата, п - выход конечного автомата (определяет изменения правой части уравнения состояния динамической части), а - входной сигнал конечного автомата (полученный в результате преобразования в булевы значения непрерывных сигналов в динамической части), v -управление в логической части объекта; At — бесконечно малая положительная величина. Предполагается, что управления ы(-), v(-) принадлежат заданному классу допустимых управлений Q (все обозначения и предположения как в [111]).
С современной точки зрения задача (В. 10) является задачей управления переключательной системой, причем конечный автомат порождает конечный набор правых частей уравнения состояния динамической частью. В отличие от распространенного случая (В.8), в правых частях сохраняется управление и(-). Кроме того, в задаче (В. 10) учитывается преобразование вектора x(t) с действительными компонентами (выходной сигнал динамической части) в вектор а(/) с булевыми компонентами (входной сигнал логической части). Заметим, что 9 вопросам преобразования сигналов сейчас уделяется большое внимание [152]. В функционале (В. 10) по сравнению с (В.4) отсутствуют штрафы за переключения автоматной части. Для поставленной задачи в [111] получены достаточные условия в форме уравнения:
0 = , min \f(x,и,ъv,г) + [пТ0t)gT(x,u,t) +fT(х,и,t)]dЩх>+ П + w(0,v(0en[ дх
Af->0 j. + Afl 0 ЩХ} ^ 0 3 5(Д0 | (В.11) с граничным условием W(x,%(t +&t)j) = W(x,%,t) = G[x(t{),%{t{),ti]. Входящие в (В.11) дельта-функция, предельный переход, а также операция минимизации в функциональном пространстве Q, затрудняют понимание и препятствуют применению этого уравнения.
Более конструктивные достаточные условия в форме "уравнения Беллмана для гибридных систем" получены в [144]. Рассмотрим подробнее эти достаточные условия оптимальности, поскольку они довольно близки к предшествующей им работе [17] и последующим работам [25,27]. Постановка задачи в [144] следующая (все обозначения как в [144]):
0 = /9(о(*(0.и(0)> q(t) = v(x(t),q(t~),p.(t)), {f М
Axo,qo)= \lq(Xu)dt + Yu)>ч^к )> Ч(?к )) » (B.12) о где x(t) e JeR", u(t) e fiM c:- векторы состояния и управления в непрерывной части системы, q{t) е Q = {1,2,., N), p.(i) е Q^ - вектор состояния и входной сигнал в дискретной части системы (q(t~) ,q(t+) - пределы слева и справа соответственно). Пространство состояний X непрерывной части разбито на подмножества Sqr с!,в которых возможно переключение дискретной части из состояния q в состояние г. Функция s{-) > 0 определяет штраф за переключение автоматной части в момент времени tк = \,.,М. Начальное (*0>*7о) и конечное (xj-,q f) состояния заданы, а время /у свободно.
Уравнения для функции Беллмана имеют вид: dVJx)
0<—--fa(x,u) + L(x,n) Vxe X, и е QM, q^Q, дх 1 4
0<Vr(x)-Vq(x) + s(x,q,r) q,r<=Q:q*r,
0 = Vq/(xf)t (B.13) а оптимальное управление находится по формулам:
В. 14)
АО> Ч) = агё { (х) + },
В. 15) где у = у(х,д,ц).
По сравнению с [17] в задаче (В. 12) система стационарная, время не фиксировано, дискретная часть описывается уравнением, а не включением, множество состояний автоматной части конечно. Если не учитывать эти отличия, то соотношения (В.13)-(В.15) аналогичны полученным ранее условиям в [17], за исключением (В.15). Это условие определяет управление дискретной частью из условия минимума скачка функции Беллмана (приращения в фиксированный момент времени). В [17] для управления в автоматной части получено другое, более слабое достаточное условие. Оптимальное управление находится как минимум производной функции Беллмана (в силу системы) по тем управлениям, где скачок функции Беллмана минимален. В разд. 2 приводится пример 2.1, в котором "упрощенное" условие, аналогичное (В. 15), не позволяет однозначно получить оптимальное управление, а условие из [17]. определяет единственное оптимальное управление. Впрочем, эти довольно тонкие отличия проявляются, видимо, только в специальных примерах. Для большого круга задач, например, когда минимум в (В.15) единственный, условие в [17] можно заменить "упрощенным" соотношением (В. 15).
Вывод необходимых условий оптимальности для задачи (В.1)-(В.4) имеет некоторые отличия от обычно применяемых подходов [3,8,13,14,44,49,64,68,103,118]. Конечно, эти отличия касаются только вариаций траекторий у(-) автоматной части (для управления и(-) динамической части применяются обычные игольчатые вариации). Дело в том, что малые вариации траекторий автоматной части системы недопустимы для систем, в которых пространство состояний автоматной части несвязно. Например, если состояние автоматной части описывается вектором с логическими (булевыми) или целочисленными компонентами (уе%т), то малых вариаций таких векторов просто не может быть. К такому же выводу приходим в случае переключательных систем, "пространство состояний" автоматной части которых — конечное множество {1,2,., ./V} номеров типовых траекторий движения. Если же пространство состояний автоматной части связно (например, у е Кт ), то малые кусочно-постоянные вариации траекторий автоматной части оказываются допустимыми.
Игольчатые вариации траекторий автоматной части (т.е. конечные изменения состояний автоматной части системы на множестве малой меры) тоже не всегда допустимы. Эти вариации, как и в случае непрерывных систем, приводят к малым вариациям траектории динамической части системы. Однако, вариация функционала (В.4) оказывается конечной при наличии штрафов за переключения (т.е. при 0). Поэтому в общем случае в задаче (В.1)— (В.4) допустимы только вариации моментов переключения автоматной части, а также малые кусочно-постоянные вариации траекторий автоматной части в случае, когда у е К"7. При отсутствии штрафов (т.е. при g0 = 0) можно использовать игольчатые вариации траекторий автоматной части.
На рис.В.2 изображены допустимые вариации траектории логической части системы. Полужирными линиями обозначена оптимальная траектория У (0 > ' е Г, а светлыми - возмущенная траектория У(0 + 5у(0, (еТ. Вариации 8х^, 8x2 ДВУ* моментов переключения автоматной части указаны на рис.В.2,а, малые кусочно-постоянные вариации 3у(0, I еТ, изображены на рис.В.2,б.
У
8х2 «---->
8x1 1 1 1
5X0 о
1 ( б
X! Х| + 8х] т2 "с2+6т2 I а
Рис.В.2
Если пространство состояний логической части системы является дискретным (несвязным), например, когда компоненты вектора у являются целочисленными переменными у е Ът ), то малые кусочно-постоянные вариации 8X0 недопустимы. В этом случае остаются только вариации моментов переключения, которые приводят к слабым (неполным) необходимым условиям. Напомним, что принцип максимума представляет собой "полную систему соотношений" [103], позволяющих выделить из множества допустимых решений отдельные, вообще говоря, "изолированные" решения, удовлетворяющие всем сформулированным условиям. Применение только вариаций моментов переключения недостаточно для получения "полной системы соотношений". Как показывают примеры, выделяется множество подозрительных на оптимальность процессов, но это множество может быть бесконечным (например, счетным). Поиск оптимального процесса в этом множестве уже продолжается другими методами [47].
В результате применения указанных вариаций траекторий ЛДС в [28] выведены слабые необходимые условия оптимальности, которые в общем случае не позволяют однозначно найти оптимальный процесс, но ограничивают область поиска, отбрасывая часть неоптимальных процессов. В некоторых задачах оптимальный режим находится однозначно, аналогично применению принципа максимума для непрерывных систем.
При отсутствии штрафа (т.е. при = 0) необходимые условия для переключательных систем получены в работах [133,134], где для вычисления градиента функционала применяется вариация конечного числа моментов переключения. Заметим, что автоматная часть ЛДС представляет собой дискретную систему. Поэтому для нее принцип максимума, вообще говоря, не выполняется. Для динамической части (т.е. для оптимального управления и(-)) принцип максимума, разумеется, остается справедливым.
Большой интерес представляет исследование минимизирующих последовательностей в классе ЛДС. Минимизирующие последовательности (скользящие режимы) в классических задачах оптимального управления и вариационного исчисления приводят к счетному множеству переключений управления, которые происходят в разные, хотя и бесконечно близкие, моменты времени. Исследования показали, что оптимальные процессы в классе логико-динамических систем могут иметь новые, ранее не встречавшиеся, режимы с конечным или счетным числом мгновенных (т.е. происходящих в один и тот же момент времени) переключений автоматной части при фиксированном состоянии динамической части системы. Важным представляется тот факт, что эти новые режимы не являются редкими исключениями, напротив, они появляются в аналогах хорошо известных задач, например, в задаче управления линейными ЛДС с квадратичным критерием качества. Об открытии таких оптимальных режимов было заявлено на конференциях [23,24] в 2006 г. Затем почти все исследования ЛДС проводились автором с учетом этих режимов [25-27,29,38-40,42,137,138]. В отличие от работ других авторов, в [25,27,29] достаточные и необходимые условия получены с учетом мгновенных многократных переключений автоматной части. Поясним, о чем идет речь. Процесс с мгновенными многократными переключениями можно получить как предел последовательности {dj}J=i допустимых процессов d j = {xj(•),у j(■),Uj(■)) > в которых траектории
1 7 к yj(-) автоматной части имеют, например, К точек разрыва xj < Xj <. < тj . Причем эти точки разрывов функций уj(•) стремятся (при j —>оо) к одной точке г, сохраняя указанный порядок. Считаем, что предельная функция y(t) = lim y,(t), t еТ, в точке г является мноj-> 00 гозначной, принимающей К значений: у1 =yj(xlj), i = \,.,K, при этом точку т будем называть точкой многозначного разрыва. Например, на рис.В.3,а изображена кусочно-постоянная функция стремя разрывами в точках x-2s, т—е, т и значениями у0 = у(т-2е-0), у1 = y(i-2s), у2 =у(т-е), у3~у(х). При в-»+0 получаем кусочно-постоянную функцию с трехзначным разрывом в точке т (рис.В.3,6).
Автоматная часть в точке многозначного разрыва совершает К переключений, принимая последовательно состояния у(х - 0) = у0 ь^ / н». |-> ук = у(х), которые удовлетворяют рекуррентному включению (В.2): еУ(т,х(т),/'-1), i = l,2,.,K.
В функционале качества (В.4) такому разрыву соответствует сумма К gV^T),/-1,/). М
К многозначным разрывам следует отнести также и случай с бесконечным количеством переключений, который получается при К —> °о, если последовательность у1 сходится. В этом случае полагаем, что >>(т) = jh00 = lim у' (рис.В.З,в). Предполагаем, что допустимая
-»со траектория >>(•) автоматной части имеет конечное число точек многозначных разрывов. Заметим, что все эти мгновенные многократные переключения совершенно не влияют на траекторию динамической части системы, поскольку они происходят одновременно (на множестве меры нуль). У у3 / У У У У У У t-2s x-s а t А А
У/ со У i У а
I ♦ t t а -Н t б в Рис.В.З
Такие процессы, как показывают примеры, не являются исключениями, встречающимися только в специальных системах. Наоборот, они появляются в совершенно обычных задачах, в частности, в задаче управления линейными ЛДС с квадратичным критерием качества [23-25,33,35,36,38,39]. Эта задача аналогична хорошо изученной проблеме аналитического конструирования оптимальных регуляторов (АКОР) А.М.Летова [81]. Заметим, что процессы с мгновенными многократными переключениями в задачах управления непрерывнодискретными (или дискретными) системами не могут возникнуть, поскольку тактовые моменты времени в этих системах фиксированы.
Наличие положительного штрафа за переключение автоматной части является регуляри-зирующим фактором в задаче управления. Например, при фиксированной положительной величине штрафа последовательности допустимых процессов, приводящие к бесконечному количеству переключений автоматной части, являются неоптимальными. В частности, при наличии такого штрафа за переключение релейного управления невозможно появление скользящих режимов [3,45,54,55,76,118].
Кроме регуляризирующего влияния учет штрафа за переключение релейного управления делает классические решения ряда задач управления более практичными. Рассмотрим, например, задачу активной стабилизации спутника с минимальным расходом топлива [54]. Классическое решение поставленной задачи, полученное в [54], приводит к последовательности режимов торможения в окрестности положения равновесия, где угловая скорость максимальная. Торможение производится с максимальной тягой двигателя. Чем короче промежуток работы двигателя при каждом включении, тем больше таких включений необходимо сделать для гашения колебаний. Однако общие затраты топлива при этом уменьшаются. В пределе получаем бесконечную последовательность импульсных включений (на бесконечно малое время) двигателя с максимальной тягой, при этом общее время стабилизации неограниченно возрастает. Разумеется, что это управление, практически не реализуемое, является абстрактным, идеальным решением, показывающим предельные возможности (экономии топлива) данной математической модели.
Эту задачу можно рассматривать в классе ЛДС [41], учитывая, что каждое включение реактивного двигателя от его запуска до достижения максимальной тяги сопровождается расходом топлива и представляет собой немгновенный переходный процесс (как и выключение двигателя). Добавляя в критерий качества соответствующие штрафные слагаемые за включение (и выключение) двигателя, получаем задачу, в которой определяется оптимальное (конечное) количество запусков двигателя, а процессы, требующие бесконечного числа включений, отбрасываются как неоптимальные. Такая постановка задачи ближе к практике, чем классический вариант. Кроме расхода топлива в переходных процессах включения и выключения двигателя имеются и другие недостатки классического решения. Во-первых, в силу конструктивных особенностей реактивных двигателей малая продолжительность их работы приводит, как правило, к уменьшению точности коррекции траектории. Поэтому длительные промежутки работы двигателя обеспечивают меньшую погрешность, чем частые "мгновенные" включения/выключения двигателя. Значит, "импульсный" режим не годится из-за больших погрешностей при его реализации. Во-вторых, при каждом выключении химического реактивного двигателя часть топлива (горючего и окислителя) выбрасывается в пространство не полностью "сгоревшим". Эти остатки (как правило, активные химические вещества) затем оседают на солнечных батареях, снижая их производительность. Чем больше выключений двигателей, тем больше "загрязнение". Конечно, эти негативные явления трудно выразить в виде числовых характеристик (штрафов), чтобы учитывать в критерии качества.
Многие практические задачи оптимального управления приводят к релейным управлениям с конечным или бесконечным количеством переключений (например, задачи управления космическими и летательными аппаратами [52,53,76,118], задачи с эффектом Фуллера [65,122] и др.). Эти задачи лучше рассматривать в классе ЛДС, учитывая при помощи штрафных слагаемых, что любое переключение управления требует некоторых затрат. При этом задача регуляризируется, и ее решение становится более практичным.
Таким образом, задача (В.1)-(В.5) оптимального управления ЛДС, поставленная автором в 1992 г. в [17], была новой в теории оптимального управления. К настоящему времени достигнуты вполне исчерпывающие теоретические результаты: получены необходимые и достаточные условия оптимальности.
Необходимые условия оптимальности ослабляются в случае процессов с мгновенными многократными переключениями автоматной части. При недопустимости малых кусочно-постоянных вариаций 5у(-) приходим к системе неравенств для промежуточных состояний автоматной части ЛДС, что усложняет решение задачи.
Отметим, что с методической точки зрения (в случае однократных переключений автоматной части) доказательство проводится теми же средствами, что и доказательство принципа максимума. Вывод условий, относящихся к автоматной части, оказывается даже проще, поскольку множество допустимых вариаций значительно уже игольчатых. При этом задача (В.1)-(В.5), как показано выше, является более общей, чем классическая задача оптимального управления [103]. Для случая мгновенных многократных переключений вывод дополняется соответствующим предельным переходом.
Для получения достаточных условий оптимальности управления ЛДС использовался подход, развитый в работах Кротова В.Ф., Гурмана В.И. (например, [55,76]). Применение этого подхода к решению задачи синтеза оптимальных логико-динамических систем имеет новые особенности, связанные с дифференциальными свойствами синтезируемой функции. В рассматриваемой задаче функция цены, в отличие от функции Беллмана, может иметь разрывы, а в области непрерывности оказывается квазидифференцируемой [57,58,68,70, 107,108]. Это отражается в форме и в доказательстве условий оптимальности. Важным обстоятельством является наличие у оптимальных процессов мгновенных многократных переключений автоматной части, что усложняет структуру функции Беллмана и условия оптимальности. Для проблемы аналитического конструирования оптимальных регуляторов в классе логико-динамических систем на основе достаточных условий оптимальности были получены оптимальные законы замкнутого управления с учетом мгновенных многократных переключений автоматной части. Для динамической части оптимальное управление реализуется линейным регулятором, как и в классическом случае. Однако для логической части оптимальный закон управления находится как решение системы рекуррентных уравнений. В некоторых случаях оптимальный процесс имеет бесконечное число мгновенных переключений (происходящих в один и тот же момент времени), а оптимальный закон управления определяется в результате предельного перехода.
Вместе с задачей (В.1)-(В.5) управления при полной информации рассматривается задача управления ЛДС в условиях параметрической неопределенности. Предполагается, что состояние ЛДС в каждый момент времени точно не известно, а известно целое множество возможных состояний, т.е. речь идет об управлении пучком траекторий [4,79,93,95,98,114,154]. Синтез управления ЛДС производится с целью минимизации среднего или максимального значений показателя качества управления изолированной траекторией. Другими словами, синтезируется либо оптимальное гарантирующее [79] управление, либо управление, оптимальное в среднем [93]. Эти два подхода к задачам управления пучками траекторий непрерывных систем являются наиболее исследованными и важными для практики. Первый подход - минимаксный - происходит от дифференциальных игр [2,4,70,73,74,79,92,101,117,127, 129,154] и предусматривает нахождение управления, гарантирующего наилучший результат при наиболее неблагоприятном стечении обстоятельств. Второй подход - вероятностный [5, 11,44,69,77,86,93,98,99,105,106,121,129,143,157], при котором предполагается оценивать качество управления пучком траекторий средним значением функционала качества управления одной траекторией. Оба направления объединяются при вероятностно-гарантирующем подходе [85]. В диссертации рассматривается частный случай, когда в процессе функционирования никаких неопределенных воздействий на систему случайного или детерминированного характера нет, а пучки траекторий порождаются только неопределенностью начального состояния системы. Эти задачи обычно называют задачами с параметрической неопределенностью.
В теории позиционных дифференциальных игр принята гипотеза информированности, при которой не предполагается знание управления противника (внешнего воздействия), как в [2], однако считается возможным использовать в алгоритмах управления в каждый момент времени полную информацию о состоянии системы. В рамках принятой гипотезы информированности получены теоретические результаты, методы и приемы построения экстремальных конструкций, которые потом использовались и при более слабых условиях информированности. К этим результатам относятся: методы экстремального прицеливания, теорема об альтернативе в игре сближения-уклонения, необходимые и достаточные условия существования кусочно-гладкой цены игры, способы построения стабильных множеств, методы вычисления цены игры (см. [73,74,117] и другие работы школы акад. Красовского H.H.).
Другая гипотеза информированности заключается в том, что алгоритмы управления строятся на основе информации о множестве возможных в данный момент времени состояний системы. В [74] было показано, что выбором в качестве пространства позиций подходящего функционального пространства задачу гарантированного управления пучком траекторий можно свести к позиционной дифференциальной игре, однако такая игра, естественно, оказывается гораздо более сложной, чем игры с доступной точной информацией о состоянии системы. Выбор пространства позиций определяется формой описания множеств возможных состояний системы. Для описания таких подмножеств конечномерного пространства состояния использовались опорные функции [74,79], а также различные аппроксимации: параллелепипедами [70] или эллипсоидами [127]. Другой подход к построению алгоритмов управления состоит в получении оценки действительного состояния системы по множеству возможных состояний методами минимаксной фильтрации [78,85,86]. Применение различных аппроксимаций или оценочных процедур приводит к формированию субоптимальных алгоритмов управления.
Наиболее слабая гипотеза информированности - полное отсутствие дополнительной информации о состоянии системы, получаемой в процессе движения - соответствует задаче программного управления. Необходимые условия оптимальности гарантирующего управления получены для линейных [79] и нелинейных [4,93] систем. Достаточные условия оптимальности получены для линейных систем в [79] и для выпуклых задач в [154].
Перейдем к задаче оптимального в среднем управления, которая в диссертации понимается как частный случай задачи управления стохастическими системами при случайных начальных условиях и при отсутствии случайных воздействий в процессе движения. Наиболее сильная гипотеза информированности - предположение о доступной точной информации о состоянии системы - позволяет формировать закон управления с полной обратной связью, который находится в результате решения уравнения Беллмана для стохастических систем. Вопросам существования и единственности решения, а также приближенным методам решения этого уравнения посвящены работы [77,121,129]. Для линейных систем наиболее полные результаты в этой области представлены в работах [5,44]. Заметим, что при гипотезе полной информации оптимальное управление пучком складывается из оптимальных для каждой его траектории управлений, поэтому проблема описания, оценивания или аппроксимации множества возможных состояний здесь не возникает.
Задачу управления системой, динамика которой описывается стохастическими дифференциальными уравнениями, как правило, сводят к задаче управления решениями уравнения Фоккера - Планка - Колмогорова [106], описывающего эволюцию плотности вероятности случайного процесса. Этот прием описания позиции системы при помощи функции (в данном случае одномерной плотностью вероятности) характерен для задач управления системами с распределенными параметрами. При отсутствии случайных воздействий в процессе управления плотность вероятности удовлетворяет уравнению Лиувилля [93].
Наиболее слабая гипотеза информированности — отсутствие информации о текущем состоянии системы - используется в работах [4,69,93]. В них получены необходимые и достаточные условия оптимальности в среднем программного управления.
Перечисленные выше результаты относятся, в основном, к задачам управления непрерывными системами. Задачи оптимального гарантирующего и оптимального в среднем управлений ЛДС в условиях неопределенности, по-видимому, впервые обсуждались на конференциях [20,21]. Достаточные условия субоптимального управления получены в [27].
Для управления пучками траекторий ЛДС предлагается использовать оптимальное управление с обратной связью, в котором вместо неизвестного состояния системы подставляется его оценка (либо оптимальная гарантирующая, либо оптимальная в среднем). Таким образом, для управления пучком траекторий предлагается применять оптимальное управление для одной, специальным образом выбранной, траектории системы. Разумеется, что получаемое таким способом управление пучком является субоптимальным. Однако оно может оказаться удовлетворительным для практики. Такой подход к синтезу оптимального управления аналогичен применяемому в стохастических системах [80,96-99,109,110,121,125,143], когда для управления пучком траекторий используют оптимальное замкнутое управление для математического ожидания состояния системы. Обоснование этого метода опирается на теорему разделения [83,109], которая справедлива не для всех систем [75]. На практике такой подход часто применяется даже и без обоснования.
Представляют интерес задачи, в которых субоптимальное управление пучком оказывается оптимальным. Достаточным условием такого совпадения является гипотеза об оптимальности эффективных управлений [ 16,19-21,27]. Для пучка траекторий рассматриваются два множества программных управлений. Первое множество - множество оптимальных управлений - образуют оптимальные программные у правления для каждой изолированной траектории пучка. Второе множество - множество слабо эффективных управлений - включает такие программные управления, которые нельзя улучшить сразу для всех траекторий пучка. Равенство этих двух множеств, а именно в этом и состоит гипотеза об оптимальности эффективных управлений, является достаточным условием для того, чтобы субоптимальное управление пучком траекторий оказалось оптимальным. На основании этого подхода доказано, что субоптимальное в среднем или субоптимальное гарантирующее управления пучком траекторий линейной непрерывной системой с квадратичным критерием качества совпадают с оптимальными управлениями некоторыми траекториями пучка. Причем оптимальное в среднем управление совпадает с оптимальным управлением для траектории, исходящей из центра тяжести множества возможных начальных состояний [93]. Этот результат теперь распространен на ЛДС и непрерывно-дискретные системы [27,30-32].
Таким образом, в диссертационной работе решена новая, поставленная автором, проблема (В.1)-(В.5) оптимального управления ЛДС, имеющая важное теоретическое значение в области оптимального управления. Полученные теоретические результаты имеют практическую направленность и могут быть использованы при создании систем автоматического управления.
На защиту выносятся следующие основные результаты:
1) необходимые условия оптимальности управления ЛДС;
2) достаточные условия оптимальности управления ЛДС;
3) открытие нового типа минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями автоматной части;
4) достаточные условия субоптимальности и оптимальности управления ЛДС в условиях параметрической неопределенности.
Диссертационная работа состоит из введения, трех разделов основной части, заключения, списка использованных источников.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Иерархические модели управления системами неоднородной структуры2013 год, доктор физико-математических наук Расина, Ирина Викторовна
Оптимизация динамических систем с краевыми условиями1997 год, кандидат физико-математических наук Васильева, Ольга Олеговна
Методы поиска и улучшения экстремальных процессов в невыпуклых задачах оптимального управления2011 год, кандидат физико-математических наук Розинова, Надежда Сергеевна
Неравенства Гамильтона-Якоби в задачах оптимального управления дискретно-непрерывными системами2012 год, кандидат физико-математических наук Сорокин, Степан Павлович
Синтез оптимальных по быстродействию систем управления методом малых приращений1999 год, кандидат технических наук Денисов, Алексей Игоревич
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Бортаковский, Александр Сергеевич
3.4. ВЫВОДЫ
1. Разработана математическая модель важного класса гибридных систем управления в условиях параметрической неопределенности. Поставлены задачи оптимального и субоптимального управлений пучками траекторий детерминированной ЛДС. В качестве субоптимального управления пучком траекторий предлагается использовать управление, оптимальное для одной, специальным образом выбранной траектории.
2. Получены достаточные условия субоптимального в среднем и субоптимального гарантирующего управления пучком траекторий, в основе которых лежит предложенное автором обобщение функции Беллмана.
3. Показано, что для линейной ЛДС с квадратичным критерием качества субоптимальные управления оказываются оптимальными, что является нетривиальным обобщением известных результатов для линейных непрерывных систем.
ЗАКЛЮЧЕНИЕ
Основным итогом диссертационной работы является создание теории оптимального управления логико-динамическими системами и методов ее применения в новых актуальных приложениях, в том числе задачах авиационной и ракетно-космической техники, выразившееся в следующих научных результатах:
1. Разработана новая математическая модель логико-динамических систем, описывающая широкий класс гибридных систем автоматического управления, качество управления которых оценивается функционалом, учитывающим переключения логической части. Показано, что такая конструкция функционала отвечает потребностям практики.
2. Доказаны необходимые условия оптимальности логико-динамических систем, проведен анализ их применимости для синтеза оптимального программного управления.
3. Доказаны достаточные условия оптимальности логико-динамических систем, разработана методика их применения для синтеза оптимального позиционного управления.
4. Открыт новый тип минимизирующих последовательностей, приводящих к процессам с мгновенными многократными переключениями логической (автоматной) части. Необходимые и достаточные условия оптимальности доказаны для таких процессов.
5. Поставлена и решена задача оптимального управления линейной логико-динамической системой с квадратичным критерием качества, обобщающая известную проблему аналитического конструирования оптимальных регуляторов.
6. Доказаны достаточные условия субоптимального в среднем и субоптимального гарантирующего управления пучком траекторий детерминированных логико-динамических систем. Показано, что для линейно-квадратичной задачи субоптимальные управления оказываются оптимальными.
7. Решена задача активной стабилизации колебаний спутника с учетом неэффективных затрат топлива при включении и выключении реактивного двигателя.
Список литературы диссертационного исследования доктор физико-математических наук Бортаковский, Александр Сергеевич, 2010 год
1. Аграчев A.A., Сачков Ю.Л. Геометрическая теория управления. М.: ФИЗМАТЛИТ, 2005. 392 с.
2. Айзеке Р. Дифференциальные игры. М.: Мир, 1967. — 480 с.
3. Алексеев В.М., Тихомиров В.М., Фомин C.B. Оптимальное управление. — М.: Наука, 1979.-432 с.
4. Ананьина Т.Ф. Задача управления по неполным данным // Дифференциальные уравнения. 1976. - Т. 12. - №4. - С.612-620.
5. Аоки М. Оптимизация стохастических систем. М.: Наука, 1971. — 424 с.
6. Арутюнов A.B. К теории принципа максимума в задачах оптимального управления с фазовыми ограничениями //ДАН СССР. 1989. -Т.304. -№ 1. - С. 11-14.
7. Арутюнов A.B. Условия экстремума. Анормальные и вырожденные задачи. М.: Факториал, 1997.-254 с.
8. Арутюнов A.B., Магарил-Ильяев Г.Г., Тихомиров В.М. Принцип максимума Понтря-гина: Доказательство и приложения. М.: Факториал, 2006. 144 с.
9. Белецкий В.В. Движение искусственного спутника относительно центра масс. М.: Наука, 1975.-416 с.
10. Беллман Р. Динамическое программирование. М.: ИЛ, 1960. - 400 с .
11. Богуславский И.А. Прикладные задачи фильтрации и управления. М.: Наука, 1983. -400 с.
12. Болтянский В.Г. Достаточные условия оптимальности и обоснование метода динамического программирования // Известия АН СССР. Сер. Математика. 1964. — Т.28. - №3. - С.418-514.
13. Болтянский В.Г. Математические методы оптимального управления. М.: Наука, 1969.-408 с.
14. Болтянский В.Г. Оптимальное управление дискретными системами. — М.: Наука, 1973.-448 с.
15. Бортаковский A.C. Управление детерминированными системами в условиях неопределенности при оптимальности эффективных управлений / Управление и навигация ЛА в условиях параметрической неопределенности. М.: Изд-во МАИ, 1991. С. 18-23.
16. Бортаковский A.C. Достаточные условия оптимальности управления детерминированными логико-динамическими системами. // Информатика. Сер. Автоматизация проектирования. М.: ВНИИМИ, 1992. - Вып. 2-3. - С.72-79.
17. Бортаковский A.C. Оптимальное управление логико-динамическими системами // Научная сессия МИФИ-2000. Сб. науч. трудов. Т.2. М.: МИФИ, 2000. - С. 122-123.
18. Бортаковский A.C. Управление логико-динамическими системами в условиях неопределенности // Международная школа по динамическим и управляемым системам, г. Суздаль, 2001. Тезисы докладов. Владимир: ВГУ, 2001. — С. 12-17.
19. Бортаковский A.C. Оптимальное конструирование автоматной части логико-динамических систем // Второй международный конгресс "Нелинейный динамический анализ", г. Москва, 2002. Тезисы докладов. - М.: Изд-во МАИ, 2002. - С.104.
20. Бортаковский A.C. Достаточные условия оптимальности автоматной части логико-динамической системы // Известия РАН. Теория и системы управления, 2006, №6. С.77-92.
21. Бортаковский A.C. Субоптимальное управление логико-динамическими системами в условиях параметрической неопределенности // Автоматика и телемеханика. 2007. - №11. -С.105-121.
22. Бортаковский A.C. Необходимые условия оптимальности управления логико-динамическими системами // Известия РАН. Теория и системы управления, 2007, №6. -С. 16-33.
23. Бортаковский A.C. Необходимые условия оптимальности автоматной части логико-динамической системы // Тр. МИАН. 2008. - Т.262. - С.50-63.
24. Бортаковский A.C. Оптимальное и субоптимальное управления пучками траекторий детерминированных непрерывно-дискретных систем // Известия РАН. Теория и системы управления. 2009. -№1. - С. 18-33.
25. Бортаковский A.C. Оптимальное и субоптималыюе управления пучками траекторий детерминированных логико-динамических систем // Известия РАН. Теория и системы управления. 2009. - №6. - С.27-45.
26. Бортаковский A.C. Синтез логико-динамических систем на основе достаточных условий оптимальности // Известия РАН. Теория и системы управления. 2010.-№2 - С.54-68.
27. Бортаковский A.C., Волокитин Д.А. Синтез автоматной части оптимальной логико-динамической системы // Международная конференция по дифференциальным уравнениям и динамическим системам, г. Суздаль, 2002. Тезисы докладов. - Владимир: ВГУ, 2002. -С.39-40.
28. Бортаковский A.C., Пантелеев A.B. Достаточные условия оптимальности управления непрерывно-дискретными системами // Автоматика и телемеханика. 1987. - №7. - С.57-66.
29. Бортаковский A.C., Пегачкова Е.А. Синтез оптимального управления линейными логико-динамическими системами // "Труды МАИ", №27. http://www.mai.ru (25.04.2007)
30. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Международная конференция по математической теории управления и механике, г. Суздаль, 2007. Тезисы докладов. - Владимир: ВГУ, 2007. - С. 18.
31. Бортаковский A.C., Пегачкова Е.А. Синтез управления активной стабилизацией спутника на основе необходимых условий оптимальности логико-динамических систем // Вестник Московского авиационного института. 2008. - Т. 15. - № 2. - С.28-35.
32. Бортаковский A.C., Пегачкова Е.А. Синтез оптимальных детерминированных систем автоматного типа // Межвуз. сб. науч. трудов "Теоретические вопросы вычислительной техники и программного обеспечения". М.: Изд-во МИРЭА, 2008. - С. 102-107.
33. Бортаковский A.C., Семенов В.В. Оптимальное конструирование траекторий детерминированных логико-динамических систем / Междувед. сб. науч. тр. "Проблемы математики в физико-технических и экономических задачах". М.: Изд-во МФТИ, 1993. - С.4-10.
34. Брайсон А., Хо-Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972.-544 с.
35. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. - 624 с.
36. Васильев С.Н., Жерлов А.К., Федосов Е.А., Федунов Б.Е. Интеллектное управление динамическими системами. М.: Физматлит, 2000. 352 с.
37. Васильев Ф.П. Методы решения экстремальных задач. М.: Наука, 1981. - 400 с.
38. Вязгин В.А. К обоснованию достаточных условий оптимальности в методах Вейерштрасса и Гамильтона Якоби - Беллмана // Автоматика и телемеханика. - 1 984. -№4. - С.31-38.
39. Габасов Р., Кириллова Ф.М. Принцип максимума в теории оптимального управления. Минск, Наука и техника, 1974. - 272 с.
40. Габасов Р., Кириллова Ф.М. Основы динамического программирования. Минск. Изд-во БГУ, 1975.-264 с.
41. Грачев Н.И., Евтушенко Ю.Г. Библиотека программ для решения задач оптимального управления // Ж-л вычислит, математика и матем. физики. 1979. — Т. 10. - №2. - С.367-387.
42. Гурман В.И. Об оптимальных траекториях реактивного аппарата в центральном поле. // Космические исследования. 1965. - T.III. - Вып.З. — С.368-373.
43. Гурман В.И. Об оптимальных переходах между компланарными эллиптическими орбитами в центральном поле // Космические исследования. — 1966. T.IV. - Вып.1. - С.26-39. 54. Гурман В.И. Вырожденные задачи оптимального управления. - М.: Наука, 1977. -304 с.
44. Гурман В.И. Принцип расширения в задачах управления. М.: Наука,1985. - 288 с.
45. Гурман В.И. Модели и условия оптимальности для гибридных управляемых систем // Известия РАН. Теория и системы управления. 204.-№4- С.70-75.
46. Демьянов В.Ф., Васильев JI.B. Недифференцируемая оптимизация. М.: Наука, 1981. - 384 с.
47. Демьянов В.Ф., Рубинов A.M. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. - 432 с.
48. Дубовицкий А.Я., Милютин A.A. Задачи на экстремум при наличии ограничений // Ж-л вычислит, математика и матем. физики. 1965. - т.5. - №3. - С.395-453.
49. Дыхта В.А., Самсонюк О.Н. Оптимальное импульсное управление с приложениями. -М.: ФИЗМАТЛИТ, 2000. 256 с.
50. Емельянов C.B. Системы автоматического управления с переменной структурой. -М.: Наука, 1967.-336 с.
51. Жук К.Д., Тимченко A.A., Даленко Т.И. Исследование структур и моделирование логико-динамических систем. — Киев: Наукова думка, 1975. 199 с.
52. Завалищин С.Т., Сесекин А.Н. Импульсные процессы. Модели и приложения. М.: Наука, 1991.-256 с.
53. Зеликин М.И. Оптимальное управление и вариационное исчисление. М.: Едиториал УРСС, 2004.-160 с.
54. Зеликин М.И., Борисов В.Ф. Синтез оптимальных управлений с накоплением переключений // Итоги науки и техники. Сер. Современная математика и ее приложения. Тематический обзор. 2002. - т.90. - С.5-189.
55. Иванов Н.М., Мартынов А.И. Управление движением космического аппарата в атмосфере Марса. М.: Наука, 1977. - 416 с.
56. Иванов В.А., Ющенко A.C. Теория дискретных систем автоматического управления. -М.: Наука, 1983.-336 с.
57. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. 480 с.
58. Казаков И.Е. Статистическая теория систем управления в пространстве состояний. — М.: Наука, 1975.-432 с.
59. Кейн В.М. Оптимизация управления по минимаксному критерию. М.: Наука, 1985. — 248 с.
60. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988.-280с.
61. Колмогоров А.Н., Фомин C.B. Элементы теории функций и функционального анализа. M.: Наука, 1972. 496 с.
62. Красовский H.H. Управление динамической системой. Задача о минимуме гарантированного результата. -М.: Наука, 1985. 520 с.
63. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. M.: Наука, 1974.-456 с.
64. Краснощеченко В.И., Крищенко А.П. Нелинейные системы: геометрические методы анализа и синтеза. М.: Изд-во МГТУ им. Баумана, 2005. - 520 с.
65. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973.-446 с.
66. Крылов Н.В. Управляемые процессы диффузионного типа. М.: Наука, 1977. 399 с.
67. Куржанский А.Б. Оптимальные системы с импульсными управлениями // Дифференциальные игры и задачи управления. УНЦ АН СССР. - 1975. - С.131-156.
68. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.-392 с.
69. Лебедев A.A., Красильщиков М.Н., Малышев В.В. Оптимальное управление движением космических летательных аппаратов. М.: Машиностроение, 1974. - 292 с.
70. Летов A.M. Динамика полета и управление. М.: Наука, 1973. - 390 с.
71. Ли Э.Б., Маркус Л. Основы теории оптимального управления. М.Наука, 1972. -576 с.
72. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.: Наука, 1974. -696 с.
73. Лурье К.А. Оптимальное управление в задачах математической физики. М.: Наука, 1975.-478 с.
74. Малышев В.В., Кибзун А.И. Анализ и синтез высокоточного управления летательными аппаратами. М.: Машиностроение, 1987. - 302 с.
75. Малышев В.В., Красильщиков М.Н., Карлов В.И. Оптимизация наблюдений и управления летательных аппаратов. М.: Машиностроение, 1989. 311 с.
76. Марков A.A. Некоторые примеры решений специального класса задач на наибольшие и наименьшие количества// Сообщ. Харьковск. мат. о-ва. 1887. Т.1.
77. Миллер Б.М., Рубинович Е.Я. Оптимизация динамических систем с импульсными управлениями. М. Наука, 2004. - 493 с.
78. Моисеев H.H. Численные методы в теории оптимальных систем. М.: Наука. 1971. -424 с.
79. Натансон И.П. Теория функций вещественной переменной. М.: Гостехтеориздат, 1957.-552 с.
80. Никольский М.С. Приближенное вычисление наименьшей гарантированной оценки в линейных дифференциальных играх с фиксированной продолжительностью // Прикладная математика и механика. 1982. - Т.46. - №4. - С.691-693.
81. Овсянников Д.А. Математические методы управления пучками. Л.: Изд-во Ленингр. ун-та, 1980.-223 с.
82. Пантелеев A.B. Достаточные условия оптимальности управления дискретными детерминированными системами с ограниченным составом точных измерений // Автоматика и телемеханика. 2007. - №4. - С.67-78.
83. Пантелеев A.B., Бортаковский A.C. Теория управления в примерах и задачах. М.: Высшая школа, 2003. — 583 с.
84. Пантелеев A.B., Руденко Е.А., Бортаковский A.C. Нелинейные системы управления. М.: Вузовская книга, 2008. - 312 с.
85. Пантелеев A.B., Семенов В.В. Достаточные условия оптимальности управления детерминированными системами с ограниченным составом точных измерений // Автоматика и телемеханика. 1983. - №9. - С.67-75.
86. Пантелеев A.B., Семенов В.В. Синтез оптимальных систем управления при неполной информации. М.: Изд-во МАИ, 1992. - 192 с.
87. Параев Ю.И. Введение в стохастическую динамику процессов управления и фильтрации. М.: Сов. радио, 1976. - 184 с.
88. Первозванский A.A. Курс теории автоматического управления. М.: Наука, 1986. -616 с.
89. Петросян Л.А., Томский Г.В. Дифференциальные игры с неполной информацией. — Иркутск, Изд-во Иркутского ун-та, 1984. 187 с.
90. Понтрягин Л.С. Обыкновенные дифференциальные уравнения. М.: Наука, 1977. -332 с.
91. Понтрягин JI.C., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Физматгиз, 1961. — 392 с.
92. Пропой А.И. Элементы теории оптимальных дискретных систем. М.: Наука, 1973. -256 с.
93. Пугачев B.C. Теория вероятностей и математическая статистика. М.: Наука, 1979. -496 с.
94. Пугачев B.C., Синицын И.Н. Стохастические дифференциальные системы. Анализ и фильтрация. М.: Наука, 1990. - 632 с.
95. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука, 1980. -320 с.
96. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982. - 144 с.
97. Ройтенберг Я.Н. Автоматическое управление. М.: Наука, 1977. - 552 с.
98. Румянцев Д.С., Хрусталев М.М. Численные методы синтеза оптимального управления для стохастических динамических систем диффузионного типа // Известия РАН. Теория и системы управления, 2007, №3. С.27-38.
99. Семенов В.В. Динамическое программирование в синтезе логико-динамических систем // Приборостроение. 1984. №9. - С.71-77.
100. Семенов В.В., Бортаковский A.C. Оптимальное управление детерминированными логико-динамическими системами // Междувед. сб. науч. трудов "Проблемы математики в задачах физики и техники". М.: Изд-во МФТИ, 1992. - С. 135-140.
101. Семенов В.В., Бортаковский A.C., Руденко Е.А. Оптимальные управление и конечномерное оценивание состояния логико-динамических систем / Труды Второго международного симпозиума "ИНТЕЛС'96". М.: Изд-во РУДН-ПАИМС, 1996. - Т.1. - С.124-129.
102. Семенов В.В. Пантелеев A.B., Руденко Е.А., Бортаковский A.C. Методы описания, анализа и синтеза нелинейных систем управления / Учебное пособие. -М.: Изд-во МАИ, 1993.-312 с.
103. Семенов В.В., Репин В.М., Журина Н.Э. Алгоритмизация процессов управления летательными аппаратами в классе логико-динамических систем. М.: МАИ, 1987. - 50 с.
104. Сиротин А.Н. Об одном способе синтеза управления для класса дискретных систем с ограничениями // Известия РАН. Теория и системы управления, 2007, №4. С.43-55.
105. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. М.: Наука, 1981.-288 с.
106. Федоренко Р.П. Приближенное решение задач оптимального управления. М.: Наука, 1978.-488 с.
107. Федунов Б.Е. Проблемы разработки бортовых оперативно-советующих систем для антропоцентрических объектов // Известия РАН. Теория и системы управления. 1996. -№5. - С.147-160.
108. Филиппов А.Ф. Дифференциальные уравнения с разрывной правой частью. М.: Наука, 1985.-223 с.
109. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978. - 318 с.
110. Фуллер А.Т. Оптимизация релейных систем регулирования по различным критериям качества // Труды I Международного конгресса IF АС. М.: Изд-во АН СССР. - 1961. -С.584-605.
111. Хрусталев М.М. Необходимые и достаточные условия для задачи оптимального управления // Доклады АН СССР. 1973. - Т.211. - №1. - С.59-62.
112. Хрусталев М.М. Необходимые и достаточные условия в форме уравнения Беллмана //Доклады АН СССР. 1978. - Т.242. - №5. - С. 1023-1026.
113. Хрусталев М.М., Савастюк C.B. Условия оптимальности стохастических систем диффузионного типа в задачах с ограничениями на процесс управления-наблюдения // Доклады АН СССР. 1990. - Т.311. - №2. - С.291-295.
114. Чебыкин JI.C. Условия оптимальности дискретно-непрерывных систем // Оптимальное управление системами с неопределенной информацией. Свердловск: УНЦ АН СССР, 1980.-С. 132-140.
115. Черноусько Ф.Л. Оценивание фазового состояния динамических систем. Метод эллипсоидов. М.: Наука, 1988. 320 с.
116. Черноусько Ф.Л., Баничук Н.В. Вариационные задачи механики и управления. М.: Наука, 1973.-238 с.
117. Черноусько Ф.Л., Колмановский В.Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978. - 351 с.
118. Черноусько Ф.Л., Меликян A.A. Игровые задачи управления и поиска. М.: Наука, 1978.-270 с.
119. Цыпкин Я.З., Попков Ю.С. Теория нелинейных импульсных систем. М.: Наука, 1973.-414 с.
120. Agrachev A.A, Liberzon D. Lie-algebraic stability for switched systems // SIAM J. Control Optim. 2001. - v.40. - p.253-270.
121. Axelsson H., Boccadoro M., Egerstedt M., Valigi P., Wardi Y. Optimal Mode-Switching for Hybrid Systems with Varying Initial States // Journal of Nonlinear Analysis: Hybrid Systems and Applications. 2008. - Vol.2. - No.3. pp.765-772.
122. Axelsson H., Wardi Y., Egerstedt M., Verriest E. Gradient Descent Approach to Optimal Mode Scheduling in Hybrid Dynamical Systems // Journal of Optimization Theory and Applications. 2008. - Vol.136. -No.2. pp. 167-186.
123. Bortakovskii A.S. Sufficient conditions of optimality of logic-dynamical systems // Международная конференция по дифференциальным уравнениям и динамическим системам. Суздаль, 2000. Владимир: ВГУ, 2000. - С.21.
124. Bortakovskii A.S., Volokitin D.A. Synthesis of the automaton part of optimal logic-dynamical system. // Journal of mathematical sciences. 2005. - v. 126. - №6. - p. 1536-1541.
125. Brockett R.W. Hybrid models for motion control systems // Perspectives in the Theory and its Applications. Boston, Birkhauser, 1993. - p.29-53.
126. Cassandras C.G., Pepyne D.L., Wardi Y. Optimal control of a class of hybrid systems // IEEE Trans. Aut. Con. 2001. v.46. -N 3, P. 398-415.
127. Engell S., Frehse G., Schnieder E. Modeling, analysis and design of hybrid systems. -Springer, 2002. 504 p.
128. Fleming W.H. Optimal control of partially observable diffusions // SIAM. J. Control. -1968. v.6. -№2. - p.194-214.
129. Hedlund S., Rantzer A. Optimal control of hybrid systems // Proceedings of the 38th IEEE Conference on Decision and Control (Phoenix, AZ). 1999. - p.3972-3977.
130. Hybrid Systems / Ed. by R.L.Grossman, A.Nerode, A.P.Ravn, H.Rischel. Berlin, Springer, 1993. (Lect. Notes in Computer Science. - v.736).
131. Hybrid Systems. III. / Ed. by R.Alur, T.A.Henzinger, E.D.Sontag. Berlin, Springer, 1996. (Lect. Notes in Computer Science. - v. 1066).
132. H ybrid S ystems. V. / E d. b у P .Ahtsaklis, W .Kohn, M .Lemmon, A .Nerode, S .Sastry. -Berlin, Springer, 1999. (Lect. Notes in Computer Science. — v.1567).
133. Isaev K.V. Optimal control of discrete-continuous system // Kibern. Vychisl. Tek. -1988.-No. 79. — p.45-51.
134. Li Z., Soh Y., Wen C. Switched and impulsive systems: Analysis, design and applications. Berlin: Springer, 2005. - 271 p.
135. Liberzon D. Switching in Systems and Control. Berlin: Springer, 2003. - 252 p.
136. Matveev A.S., Savkin A.V. Qualitative theory of hybrid dynamical systems. Boston: Birk-hauser, 2000. 364 p.
137. Modelling and Analysis of Logic Controlled Dynamic Systems: IF AC Workshop. -Irkutsk: Inst. Syst. Dyn. and Control Theory. Sib. Branch RAS, 2003.
138. Savkin A.V., Evans R.J. Hybrid dynamical systems: Controller and sensor switching problems. Boston: Birkhauser, 2002. - 364 p.
139. Schmitendorf W.E. Minimax control of systems with uncertainty in the initial state and in the state equations. // IEEE Trans, on Autom. Control. 1977. -v.22. - №3. - p.439-443.
140. Silva G.N., Vinter R.V. Necessary conditions for optimal impulsive control problems // SLAM. J. Control and Optim. 1997. - v.35. -No. 6. -p.1829-1846.
141. Vinter R.B. New global optimality conditions in optimal control theory // SIAM. J. Control and Optim. 1983. - v.21. - №2. - p.235-245.
142. Wonham W.M. On the separation theorem of stochastic control. J. SIAM Control. 1968. - v.6. - p.312-326.
143. Xu X., Antsaklis PJ. On time optimal control of integrator switched systems with state constrains // J. of Nonlinear Analysis Special Issue on Hybrid Systems. 2005. - v.62. - p.1453-1465.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.