Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач тема диссертации и автореферата по ВАК РФ 05.13.01, доктор физико-математических наук Коган, Марк Михайлович
- Специальность ВАК РФ05.13.01
- Количество страниц 224
Оглавление диссертации доктор физико-математических наук Коган, Марк Михайлович
Содержание
Введение
Глава 1. Решение обратных задач минимаксного управления непрерывными системами
1.1 Обратные задачи дифференциальной игры для линейных систем
1.1.1 Обратная задача наихудшего возмущения
1.1.2 Обратная задача минимаксного управления и наихудшего возмущения
1.2 Обратная задача минимаксного управления
1.3 Обратные задачи дифференциальной игры для нелинейных аффинных систем
1.3.1 Предварительные сведения о дифференциальных играх для нелинейных систем
1.3.2 Прямая и обратная задачи наихудшего возмущения
1.3.3 Обратная задача дифференциальной игры
1.3.4 Обратная задача минимаксного управления
Глава 2. Синтез робастных регуляторов
2.1 Теоретико-игровой подход к синтезу робастных регуляторов
2.2 Частотные условия робастного управления
2.3 Оптимальные робастные законы управления
2.4 Робастные законы управления нелинейными системами
2.4.1 Синтез в пространстве состояний
2.4.2 Интегральные неравенства для робастных регуляторов
Глава 3. Синтез абсолютно стабилизирующих регуляторов для нелинейных систем Лурье
3.1 Квадратичная функция Ляпунова
3.1.1 Синтез регуляторов в пространстве состояний
3.1.2 Частотные условия для абсолютно стабилизирующих регуляторов
3.2 Функция Ляпунова в форме Лурье-Постникова
3.3 Нелинейные системы с нелинейными статическими характеристиками
Глава 4. Синтез минимаксного и .Н^-оптимального управлений в условиях неопределенности
4.1 Линейно-квадратичная дифференциальная игра с неопределенной системой
4.2 Частотные условия робастно-минимаксного управления
4.3 Робастно-минимаксное управление для нелинейных систем 113 4.3.1 Дифференциальная игра с неопределенной системой
4.3.2 Интегральные неравенства для робастно-минимаксного управления
Глава 5. Решение обратных задач оптимального и минимаксного управлений для линейных дискретных систем
5.1 Обратная задача оптимального управления
5.2 Локально-минимаксное и минимаксное управления
5.2.1 Локальный подход к синтезу минимаксного управления
5.2.2 Прямая и обратная задачи наихудшего возмущения
5.2.3 Когда локально-минимаксное управление будет ми-
нимаксным
5.3 Обратная задача минимаксного управления и наихудшего
возмущения
Глава 6. Синтез робастных и абсолютно стабилизирующих регуляторов для дискретных систем
6.1 Синтез робастных регз^ляторов
6.2 Синтез абсолютно стабилизирующих регуляторов
6.3 Синтез робастно-минимаксных регуляторов
Глава 7. Адаптивное локально оптимальное управление
7.1 Идентификация методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова
7.2 Идентифицируемость локально-оптимального закона управления
7.3 Локальное-оптимальное управление в условиях неопределенности
7.3.1 Детерминированный случай
7.3.2 Стохастический случай
7.4 Результаты численного моделирования
Заключение
Список литературы
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Синтез субоптимального анизотропийного стохастического робастного управления методами выпуклой оптимизации2012 год, доктор технических наук Чайковский, Михаил Михайлович
Минимаксные методы оценивания и оптимизации процессов в неопределенно-стохастических системах1998 год, доктор физико-математических наук Панков, Алексей Ростиславович
Адаптивное робастное управление в l1 постановке1998 год, доктор физико-математических наук Соколов, Виктор Федорович
Методы анализа и оценивания в скрытых марковских системах при обработке разнородной информации2008 год, доктор физико-математических наук Борисов, Андрей Владимирович
Алгоритмы робастного субоптимального управления для динамических объектов2012 год, кандидат технических наук Галяув, Елена Романовна
Введение диссертации (часть автореферата) на тему «Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач»
Введение
В своем развитии теория управления проходила несколько этапов, среди которых можно условно выделить следующие: классическая теория устойчивости и автоматического регулирования, теория оптимальных систем управления, теория стохастических систем управления и современный этап - теория адаптивного и робастного управлений. Возникновение последнего связано с необходимостью управления сложными техническими объектами, меняющимися в процессе функционирования в изменяющейся со временем среде, получение точных математических моделей которых представляется весьма проблематичным. Отсутствие точной математической модели объекта препятствует нахождению закона управления, обеспечивающего устойчивость и оптимальность. В этих условиях естественно желание преодолеть "узкую специализацию" стратегии управления и сделать ее более универсальной по отношению к объектам и возмущениям, что и привело к появлению теорий адаптивного и робастного управлений.
Исходным в теории робастного управления является стремление к обеспечению устойчивости не только заданной (номинальной) системы управления, но и всех не очень отличных от нее в определенном смысле систем. В отличие от классической теории автоматического регулирования, в теории робастного управления цель должна достигаться не только для данного объекта, а для целого класса объектов и возмущений, выделяемых на основе априорной информации.
Теория адаптивного управления - это теория систем управления, которые благодаря самонастройке и обучению меняют свою стратегию, стремясь приблизить ее к оптимальной, причем делают они это асимптотически точно, если объект перестает меняться, и, следовательно, достаточно точно, если объект меняется медленно.
Работы Лурье, Айзермана, Попова, Якубовича, Калмана, Лефшеца, Ла-Салля стимулировали большой интерес к теории устойчивости, во-
обще, и к методам Ляпунова и проблеме абсолютной устойчивости, в частности. К этому добавилось понимание принципа динамического программирования Беллмана и достижения в стохастическом оценивании, связанные с фильтром Калмана-Бьюси. Тесная связь, которая существует между идентификацией и управлением, и дуальная роль управления были вскрыты Фельдбаумом.
В конце 70-х параллельно с развитием теории адаптивного управления стала развиваться теория робастного управления. В работе Харитонова [72] было показано, что для выяснения устойчивости класса линейных дифференциальных уравнений произвольного порядка, параметры которых принимают значения в заданных интервалах, достаточно проверить устойчивость только четырех полиномов. Эта работа через некоторое время вызвала экспоненциально растущий поток публикаций [168], [183], [98], [95], [93], [13], [75], не прекращающийся по настоящее время [83], [94], [51], [161], [7], [180]. В работах Цыпкина и Поляка [58], [59] были получены частотные критерии робастной устойчивости и апериодичности линейных систем. Впоследствие, Неймарк [48], [49], [50] показал, что рассмотрение проблемы робастной устойчивости с позиции D-разбиения позволяет определить меру робастной устойчивости и применить алгоритмы оптимизации для ее вычисления.
Синтез робастного управления для различных классов неопределенных объектов во многом опирается на метод функций Ляпунова [46], [105], [92], [171], [82], [181], [ИЗ], [118], [119], [84]. Так, для неопределенных линейных систем с ограниченными по норме неизвестными нестационарными параметрами были введены понятия квадратичной устойчивости и квадратичной стабилизируемости [158], [159], [5], в соответствии с которыми осуществляется поиск линейного стационарного закона управления и квадратичной функции, являющейся при этом управлении функцией Ляпунова для произвольной системы рассматриваемого класса, а также понятие оптимального гарантированного управления [97], [160], обеспе-
чивающего определенный уровень показателя качества при любой допустимой неопределенности. В связи с развитием теории Д^о-оптимального управления [110], [108], [57], [4], [144] появился ряд работ [127], [177], [178], [184], [104], в которых устанавлена связь между Н^ управлением и ро-бастной стабилизацией неопределенных линейных систем. Применение этих методов предполагает нахождение положительно определенного решения матричного уравнения типа Лурье-Риккати, по которому и определяются параметры обратной связи.
Подходы к синтезу робастного управления, ориентированные на задание неопределенных объектов передаточными матрицами с аддитивными, мультипликативными или дробно-рациональными возмущениями развиваются в [174], [143], [114], [144], [101], [91], [53].
Для систем Лурье, которые наряду с линейными блоками содержат неизвестные нелинейные характеристики, принадлежащие заданным секторам, анализ устойчивости состояния равновесия, как хорошо известно, основан на построении функции Ляпунова квадратичного вида или в форме Лурье-Постникова [43], [44], [2]. Частотные условия, полученные в работах [78], [60], [61], [81], [8], [10], гарантируют существование функции Ляпунова соответствующего вида и, тем самым, глобальную асимптотическую устойчивость состояния равновесия при любой допустимой нелинейной характеристики или, другими словами, абсолютную устойчивость. В [71], [176], [182], [6], [52], [65], [100], [157] методы абсолютной устойчивости развиты для стохастических систем и для дискретных систем со случайными параметрами и структурой.
В последнее время проблема абсолютной стабилизируемости, т.е. существования регуляторов, при которых замкнутая система Лурье является абсолютно устойчивой, обсуждается с позиций теории #оо оптимального управления. В частности, в [163] условия абсолютной стабилизируемости были сформулированы в терминах решений пары матричных уравнений, характерных для задачи Яос-оптимального управления, а в [9] эти
условия выражаются в виде частотного неравенства, включающего решение матричного уравнения для задачи Н^ - оптимального управления. В [162], [151], основываясь на работе [80], показано, как сложная система может быть описана, используя так называемые интегрально квадрати-ческие ограничения, и представлены условия устойчивости такого рода систем.
Что касается робастного управления нелинейными неопределенными объектами, то первые результаты в этом направлении были получены на основе так называемой теоремы о малом коэффициенте роста [185], [12]. В последнее десятилетие был сделан значительный прогресс ъ развитии геометрической теории нелинейных систем управления [121], [126]. Вместе с теорией устойчивости Ляпунова она составляет основу для синтеза робастного управления. Вопросы управления и оценивания в неопределенных нелинейных системах изучались в [42], [76], [35], [16]. Управляемость, наблюдаемость и условия существования функции Ляпунова при соответствующем законе управления для различных классов нелинейных систем управления даны в [175], [88], [170], [11], [40], [15], [172], [106], [107], в работах [138], [111] изучаются итеративные процедуры построения функции Ляпунова, а в [165], [166], [156], [179], [150] для некоторых классов систем со структурированной неопределенностью результаты получены на основе теории Н^ оптимального управления для нелинейных систем [164], [122], [90], [123], [149].
Следует отметить, что в работах этого направления результаты, как правило, формулируются в терминах существования положительно определенного решения уравнений/неравенств Гамильтона-Якобп, что представляет проблему при реализации предлагаемых законов управления. Таким образом, при синтезе робастного управления различными классами линейных и нелинейных неопределенных объектов, остается актуальной разработка регулярных методов, по возможности не требующих непосредственного решения нелинейных дифференциальных урав-
нений/неравенств Гамильтона-Якоби или нелинейных матричных уравнений/неравенств Лурье-Риккати.
Исследования в области адаптивного управления проводились в различных направлениях, среди которых можно выделить такие как адаптация параметров, модели теории чувствительности и методы, основанные на теории устойчивости Ляпунова. Потребовалось значительное время на осознание того факта, что методы синтеза адаптивного управления, основанного на функциях Ляпунова, состоят в получении таких дифференциальных или разностных уравнений, описывающих динамику настраиваемых параметров или оценок, которые в дополнении к уравнениям объекта обеспечивают устойчивость полной системы.
В конце 60-х появилась монография Цыпкина [73], в которой было показано, что многие адаптивные и обучающиеся схемы могут быть описаны в рамках алгоритмов стохастической аппроксимации. В этот период также были получены результаты по сходимости самонастраивающихся регуляторов и по адаптивным наблюдателям. Получил развитие синтез адаптивного управления на основе алгоритмов идентификации типа метода наименьших квадратов [89], [115] и конечно-сходящихся алгоритмов решения рекуррентных целевых неравенств [79], [66], [67], [64], а также синтез адаптивного управления по скорости убывания функции Ляпунова [47], [68], [69], [27], который впоследствии стал известен как метод скоростного градиента [70].
В конце 70-х появилось понимание того, что для адаптивных законов управления, основанных на методе Ляпунова, характерным является то обстоятельство, что производная или приращение функции Ляпунова полной системы, включающей фазовые переменные объекта и настраиваемые параметры или оценки, является только неположительной, а не отрицательно определенной как это требуется для экспоненциальной устойчивости. Это привело к развитию различных методов, обеспечивающих робастностъ адаптивных систем по отношению к внешним и внутренним
возмущениям [139], [120], [154], [147].
В последние десятилетия произошел значительный прогресс в теории адаптивного управления. Об этом можно судить, например, по монографиям [54], [146], [109], [66], [63], [74], [117], [87], [70], [140]. Вместе с тем, из-за существенной нелинейности и многомерности уравнений адаптивных систем управления многие фундаментальные теоретические проблемы остаются еще нерешенными. Одной из наиболее значимых из них является сходимость самонастраивающихся регуляторов, основанных на рекуррентом оценивании методом наименьших квадратов (МНК). Сложность этой задачи заключается в следующем. Если старший коэффициент числителя передаточной функции объекта является неизвестным, тогда текущее управление должно входить в регрессионный вектор в качестве одной из его компонент. Однако, выбор закона управления в виде линейной обратной связи от остальных регрессоров приводит в таком случае к нарушению так называемого условия неисчезающего возбуждения, обеспечивающего в соответствии с классической теоремой Гаусса-Маркова невырожденность информационной матрицы и сходимость оценок к их истинным значениям.
Для преодоления этой трудности обычно применяют внешние сигналы или модифицируют алгоритм МНК так, чтобы, дополнительно возбуждая систему, обеспечить состоятельное оценивание. В [167], [41], например, это достигается путем усложнения алгоритма МНК, в [3] для этого применялся регулятор переменной структуры, в [67], [102], [145], [103] это происходит за счет введения дополнительных шумов, в [86] -вследствие разнообразности эталонной траектории, а в [87] - путем обогащения опорных сигналов. Вместе с тем, как отмечалось многими авторами. указанные меры значительно усложняют синтез и анализ адаптивной системы и, что, наверное, самое существенное, могз^т приходить в противоречие с целями управления. Что касается адаптивных регуляторов, в которых не обеспечивается состоятельное оценивание, то в [116], [152],
[141] была доказана асимптотическая оптимальность регулятора, использующего алгоритм стохастической аппроксимации. Для стохастических объектов в [45], [14], [148], [142], [173], [169] поведение алгоритмов адаптации изучалось методом усреднения. Отметим, что в этих работах не рассматривалось поведение оценок в случае, когда возбуждение является неполным. Таким образом, при изучении адаптивного управления, основанного на идентификации, важно выяснить, что происходит с оценками при невыполнении условий неисчезающего возбуждения.
В диссертации развивается новый подход к синтезу робастного управления неопределенными динамическими объектами, основанный на применении теории дифференциальных игр и решении обратных минимаксных задач, а также синтезируется адаптивное управление классами линейных дискретных стохастических объектов, использующее идентификацию рекуррентным методом наименьших квадратов и не требующее идентифицируемости неизвестных параметров.
Синтез робастного управления осуществляется для следующих классов неопределенных объектов:
• аффинных по входам нелинейных непрерывных систем, уравнения которых включают неизвестные функции, удовлетворяющие квадратичным неравенствам;
• непрерывных и дискретных нелинейных систем Лурье, включающих линейную систему и неизвестные статические нелинейные характеристики, принадлежащие заданным секторам;
• непрерывных и дискретных линейных систем, неизвестные нестационарные параметры которых принимают значения в некоторой области эллипсоидального вида.
Цель управления в отсутствии внешнего возмущения заключается в стабилизации объекта при любой допустимой неопределенности с гаран-
тированной интегральной оценкой переходного процесса в замкнутой системе, а при наличии ограниченного по норме в Ьч или /2 внешнего возмущения - в получении Н^ субоптимального закона управления, при котором отношение нормы выхода объекта к норме возмущения не должно превышать заданный уровень при всех допустимых неопределенностях в системе.
Синтез робастного управления указанными выше классами объектов осуществляется путем погружения исходной неопределенной системы в некоторую расширенную полностью определенную систему, включающую искусственно введенное дополнительное возмущение. Движения этой расширенной системы, когда выполняются определенные квадратичные неравенства между искусственным возмущением, состоянием и управлением, включают в себя движения исходной неопределенной системы. Для этой расширенной системы определяется целевой функционал так, что минимаксное управление в дифференциальной игре между "управлением" и "искусственным возмущением" оказывается искомым робастным управлением, а функция Беллмана - функцией Ляпунова, обеспечивающей робастную устойчивость исходной неопределенной системы. При наличии внешнего возмущения в исходной неопределенной системе робастным Н^ субоптимальным управлением оказывается минимаксное управление в дифференциальной игре для соответствующей расширенной системы против "противника", включающего внешнее возмущение и неопределенность в системе.
Отличительной особенностью развиваемого здесь подхода является то обстоятельство, что наряду с законами управления, получаемыми здесь на основе теории дифференциальных игр [1], [55], [56], [38], [39], [96] в терминах решений соответствующих уравнений или неравенств Гамиль-тона-Якоби для нелинейных систем и матричных уравнений или неравенств Лурье-Риккати для линейных систем, он также позволяет синтезировать робастное управление, не прибегая к решениям этих урав-
нений или неравенств. Такая возможность связана с тем, что искомым робастным законом управления оказывается любой из минимаксных законов управления по отношению к некоторому целевому функционалу из определенного класса. В связи с этим, для синтеза робастного управления нет необходимости в решении вариационной задачи для данного функционала, а достаточно только выяснить условия, при которых данный закон управления является минимаксным по отношению к некоторому функционалу из заданного класса.
Последняя задача относится к так называемым обратным вариационным задачам, которые известны в различных областях математики (см., например, обзор в [37]). В частности, в теории управления такая проблема возникла в связи с сомнениями, высказываемыми инженерами по поводу непрактичности оптимальных законов управления из-за субъективности выбора оптимизируемых показателей качества. По их мнению было бы более целесообразным искать законы управления, которые не являются связанными с конкретным показателем. Эти возражения не могли быть приняты с научной точки зрения, однако в связи с ними представлялось важным раскрыть общие черты, присущие всем оптимальным законам управления независимо от конкретного показателя качества и, тем самым, отделить законы управления, являющиеся оптимальными в определенном смысле, от всех прочих.
Такая точка зрения привела к рассмотрению обратной задачи оптимального управления, в которой для заданного закона управления требовалось найти все функционалы из определенного класса (если они существуют). для которых он является оптимальным. В 60-е годы в своей ставшей уже классической работе [125] "Когда линейная система управления является оптимальной ?" Калман дал ответ на этот вопрос для объектов, определяемых линейными дифференциальными уравнениями, и квадратичных функционалов. Обобщение этого результата для многомерных систем было сделано в [85], а для нелинейных систем - в [153].
В связи со сказанным выше по поводу развиваемого здесь подхода к синтезу робастного управления, в диссертации для аффинных по входам нелинейных непрерывных систем и аддитивных функционалов, а также для линейных непрерывных и дискретных систем и квадратичных функционалов ставятся и решаются следующие новые обратные вариационные задачи, которые представляют и самостоятельный интерес:
• обратная задача наихудшего возмущения, состоящая в выяснении условий, при которых данная стратегия возмущения будет наихудшей, т.е. максимизирует некоторый функционал из заданного класса для системы без управления;
• обратная задача дифференциальной игры, состоящая в выяснении условий, при которых данная пара стратегий являются соответственно минимаксным управлением и наихудшим возмущением по отношению к некоторому функционалу из заданного класса;
• обратная задача минимаксного управления, состоящая в выяснении условий, при которых данный закон управления является минимаксным для некоторого функционала из заданного класса.
Для нелинейных систем при выборе закона управ лени и/или стратегии возмущения в виде нелинейных функций текущего состояния решение каждой из указанных выше обратных задач дается в терминах соответствующего интегрального неравенства, в которое входят выбранные функции и которое должно выполняться по траектории разомкнутой системы с нулевыми начальными условиями при любых допустимых стратегиях. Для линейных систем и линейных обратных связей интегральные неравенства сводятся к неравенствам в частотной области, которым должны удовлетворять определенные передаточные функции системы, включающие параметры выбранной обратной связи.
Возвращаясь к синтезу робастного управления как минимаксного управления в дифференциальной игре для расширенной системы и целевого функционала из некоторого класса, разработанный при решении указанных обратных задач аппарат позволяет получить условия, которым должна удовлетворять данная обратная связь для того, чтобы отвечать искомому робастному закону управления для соответствующего класса неопределенных объектов. Эти условия для нелинейных систем выражаются в виде соответствующего интегрального неравенства, которое должно выполняться по траектории расширенной системы при нулевых начальных условиях, а для линейных систем - в виде частотного неравенства для передаточной матрицы, которая содержит параметры выбранного линейного закона управления.
Развиваемый здесь подход позволяет также выразить решение рассматриваемых задач в терминах так называемых линейных матричных неравенств (ХМ1). На языке ЬМ1 могут быть сформулированы условия Ляпунова для устойчивости линейных систем, условия абсолютной устойчивости систем Лурье и многие другие проблемы современной теории управления [99], [124], [112]. В 60-е годы Якубович, Попов, Калман, Цып-кин и другие получили различные частотные условия разрешимости соответствующих ЬМ1, которые свели решение проблемы Лурье к проверке простых графических критериев. Далее Пятницкий и Скородинский в [62] показали, что задача Лурье для систем со многими нелинейностями может быть сведена к задаче выпуклой оптимизации, включающей ЬМ1, и применили для ее решения метод эллипсоидов.
В последнее время на основе известных алгоритмов выпуклой оптимизации разработаны так называемые алгоритмы внутренней точки и эффективные программные средства в среде МАТЬАВ [155], позволяющие выяснять разрешимость данного ЬМ1 и находить экстремум линейной функции при ограничениях, задаваемых ЬМ1. В связи с этим, отметим, что полученные в диссертации робастные и Н^ субоптимальные законы
управления для рассматриваемых классов неопределенных систем также выражены в терминах соответствующих ЬМ1, и получены частотные условия их разрешимости. Применение указанных программных средств дает возможность довести развиваемый здесь подход до конкретных реализаций.
Наряду с описанным выше синтезом робастного управления, в диссертации для классов линейных дискретных стохастических объектов с неизвестными стационарными параметрами рассматривается синтез адаптивного управления, основанный на рекуррентной идентификации методом наименьших квадратов (МНК). Как было отмечено выше, выбор закона управления в виде линейной обратной связи приводит к нарушению так называемого условия неисчезающего возбуждения, обеспечивающего в соответствии с классической теоремой Гаусса-Маркова невырожденность информационной матрицы и сходимость оценок к их истинным значениям. В диссертации показывается, что для достижения цели управления не требуется состоятельность оценок в системе. В том случае, когда параметры регулятора являются некоторыми специфичными функциями текущих оценок, этот синтез может быть осуществлен на основе чистого МНК без введения каких-либо дополнительных сигналов, как это обычно принято делать для обеспечения идентифицируемости неизвестных параметров объекта. Это утверждение основывается на изучении динамики оценок МНК при нарушении условий состоятельного оценивания. С помощью декомпозиции пространства оценок в детерминированном случае и с помощью метода усреднения в стохастическом случае, здесь устанавливается наличие глобально притягивающего многообразия, соответствующего множеству идентифицируемости системы, и инвариантность параметров некоторого класса законов управления на этом многообразии.
Показано, что этот особый класс составляют локально-оптимальные законы управления, минимизирующие условное математическое ожида-
ние приращения по траекториии объекта целевой функции, являющейся квадратичной по выходным переменным регрессии. Установлено, что оптимальный закон управления по отношению к интегральному функционалу всегда является локально-оптимальным для некоторого локального критерия, в то время как обратное имеет место только при выполнении частотного условия, полученного на основе решения обратной задачи оптимального управления для линейных дискретных объектов.
Доказано, что в локально-оптимальных адаптивных системах управления, несмотря на отсутствие идентифицируемости оцениваемых параметров неизвестного объекта, происходит идентификация параметров локально-оптимального регулятора для этого объекта и, тем самым, решается задача управления в условиях неопределенности.
Апробация работы. Результаты диссертации докладывались и обсуждались на 12 Всемирном Конгрессе Международной федерации по автоматическому управлению (IFAC) (Сидней, 1993), на 3 и 4 Европейских конференциях по управлению (Рим, 1995 и Брюссель, 1997), на 33-й Конференции по принятию решений и управлению (CDC) (Орландо, 1994), на 10 Симпозиуме IFAC по идентификации (Копенгаген, 1994), на 2-м Симпозиуме IFAC по стохастическому управлению (Вильнюс, 1986), на Симпозиуме IFAC по адаптивному управлению (Тбилиси, 1989), на 2-й Российско-Шведской конференции по управлению (Санкт-Петербург, 1995), на 1-й Международной конференции по управлению колебаниями и хаосом (Санкт-Петербург, 1997), на 7, 9,10, 11 Всесоюзных совещаниях по проблемам управления (Минск, 1977; Ереван, 1983; Алма-Ата, 1986; Ташкент, 1989) и на Всероссийской конференции "Новые направления в теории систем с обратной связью" (Уфа, 1993), на Всесоюзных конференциях "Теория адаптивных систем и ее применение" (Ленинград, 1983 и 1991), на 5 Всесоюзном совещании по статистическим методам в процессах управления (Алма-Ата, 1981), на 12 Всесоюзной школе-семинаре по адаптивным системам (Могилев, 1984), на Всесоюзном семинаре "Дина-
мика нелинейных систем управления" (Таллин, 1987) и на 4 и 5 Международных семинарах "Устойчивость и колебания нелинейных систем управления" (Москва, 1996 и 1998), на 6 и 7 Всесоюзных совещаниях по непараметрическим и робастным методам статистики в кибернетике (Томск, 1987 и 1990), на 8 Всесоюзной конференции "Проблемы теоретической кибернетики" (Горький, 1988), на 4-й конференции по нелинейным колебаниям механических систем (Нижний Новгород, 1996), на Итоговых научных конференциях Горьковского госуниверситета (19811989), на семинаре в 1985 году в Институте проблем управления под руководством академика РАН Я.З.Цыпкина и на семинаре "Нелинейные динамические системы" на ВМиК в МГУ под руководством академика РАН С.В.Емельянова и члена-корреспондента РАН С.К.Коровина (1992 и 1996).
Публикации. Основные результаты диссертации опубликованы в 28 работах, среди которых 15 в центральных научных журналах РАН, 1 статья в Вестнике Нижегородского университета, 3 статьи в международных журналах и 9 работ - в трудах международных конференций. Результаты по адаптивному локально-оптимальному управлению, опубликованные в совместных с Ю.И.Неймарком статьях, вошли в главу 7 и являются неразделимыми.
1 Глава 1. Решение обратных задач минимаксного управления непрерывными системами
1.1 Обратные задачи дифференциальной игры для линейных систем
1.1.1 Обратная задача наихудшего возмущения
Пусть динамика системы задается уравнением
x = Ax + Fv, (1-1-1)
в котором х £ Rm -измеряемое состояние, v Е В1 -неизмеряемое возмущение, А - устойчивая матрица, т.е. все ее собственные значения лежат строго слева от мнимой оси. Возмущение v = v (t) будем считать допустимым, если выполняется условие
J™vTvdt < оо . (1.1.2)
Примем, что потери от возмущения характеризуются функционалом
Jx (v) = Г (xTQvx - j2vTv) dt , (1.1.3)
J О
в котором Qr = Qv > 0 - неотрицательно определенная симметрическая весовая матрица, а у ф 0 - некоторое число. Определим наихудшее возмущение как максимизирующее значение этого функционала, т.е.
v* = arg max J\ (v) . (1.1.4)
Прежде, чем сформулировать и решить обратную задачу о наихудшем возмущении, рассмотрим локальный подход к нахождению этого возмущения. Для этого наряду с функционалом (1.1.3) введем локальный критерий
ф(г,) = Т/-72итг; , (1.1.5)
в котором V - производная некоторой целевой функции V (х) = хтСх. где С = Ст > 0, вычисленная по траектории (1.1.1). Назовем возмущение У] локально наихудшим, если оно в каждый момент времени максимизирует этот критерий, т.е.
VI = ащшахФ (у) . Так как согласно (1.1.1), (1.1.5) имеем
Ф (у) = 2хтС {Ах + Гу) - 72уту ,
то, приравнивая градиент этой функции по г; к нулю, найдем
= НУ=СР , (1.1.6)
при котором
шахФ(г;) = —хтС}х ,
где
д = —АТС -СА- 1-2СРРтС . (1.1.7)
Очевидно, что имеет место тождество
• гр Л гр (\ ^
V = —х О,х + 7 у у — 7 (у — vi) (v — 1>1)
и что локально наихудшее возмущение будет допустимым, если матрица замкнутой системы (1.1.1),(1.1.6)
А, = А + Т'2РЩ , (1.1.8)
где Нг) = СТ, является устойчивой. В этом случае ясно, что для всех допустимых возмущений верно неравенство
V < -хт(^)х + 72уту ,
превращающееся в равенство при у = г>/, поэтому можно утверждать следующее.
Теорема 1.1.1 Пусть неотрицательно определенные симметрические матрицы С} и С удовлетворяют уравнению (1.1.7) и при Ну = СР матрица (1.1.8) является устойчивой. Тогда наихудшее возмущение по отношению к функционалу (1.1.3), в котором = будет локально наихудшим возмущением (1.1.6) и при этом таху 3\ (у) = х^Схо.
Нетрудно убедиться в том, что множество всех наихудших возмущений исчерпывается формулой (1.1.6), в которой матрица С удовлетворяет перечисленным в теореме 1.1.1 свойствам. Для этого достаточно записать гамильтониан рассматриваемой вариационной задачи (1.1.1),(1.1.3)
Я (х, v, р) = рТ (Ах + Гь) +0,5 (хтдьх - 72Л) , найти его максимум по возмущению
V = ^~2Ртр ,
и, подставляя // = Сх в уравнения Эйлера-Лагранжа
х = Ах + Ри , ¡1 = V - Атр ,
получить уравнение (1.1.7) для матрицы С.
Теперь рассмотрим обратную задачу о наихудшем возмущении: когда допустимое локально наихудшее возмущение будет наихудшим по отношению к функционалу (1.1.3) с некоторой матрицей С^у > 0 ? С учетом вышеизложенного зта задача сводится к нахождению условий, при которых выбранная матрица Ну отвечает согласно равенству Нь = СР некоторой матрице С = Ст > 0 - решению уравнения (1.1.7) при > 0. Решение этой задачи в терминах матрицы возвратной разности для обратной связи (1.1.6). т.е. матрицы
(р) = / _ т-2Щ {р1 _ Ау1 Е ? (1Л_9)
где I - едпнпчная матрица, дается в следующей теореме.
Теорема 1.1.2 Пусть для системы (1-1.1) с устойчивой матрицей А и управляемой парой (Л, Г) выбрана матрица Ну так, что матрица (1.1.8) является устойчивой. Тогда необходимым и достаточным условием того, что возмущение (1.1.6) будет наихудшим для функционала (1.1.3) при некоторой > 0, является выполнение для всех си 6 (—ос, оо) частотного неравенства
{-ш) ЧГ™ (ш) < I , (1.1.10)
где матрица Ц*"^ (р) задана в (1.1.9). Если при этом пара (А,НУ) наблюдаема, то любая матрица С = СТ, удовлетворяющая соотношению С Г = Ну, является положительно определенной.
Доказательство теоремы 1.1.2. Согласно теореме 1.1.1 и следующему за ней замечанию требуется найти условия существования матрицы С = СТ > 0 такой, что С Г = Нг! и выполняется матричное неравенство
АТС + С А + 7 ~2НЬ.Н^ < 0 ,
или, другими словами, такой что для всех комплексных (х,у) выполняется следующее неравенство:
2Вех*С (Ах + Гу) - 2Вех*Нур + ~/~2х*НуЩх < 0 ,
где * означает транспонирование и комплексное сопряжение. Из "частотной теоремы" [81] следует, что для существования такой матрицы необходимо и достаточно, чтобы для всех си £ (—оо,оо) выполнялось
2Ке1С (¿си) - 7-2 К* (ш) К (ги) > 0 ,
где
к(р) = н;(р1-А)-1г.
Это неравенство непосредственно преобразуется в следующее
72/ - 7Х(2)т Н") М > 0 , 22
которое является эквивалентным (1.1.10) Л Если ввести ос-норму оператора
||И'||оо=ЗиР||ЖМ ||2 ,
и
где 2-норма комплексной матрицы равна максимальному из ее сингулярных чисел, т.е.
||А||2=тахУА(А*А) ,
где А (•) обозначает собственное значение соответствующей матрицы, то неравенство (1.1.10) может быть эквивалентно выражено в виде
1|и?>||«, < 1 • (1.1.Ц)
Следовательно, согласно теореме 1.1.2 для того, чтобы данное допустимое возмущение вида линейной обратной связи по состоянию было наихудшим по отношению к функционалу (1.1.3) с некоторой > 0, необходимо и достаточно, чтобы его матрица возвратной разности имела оо-норму, меньшую или равную 1.
Этот результат в некотором смысле является дуальным хорошо известному частотному условию Калмана [125], которое выделяет устойчивые обратные связи, являющиеся оптимальными для некоторого квадратичного функционала. Кроме того, оказывается, что обратные связи, отвечающие наихудшему возмущению для некоторого функционала вида (1.1.3), обеспечивают устойчивость замкнутой системы при значительных вариациях ее параметров подобно тому, как оптимальные законы управления независимо от весовой матрицы функционала обнаруживают хорошие робастные свойства.
Действительно, пусть в результате возникших изменений или неточности моде,ли вместо (1.1.6) в системе реализуется V = где К,-некоторая квадратная матрица. Вычисляя производную по времени вдоль траектории замкнутой системы от функции V (х) = хтСх. в которой
матрица С согласно теореме 1.1.2 удовлетворяет уравнению (1.1.7) для некоторой Q > О, получим
V = -xTQx - 7-2#v (I - Kv - Kj) Щ .
Таким образом, при выполнении частотного условия (1.1.10) для любых Ки. удовлетворяющих матричному неравенству
Kv + КJ < I ,
матрица замкнутой системы А + 7~2FI(vHJ остается устойчивой.
Полученные в этом разделе результаты станут основой для решения обратной задачи линейно-квадратичной дифференциальной игры, к которой мы переходим.
1.1.2 Обратная задача минимаксного управления и наихудшего возмущения
Пусть управляемый объект, на который действует возмущение, задан уравнением
х = Ax + Bu + Fv , (1.1.12)
в котором х 6 Ят -измеряемое состояние, и £ Rk - управление, v £ В1 -неизмеряемое возмущение, удовлетворяющее условию (1.1.2), и матрица А уже не предполагается устойчивой. Примем, что качество переходного процесса в системе с учетом управления и возмущения характеризуется значением функционала
h (u, v) = /о°° (xTQux + иТи - j2vTv) dt , (1.1.13)
в котором Qu = Qu > 0 и 7 ф 0. Наша основная задача будет состоять в выявлении свойств минимаксного управления, определяемого как
u* = arg min max J2 (11. v ) ,
не зависимых от конкретной весовой матрицы Qu.
Вначале, как и в предыдущем разделе, применим локальный подход для нахождения минимаксного управления. Введем локальный критерий
ф(«,г>) =V + uTu-y2vTv , (1.1.14)
в котором V - производная некоторой целевой функции V (х) — хгСх. где С = Ст > 0, вычисленная по траектории (1.1.12). Определим локально наихудшее возмущение условием
vi = arg max Ф (г/, v)
и локально минимаксное управление - условием
щ = arg min max Ф (г/, v)
Так как
Ф (и, v) = 2 хтС (Ах + В и + Fv) + ити - y2vTv ,
то, вычисляя градиент этой функции по г>, найдем локально наихудшее возмущение
Щ — HV = CF , (1.1.15)
при котором
max Ф (и. v) = 2хтС [Ах + Ви) + ити + y~2xTCFFTCx .
Дифференцируя последнее выражение по и. найдем локально минимаксное управление
щ = -Hlx , Ни = СВ , (1.1.16)
при котором
ггт
liiinmax Ф (и, v) = —х Qx ,
где
Q = -АТС - CA + СВВТС - j-2CFFtC . (1.1.17)
Теперь из (1.1.14) следует, что
• . ^ / о \ т \ т л т* 2 т1
V = (и — щ) (и — щ) — 7 (г; — г?/) (г> — г;/) — х ц)х — гт гг + у V V .
Интегрируя это уравнение и предполагая, что матрица замкнутой системы (1.1.12),(1.1.15),(1.1.16)
Аг = А - ВЕти + 7(1.1.18)
является устойчивой, приходим к следующему утверждению.
Теорема 1.1.3 Пусть неотрицательно определенные симметрические матрицы С и удовлетворяют уравнению (1.1.17) и при Ни = С В , Нь = С Г матрица (1.1.18) является устойчивой. Тогда наихудшее возмущение и минимаксное управление для функционала (1.1.13), в котором = будут соответственно совпадать с локально наихудшим возмущением (1.1.15) и локально минимаксным управлением (1.1.16), при которых
тртах /2 (и, V) = х$Схо .
Отметим, что для рассматриваемой вариационной задачи необходимые условия оптимальности заключаются в том, что искомые управление и возмущение должны удовлетворять минимаксу для гамильтониана
Я (ж, и, у, = /1Т (Ах + Ви + Г у) + 0,5 (хтС£их + ити - у2уту) ,
т.е. должны быть вида
и = -Втр , у = 7~2-Рт// •
Подставляя /1 = Сх в уравнения Эйлера-Лагранжа для этой задачи
гр
х = Ах + Ви + Ру , р = —(¡}их — А ц ,
непосредственно убеждаемся в том, что матрица С удовлетворяет уравнению (1.1.17). Тем самым сформулированные в теореме 1.1.3 условия
являются также необходимыми условиями минимакса для функционала (1.1.13).
Теперь мы можем сформулировать обратную задачу: при каких условиях локально наихудшее возмущение (1.1.15) и локально минимаксное управление (1.1.16), синтезированные по выбранной целевой функции V (х) = хтСх, являются соответственно наихудшим возмущением и минимаксным управлением по отношению к некоторому функционалу (1.1.13) с <5« > 0 ?
Для ответа на этот вопрос вычислим Ни = СВ. Нт = СТ. введем матрицу
Аи = А-ВН1 (1.1.19)
и преобразуем уравнение (1.1.17) к виду
д = -АтиС - САи - , (1.1.20)
где Ну — (7Ни , Ню). С учетом этого рассматриваемая задача может быть переформулирована следующим образом: когда выбранная матрица Нг) отвечает согласно равенству Ну = С (7В , Р) некоторой матрице С = Ст > 0 - решению уравнения (1.1.20) при (¡) > 0? Сравнение этой задачи с рассмотренной выше обратной задачей о наихудшем возмущении показывает, что они совпадают при замене в последней матриц А , Г , Н, на Аи , (7Б, 1Г) , (7Ни:Ну) соответственно. При этом матрица (1.1.9) примет вид
П'иг (Р) = / - 7~2 № , НУ)Т (Р1 - А«)-1 (7В , Г) , (1.1.21)
а матрица (1.1.8) станет вида
Ау = А + 1-2РН? . (1.1.22)
Управляемость пары (Аи , (Б, Г)) следует из управляемости, по крайней мере, одной из пар (А ,£) или (А , .Р), поэтому из теоремы 1.1.2 непосредственно следует
Теорема 1.1.4 Пусть для системы (1.1.12), в которой, по крайней мере, одна из пар (А ,В) или (А , Р) является управляемой, выбраны матрицы Ни и Ну такие, что матрицы (1.1.19) и (1.1.22) являются устойчивыми. Тогда выполнение неравенства
||ИУ|оо < 1 , (1.1.23)
в котором матрица Шт(р) задана в (1.1.21), является необходимым и достаточным условием того, что возмущение (1.1.15) и управление (1.1.16) являются соответственно наихудшим возмущением и минимаксным управлением по отношению к функционалу (1.1.13) с > 0.
Интересно отметить, что в пределе при у —> оо неравенство (1.1.23) сводится к неравенству
\\1 - Н? (Р1 - Аи)~1 ВЦос < I ,
выполнение которого с учетом (1.1.19) и известной леммы об обращении матриц эквивалентно тому, что для всех и € (—оо.оо) должно выполняться
(-га;) («а/) > / , (1.1.24)
где
Ш^(р) = 1 + Н1(р1-АГ1В.
Из (1.1.21) также следует, что неравенство (1.1.24) с необходимостью должно выполняться для минимаксного управления и при произвольном конечном 7. Вместе с тем (1.1.24) означает, что абсолютная величина обратной ошибки управления (1.1.16), по крайней мере, равна единице на всех частотах и, как доказано в [125], является необходимым и достаточным условием оптимальности этого закона управления по отношению к функционалу вида
/з (и) = /о°° (хТЯих + ити) 6Л (1.1.25)
с некоторой С1и — > 0. Таким образом, множество всех устойчивых линейных обратных связей данного объекта (1.1.12) включает в себя множество всех оптимальных законов управления (когда возмущение V отсутствует) по отношению к функционалу вида (1.1.25), выделяемых условием (1.1.24), а последнее множество, в свою очередь, включает в себя множество всех минимаксных законов управления по отношению к функционалу вида (1.1.13), определяемых условием (1.1.23).
Стоит также заметить, что решение рассмотренной в этом разделе обратной задачи наихудшего возмущения и минимаксного управления может быть получено и не опираясь на решение обратной задачи наихудшего возмущения. Действительно, возмущение (1.1.15) и управление (1.1.16) являются соответственно наихудшим возмущением и минимаксным управлением по отношению к функционалу (1.1.13) с > С^*, где
>0 - некоторая заданная матрица, тогда и только тогда, когда существует матрица С = Ст > 0 такая, что СБ = Ни ,СГ = Нь и
АТС + С А - НиЩ + 7 ~'гНуЩ + <Э* < 0 .
Эти условия могут быть эквивалентно записаны в виде линейного матричного неравенства
( АТС + СА - НиН1 + Т2НУЩ + СВ-Ни СГ-ЯИ
(СБ - Ни)т 0 О
(СТ - Н,)т 0 0
или в виде имеющего место для всех комплексных (х, и, и) неравенства
2Бех*С {Ах + Ви + Гь) - Ф {х, и, у) < 0 ,
гТ
гТ
< о
в котором
Ф (я, и, V) = (и + Н1х)Т [и + Нтих) - 72 (V - Т2Н?х)Т (ь - ч^Н^х)
—ити + 72уту — хт(^*х .
Введем вспомогательные переменные
1Л = и + Н1х , У2 = у- 7~2Щх , 2/3 =
и найдем передаточные матрицы системы (1.1.12) от входов (и, у) к выходам (2/1,2/2,2/3)
И^ (р) = (/ + #иг (р/ - А)"1 В , (р/ - А)"1 Г) , Ж, (р) = {-Т2Щ (Р1 - А)'1 В , / - (р/ - А)"1 ,
Теперь, непосредственно применяя частотную теорему [81], выразим условия существования требуемой матрицы С следующим образом.
Теорема 1.1.5 В условиях теоремы 1.1.4 выполнение неравенства (-¡и) \¥и (ш) - 72РК(г (-ш) 147 М - (-ги) ^ (ш)
является необходимым и достаточным условием того, что возмущение (1.1.15) и управление (1.1.16) являются соответственно наихудшим возмущением и минимаксным управлением по отношению к функционалу (1.1.13) с Яи > <5*.
В качестве примера для объекта первого порядка
х = ах + и + V (1.1.27)
найдем условия, при которых заданные управление и возмущение вида
и = —Ь,их , V = у~2кух (1.1.28)
будут соответственно минимаксным управлением и наихудшим возмущением по отношению к функционалу
Д (и, V) = (дг2 + и2 - 7 V) <И
при некотором д > 0. Согласно вышеизложенному для этого, во-первых, должны выполняться условия устойчивости, которые в данном случае принимают вид
К > а , К < -72а , (1.1.29)
и, во-вторых, должно выполняться частотное неравенство (1.1.23), в котором для рассматриваемого примера
1 р — а —7 1Н
р - (а - Ни) ^ -7~1/гг, р - а
где а = а — Ни + 7~2/гг,. Нетрудно проверить, что в данном случае неравенство (1.1.23) выполняется тогда и только тогда, когда
Ни = К = Н , Н [И (1 - 7~2) - 2а] > 0 .
Поэтому, учитывая (1.1.29), приходим к заключению о том, что выбранные в (1.1.28) управление и возмущение будут соответственно минимаксным управлением и наихудшим возмущением тогда и только тогда, когда
Ии = 1гу — Н , а < 0 , 0 < И < —7~2а .
С другой стороны, если возмущения в системе (1.1.27) отсутствуют, то из (1.1.24) следует, что произвольная обратная связь и = —Их при к > 0, когда а < 0, и при Н > 2а, когда а > 0, может быть оптимальной для некоторого функционала (1.1.25) с положительным весовым коэффициентом.
1.2 Обратная задача минимаксного управления
Рассмотрим систему
х = Ах + Ви + Ру , (1.2.1)
где х G Rm - состояние, и G Rk - управление, и G Rl - возмущение. Пусть качество ее функционирования характеризуется значением функционала
оо
J (u, v) = I (xTQx + ити - ~?vTv) dt , (1.2.2)
о
где Q = QT > 0 - неотрицательно-определенная симметрическая матрица, 7^0- некоторое число. Как известно, например из [38], минимаксное управление, которое минимизирует (1.2.2) при наихудшем, максимизирующем его возмущении, определяется по формуле
и = -в^х, в* = СВ, (1.2.3)
в которой матрица С является решением уравнения Лурье - Риккати
АТС Л-CA- СВВТС + 7 ~2CFFtC = -Q . (1.2.4)
При этом матрица А — ВВТС оказывается устойчивой и
min max J (u, v) = хт (0) Сх (0) . (1.2.5)
Так как верны следующие неравенства
min max J(u,v) > min J(u. 0) > 0 ,
u v V' / — u \ ' / —
то при выполнении сбщих системных требований матрица С является неотрицательно определенной. Таким образом, построение минимаксного регулятора требует или нахождения неотрицательно определенного решения соответствующего матричного уравнения (1.2.4) или реализации процедуры факторизации для получения его передаточной матрицы.
Замечание 1.2.1 Отметим, что при минимаксном управлении (1.2.3) и наихудшем возмущении v = 7" -2FtCx имеет место соотношение
min max (V + иТи — y2vTv) — —xTQx ,
в котором V - производная функции V (х) = хТСх по траектории (1.2.1). Эту функцию в дальнейшем будем называть оптимальной функцией Ляпунова для соответствующей задачи.
Поставим обратную задачу о нахождении условий, при которых данная обратная связь
и = -9Тх (1.2.6)
является минимаксным законом управления по отношению к некоторому функционалу вида (1.2.2) с весовой матрицей С} = 0>г > 0. С учетом сказанного выше, это будет иметь место, если существует С = Ст > 0 такая, что С В = 9 и выполнено неравенство
АТС + СА- ввт + 7~2СРГТС < 0 .
Учитывая известные условия неотрицательной определенности блочной матрицы, эти условия эквивалентны выполнению для некоторой С = Ст > 0 следующего линейного матричного неравенства
/
АтС + СА-вОт СВ-9 С Г \ (СВ -9)т 0 0
V 0 -7 21 /
< 0 .
Решение поставленной задачи в терминах матрицы возвратной разности, определяемой как передаточная матрица разомкнутой системы (1.2.1) от входов («, и) к выходу У\ = и + 9тх
Жи(р) = ^(р)М2Чр)) , (1.2.7)
где
Т^1) (р) = I + 9Т (Р1 - АУ1 В , ЦТ® (р) = 9Т {Р1 - А)'1 Р , дается в следующей теореме.
Теорема 1.2.1 Закон управления (1.2.6), при котором матрица Ас = А — ВвТ - гурвицева, является минимаксным для (А, В) управляемой сист,емы (1.2.1), где В = (В, Р), и некоторого функционала (1.2.2)
с Q = QT > 0 тогда и только тогда, когда при всех и> Е (—оо, оо), для которых det (icol — Á) ф 0, выполняется неравенство
WPT (-iu) [I + 7-2^i2) (iu>) (-га;)]-1 W™ (iu) > I . (1.2.8)
Доказательство теоремы 1.2.1. Согласно (1.2.3), (1.2.4) для того, чтобы закон управления (1.2.6) был минимаксным, необходимо и достаточно существования такой неотрицательно-определенной матрицы С = СТ, для которой С В = 9 и выполнено матричное неравенство
АТС + С А + 1~2CFFtC - в9т < 0 .
Так как из этого неравенства следует, что
АтсС + САс < -7-2CFFtC - 9вт ,
и по условию матрица Ас - гурвицева, то искомая матрица С, если она существует, должна быть неотрицательно-определенной, а в случае наблюдаемости пары (А, в) - положительно определенной. С учетом этого задача сводится к нахождению условий существования эрмитовой матрицы С, удовлетворяющей для всех комплексных х и £* == (и*, v*) соотношению
2Rex*C [Ах + (В, F) £] - Ф (х, f) < 0 ,
где
Ф(ж,£) = 2Rex*(e,Q)£ + x*ee*x + y2v*v < 0 .
В соответствии с частотной теоремой [81] для этого необходимо и достаточно, чтобы для всех £ и о; 6 (—оо,оо),за исключением Uj, для которых det (iujjl — А) = 0, выполнялось неравенство
Ф {(iul - A)-1 (B,F)S,Z]> 0 , 34
которое после некоторых преобразований переходит в (1.2.8). Теорема доказана. ■
Замечание 1.2.2 Если пара (А, 9) - наблюдаема, то матрица С в соответствующей минимаксной задаче является положительно определенной.
Замечание 1.2.3 Множество всех матриц в, для которых закон управления (1.2.6) является минимаксным, в терминах передаточных матриц замкнутой системы определяется с помощью имеющего место при всех ш £ (—ос, оо) неравенства
И#с>г {-¡и) [I - т"2^) (¿а,) И*2 с>г (-¡и)}'1 У?™ (ш) < I ,
в котором
цг11е) (р) = 1 + 9Т(р1- Ас)-1 В , УУ™ (р) = 9Т (Р1 - Ас)-1 ^ .
Замечание 1.2.4 Частотное условие (1.2.8), учитывая (1.2.7), может быть эквивалентно выражено в следующем виде
^ | - (1.2.9)
Как было показано выше, данная пара линейных обратных связей и = —9Тх и V = ~/~2(тх является соответственно минимаксным управлением и наихудшим возмущением для некоторого функционала вида (1.2.2) тогда и только тогда, когда выполнено частотное условие
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Синтез оптимальных и робастных алгоритмов с параллельной обработкой информации для задач децентрализованного управления динамическими системами2005 год, доктор технических наук Лыченко, Наталья Михайловна
Минимизация влияния параметрических неопределенностей и внешних возмущений методами адаптивного и стохастического робастного управления2001 год, доктор технических наук Курдюков, Александр Петрович
Вычислительные методы анизотропийного анализа и синтеза оптимального управления для систем с неопределенностью2007 год, кандидат физико-математических наук Чайковский, Михаил Михайлович
Управление нелинейными многосвязными объектами в условиях неопределенности2010 год, доктор технических наук Медведев, Михаил Юрьевич
Адаптивное и робастное децентрализованное управление многосвязными объектами с односвязными подсистемами2007 год, доктор технических наук Паршева, Елизавета Александровна
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Коган, Марк Михайлович
Основные результаты диссертации
• Доказано, что робастными, абсолютно стабилизирующими и Н^ субоптимальными законами управления для рассматриваемых классов неопределенных объектов являются минимаксные законы управления в дифференциальной игре против искусственного возмущения для полностью определенной вспомогательной системы и целевого функционала некоторого вида, а функцией Ляпунова для исходной неопределенной системы является функция Беллмана этой игры. Для нелинейных систем эти законы управления выражены в терминах решений нелинейных уравнений или неравенств Гамильтона-Якоби, а для линейных систем - в терминах решений матричных уравнений или неравенств Лурье-Риккати, а также в виде линейных матричных неравенств.
• Показано, что задача синтеза робастных, абсолютно стабилизирующих и Н0о субоптимальных регуляторов может быть рассмотрена как обратная задача минимаксного управления. Получены проверяемые условия для данной обратной связи, при выполнении которых она соответствует требуемому закону управления, что исключает необходимость решения нелинейных неравенств или уравнений. Для нелинейных аффинных по входам неопределенных систем эти условия выражаются в виде интегральных неравенств, а для систем Лурье и линейных систем - в виде линейных матричных неравенств или частотных .условий.
• Решены обратные вариационные задачи наихудшего возмущения, дифференциальной игры и минимаксного управления для нелинейных аффинных по входам динамических систем и для линейных непрерывных и дискретных систем, а также обратная задача оптимального управления для линейных дискретных систем.
• Установлено, что при идентификации методом наименьших квадратов в общей задаче линейной регрессии, когда не выполнены условия теоремы Гаусса-Маркова о состоятельном оценивании, имеет место сходимость оценок к многообразию, на котором дисперсия ошибки прогноза принимает минимальное значение. Показано, что при идентификации в замкнутых системах управления, когда параметры регулятора являются функциями оценок неизвестных параметров объекта, существуют локально-оптимальные законы управления, инвариантные на этом многообразии.
• Для линейных стохастических объектов синтезировано адаптивное локально-оптимальное управление, основанное на идентификации рекуррентным методом наименьших квадратов и не требующее для своей реализации идентифицируемости параметров объекта. Получены дифференциальные уравнения, описывающие динамику оценок в этой адаптивной системе, и доказано существование глобально притягивающего предельного многообразия, на котором реализуется локально-оптимальный закон управления неизвестным объектом.
8 Заключение
В диссертации разработан новый метод синтеза робастных, абсолютно стабилизирующих и Н^ субоптимальных регуляторов, основанный на минимаксном подходе и обратных вариационных задачах, применимый для классов неопределенных аффинных по входам нелинейных непрерывных систем, нелинейных непрерывных и дискретных систем Лурье, линейных непрерывных и дискретных систем с неизвестными нестационарными параметрами, а также выяснены особенности идентификации методом наименьших квадратов в отсутствие идентифицируемости объекта. Это позволило получить следующие результаты.
Список литературы диссертационного исследования доктор физико-математических наук Коган, Марк Михайлович, 1998 год
Список литературы
[1] Айзеке Р. Дифференциальные игры. М.: Мир, 1967.
[2] Айзерман М.А., Гантмахер Ф.Р. Абсолютная устойчивость регулируемых систем. М.: Изд-во АН СССР, 1963.
[3] Барабанов А.Е. Применение метода наименьших квадратов для построения адаптивного оптимального управления линейным динамическим объектом// Автоматика и телемеханика. 1983. N 12. С. 57-65.
[4] Барабанов А.Е., Первозванский A.A. Оптимизация по равномерно-частотным показателям (Я"-теория)//Автоматика и телемеханика. 1992. N 9. С. 3-32.
[5] Барабанов Н.Е. О стабилизации линейных нестационарных систем с неопределенностью в коэффициентах//Автоматика и телемеханика. 1990. N 10. С. 30 - 37.
[6] Баркин А.И., Зеленцовский А.iL, Пакшин П.В. Абсолютная устойчивость детерминированных и стохастических систем управления. AI.: Изд-во МАИ, 1992.
[7] Бобылев H.A., Емельянов C.B., Коровин С.К. Оценки возмущений устойчивых матриц//Автоматика и телемеханика. 1998. N 4. С. 1524.
[8] Бруспн В.А. Уравнения Лурье в гильбертовом пространстве и их разрешимость// Прикладная математика и механика. 1976. Т. 40. С. 947-956.
[9] Бруспн В.А. Частотные условия Н^-управления и абсолютной стабилизации//Автоматика и телемеханика. 1996. N 5. С. 17-25.
[10] Гелиг А.Х., Леонов Г.А., Якубович В.А. Устойчивость нелинейных систем с неединственным состоянием равновесия. М.: Паука, 1978.
[11] Дарховский B.C., Магарил-Ильяев Г.Г. О методе локальной оптимизации для управления динамическими системами//Доклады АН СССР. 1984. Т.274. С. 273-275.
[12] Дезоер Ч., Видьясагар М. Системы с обратной связью: входо-выходные соотношения. М.: Наука, 1983.
[13] Джури Е.И. Робастность дискретных систем//Автоматика и телемеханика. 1990. N 5. С. 3-28.
[14] Деревицкий Д.П., Фрадков А.Л. Две модели для анализа динамики адаптивных алгоритмов//Автоматика и телемеханика. 1974. N 1. С. 65-75.
[15] Емельянов C.B., Коровин С.К., Никитин C.B. Управляемость нелинейных систем на слоении//Док лады АН СССР. 1988. Т. 299. N 3. С. 573-576.
[16] Емельянов C.B., Коровин С.К. Новые типы обратной связи. Управление при неопределенности. М.: Наука, Физматлит, 1997.
[17] Коган М.М. Решение обратных задач о наихудшем возмущении и минимаксном управлении для линейных непрерывных систем // Автоматика и телемеханика. 1997. N 4. С. 22-30.
[18] Коган М.М. Синтез минимаксного управления неопределенной системой на основе решения обратной вариационной задачи // Дифференциальные уравнения. 1997. Т. 33. N 8. С.1141-1142.
[19] Коган М.М. Локально-минимаксное и минимаксное управления линейными дискретными системами // Автоматика и телемеханика. 1997. N 11. С. 33-44.
[20] Коган М.М. Решение обратных задач минимаксного и минимаксно робастного ^управлений // Автоматика и телемеханика. 1998. N 3. С. 87-97.
[21] Коган М.М. Решение некоторых обратных вариационных задач для нелинейных систем управления // Вестник ННГУ. Математическое моделирование и оптимальное управление./Под ред. Р.Г.Стронгина - Н.Новгород: Изд-во Нижегородского ун-та, 1998. N 1(18). С.161-177.
[22] Коган М.М. Когда линейная система управления является минимаксной? Доклады РАН. 1998. Т. 360. N 2. С. 179-181.
[23] Коган М.М. Теоретико-игровой подход к синтезу робастных регуляторов // Автоматика и телемеханика. 1998. N 5. С. 142-151.
[24] Коган М.М. Оптимальные робастные законы управления линейными непрерывными системами. Доклады РАН. 1998. ТЗа. ¿1.
[25] Коган М.М. Решение обратных задач минимаксного и Н^ субоптимального управлений для линейных непрерывных систем / / Тезисы докладов IV Международного семинара "Устойчивость и колебания нелинейных систем управления". Москва, ИПУ РАН, 1996. С.113.
[26] Коган М.М. О построении функций Ляпунова и абсолютно стабилизирующих регуляторов для систем Лурье методами теории дифференциальных игр // Тезисы докладов V Международного семинара "Устойчивость и колебания нелинейных систем управления". Москва. ИПУ РАН, 1998. С.53.
[27] Коган М.М., Неймарк Ю.И. Адаптивное локально-оптимальное управление // Автоматика и телемеханика. 1987. N 8. С.126-136.
[28] Коган М.М., Неймарк Ю.И. Исследование идентифицируемости в адаптивных системах управления методом усреднения / / Автоматика и телемеханика. 1989. N 3. С. 108-116.
[29] Коган М.М., Неймарк Ю.И. Идентифицируемость локально-оптимальных адаптивных законов управления при косвенных наблюдениях // Автоматика и телемеханика. 1990. N 1. С.65-75.
[30] Коган М.М., Неймарк Ю.И. Об оптимальности локально-оптимальных решений линейно-квадратичных задач управления и фильтрации // Автоматике и телемеханика. 1992. N 4. С.101-110.
[31] Коган М.М., Неймарк Ю.И. Адаптивное управление стохастическим объектом с неизмеряемым состоянием в условиях неидентифицируемости // Автоматика и телемеханика. 1992. N 6. С.114-122.
[32] Коган М.М., Неймарк Ю.И. Идентификация рекуррентным методом наименьших квадратов при невыполнении условий теоремы Гаусса-Маркова // Известия РАН. Техническая кибернетика. 1993. N 4. С. 29-34.
[33] Коган М.М., Неймарк Ю.И. Локально-оптимальное адаптивное управление линейным стохастическим объектом с неизмеряемым состоянием// Известия РАН. Техническая кибернетика. 1993. N 6. С. 48-53.
[34] Коган М.М., Неймарк Ю.И. Функциональные возможности адаптивного локально-оптимального управления // Автоматика и телемеханика. 1994. N 6. С. 94-105.
[35] Коровин С.К., Мамедов И.Г., Носов А.П. Стабилизация неопределенных систем на кольцах// В кн. Математическое моделирование/ Ред. кол. А.Н.Тихонов, В.А.Садовничий и др., М.: МГУ, 1993. С. 279-295.
[36] Коровин С.К., Нерсисян А.Л., Нисензон Ю.Е. Управление по выходу линейными неопределенными объектами// Известия АН СССР. Техническая кибернетика. 1990. N 1. С. 67-73.
[37] Короткий А.И. Обратные задачи динамики управляемых систем с распределенными параметрами//Известия вузов. Математика. 1995. N 11. С. 101-124.
[38] Красовскнй H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.
[39] Красовскнй H.H. Управление динамической системой. М.: Наука, 1985.
[40] Кргпценко А.П. Исследование управляемости и множеств достижимости нелинейных систем управления// Автоматика и телемеханика. 1984. N 6. С. 30-36.
[41] Кульчицкий О.Ю. Адаптивное управление линейным динамическим объектом с помощью модифицированного метода наименьших квадратов// Автоматика и телемеханика. 1987. N 1. С. 89-105.
[42] Куржанскнй А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977.
[43] Лурье А.И., Постников В.Н. К теории устойчивости регулируемых систем//Прикладная математика и механика. 1944. Т. 8, вып. 3.
[44] Лурье А.И. Некоторые нелинейные задачи теории автоматического регулирования. М.: Гостехиздат, 1951.
[45] Меерков С.М. Об упрощенном описании медленных марковских блужданпп.1// Автоматика и телемеханика. 1972. N 3. С. 66-75.
[46] Мейлахс A.M. О стабилизации линейных управляемых систем в условиях неопределенности//Автоматика и телемеханика. 1975. N 2. С. 182 - 184.
[47] Неймарк Ю.И. Динамические системы и управляемые процессы. М.: Наука, 1978.
[48] Неймарк Ю.И. Робастная устойчивость линейных систем// Доклады АН СССР. 1991. Т.319. N 3. С. 578-580.
[49] Неймарк Ю.И. Мера робастной устойчивости и модальности линейных систем// Доклады АН СССР. 1992. Т.325. N 2. С. 578-580.
[50] Неймарк Ю.И. Область робастной устойчивости и робастность по нелинейным параметрам//Доклады АН СССР. 1991. Т.325. N 3. С. 438-440.
[51] Неймарк Ю.И. Робастная интервальная матричная устойчивость// Автоматика и телемеханика. 1994. N 7. С. 132-137.
[52] Пакшин П.В. Дискретные системы со случайными параметрами и структурой. М.: Наука, 1994.
[53] Первозванский A.A., Чечурин Л.С. Синтез обратной связи по критерию робастности с помощью уравнений Риккати//Автоматика и телемеханика. 1997. N И. С. 152-161.
[54] Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков С.Д. Принципы построения и проектирования самонастраивающихся систем управления. М.: Машиностроение, 1972.
[55] Понтрягин Л.С. О линейных дифференциальных играх 1// Доклады АН СССР. 1967. Т.174. N 6. С. 1278-1280.
[56] Понтрягин Л.С. О линейных дифференциальных играх 2// Доклады АН СССР. 1967. Т.175. N 4. С. 764-766.
[57] Позняк A.C., Семенов A.B., Себряков Г.Г., Федосов Е.А. Новые результаты в теории управления//Техническая кибернетика. 1991. N б. С. 10-39.
[58] Поляк Б.Т., Цыпкин Я.З. Частотные критерии робастной устойчивости и апериодичности линейных систем//Автоматика и телемеханика. 1990. N 9. С. 45-54.
[59] Поляк Б.Т., Цыпкин Я.З. Робастная устойчивость при комплексных возмущениях параметров//Автоматика и телемеханика. 1991. N 8. С. 45-55.
[60] Попов В.М. Гиперустойчивость автоматических систем. М.: Наука, 1970.
[61] Пятницкий Е.С. Абсолютная устойчивость нестационарных нелинейных систем// Автоматика и телемеханика. 1970. N 1. С. 5-15.
[62] Пятницкий Е.С., Скородинский В.И. Численный метод построения функций Ляпунова и критериев абсолютной устойчивости в виде численных процедур// Автоматика и телемеханика. 1983. N 11. С. 52-63.
[63] С'рагович В.Г. Адаптивное управление. М.: Наука. 1981.
[64] Соколов В.Ф. Адаптивное робастное управление дискретным скалярным объектом в 1\-постановке// Автоматика и телемеханика. 1998. N 3. С. 107-131.
[65] Угрпновский В.А. О робастностп линейных систем со случайно изменяющимися во времени параметрами//Автоматика и телемеханика. 1994. N 4. С. 90-99.
[66] Фомин В.Н.. Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981.
[67] Фомин В.Н. Методы управления линейными дискретными объектами. Л.: Изд-во ЛГУ, 1985.
[68] Фрадков А.Л. Схема скоростного градиента и ее применение в задачах адаптивного управления//Автоматика и телемеханика. 1979. N 9. С. 96-101.
[69] Фрадков А.Л. Интегродифференцирующие алгоритмы скоростного градиента// Доклады АН СССР. 1986. Т. 268. N 4. С. 798-801.
[70] Фрадков А.Л. Адаптивное управление в сложных системах. М.: Наука, 1990.
[71] Халанай А., Векслер Д. Качественная теория импульсных систем. М.: Мир, 1971.
[72] Харитонов В.Л. Асимптотическая устойчивость семейства систем линейных дифференциальных уравнений// Дифференциальные уравнения. Т.Н. N 11. С. 2086-2088.
[73] Цыпкин Я.З. Адаптация и обучение в автоматических системах. М.: Наука, 1968.
[74] Цыпкин Я.З. Основы информационной теории идентификации. М.: Наука, 1984.
[75] Цыпкин Я.З., Поляк Б.Т. Робастная устойчивость линейных систем// Итоги науки и техники. Техническая кибернетика. М.: ВИНИТИ. 1991. Т. 32. С. 3-31.
[76] Черноусько Ф.Л. Оценивание фазового состояния динамических систем. М.: Наука, 1988.
[77] Якубович В.А. Решение некоторых матричных неравенств, встречающихся в теории автоматического регулирования.//Доклады АН СССР. 1962. Т. 143. N 6.
[78] Якубович В.А. Частотные условия абсолютной устойчивости регулируемых систем с гистерезисными нелинейностями//Доклады АН СССР. 1963. Т. 149. N 2.
[79] Якубович В.А. Конечно-сходящиеся алгоритмы решения счетных систем неравенств и их применение в задачах адаптивных си-стем//Доклады АН СССР. 1969. Т. 189. С. 495-498.
[80] Якубович В.А. 5-процедура в нелинейной теории регулирования// Вестник ЛГУ, сер. физ., мат., астр. 1971. N 1.
[81] Якубович В.А. Частотная теорема в теории управления// Сибирский математический журнал. 1973. N 2. С. 384-420.
[82] Abdul-Wanab А.-А. Lyapimov stability robustness measures for multivariable, continuous, time-invariant, linear systems//Int. J. Systems Sci., 1990. V. 21. P. 2577-2587.
[83] Ackennan J. Robust control: systems with uncertain physical parameters. London: Springer-Verlag, 1993.
[84] Amato F.. Pironti A., Scala S. Necessary and sufficient conditions for quadratic stability and stabilizability of uncertain linear time-varying systeuis//IEEE Transactions oil Automatic Control. 1996. V. 41. P. 125-128.
[85] Anderson B.D.O., Moore J.B. Linear optimal control. Englewood Cliffs, N.J.: Prentice-Hall, 1971.
[86] Anderson B.D.O., Johnson C.R.Jr. Exponential convergence of adaptive identification and control algorithms//Automatica. 1982. V. 18. P. 1-13.
[87] Anderson B.D.O., Bitmead R.R., Johnson C.R.Jr., Kokotovic P.V., Kosut R.L., Mareels I.M.Y., Praly. L., Riedle B.D. Stability of Adaptive Systems: Passivity and Averaging Analysis. The MIT Press, MA , 1986.
[88] Artstein Z. Stabilization with relaxed controls//Nonlinear Anal. 1983. V. 7. P.1163-1173.
[89] Astrom K.J., Borisson U., Ljung L., Wittenmark B. Theory and apphcation of self-tuning regulators//Automática. 1977. V. 13. P. 457476.
[90] Ball J.A., Helton J.W., Walker M.L. H^ control for nonlinear systems with output feedback// IEEE Transactions on Automatic Control. 1993. V. 38. P. 546-559.
[91] Barabanov A.E. Canonical matrix factorization and polynomial Riccati equations//European Journal of Control. 1997. V. 3. P.47-67.
[92] Barmish B.R. Stabilazation of uncertain systems via linear control//IEEE Transactions on Automatic Control. 1983. V. 28. P. 848 - 850.
[93] Barmish B.R. A generalization of Kharitonov's four polynomial concept for robust stability problems with linearly dependent coefficients perturbations//IEEE Transactions on Automatic Control. 1989. V. 34. P. 157-165.
[94] Barmish B.R. New tools for robustness of linear systems. N.Y.: Macmillan, 1994.
[95] Bartlett A.C., Hollot C.V., Lin H. Root location of an entire polytope of polynomials: it suffices to check the edges// Math. Contr., Signals, Systems. 1988 V. 1. P. 61-71.
[96] Basar T., Bernhard P. í/oo-optimal control and related minimax design problems: a dynamic game approach.. 2nd ed. Birkhauser Boston.1995.
[97] Bernstein D.S., Haddad W.M. Robust stability and performance analysis for state-space systems via quadratic Lyapunov bounds// SI AM J. Matrix Anal. 1990. V. 11. P. 239-271.
[98] Bliattacharyya S.P. Robust stabilization against structured perturbations. N.Y.: Springer, 1987.
[99] Boyd S.. Ghaoui L.E., Feron E., Balakrishnan V. Linear matrix inequalities in system and control theory. Philadelphia: SIAM, 1994.
[100] Brusin V. A., Ugrinovskii V. A. Absolute stability approach to stochasic stabilit}' of infinite-dimensional nonlinear systems//Automatica. 1995. V. 31. P. 1453-1458.
[101] de Callafon R.A., van den Hof P.M.J., Bongers P.M.M. A unified approach to stability robustness for uncertainty descriptions based fractional model representations// IEEE Transactions Automatic-Control. 1996. V. 41. P. 723-726.
[102] Clien H.F.. Guo L. Optimal adaptive control and consistent parameter estimates for ARMAX model with quadratic cost// SIAM J. Control and Optim. 1987. V. 25. P. 845-867.
[103] Chen H.F. Adaptive quadraic control for stochastic systems. Preprints of papers of 12-th world congress IFAC, Sydney, 1993. V. 10. P. 165-168.
[104] Cohen A.. Slialced U. Robust discrete-time H-¿ control//Int. J. Control. V. 67. P. 213-231.
[105] Corless M.J., Leitmann G. Continuous state feedback guaranteeing uniform ultimate boundedness for uncertain dynamic systems// IEEE Transactions Automatic Control. 1981. V. 26. P. 1139-1144.
[106] Corless M. Control of uncertain nonlinear systems//Journal of Dynamic Systems, Measurement, and Control. 1993. V. 115. P.362-372.
[107] Coron J.-M., Praly L., Teel A. Feedback stabilization of nonlinear systems: sufficient conditions and Lyapunov and input-output techiques// In: Trends in Control (A.Isidori Ed.), Springer, 1995.
[108] Doyle J.C., Glover K., Khargonekar P.P., Fransis B.A. State-space solution to standard H2 and Hoo control problems// IEEE Transactions on Automatic Control. 1989. N 9. P. 831 - 847.
[109] Egardt B. Stability of adaptive controllers. Berlin: Springer-Verlag, 1979.
[110] Francis B.A. A course in H control theory. Lecture Notes in Control and Information Sciences, V. 88. Berlin, Heidelberg: Springer-Verlag, 1987.
[111] Freeman R.A., Kokotovic P.V. Design of 'softer' robust nonlinear control laws// Automatica. 1993. V. 29. P. 1425-1437.
[112] Galiinet P., Apkarian P. A linear matrix inequality approach to H^ control//Int. J. Robust and Nonlinear Control. 1994. V.4. P. 421-448.
[113] Garcia G., Bernussou J., Arzelier D. Robust stabilization of discrete-time linear systems with norm-bounded time-varying uncertainty// Systems and Control Letters. 1994. V. 22. P. 327-339.
[114] Glover K.. Limebeer D.J.N., Doyle E.M., Kasenally E.M., Safonov M.G. A characterization of all solutions to the four block general distance problem//SIAM J. Control and Optimization. 1991. V. 29. P. 283-324.
[115] Goodwin G.C.. Ramadge P., Caines P.E. Discrete time multivariable adaptive control//IEEE Transactions on Automatic Control. 1980. V. 25. P. 449-456.
[116] Goodwin G.C., Ramadge P., Caines P.E. Discrete time stochastic adaptive control//SIAM J. Control and Optim. 1981. V. 19. P. 829853.
[117] Goodwin G.C., Sin K.S. Adaptive filtering, prediction and adaptive control. Engiewood Cliffs, NJ: Prentice-Hall, 1984.
[118] Haddad W.M., Bernstein D.S. Parameter-dependent Lyapunov functions and the discrete-time Popov criterion for robust analysis// Automatica. 1994. V. 30. P. 1015-1021.
[119] Haddad W.M., Bernstein D.S. Parameter-dependent Lyapunov functions and the Popov criterion in robust analysis and synthesis// IEEE Transactions on Automatic Control. 1995. V. 40. P. 536-543.
[120] Ioannom P.A.,Tsakalis K.S.A robust direct adaptive controllers//IEEE Transactions on Automatic Control. 1986. V. 31. P. 1033-1043.
[121] Isidori A. Nonlinear control systems. Springer-Verlag, 1989.
[122] Isidori A.. Astolfi A. Disturbance attenuation and H^ control via measurement feedback in nonlinear systems// IEEE Transactions on Automatic Control. 1992. V. 37. P. 1283-1293.
[123] Isidori A., Tarn T.J. Robust regulation for nonlinear systems with gain-bounded uncertainties//IEEE Transactions on Automatic Control. 1995. V. 40. P. 1744-1754.
[124] Iwasaki T.. Skelton R.E. All controllers for the general H00 control problem: LMI existence conditions and state space formulas// Automatica. 1994. V. 30. P. 1307-1317.
[125] Kahnan R.E. When is a linear control system optimal ?// Transactions ASME J. Bas. Eng. 1964. V. 86. P. 1-10.
[126] Khalil H.K. Nonlinear systems. Macmillan Publishing Company, 1992.
[127] Khargonekar P.P., Petersen I.R., Zhou K. Robust stabilization of uncertain linear systems: Quadratic stabilizability and Hx control theory//IEEE Transactions on Automatic Control. 1990. V. 35. P. 356361.
[128] Kogan M.M. and Ju.I.Neimark. Locally-optimal adaptive control without persistent excitation // Preprints of 12th World Congress IFAC, Sydney. 1993. V. 2. P.71-77.
[129] Kogan M.M. and Ju.I.Neimark. Estimating the locally-optimal control in closed-loop adaptive systems // Preprints of 10th IFAC Symposium on System Identification, Copenhagen. 1994. V. 3. P. 543-548.
[130] Kogan M.M. and Ju.I.Neimark. The attracting manifold of slow identification in adaptive control systems // Proceedings of the 33rd IEEE Conference on Decision and Control, Lake Buena Vista, USA. 1994. V. 3. P.2201-2202.
[131] Kogan M.M. and Ju.I.Neimark. A family of multistep locally-optimal controls // Proceedings of the third European Control Conference, Rome. 1995. V. 4. Part 2. P.3616-3619.
[132] Kogan M.M. and Ju.I. Neimark. Locally optimal adaptive control without persistent excitation // Automatica (The Journal of the International Federation on Automatic Control). Pergamon Press. 1996. V. 32. No 10. P.1463-1467.
[133] Kogan M.M. A local approach to the inverse minimax control problem for discrete-time systems // Proc. of 1st Conference on Control of Oscillations and Chaos, St.Petersburg, 1997. P.88-91.
[134] Kogan M.M. On minimaxity criteria of a linear regulator for known and uncertain systems // Proceedings of 4 European Control Conference, Brussels. 1997.
[135] Kogan M.M. A local approach to solving the inverse minimax control problem for discrete-time systems // International Journal of Control. 1997. V. 68. No 6. P.1437-1448.
[136] Kogan M.M. Solution to the inverse problem of minimax control and worst case disturbance for linear continuous-time systems // IEEE Transactions on Automatic Control. 1998. V. 43. No 5. P.670-674.
[137] Kogan M.M. On inverse problems of minimax control and worst case disturbance for affine nonlinear systems // Proc. of IFAC Simposium on Nonlinear Control Systems Design, Enschede, The Netherlands. 1998.
[138] Kokotivic P.V., Sussmann H.J. A positive real condition for global stabilization of nonlinear systems//Systems and Control Letters. 1989. V. 13. P. 125-133.
[139] Kreisselmeier G., Anderson B. Robust model reference adaptive control based on pole placement design//IEEE Transactions on Automatic Control. 1986. V. 31. P. 127-133.
[140] Krstic M.. Kanellakopoulos I., Kokotovic P.V. Nonlinear and adaptive control design. N.Y.: Wiley, 1995.
[141] Kumar P.R., Praly L. Self-tuning trackers// SI AM J. Control and Optim. 1987. V. 25. P. 1053-1071.
[142] Kuslmer H.J. Convergence of recursive adaptive and identification procedures via weak convergence theory//IEEE Transactions on Automatic Control. 1977. V. 15. P. 921-930.
[143] Kwakernaak H.J. The polynomial approach to Hqq optimal regulation// In E.Mosca and L.Pandolfi (Eds), Hoq control; Lecture Notes in Mathematics, 1496. Springer-Verlag, 1990.
[144] Kwakernaak H. Robust control and if^-optimization - Tutorial paper// Automatica. 1993. V.29. N 2. R 255-273.
[145] Lai T.L., Wei C.Z. Asymptotically efficient self-tuning regulators// SIAM J. Control and Optim. 1987. V. 25. R 227-254.
[146] Landau I.D. Adaptive control: the model reference approach. N.Y.: Marcel Dekker, 1979.
[147] Li Y,, Chen H.-F. Robust adaptive pole placement for linear time-varying systems//IEEE Transactions on Automatic Control. 1996. V. 41. P. 714-719.
[148] Ljung L. Analysis of recursive stochastic algorithms// IEEE Transactions on Automatic Control. 1977. V. 22. P. 551-575.
[149] Lu W.-M., Doyle J.C. H^ control of nonlinear systems: a convex characterization//IEEE Transactions on Automatic Control. 1995. V.40. P. 1668-1675.
[150] Lu W.-M., Doyle J.C. Robustness analysis and synthesis for nonlinear uncertain systems//IEEE Transactions on Automatic Control. 1997. V.42. P. 1654-1662.
[151] Megretski A., Rantzer A. System analysis via integral quadratic constraints// IEEE Transactions on Automatic Control. 1997. V. 42. P. 819-830.
[152] Moore J.B., Kumar R. Convergence of adaptive minimum variance algorithms via weighting coefficient selection//IEEE Transactions on Automatic Control. 1982. V. 27. P. 146-153.
[153] Moylan P.-J., Anderson B.D.O. Nonlinear regulator theory and an inverse optimal control problem//IEEE Transactions on Automatic Control. 1973. V. 18. P. 460-465.
[154] Naik S.M., Kumar P.R., Ydstie B.E. Robust continuous time adaptive control by parameter projection//IEEE Transactions on Automatic Control. 1992. V. 37. P. 182-197.
[155] Nesterov Yu., Nemirovskii A. Interior-point methods in convex programming. Philadelphia: SIAM, 1994.
[156] Nguang S.K. Robust nonlinear Hoq output feedback control// IEEE Transactions on Automatic Control. 1996. V. 41. P. 1003-1007.
[157] Pakshin P.V. Robust stability and stabilization of the family of jumping stochastic systems//Nonlinear Analysis, Theory, Methods and Applications. 1997. V. 30. P. 2855-2866.
[158] Petersen I.R., Hollot C.V. A Riccati equation approach to the stabilization of uncertain linear systems//Automatica. 1986. V. 22. P. 397-411.
[159] Petersen I.R. Notions of stabilizabilitv and controllability for a class of uncertain linear svstems//Int. J. Control. 1987. V. 46. N 2. P. 409 -422.
[160] Petersen I.R., McFarlane D.C. Optimal guaranteed cost control and filtering for uncertain linear systems// IEEE Transactions on Automatic Control. 1994. V. 39. P. 1971 - 1977.
[161] Polyak B.T., Kogan J. Necessary and sufficient conditions for robust stability of linear systems with multiaffine uncertainty structure// IEEE Transactions on Automatic Control. 1995. V. 40. P. 1255-1260.
[162] Savkin A.V., Petersen I.R. Nonlinear versus linear control in the absolute stabilizability of uncertain systems with structured uncertainty//IEEE Transactions on Automatic Control. 1995. V. 40. P. 122-127.
[163] Savkin A.V., Petersen I.R. Output feedback guaranteed cost control of uncertain systems on an infinite time interval//International Journal of Robust and Nonlinear control. 1997. V. 7. N 1. P. 43-59.
[164] Schaft A.J. I/2-gain analysis of nonlinear systems and nonlinear state feedback H^ control// IEEE Transactions on Automatic Control. 1992. V. 37. P. 770-784.
[165] Schaft A.J. Robust stabilization of nonlinear systems via stable kernel representations with Z^-gain bounded uncertainty// Systems and Control Letters. 1995. V. 24. P. 75-81.
[166] Shen T., Tamura K. Robust Hc0 control of uncertain nonlinear system via state feedback// IEEE Transactions on Automatic Control. 1995. V. 40. P. 766-768.
[167] Sin K.S., Goodwin G.S. Stochastic adaptive control using a modified least - squares algorithms//Automatica. 1982. V. 18. P.315-321.
[168] Soh C.B., Berger C.S., Dabke K.P. On the stability properties of polynomials with perturbed coefficients//IEEE Transactions on Automatic Control. 1985. V. 30. P. 1033-1036.
[169] Solo V. Adaptive control performance with time varying parameters. Preprints of papers of 12-th world congress IFAC, Sydney, 1993. V. 10. P. 173-175.
[170] Sontag E.D. A Lyapunov-like characterization of asymptotic controllability// SIAM J. Control and Optim. 1983. V. 21. P. 462-471.
[171] Stalforcl H.L., Chao C.H. A necessary and sufficient condition in Lyapunov robust control//Journal of Optimization Theory and Applications. 1989. V. 63. P. 191-204.
[172] Tsinias J. Asymptotic feedback stabilization: a sufficient condition for the existence of control Lyapunov function//Systems and Control Letters. 1990. V. 15. P. 441-448.
[173] Tsypkin Ja.Z., Avedyan E.D., Gulinskiy O.V. On convergence of the recursive identification algorithms//IEEE Transactions on Automatic Control. 1981. V. 26. P. 1009-1017.
[174] Vidyasagar M. Control system synthesis - a factorization approach. MIT Press, Cambridge, 1985.
[175] Willems J.C. Dissipative dynamical systems (Parts I and II)// Arch. Rat. Mech. Anal. 1972. V. 45. P. 321-393.
[176] Willems J.L., Willems J.C. Feedback stabilizability for stochastic systems with state and control dependent noise//Automatica. 1976. V. 12. P. 277-283.
[177] Xie L., de Souza C.E. Robust Hra control for linear systems with norm-bounded time-varying uncertainty//IEEE Transactions on Automatic Control. 1992. V. 37. P. 1188-1191.
[178] Xie L., Fu M., de Souza C.E. H^ control and quadratic stabilization of systems with parameter uncertainty via output feedback//IEEE Transactions on Automatic Control. 1992. V. 37. P. 1253-1256.
[179] Xie L.. Su W. Robust H^ control for a class of cascaded nonlinear systems//IEEE Transactions on Automatic Control. 1997. V. 42. P. 1465-1469.
[180] Xu S.J., Rachid A., Darouach M. Robustness analysis of interval matrices based on Kharitonov's theorem//IEEE Transactions on Automatic Control. 1998. V. 43. P. 273-278.
[181] Yang W.-C., Tomizuka M. Discrete time robust control via state feedback for single input systems//IEEE Transactions on Automatic Control. 1990. V. 35. P. 590-598.
[182] Yaz E., Yildizbayrak N. Robustness of feedback-stabilized systems in the presence of nonlinear and random perturbation//International J. of Control. 1985. V.41. P. 345-353.
[183] Yeng K.S., Wang S.S. A simple proof of Kharitonov's theorem//IEEE Transactions on Automatic Control. 1987. V. 32. P. 822-823.
[184] Yuan L., Achenie L., Jiang W. Robust Hoc control for linear discrete-time systems with norm-bounded time-varying uncertainty// Systems and Control Letters. 1996. V. 27. P. 199-208.
[185] Zames G. On the input-output stability of time-varying nonlinear feedback systems: Conditions using consepts of loop gain, conicity, and positivity//IEEE Transactions on Automatic Control. 1966. V. 11. P. 228-238.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.