Развитие эллипсоидных методов одновременного подавления внешних возмущений и помех измерения тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Перегудин Алексей Алексеевич
- Специальность ВАК РФ05.13.01
- Количество страниц 255
Оглавление диссертации кандидат наук Перегудин Алексей Алексеевич
Реферат
Synopsis
Введение
Глава 1. Метод притягивающих эллипсоидов. Решение задачи
стабилизации при стандартной структуре регулятора
1.1 Определения и леммы
1.2 Подавление возмущений и помех в линейных системах с использованием алгоритма восполнения конуса
1.3 Подавление возмущений и помех в линейных системах с использованием алгоритма попеременного спуска
1.4 Сравнение алгоритма восполнения конуса, алгоритма попеременного спуска и алгоритма Поляка-Хлебникова
1.5 Подавление возмущений и помех в системах с нелинейной динамической составляющей
1.6 Подавление возмущений и помех в линейных системах с дискретизированным выходом
1.7 Выводы по главе
Глава 2. Решение задачи стабилизации при использовании
динамического регулятора специальной структуры
2.1 Компенсация возмущений и помех в системах с дискретно измеряемым вектором состояния
2.2 Компенсация возмущений и помех в системах с непрерывно измеряемой выходной переменной
2.3 Компенсация возмущений и помех в системах с дискретно измеряемой выходной переменной
2.4 Выводы по главе
Глава 3. Метод притягивающих цилиндров. Решение общей
линейной задачи слежения
3.1 Геометрические основы метода притягивающих цилиндров
3.2 Анализ. Метод притягивающих цилиндров
3.3 Синтез. Решение общей линейной задачи слежения
3.4 Примеры применения метода притягивающих цилиндров при решении задач слежения и наблюдения
3.5 Выводы по главе
Глава 4. Применение разработанных методов для управления
механической системой
4.1 Описание механической системы и построение ее математической модели
4.2 Синтез стабилизирующего регулятора. Применение метода притягивающих эллипсоидов
4.3 Синтез следящего регулятора. Применение метода притягивающих цилиндров
4.4 Выводы по главе
Заключение
Список литературы
Список рисунков
Список таблиц
Публикации автора по теме диссертации
Реферат
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Адаптивное и робастное управление в условиях квантования выходного сигнала, возмущений и запаздывания2017 год, кандидат наук Маргун, Алексей Анатольевич
Численно-аналитические алгоритмы построения стабилизирующих регуляторов для слабонелинейных непрерывных и дискретных систем управления2019 год, кандидат наук Даник Юлия Эдуардовна
Синтез алгоритмов управления на основе пассификации для каскадных систем с возмущениями2016 год, кандидат наук Усик Егор Владимирович
Адаптивное робастное управление в l1 постановке1998 год, доктор физико-математических наук Соколов, Виктор Федорович
Адаптивное и робастное управление по выходу в условиях дискретных измерений и внешних возмущений2019 год, кандидат наук Добриборщ Дмитрий
Введение диссертации (часть автореферата) на тему «Развитие эллипсоидных методов одновременного подавления внешних возмущений и помех измерения»
Общая характеристика работы
Актуальность темы и степень ее разработанности. Эллипсоидные методы получили широкое распространение в области анализа и синтеза линейных систем. Появление подобных методов можно связать с решением задачи оценивания вектора состояния в линейных системах, которое естественным образом может быть выполнено с помощью положительно определенных квадратичных форм и соответствующих им эллипсоидных подмножеств пространства состояний. С работами в этой области связаны имена Ф.Л. Черно-усько, А.Б. Куржанского и других российских и зарубежных специалистов. Позднее была поставлена и решена задача синтеза статических и динамических регуляторов, обеспечивающих существование ограниченных инвариантных подмножеств пространства состояний линейных систем. Результатом решения подобных задач стал метод инвариантных эллипсоидов, получивший развитие в работах Б.Т. Поляка, М.В. Хлебникова, П.С. Щербакова и других. Позднее эллипсоидными методами управления занимались А.С. Позняк, А.Е. Поляков, В.В. Ажмяков, П. Ордаз, А. Санчез-Орта, П. Гарсиа, а также ряд других российских и зарубежных авторов.
Подобные методы управления находятся в активной фазе теоретического и практического развития. Для многих физических объектов актуальной задачей является подавление внешних возмущений в условиях помех измерения. Внешние возмущения включают в себя нежелательные силы, воздействующие на объект управления (для судна, например, ими будут являться морское волнение и ветер), а помехами измерения называются шумы измерений и ошибки датчиков (например, ошибка позиционирования судна по GPS). Достоинством эллипсоидных методов является возможность находить такое соотношение параметров регулирующего устройства, которое позволяет сбалансировано подавлять оба типа нежелательных воздействий. Критерием качества при этом является размер притягивающего эллипсоида в пространстве состояний замкнутой системы.
Несмотря на активное развитие эллипсоидных методов, последнее слово в них еще не сказано, а окончательной теории еще предстоит быть построенной. В частности, почти не развитой остается область применения эллипсо-
идных методов для синтеза оптимальных следящих регуляторов. Также - и это будет продемонстрировано в настоящей диссертационной работе - классические результаты в области синтеза динамических стабилизирующих регуляторов, полученные с помощью метода инвариантных эллипсоидов, могут быть существенно усовершенствованы за счет использования определенных итерационных процедур. Улучшенные таким образом алгоритмы могут быть обобщены на широкий круг задач (системы с нелинейностями, дискретизацией выходного сигнала, специальной структурой регулятора), что и будет сделано в основной части настоящей диссертационной работы.
Целью диссертационной работы является развитие эллипсоидных методов одновременного подавления внешних возмущений и помех измерения при решении задач стабилизации, слежения и наблюдения.
В рамках работы были поставлены следующие задачи:
1. Разработать алгоритм стабилизирующего управления линейными и нелинейными системами, основанный на методе инвариантных эллипсоидов и алгоритме восполнения конуса, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
2. Разработать алгоритм стабилизирующего управления линейными системами с непрерывно и дискретно измеряемой выходной переменной, основанный на методе инвариантных эллипсоидов и алгоритме попеременного спуска, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
3. Предложить обобщение метода инвариантных эллипсоидов для работы с притягивающими подмножествами, неограниченными по части переменных. На основе предложенного обобщения разработать алгоритм синтеза динамического регулятора для решения задач стабилизации, слежения и наблюдения.
Положения, выносимые на защиту:
1. Алгоритм стабилизирующего управления линейными и нелинейными системами, основанный на методе инвариантных эллипсоидов и алгоритме восполнения конуса, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
2. Алгоритм стабилизирующего управления линейными системами с непрерывно и дискретно измеряемой выходной переменной, осно-
ванный на методе инвариантных эллипсоидов и алгоритме попеременного спуска, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
3. Метод притягивающих цилиндров и основанный на нем алгоритм синтеза линейного динамического регулятора для решения задач стабилизации, слежения и наблюдения.
Научная новизна:
1. Предложен новый алгоритм синтеза параметров линейного стабилизирующего регулятора, основанный на совместном использовании метода притягивающих эллипсоидов и алгоритма восполнения конуса. На примере показано превосходство разработанного алгоритма над известным результатом, основанным на методе инвариантных эллипсоидов.
2. Предложен новый алгоритм синтеза параметров линейного стабилизирующего регулятора, основанный на сочетании метода притягивающих эллипсоидов и алгоритма попеременного спуска. На примере показано превосходство разработанного алгоритма над известным результатом, основанным на методе инвариантных эллипсоидов.
3. Предложено оригинальное развитие метода притягивающих эллипсоидов на случаи задач слежения и наблюдения, получившее название «Метод притягивающих цилиндров». Впервые рассмотрены притягивающие подмножества пространства состояний обобщенной цилиндрической структуры, сформулированы и доказаны утверждения об их геометрии и топологии. В рамках разработанного метода предложен алгоритм синтеза линейного регулятора для решения общей линейной задачи слежения, которая может включать в себя задачи стабилизации, слежения, наблюдения, а также их комбинации.
Теоретическая и практическая значимость полученных результатов заключается в возможности их широкого применения для решения задач стабилизации и слежения в условиях действия внешних возмущений и измерительных помех. Предложенные алгоритмы в том числе могут быть применены для управления беспилотными летательными аппаратами, автономными надводными и подводными судами, мобильными робототехническими
объектами, а также при решении задач траекторного и консенсусного управления мультиагентными системами. Теоретическая значимость работы также заключается в разработке метода притягивающих цилиндров, который является обобщением метода притягивающих эллипсоидов и позволяет решать задачи анализа и синтеза линейных систем, в пространстве состояний которых существуют притягивающие подмножества более общего (неэллипсоидного) вида. Показано, что с помощью разработанного метода возможно обеспечить подавление внешних возмущений и помех измерения не только при решении задачи стабилизации, но также при решении задач слежения и наблюдения. Предложенный метод развивает известные ранее подходы, связанные с инвариантными эллипсоидами.
Достоверность полученных результатов подтверждается:
1. Верифицируемостью сформулированных утверждений и теорем. Результаты получены посредством корректного использования математического аппарата и находятся в согласии с результатами, полученными другими авторами.
2. Представленными в диссертационной работе результатами численного моделирования разработанных алгоритмов.
3. Представленными в диссертационной работе результатами экспериментальной апробации разработанных алгоритмов, включающей в себя управление двухроторной механической системой.
4. Наличием публикаций в рецензируемых печатных изданиях.
Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих международных и всероссийских конференциях:
1. 21st IFAC World Congress - 2020
2. 7th International Conference on Control, Decision and Information Technologies (CODIT) - 2020
3. 5th IFAC Analysis and Control of Chaotic Systems (CHAOS) - 2018
4. Навигация и управление движением (Юбилейная XX конференция молодых ученых с международным участием) - 2018
5. XXIII конференция молодых ученых «Навигация и управление движением» - 2021
Результаты диссертационных исследований использовались при выполнении следующих НИР:
1. Разработка методов и алгоритмов управления многоагентными, распределенными и сетевыми системами (тема 716969)
2. Управление киберфизическими системами (тема 718546)
3. Адаптивное бессенсорное управление синхронным электроприводом для интеллектуальных робототехнических и транспортных систем (тема 380284)
4. Многоуровневое управление сложными техническими системами (тема 12441)
5. Методы искусственного интеллекта для киберфизических систем (тема 620164)
6. Разработка методов и программного обеспечения для оптимального управления распределенными системами через цифровые каналы связи с приложением к интеллектуальным сетям электроснабжения (грант Президента РФ № МД-1054.2020.8).
Личный вклад состоит в самостоятельном определении цели и задач исследования, выборе и использовании соответствующего математического аппарата. Соискатель принимал непосредственное участие в формулировке основных утверждений и теорем, их доказательстве, а также в экспериментальной апробации полученных результатов и обработке полученных данных.
Публикации. По теме диссертационного исследования соискателем опубликовано 9 печатных работ, из которых 8 представлены в научных изданиях, входящих в международную реферативную базу Scopus, 1 - в тезисах докладов. Из 8 опубликованных работ, входящих в базу Scopus, 4 работы опубликованы в рецензируемых научных журналах, 4 - в материалах международных конференций.
Содержание работы
Во введении обосновывается актуальность исследований, проводимых в рамках данной диссертационной работы, формулируется цель, ставятся задачи работы, сформулированы научная новизна и практическая значимость представляемой работы.
Первая глава посвящена разработке алгоритмов стабилизирующего управления в системах со стандартной структурой регулятора, основанных на методе притягивающих эллипсоидов.
Во введении к главе 1 приведен обзор существующих подходов к решению поставленной задачи, дан краткий исторический обзор развития метода. В качестве мотивирующего примера рассматривается неустойчивая двумерная линейная система с выходными переменными у\(Ъ) и у2(Ъ), а также три стабилизирующих регулятора с различными коэффициентами.
щ(1) = -1.12у1(*) - 1.7^), «2(0 = -13У1(г) - 8У2(г), из(1) = -1201У1(г) - 71У2(г).
2 1.5
1
0.5 0
-0.5 -1 -1.5 -2
-XI (г)
Ь с.
0 2 4 6 8 10 12
Рис. 1 — Траектория системы, замкнутой «слабым» регулятором
2 1.5
1
0.5 0
-0.5 -1 -1.5 -2
*, с.
0 2 4 6 8 10 12
Рис. 2 — Траектория системы, замкнутой «средним» регулятором
2 1.5
1
0.5 0
-0.5 -1 -1.5 -2
-ал(*)
^л/УЧЛЛЛЛЛЛЛЛЛЛЛЛЛЛ/^
С
0 2 4 6 8 10 12
Рис. 3 — Траектория системы, замкнутой «сильным» регулятором
8 6 4 2 0 -2 -4 -6 -8
Х2 -"Слабый" регулятор
■ -"Средний" регулятор
-"Сильный" регулятор
Х1
-1.5 -1 -0.5 0
Рис. 4 — Сравнение траекторий в пространстве состояний
Регулятор, использующий закон управления u1(t), условно назовем «слабым», регулятор u2(t) - «средним», регулятор u3(t) - «сильным». Указанные названия можно формализовать, рассмотрев либо модули полюсов замкнутой системы, либо модули коэффициентов обратной связи: чем они больше, тем регулятор «сильнее».
На рисунках 1-4 представлены результаты моделирования замкнутой системы при наличии внешних возмущений и помех измерения. Можно заметить, что величина max{sup |^i(i)|, sup |ж2(£)|}) оказывается при использовании «среднего» регулятора, в то время как два других регулятора приводят к большим значениям указанной величины. Отметим (пока без должной формализации), что область пространства состояний, охватываемая траекторией системы со «средним» регулятором, меньше, чем области, охватываемые двумя другими траекториями. Приведенный пример демонстрирует необходимость в разработке алгоритма поиска параметров регулятора, доставляющих замкнутой системе некоторый оптимум (в смысле размера области в пространстве состояний, охватываемой траекторией) относительно внешних возмущений и помех измерения с известными верхними границами.
В разделе 1.2 формулируются основные определения и вспомогательные леммы, среди которых основным является следующее
Определение 1. Притягивающим эллипсоидом степени а динамической системы с вектором состояния x(t) £ Rn называется множество вида
{х £ Rn | xTQx < 1} , Q У 0 (1)
такое, что для всех траекторий x(t) при всех t > 0 выполнено неравенство
(xT(t)Qx(t) - 1) < (жт(0)^ж(0) - 1) e-at. (2)
Отмечается, что при выполнении условия (2) множество (1) является инвариантным: если жт(0)^ж(0) < 1, то xT(t)Qx(t) < 1 при всех t > 0.
В разделе 1.3 представлен один из основных результатов диссертационного исследования, сформулированный как
Теорема 1. Если существуют P1.Q1.Q2 £ §п, Н1 £ &к, Н2 £ Н3 £ , У £ Жпх/, а,^1,№,РиР2 £ Ж такие, что
а> 0, > 0, А + & < 1, P1.Q1.Q2 ^ 0, = I,
Н1 Н2 * Нз
^ 0,
Н1 — Н2
* Нз — ^2^2
0,
(АР1)х2 + аР1 — ^ВВ
т
*
*
*
0
(Я2А)х2 + (УС)х2 + ад2 Q2D УЕ
—аН1 —аН2
Б 0
*
*
* —аН3
* 0, (3)
(д1^)х2 + аЯ! — »21 ЯгР 0
* (^)х2 + (УС)х2 + — Ц21 ^ УЕ
* * —аН1 —аН2
* * * —аНз
то существуют К и Ь такие, что подмножество
* 0, (4)
{(х,е) £ К2п, xTQlх + eTQ2e < 1}
(5)
пространства состоянии системы
{
±(г) = Ах(г) + Ви(г) + и/(г). у(г) = Сх(г) + е$ (г),
замкнутой регулятором
I
¿(4) = АхЦ) + Ви(;,) + ЦСхЦ) — у (1)), и(г) = КЩ),
(6)
(7)
при выполнении условии
/т(£)С1/(г) < 1, (г) < 1, ъ > 0
-т
(8)
является притягивающим эллипсоидом степени а. Соответствующая матрица Е может быть вычислена по формуле Е = Q-1У, а матрица К найдена как
решение линейного матричного неравенства
((1(А + ВК ))х2 + а(1 -Я1ВК Я1В 0
* ((А + ЬС ))х2 + а((2 Я2ЬЕ
* * -аН1 -аН2
* * * -аН3
^ 0. (9)
В силу присутствия в условиях теоремы 1 нелинейного ограничения Р1(1 = I применение данной теоремы на практике не может быть выполнено непосредственно с помощью стандартных программных средств, предназначенных для решения линейных матричных неравенств. В рамках настоящей работы для вычисления параметров регулятора предлагается использовать следующий итеративный алгоритм.
Алгоритм 1. (Алгоритм восполнения конуса)
1. Задать % = 1 и найти положительно определенное решение (Р1,(^1) системы линейных матричных неравенств (3)-(4).
2. Положить (Я^Б,) = (Р1,((1).
3. Найти положительно определенное решение (Р1,(^1) задачи минимизации:
минимизировать 1т&се(Р131/ + (1Я¿)
Р1
при условиях
ъ 0, (3), (4).
4. Если выполнено условие остановки (например, величина 1т&се(Р131/ + ()1Я{) достаточно близка к 2п или величина г достигла предельного значения), перейти к шагу 5. Иначе увеличить
на единицу и перейти к шагу 2.
5. Принять полученную пару (РР1,С}1) в качестве пары (Р1,(1), приближенно удовлетворяющей условиям теоремы 1.
6. Вычислить матрицу Ь по формуле Ь = (-1У и матрицу К как решение линейного матричного неравенства (9). Закончить.
В разделе 1.4 представлен теоретический результат, позволяющий при-
менить для поиска параметров регулятора алгоритм попеременного спуска,
который в свою очередь допускает обобщение на случай систем с дискретно измеряемой выходной переменной.
Алгоритм 2. (Алгоритм попеременного спуска)
1. Выбрать число £ > 0, характеризующее точность алгоритма. Задать г = 0 и выбрать К0 такой, чтобы матрица (А + ВК0) была гурвицевой. Это всегда возможно при условии стабилизируемости пары (А, В).
2. Зафиксировать матрицу К = Kj. Найти решение задачи минимизации trace Pi ^ min при ограничениях, заданных как линейные матричные неравенства из посылок соответствующей теоремы. Положить PI = Pi.
3. Зафиксировать матрицу Pi = Найти решение задачи минимизации trace Q-1 ^ min при ограничениях, заданных как линейные матричные неравенства из посылок соответствующей теоремы. Положить Ki+i = К.
4. Если i > 2 и (trace PI-1 - trace Р{) < e, закончить. Иначе увеличить i на 1 и перейти к шагу 2.
В диссертационной работе показано, что алгоритм 2 сходится - в том смысле, что условие остановки на шаге 4 будет достигнуто независимо от выбранных на шаге 1 величин £ и К0.
В разделе 1.5 проводится сравнение алгоритма восполнения конуса и алгоритма попеременного спуска с известным алгоритмом, предложенным ранее в работах Б.Т. Поляка и М.В. Хлебникова. Результаты синтеза регулятора (7), соответствующего минимальному притягивающему эллипсоиду
{х е R2 | xTP-1x < 1}
степени а = 1, с помощью указанных алгоритмов приведены в таблице 1.
Результаты моделирования полученных систем представлены на рисунках 5-6. На рисунке 5 представлены притягивающие эллипсоиды, соответствующие различным алгоритмам, а также траектории системы, замкнутой соответствующими регуляторами. На рисунке 6 представлены графики величины xT(t)P-1x(t) при использовании различных регуляторов, при этом матрица Р1 выбрана как соответствующая алгоритму попеременного спуска.
Таблица 1 — Сравнение результатов работы алгоритмов
Алгоритм Алгоритм Алгоритм Поляка-Хлебникова восполнение конуса попеременного спуска
К -1187.19 -265.91 -45.01 -11.06 -50.90 -11.83
LT [-2.84 -0.43 -8.56 -12.99 -2514.84 -5293.30
P " 15847 -70475" -70475 379834 3.71 -10.09" -10.09 99.68 3.39 -9.35 -9.35 105.16
trace(Pi) 395681 108.54 103.38
5 0 -5
-10 I-
Х2
-Алгоритм Поляка-Хлебникова -Алгоритм восполнения конуса - Алгоритм попеременного спуска
Xi
-2-10 1 2 3
Рис. 5 — Траектории и эллипсоиды, соответствующие различным алгоритмам
3 2.5 2 1.5
1
0.5
xTP1-1x
-Алгоритм Поляка-Хлебникова
-Алгоритм восполнения конуса
-Алгоритм попеременного спуска
---- Граница эллипсоида
I
0 5 10 15 20 25 30
Рис. 6 — Графики функции xT(t)P-1x(t) для различных алгоритмов
0
Из графиков следует, что параметры регулятора, рассчитанные с помощью алгоритмов попеременного спуска и восполнения конуса в рассматриваемом случае гарантируют ограниченность траектории замкнутой системы с равномерно эллипсоидной оценкой меньшей, чем при использовании алгоритма Поляка-Хлебникова.
В разделе 1.6 рассматривается задача управления нелинейным объектом управления вида
'x(t) = Ax(t) + Bu(t) + Df (t) + (p(x(t)), y(t) = Cx(t) + Ei (t),
{
где ^ : Rn ^ Rn - нелинейная функция, удовлетворяющая ограничению
^T(x)^(x) < д + xTMx (11)
с известными матрицами W У 0, М У 0 и числом д > 0.
В диссертации показано, что синтез стабилизирующего регулятора для нелинейной системы (10)-(11) можно осуществить с помощью алгоритма, основанного на алгоритме восполнения конуса. Соответствующий результат сформулирован в виде теоремы.
В разделе 1.7 задача управления линейным объектом с дискретно измеряемой выходной переменной. Уравнения объекта управления имеют вид
'ад = Ах(г) + Ви(г) + и/(г), У + т) = Сх^ + Е£ ^т + т),
{
где ] £ N - номер дискретного измерения, т - период дискретизации, т £ [0,т) - время, прошедшее с момента последнего дискретного измерения.
В диссертации показано, что синтез стабилизирующего регулятора для нелинейной системы (12) можно осуществить с помощью алгоритма, основанного на алгоритме попеременного спуска. Соответствующий результат сформулирован в виде теоремы.
Вторая глава посвящена исследованию возможности применения разработанных алгоритмов при использовании регулятора специальной структуры, представимого как
'X (¿) = мАхХ (¿) + МАЫу(г) + мви(г) + еы (сэд — у(г)), < £(*) = х(¿) + Му^), (13)
и(г) = Кх(г),
где матрицы М и N таковы, что М + N0 = I и пара (N0, МА) обнаруживаема.
В главе 2 показано, что использование описанной структуры регулятора позволяет ослабить ограничения, налагаемые на внешние сигналы - например, нормы отдельных компонент сигнала £(£) могут не иметь известных верхних ограничений. В частности, условие (8) может быть ослаблено до
/т(^)^1/(¿) < 1, (т(1)МтС2ЩСО < 1, У > 0,
где матрица N имеет неполный ранг.
Рис. 7 — Пример (1,2)-цилиндра
Рис. 8 — Пример (2,3)-цилиндра
Рис. 9 — Пример (1,3)-цилиндра
В разделе 2.3 сформулирована теорема и предложен алгоритм синтеза стабилизирующего регулятора, основанный на методе восполнения конуса, позволяющий минимизировать размер притягивающего эллипсоида в пространстве состояний системы (6), замкнутой регулятором (13). В разделе 2.4 аналогичная задача рассмотрена в условиях дискретно измеряемой выходной переменной: сформулирован теоретический результат, а также предложен алгоритм синтеза стабилизирующего регулятора, основанный на методе попеременного спуска, позволяющий минимизировать размер притягивающего эллипсоида в пространстве состояний системы (12)-(13).
Третья глава посвящена развитию метода притягивающих цилиндров, представляющего собой обобщение метода инвариантных эллипсоидов на случаи задач слежения и наблюдения. В главе рассматриваются притягивающие подмножества пространства состояний нового вида, для описания которых введено
Определение 2. Подмножество пространства заданное как
где Я Е §п, Я У 0 и гапк^ = к, называется (к, п)-цилиндром.
В разделе 3.3 рассматривается задача анализа линейной системы вида
{ж Е хтЯх < 1},
(14)
ад = лад + в/(¿), /т(г)с/(¿) < 1, ш > о.
(15)
Условие существования притягивающего цилиндра в пространстве состояний системы (15) формулируется как
Теорема 2. Если матрица С е такова, что rank С = к, СА(1 - С+С) = 0, и если существуют Р >- 0 и а > 0 такие, что
PC АС + + (CAC+)TP + аР PCB (CB)TP -aG
0,
то подмножество {х £ | хтСтРСх < 1} пространства состояний системы (15) является притягивающим (к, п)-цилиндром.
В разделе 3.4 приводится решение задачи синтеза динамического регулятора для управления объектом вида
I
x(t) = A1x(t) + B1u(t) + C\w(t), у (t) = D1x(t) + E1 u(t) + F1w(t),
(16)
при наличии эталонной модели
{
Xr (t) = A2Xr (t) + Ö2h(t), g(t) = D2Xr (t).
(17)
Структура регулятора при этом имеет вид
{
xc(t) = Mxc(t) + Въу (t) + C3g(t), u(t) = D3xc(t) + E3y(t) + ^g(t),
(18)
матрицы Аъ,Въ,Съ,Въ,Е%, ^ подлежат выбору.
Цель управления заключается в обеспечении асимптотической сходимости целевой переменной
г (г) = К1х(г) + к2хг (г) + к3хс(г) (19)
к ограниченному множеству вида {х £ | ^тРх < 1} при известных ограничениях на сигналы п){Ъ) и к(Ъ). Отмечается, что сформулированная таким образом цель управления может включать в себя задачи стабилизации, слежения и наблюдения.
Граница притягивающего цилиндра -Траектория системы
-10 12 3 4 XI
Рис. 10 — Проекция притягивающего Рис. 11 — Траектория объекта (-
(к,п)-цилиндра и траектории траектория эталонной модели (---)
замкнутой системы и границыдопустимого коридора
малый ротор
ДПТ + энкодер
стержень
главный ротор
ДПТ + энкодер
балансир
Рис. 12 — Схематичное изображение механической системы
Результат решения задачи синтеза представлен в виде теоремы и основанного на ней алгоритма, позволяющего вычислять параметры соответствующего регулятора. В раздплт 3.5 приворятся примеры решения задач с леже-ния и наб людения с использ ованием разработанно го метода. Пример решения задачи йлежения представлен на рисунках 10-11.
В четвертой главе описано применение разработанных методов для решения! зрдач стабиливации и слтжения при управлении многокональной механической систе мой. соч етающей в себе динамические свой ства вин токры-лых летательных аппаратов и маятниковых систем. Внешний вид механической системы представлен на рисунке 12.
В разделе 4.1 приведены результаты построения математической модели рассматриваемой системы. В результате идентификации была построена
3 2.5 2 1.5
1
0.5 0
тш)\
*/*
* Экспериментальная АЧХ -Аппроксимирующая АЧХ
0
1
0.8 0.6 0.4 0.2 0 -0.2
У, рад
жкация
I с
0.5 1 1.5 2
Рис. 13 — Сравнение амплитудно-частотных характеристик
0 5 10 15 20 25 30
Рис. 14 — Сравнение переходных функций
модель шестого порядка и найдены соответствующие числовые параметры. На рисунках 13-14 показано сравнение экспериментальных и модельных характеристик - из графиков следует, что они совпадают как в частотной, так и во временной области.
У2, рад
0.2 0.15 0.1 0.05 0
-0.05 -0.1 -0.15 -0.2
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1
Рис. 15 — Проекция эллипсоида и траектории системы, замкнутой Ь^Я-регулятором
У1, рад
у2, рад
0.2 0.15 0.1 0.05 0
-0.05 -0.1 -0.15 -0.2
-0.6 -0.5 -0.4 -0.3 -0.2 -0.1 0 0.1
Рис. 16 — Проекция эллипсоида и траектории системы, замкнутой предлагаемым регулятором
У1, рад
В разделе 4.2 приведены параметры стабилизирующего регулятора, рассчитанного на основе теоремы 1 и алгоритма 1, и проведено его сравнение с другими стабилизирующими регуляторами, такими как модальный регулятор, Ь^Я-регулятор и -регулятор. В результате исследования было установлено, что предлагаемый стабилизирующий регулятор является оптимальным по критерию размера притягивающего эллипсоида в пространстве состояний. Результаты сравнения частично приведены на рисунках 15-16.
1.5
1
0.5 0
-0.5 -1 -1.5
92, рад
У
У
'-'У
' /
.............
: : I Г : : :
У2, рад
-1.5 -1 -0.5 0 0.5 1 1.5
Рис. 17 — Проекция цилиндра и траектории системы, замкнутой сильным модальным регулятором
1.5
1
0.5 0
-0.5 -1 -1.5
32, рад У У
У У У > у у ✓
/
/ ✓ У
" .У". ЛГ /
У У . / у г/ У " / У У
г
У У ЛЛУ у
У у у / Г У /
У у' у *
у У
у у
■■■у -................... ✓ 1 У2, ^сл
-1.5 -1 -0.5 0 0.5 1 1.5
Рис. 18 — Проекция цилиндра и траектории системы, замкнутой предлагаемым регулятором
В разделе 4.3 приведены параметры следящего регулятора, рассчитанного на основе результатов главы 3, и проведено его сравнение с другими следящими регуляторами (слабым модальным, сильным модальным и Д^-регулятором). В результате сравнения продемонстрирована эффективность предложенного подхода. Результаты сравнения частично приведены на рисунках 17-18.
В заключении приведены основные результаты работы, которые заключаются в следующем:
В результате проведенных диссертационных исследований все поставленные задачи успешно решены, а именно:
1. Разработан алгоритм стабилизирующего управления линейными и нелинейными системами, основанный на методе инвариантных эллипсоидов и алгоритме восполнения конуса, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
2. Разработан алгоритм стабилизирующего управления линейными системами с непрерывно и дискретно измеряемой выходной переменной, основанный на методе инвариантных эллипсоидов и алгоритме попеременного спуска, позволяющий минимизировать размер притягивающего эллипсоида замкнутой системы.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Управление движением морских судов с учетом неопределенностей в задании внешних возмущающих воздействий2015 год, кандидат наук Смирнов, Михаил Николаевич
Робастное управление с компенсацией возмущений2009 год, кандидат технических наук Имангазиева, Алия Владимировна
Адаптивное управление в условиях запаздывания, неполной информации о параметрах и переменных состояния системы2015 год, доктор наук Пыркин Антон Александрович
Алгоритмы прямого адаптивного воспроизведения мультисинусоидальных задающих воздействий в системах с запаздыванием2020 год, кандидат наук Милюшин Александр Сергеевич
Стабилизация и аналитические методы синтеза режимов нелинейной динамики машин2005 год, кандидат физико-математических наук Рыжов, Евгений Николаевич
Список литературы диссертационного исследования кандидат наук Перегудин Алексей Алексеевич, 2021 год
ЛИТЕРАТУРА
1. Герасимов Д.Н., Никифоров В.О., Парамонов А.В. Алгоритм компенсации мультигармонических возмущений в линейных системах с произвольным запаздыванием: метод внутренней модели. Научно-технический вестник информационных технологий, механики и оптики, 2016, №6.
2. Арановский С. В., Лосенков А. А. Прямой адаптивный метод компенсации мультисинусоидальных возмущений. Приборостроение, 2015, №9.
3. Назин С. А., Поляк Б. Т., Топунов М. В. Подавление ограниченных внешних возмущений с помощью метода инвариантных эллипсоидов. Автомат. и телемех.,2007, №3, 106-125.
4. Kiriakidis K. Robust stabilization of the Takagi-Sugeno fuzzy model via bilinear matrix inequalities. IEEE Trans. Fuzzy Syst., vol. 9, no. 2, pp. 269-277, Apr. 2001.
5. Gorski J., Klamroth K., Pfeuffer F. Biconvex sets and optimization with biconvex functions: A survey and extensions. Mathematical Methods of Operations Research, 2007, №66, 373-407.
A.A.Peregudin, (ITMO University, Saint Petersburg)
Simultaneous compensation of external disturbances and measurement noises using the method of invariant ellipsoids
The paper is devoted to the problem of suppression of bounded external disturbances under the condition of unknown bounded measurement noises. The synthesis of linear state-feedback controller minimizing the size of invariant ellipsoids of a closed-loop dynamical system is considered. On the basis of the Lyapunov function method, the S-procedure, the technique of linear matrix inequalities, and the alternating method, an iterative algorithm for searching for optimal controller parameters is proposed. Efficiency of the proposed algorithm is demonstrated.
Текст доклада согласован с научным руководителем
Доктор технических наук, доцент, проф. каф. Управления Сложными Системами, Фуртат Игорь Борисович
© 2020 г. А.А. ПЕРЕГУДИН (peregudin@itmo.ru) (Национальный исследовательский университет ИТМО, Институт проблем машиноведения РАН, Санкт-Петербург)
МЕТОД ПРИТЯГИВАЮЩИХ ЦИЛИНДРОВ. РЕШЕНИЕ
_ _ «_» _ _ «_» «_» _ ___ -
ОБЩЕЙ линеинои задачи слежения1
Представлен метод притягивающих цилиндров - обобщение метода инвариантных эллипсоидов на случаи задач слежения и наблюдения. На основе разработанного метода предложен алгоритм расчета параметров регулятора, обеспечивающего ограниченность ошибки слежения или наблюдения в присутствии ограниченных внешних возмущений. Эффективность предложенного подхода продемонстрирована на примерах.
Ключевые слова: задача слежения, задача наблюдения, подавление возмущений.
1. Введение
Задача подавления ограниченных внешних возмущений на основе метода инвариантных эллипсоидов ранее рассматривалась в [1-3]. В частности, в [1] решалась задача стабилизации возмущенной системы с измеряемым состоянием с помощью статического регулятора; в [2] аналогичный подход применялся для стабилизации возмущенной системы с измеряемым выходом - к статическому регулятору был добавлен динамический наблюдатель Люенбергера; в [3] аналогичная задача была решена с помощью динамического регулятора общего вида. Однако во всех этих работах решалась только задача стабилизации объекта, но не задача слежения.
Распространению метода инвариантных эллипсоидов на задачу слежения посвящены работы [4, 5], в которых на систему наложен ряд дополнительных условий. Так, в [4] предполагается, что все компоненты задающего воздействия измеряемы и могут быть использованы регулятором, а в [5] дополнительно предполагается, что их производные также измеряемы и ограничены. Отметим, что в обеих работах состояние объекта является измеряемым, а используемый регулятор - статическим. В этом смысле работы [4, 5] обобщают [1], но не более поздние [2, 3], в которых уже используется динамический регулятор при неизмеряемом состоянии объекта.
Целью настоящей работы является обобщение метода инвариантных эллипсоидов на случай задачи слежения при использовании динамического регулятора по выходу. В качестве инструмента используется новый метод, основанный на притягивающих множествах более общего вида, в том числе неограниченных по части переменных.
В работе использованы следующие обозначения: Sra = [A G Rnxn | А1 = А}, если A G Rmxra, то range А = [Ах G Rm | ж G Rra}, ker А = [х G Rra | Ах = о}, А+ - псевдообратная Мура-Пенроуза (существует у любой матрицы вне зависимости от полноты ранга).
Результаты разделов 3 и 4 получены при поддержке гранта Российского научного фонда (№ 1879-10104) в ИПМаш РАН. Результаты разделов 5 и 6 получены при поддержке гранта Президента Российской Федерации (грант № МД-1054.2020.8).
2. Мотивирующий пример
В качестве мотивирующего примера рассмотрим неустойчивую систему, состоя-ющую из объекта первого порядка и наблюдателя первого порядка, заданную как
(
х(г) = ах(г) + ь/(г), х(£) = (а — 1)Щ + 1х(£),
где х({) € К - состояние объекта, х(1) € К - состояние наблюдателя, $ (I) € К -внешнее возмущение, Ц (¿)| ^ 1, Ь > 0 и I > а> 0.В качестве выходной переменной объединенной системы (1) рассмотрим ошибку наблюдения
У(г) = х(г) — щ.
Представленная система неустойчива и не имеет притягивающего эллипсоида по состоянию. Однако в силу того, что выход у(1) имеет устойчивую динамику
у(г) = (а — 1)у(г) + ь/(г),
у системы существуют притягивающие эллипсоиды по выходу. Минимальный притягивающий эллипсоид по выходу (в данном случае - отрезок минимальной длины) может быть найден аналитически как
Ь2 1
у € К
у2 <
(а — 1)2У
однако в пространстве состояний ему соответствует неограниченное множество
Ь
(3) \(х,х) € К2 |ж — ж| ^-1
I I — а)
I — а.
не являющееся эллипсоидом. Метод инвариантных эллипсоидов [1] не может быть непосредственно применен для поиска притягивающего множества (2), потому как у системы (1) не существует инвариантного эллипсоида по состоянию. Существует, однако, притягивающее подмножество пространства состояний системы в форме полосы (3). Траектория попадает в эту полосу и затем движется в ней, неограниченно удаляясь от начала координат. Рисунок 1 иллюстрирует описанную ситуацию.
х' / Г
/ Г
/ /
/
«¿с /
/у
/
/ /
/ х
Рис. 1. Пример траектории системы. Серым цветом выделено неограниченное притягивающее подмножество пространства состояний.
Данный пример показывает, что для решения задачи слежения или наблюдения в общем случае недостаточно метода инвариантных (притягивающих) эллипсоидов, разработанного в [1-3] для решения задач стабилизации. Для обобщения существующего метода на случаи, подобные представленному выше, в настоящей работе развивается метод притягивающих цилиндров.
3. Геометрические основы метода притягивающих цилиндров
Для описания рассматриваемых в настоящей работе притягивающих подмножеств введем следующее определение.
Определение 1. Подмножество пространства Ега, заданное как
(4)
{ж е R xTQx ^ l},
где Q е Sn, Q У 0 и rank Q = к, называется (к, п)-цилиндром.
Примеры (к, п)-цилиндров приведены на рис. 2-4. Им соответствуют множества {(х,у) е R2 ж2 ^ l}, \(x,y,z) е R3 ж2 + (у - z)2 ^ l}, \(x,y,z) е R3 г2 ^ l}, каждое из которых можно задать в виде (4), выбрав соответствующую матрицу Q.
I
Рис. 2. Бесконечная полоса - пример (l, 2)-цилиндра.
Рис. 3. Бесконечный цилиндр - пример (2, 3)-цилиндра.
/
/
Рис. 4. Слой пространства между двумя плоскостями - пример (1, 3)-цилиндра.
Замечание 1. Отметим, что при к = п множество (4) является эллипсоидом и что в [1-3] авторами рассматривались притягивающие подмножества именно такого вида. При к < п множество (4) эллипсоидом уже не является, но при этом также может являться притягивающим подмножеством пространства состояний некоторой системы. В этом смысле метод притягивающих цилиндров является обобщением метода инвариантных (притягивающих) эллипсоидов.
Сформулируем геометрическое описание (к, п)-цилиндров.
Утверждение 1. Как множество в линейном пространстве (к, п)-цилиндр (4) является суммой к-мерного эллипсоида, лежащего в подпространстве range Q, и всего подпространства ker Q.
Следствие 1. Как топологическое пространство (к,п)-цилиндр гомеоморфен прямому произведению замкнутого k-мерного шара и Rra-fc.
Доказательства утверждения 1 и следствия 1 приведены в Приложении.
Известно, что образом эллипсоида при линейном отображении является эллипсоид. Обобщим это утверждение на случай (к, и)-цилиндров.
Утверждение 2. Пусть С G Rmxra; rank С = т. Образом (к, п)-цилиндра (4) при отображении у = Сх является (г, т)-цилиндр
у Е R
yTRy ^ l}, R = C+TM(I - (MN)(MN)+)MC+,
где г = rank R, M = Q1/2, N = I - C+C.
Следствие 2. При n ^ 2 проекцией (k,n)-цилиндра на произвольную плоскость является либо вся плоскость, либо полоса (часть плоскости между двумя параллельными прямыми), либо эллипс (часть плоскости, ограниченная эллипсом). Доказательства утверждения 2 и следствия 2 приведены в Приложении. Изложенные выше утверждения дают читателю базовые представления о геометрии рассматриваемых в настоящей работе притягивающих подмножеств.
4. Анализ. Метод притягивающих цилиндров
Рассмотрим линейную динамическую систему
(5) x(t) = Ax(t) + Bf (t),
где x(t) Е Rn - вектор состояния, f (t) Е Rm - внешнее возмущение, А, В - вещественные матрицы соответствующих размерностей. Предполагается, что внешнее возмущение ограничено и что известна матрица G У 0 такая, что
(6) fT(t)Gf (t) ^ l, > 0.
Определение 2. Притягивающим (k, п)-цилиндром системы (5)-(6) называется множество (4) такое, что для всех траекторий системы выполнено
lim sup жт (t)Qx(t) ^ l, t ^
а также, если x(t0) Е (4), то x(t) Е (4) при всех t ^ t0.
Согласно определению 2, притягивающие (к, п)-цилиндры являются одновременно притягивающими и инвариантными подмножествами пространства состояний.
Сформулируем достаточное условие существования притягивающего цилиндра в пространстве состояний системы (5)-(6).
Теорема 1. Если матрица С Е Rfcxra такова, что
rank С = k, СА(1 - С+С) = 0,
и если существуют Р У 0 и а > 0 такие, что
PC АС + + (CAC+)TP + аР PCB (СВ)тР -аС
0,
то подмножество {х € Кга | хТСТРСх ^ 1} пространства состояний системы (5)-(6) является притягивающим (к, п)-цилиндром.
Доказательство теоремы 1 приведено в Приложении.
Замечание 2. Отметим, что в частном случае, при С = I € Кгахга, теорема 1 совпадает с основным результатом работы [1], и тогда притягивающий (к, и)-цилиндр является инвариантным эллипсоидом.
5. Синтез. Общая линейная задача слежения
5.1. Постановка задачи Рассмотрим объект управления
x(t) = A1x(t) + B1u{t) + C1w(t),
(7
1 у (г) = Б1х(г) + Еги(г) + р^),
где х(Ь) € К"1 - неизмеряемый вектор состояния, и(Ь) € - управление, 1и({) € КС1 -неизмеряемый вектор возмущений, у(Ь) € - измеряемый выход, А1,В1,С1,В1,Е1,Р1 - известные вещественные матрицы соответствующих размерностей. Пусть эталонная модель задана как
{
х r (t) = A2xr (t) + C2h(t), g(t) = D2xr (t),
где хг(I) € К"2 - неизмеряемый вектор состояния, Н(Ь) € КС2 - неизмеряемое задающее воздействие, д(Ь) € КС1 - измеряемый эталонный выход, А2,С2,И2 - известные вещественные матрицы соответствующих размерностей.
Замечание 3. Формально, эталонную модель можно не выделять в отдельную систему, а сделать частью уравнения (7), объединив вектор х(Ь) с вектором хг (¿), т^) с к(Ь) и у(Ь) с д(Ь). Однако в настоящей работе предлагается рассмотреть (7) и (8) как две различные модели. Такое разделение не является обязательным, но помогает лучше понять смысл целевой переменной г, раскрываемый далее.
Для достижения цели управления предполагается использование регулятора заданного динамического порядка а3 € N и {0} вида
{
(9) . (t) = A3xc(t) + B3y(t) + C3g(t),
u(t) = D3xc(t) + E3y(t) + F3g(t),
где хс({) € К"3 - вектор состояния регулятора, А3,В3,С3,03,Е3,Р3 - вещественные матрицы соответствующих размерностей, подлежащие выбору.
Замечание 4. При а3 = 0 матрицы А3, В3,С3, И3 пустые, регулятор (9) является статическим и описывается формулой и(Ь) = Е3у(Ь) + Р3д(1). Поскольку современные компьютерные программы (например, МАТЬАВ) свободно работают с пустыми матрицами различных размерностей, далее не будем рассматривать этот случай отдельно, считая его частью общей теории.
Предполагается, что внешние сигналы 'ш(1), к(Ь) ограничены и что известна матрица С У 0 такая, что
'w(t) h(t)
T rw(t)
G
h(t)
^ 1, yt > 0.
Замечание 5. Консервативность основного результата, который будет изложен в разделе 5.2, может быть несколько снижена путем замены (10) на пару ограничений чи^^С^и^) ^ 1, к(1)ТС2к(Ь) ^ 1, где С1,С2 У 0, или даже на большее число ограничений, наложенных на отдельные компоненты данных векторов. Однако это приведет к увеличению числа свободных переменных и усложнению формулировок, не обязательному для настоящей статьи.
Цель управления формулируется следующим образом: при w(t),h(t) = 0 обеспечить асимптотическую сходимость целевой переменной
(11) z(t) = Kix(t) + K2xr (t) + K3xc(t)
к нулю. Если же w(t),h(t) ф 0, но выполнено условие (10), то переменная (11) должна асимптотически сходиться к ограниченному множеству вида {z G Rk | zTPz ^ 1} и должна быть найдена соответствующая матрица Р У 0. Предполагается, что матрицы К\ G Rfcxai, К2 G Rfcx"2, К3 G Rfcx"3, задающие цель управления, известны и что rank К2 К3^ = к. Последнее условие наложено для удобства и не является ограничительным, так как его выполнения всегда можно добиться, убрав из матрицы К2 Кз] линейно зависимые строки.
Сформулированная таким образом задача в рамках настоящей статьи называется общей линейной задачей слежения. Отметим несколько частных случаев:
1. Задача стабилизации. Если К\ = I, К2 = К3 = 0, то при отсутствии внешних воздействий цель управления принимает вид ||ж(£)|| ^ 0. В [3] показано, что такая задача может быть решена с помощью метода инвариантных эллипсоидов.
2. Задача слежения. Если К\ = I, К2 = —I, К3 = 0, то при отсутствии внешних воздействий цель управления имеет вид Hx(t) — xr(i)|| ^ 0, что соответствует слежению вектора состояния объекта за вектором состояния эталонной модели.
3. Задача наблюдения. Если К\ = I, К2 = 0, К3 = —I, то регулятор (9) превращается в наблюдатель, вектор состояния которого должен сходиться к вектору состояния объекта. Если внешние воздействия отсутствуют, то такая цель управления может быть сформулирована как ||xc(i) — x(t)H ^ 0.
Если матрицы Ki выбраны иным образом, то цель управления представляет собой некоторое сочетание задач стабилизации, слежения и наблюдения (возможно, по части переменных). Таким образом, поставленная задача синтеза может быть интерпретирована как одна из этих трех базовых задач либо как их комбинация.
Отметим, что на матрицы А\, B\,C\, D\, F\, А2, С2, D2 в (7) и (8) не накладывается никаких ограничений. Однако требуется наложить ограничение на матрицу Е\, связанное с корректностью рассматриваемой обратной связи. Рассмотрим вспомогательный измеряемый выход y(t) = y(t) — E\u(t) = D\x(t) + F\w(t) системы (7), который получается из выражения для y(t), если убрать слагаемое с Е\. Предположим, что поставленная задача может быть решена с помощью регулятора (9), в котором вместо выхода y(t) используется вспомогательный выход y(t). Тогда после подстановки y(t) = y(t) — Eiu(t) получим закон управления в виде
u(t) = (I + ElE3)-l(D3Xc(t) + Езу(г) + F3g(t)) = D 3Xc(t) + ЕзУ(1) + F3g(t),
для реализации которого необходимо, чтобы матрица (I + Е\Е3)-1 существовала. Именно это условие и накладывается дополнительно. С учетом указанного свойства при формулировке основного результата достаточно ограничиться случаем Е\ = 0, что и будет сделано, при этом соответствующий регулятор для общего случая всегда может быть восстановлен.
5.2. Основной результат Введем вспомогательные обозначения для описания замкнутой системы
А1 0 0 0 В1 'С1 0 0 0 I
А = 0 А2 0 , в = 0 0 , с = 0 С2 , О = 0 0
0 0 0 I 0 0 0 0 02 0
00 ^ 0 00
X
А3 В3 С3 В3 Е3 Р3
8(1)
'х(Ь)' хг (I) хс(Ь)
/ ®
к(1)
М = А + ВХВ, N = С + ВХР, К = [К1 К2 К3]
п
а,1 + а2 + 0.3.
Тогда уравнение замкнутой системы (7)-(9), (11) может быть записано как
12)
(
ё(г) = Мв(г) + N1 (г), г(г) = Кз(г),
при этом ограничение (10) примет вид
(13) (I) ^ 1, V ^ 0.
Перед формулировкой основного результата введем обозначения
Н1 = КАК + + КВ(КВ)+КА(В(К+К - I))+ВК+ , ( ) Н2 = КС + КВ(КВ)+КА(В(К+К - I))+Р,
( ) Н3 = К В, Н4 = ВК + + В(В(К+К - I ))+ВК +,
Нъ = ^ + В(В(К+К - I))+Р.
Сформулируем основной результат в виде теоремы.
Теорема 2. Если матрицы А, В, В, К таковы, что
15)
КВ(КВ)+КА(В(1 - К+К))+В(1 - К+К) = КА(1 - К+К),
и если существуют Р, Ц У 0, € К, а > 0 такие, что = I и
"вд + днТ + аЯ Н2 1 Г#3#3Т 0"
НТ -а^ ^ ^ 0 0 ,
~РН1 + НТР + аР РН2'
—аС
:1б)
ЩР
< ц1
^ V2
НТН4 Н];Н5 ЩН4 Н^Нц
то существует набор X параметров регулятора (9) такой, что подмножество {^ € Кга | вТКТРКв ^ 1} пространства состояний замкнутой системы (12) является притягивающим (к, п)-цилиндром.
При фиксированных а, Р соответствующая матрица X находится как
(17) X = (КВ)+КА(В(К+К - I))+ + У + (КВ)+КВУВ(В(К+К - I))+,
где У - любое решение линейного матричного неравенства
18)
РН1 + НТР + аР РН2 НТ Р -аС
+
РН3УНА + (РН3УНА)Т РЩУЩ (РН3УЩ )Т 0
0.
Доказательство теоремы 2 приведено в Приложении. Из доказательства, в частности, следует, что при выполнении условий теоремы матричное неравенство (18) всегда имеет решение.
Условие (15) является вполне естественным: оно показывает, как должны соотноситься между собой параметры объекта (7) и эталонной модели (8), чтобы решение соответствующей задачи слежения было возможным. Можно показать, что для задач стабилизации и наблюдения, при К = [/ 0 0 и К = [/ 0 —I] соответственно, условие (15) всегда выполнено независимо от параметров объекта и эталонной модели. Если же К = [/ —I 0, что соответствует задаче слежения, то условие (15) упрощается до
В1В++(А1 — А2) = (А1 — А2).
Следует отметить, что выполнение этого условия еще не означает возможность построения соответствующего регулятора, ведь помимо него должно быть также выполнено второе условие теоремы 2, связанное с неравенствами (16).
5.3. Вычислительные аспекты
Поскольку на матрицы Р и Q, входящие в формулировку теоремы 2, наложено дополнительное ограничение PQ = I, матричные неравенства (16) не являются линейными даже при фиксированном а и не могут быть непосредственно решены с помощью стандартных программных средств, таких как YALMIP или CVX. Однако существует эффективный алгоритм решения матричных неравенств именно с таким типом нелинейности, который в литературе можно встретить под названием «Cone complementarity algorithm» (алгоритм восполнения конуса) [6-9].
Алгоритм 1.
1. Задать i = 0. Зафиксировать параметр а > 0 и найти положительно определенное решение (P,Q) системы линейных матричных неравенств (16).
2. Положить (Ri,Si) = (P,Q).
3. Найти положительно определенное решение (Р, Q) задачи минимизации:
минимизировать trace(PSi + QRi)
\Р I'
при условиях
Q
У 0, (16).
4. Если выполнено условие остановки (например, величина Ьг&се(РЗг + С^Кг) достаточно близка к 2к или величина г достигла предельного значения), перейти к шагу 5. Иначе увеличить на единицу и перейти к шагу 2.
5. Принять полученную пару (Р, С) в качестве пары (Р,С), приближенно удовлетворяющей условиям теоремы 2. Закончить.
В [6] показано, что алгоритм 1 сходится к паре (Р, С), удовлетворяющей условиям (16) и доставляющей локальный минимум величине Ьтаое(РС + СР). Несмотря на то, что в общем случае выполнение условия РС = I не гарантировано, алгоритм широко применяется [6-9] для решения задач теории управления, в которых возникают подобные матричные неравенства.
Применение теоремы 2 на практике во всей полноте предполагает выполнение следующей последовательности действий:
1. Проверить, что для поставленной задачи выполнено условие (15).
2. Применив алгоритм 1, найти взаимообратные Р и Q, удовлетворяющие (16).
3. Используя найденную матрицу Q, найти матрицу V, удовлетворяющую (18).
4. Вычислить матрицу X параметров регулятора по формуле (17).
Однако следует отметить, что нахождение пары взаимообратных матриц (Р, Q) не является обязательным для синтеза регулятора. Если в процессе выполнения алгоритма 1 найдена матрица Р такая, что неравенство (18) имеет решение V, то нет необходимости далее выполнять алгоритм - можно сразу перейти к вычислению параметров регулятора по формуле (17).
6. Примеры
6.1. Задача слежения Рассмотрим объект управления (7) с матрицами
А1
-2,99 3,10 -2,10 2,01
01 = [1 -1, и эталонную модель (8) с матрицами
А-2
0,01 0,1 0,1 0,01
В1
Ец
С2.
1,5 1
С!
0,15 0,15
0
0
К
^2
0
[1 -1
Заметим, что объект управления является устойчивым, а эталонная модель, напротив, неустойчива. Условие (10) предполагается выполненным при С = 1.
Пусть динамический порядок а3 регулятора (9) положен равным 1, а целевая переменная (11) задана как
х(Ь) = х(£) - хг(£), что соответствует задаче слежения и выбору матрицы
К
10 -1 0 0 0 1 0 1 0
Нетрудно проверить, что в этом случае условие (15) выполнено. Тогда в результате выполнения алгоритма 1 при а = 0,5 может быть найдена матрица
Р
1485 -1585 -1585 1698
0
и затем по формулам (18), (17) восстановлены параметры
X
регулятора (9), который, несмотря на заданный динамический порядок а3 зывается статическим.
~А3 В3 С3 0 0 0
П3 Е3 р3_ 0 -2,95 4,95
1 , ока-
XI
Рис. 5. Проекция притягивающего Рис. 6. Траектория объекта (-),
(к, п)-цилиндра и траектории замкнутой траектория эталонной модели (---) и
системы. границы допустимого коридора (........-).
При моделировании внешнее возмущение было задано как = вт(0,4£), а начальные условия положены равными х(0) = [0 0 и хг(0) = [1 1] .
Результаты моделирования представлены на рис. 5-6. На рис. 5 показана проекция траектории замкнутой системы: по оси абсцисс отложено значение первой координаты вектора состояния объекта, а по оси ординат - значение первой координаты вектора состояния эталонной модели. Также показаны границы полосы, являющейся проекцией притягивающего (к, п)-цилиндра на эту плоскость.
На рис. 6 показаны траектория х(Ь) объекта и траектория хг (1) эталонной модели. На рисунке также отмечены границы «допустимого коридора», имеющего следующий смысл: если в данный момент времени каждая из проекций траектории замкнутой системы - на плоскость (х\,хг\) (см. рис. 5) и на плоскость (х2,хг2) (не приводится, так как выглядит аналогично) - находится внутри соответствующей проекции притягивающего ( к, п)-цилиндра, то траектория х(Ь) в данный момент времени находится в границах допустимого коридора. Иными словами, тот факт, что траектория объекта начиная с какого-то момента не выходит за границы точечного пунктира, является иллюстрацией того, что траектория замкнутой системы попадает внутрь ( , п) -цилиндра и не покидает его.
6.2. Задача наблюдения
Рассмотрим объект (7) с матрицами
"0,168 -0,132 -0,052" 0 0
А\ = 0,148 -0,152 0,028 , Вх = 0 , Сх = 0
0,204 -0,196 -0,006 0 0
= [—0,2 0,8 -0,2] , Ех = [0 , ^ = [0,02] .
Отметим, что объект является неустойчивым. В этом примере эталонная модель не рассматривается, т.е. все матрицы в (8) пустые. Условие (10) предполагается выполненным при С = 1.
Пусть динамический порядок а3 регулятора (9) положен равным 3, а целевая переменная (11) задана как
г (¿) = —
что соответствует задаче наблюдения и выбору матрицы
К
10 0 —1 0 0 0 10 0 —1 0 0 0 1 0 0 1
Нетрудно проверить, что в этом случае условие (15) выполнено. Тогда в результате выполнения алгоритма 1 при а = 0,3 может быть найдена матрица
192 —624 222
Р = —624 2051 — 732 ^ 0
222 —732 289
и затем по формулам (18), (17) восстановлены параметры
"3,970 — 15,341 3,750" "19,011"
Аз = 1,506 —5,585 1,386 , Вз = 6,792
0,559 — 1,618 0,349 1,777
регулятора (9), который в этой задаче выполняет роль наблюдателя.
Можно заметить, что для полученных матриц выполнено А3 = А\ — В3О\, а значит, структура системы (9) совпадает со структурой наблюдателя Люенбергера
хс(1) = Агхс(1) + В3(у(г) — А^)).
Примечательно, что такая структура не была создана искусственно, а получилась сама собой в результате выполнения алгоритма 1.
При моделировании внешняя помеха была задана как = 2 + 2 8£п(вт(0,1£)),
Т т
а начальные условия положены равными ж(0) = [3,2 3 3 и жс(0) = [—10 0 4] .
Граница притягивающего цилиндра ^^ -Траектория системы
У .•¿у'
<7
3 4 Х2
Рис. 7. Проекция притягивающего (к, п)-цилиндра и траектории замкнутой системы.
14 12 10 8 > 6 4 2 0 -2
10 15
20
Рис. 8. Траектория объекта (---),
траектория наблюдателя (-) и
границы допустимого коридора (........■)
0
5
0
2
5
6
7
8
Результаты моделирования представлены на рис. 7-8. На рис. 7 показана проекция траектории замкнутой системы: по оси абсцисс отложено значение второй координаты вектора состояния объекта, а по оси ординат - значение второй координаты вектора состояния регулятора (наблюдателя). Также показаны границы полосы, являющейся проекцией притягивающего (к, п)-цилиндра на эту плоскость.
На рис. 8 показаны траектория x(t) объекта и траектория xc(t) регулятора (наблюдателя). На рисунке также отмечены границы «допустимого коридора», имеющего следующий смысл: если в данный момент времени каждая из проекций траектории замкнутой системы - на плоскость (х2, хс2) (см. рис. 7) и на плоскость (х3, хс3) (не приводится, так как выглядит аналогично) - находится внутри соответствующей проекции притягивающего ( к, п)-цилиндра, то траектория x(t) в данный момент времени находится в границах допустимого коридора. Иными словами, тот факт, что траектория наблюдателя начиная с какого-то момента не выходит за границы точечного пунктира, является иллюстрацией того, что траектория замкнутой системы попадает внутрь ( к, п)-цилиндра и не покидает его.
7. Заключение
В работе предложено обобщение метода инвариантных эллипсоидов, позволяющее находить притягивающие подмножества пространства состояний более общего вида. Показано, что предложенный метод может быть использован для решения задач стабилизации, слежения и наблюдения, а также их комбинаций. Предложен алгоритм, позволяющий применять основой результат на практике с помощью стандартных программных средств. На численных примерах продемонстрирована эффективность предложенного подхода.
Автор выражает благодарность Игорю Борисовичу Фуртату и анонимному рецензенту за ценные замечания, позволившие улучшить форму и содержание статьи.
ПРИЛОЖЕНИЕ 1
Доказательство утверждения 1. Матрица Q симметричная, поэтому пространство R можно представить как прямую сумму ее образа и ядра:
Rra = range Q 0 ker Q. Иными словами, для любого х G Rra существует единственное разложение
х = xr + Xk, xr G range Q, Хк G kerQ. Тогда ( к, п)-цилиндр (4) можно представить как
{х G Rra | xTQx ^ 1} = {(xr + хк) G Rra | (xr + хк)TQ(xr + хк) ^ 1} =
= {(хг + Хк) G Rra | х]vQxr ^ 1} = {xr G rangeQ | х]TQxr ^ 1} + kerQ.
Сужение оператора Q на подпространство range Q имеет полный ранг. Следовательно, множество {xr G range Q | x];Qxr ^ 1} является fc-мерным эллипсоидом.
Доказательство следствия 1. Символом = обозначим гомеоморфность. Из того что range Q = Rk, kerQ = Rn-k, а множества {xr G range Q | xjQxr ^ 1} и ker Q ортогональны друг другу, следует, что
{xr G rangeQ | x^rQxr ^ 1} + kerQ = {x G Rk | xTx ^ 1} x Rn-k.
Лемма 1. [10] Если матрицы A, U, С, V таковы, что обе части равенства
(А + UCV)-1 = A-1 - A-1U(С-1 + VA-1U)-1VA-1
имеют смысл (все операции определены), то указанное равенство выполнено. Лемма 2. [11] Для произвольной матрицы A G Rmxn верно, что
lim (ATA + eI)-1AT = A+.
£ ^ 0 +
Указанное равенство выполнено даже в тех случаях, когда (ATA)-1 не существует.
Доказательство утверждения 2. Воспользуемся полнотой строчного ранга матрицы С и рассмотрим семейство матриц R£ с параметром е, определенных как
R£ =(c(Q + £l)-1CTy \ е> 0.
Известно (см. [1]), что если Q У 0, то R = (CQ-1CT)-1. При Q У 0 в силу непрерывности отображения x ^ Сx имеем R = lim£ ^ 0+ R£. Согласно лемме 1
(Q + el)-1 = (el + MM)-1 = -I - -M(I + -MM)-1 -M.
Тогда
-1 ' 1 T 1пы(т /Гч-11 -4-1
Re
(\—1 /1 1 1 1 \ —1
с(д + £1)—1ст) = (-сст —см(1 + -мм)—1-мст) .
Заметим, что матрица ССт обратима. Вновь применяя лемму 1, получаем
/ 1 \ — 1
Д = £(ССт)—1 + (ССт)—11см(1 + -м(1 - Ст(ССт)—1С)м) МСт(ССт)—1.
Воспользуемся известными равенствами
Ст(ССт)—1 = С+, I - Ст(ССт)—1С = М = М2 и перепишем Д£ в виде
/ 1 \ —1
п£ = е(ССт)—1 + С+тм[I + -мNNмJ мс+.
Применяя лемму 1, получаем
П£ = £(ССт)—1 + С+тм(I - мм(еI + ИммИ)—1Им^мС+. Тогда согласно лемме 2, учитывая, что м = мт, N = Nт, имеем
д = Иш+де = с+тм( 1-ми{мЩ+^мс+.
Наконец заметим, что У 0 и, следовательно, Д У 0.
Доказательство следствия 2. Если С - проекция на К2, то т = 2, г ^ 2. Значит, образом (к, п)-цилиндра может быть только (0, 2), (1, 2) или (2, 2)-цилиндр.
Лемма 3. [12] Если А е Rraxm, В е Rkxl, С е Rnxl, то матричное уравнение
АХ В = С
разрешимо относительно X е Rmxfc тогда и только тогда, когда
АА+СВ+В = С,
и в этом случае все решения можно параметризовать как
X = А+СВ+ + Y — A+AYBB+,
где Y е Rmxfc - произвольная матрица.
Лемма 4. [13] Если А е Sn, В е Rmxra и А2 = А, то А(ВА)+ = (ВА)+. Лемма 5. [14] Если А е Rraxm, В е Rfcxra, С е Sn, то матричное неравенство
АХ В + (AXB)T + С х 0
разрешимо относительно X е Rmxfc в том и только в том случае, если существуют ,у2 е R такие, что
С х /цААТ, С х ^2BTB.
Доказательство теоремы 1. Введем переменную y(t) = Cx(t) е Rfc, составим уравнение ее динамики
y(t) = CAx(t) + CBf (t)
и найдем условие, при котором оно может быть записано независимо от x(t), т.е. условие существования матрицы X такой, что
y(t) = XCx(t) + CBf (t) = Xy(t) + CBf (t).
Для этого рассмотрим уравнение С А = ХС. В соответствии с леммой 3 оно разрешимо относительно X в том и только в том случае, если выполнено условие СА(1 — С+С) = 0, и тогда все решения могут быть параметризованы как X = САС+ + Y(I — СС+), где Y - произвольная матрица соответствующей размерности. Если дополнительно выполнено условие rank С = к, то уравнение имеет единственное решение X = С АС +.
Так как все соответствующие условия включены в формулировку теоремы, динамика переменной y(t) может быть записана независимо от x(t) в виде
(П.1) y(t) = CAC+y(t) + CBf (t).
Обозначим: V = yTPy. Заметим, что из матричного неравенства
РСАС+ + (CAC+)TP + aP PC В (CB)TP —aC
0
следует, что
\y(t)] T
f (*).
PCAC+ + (CAC+)TP + aP PCB (CB)TP —aC
y(t) f (t)
^ 0, yt > 0,
и тогда
V(t) + «V(t) ^ afT(t)Gf (t), yt ^ 0. При выполнении условия (6) из этого следует, что
lim sup V(t) ^ 1
и
если V(to) ^ 1, то V(t) ^ 1 при всех t ^ to. При этом V = xTCTPCx, СT PC У 0
и
rank СTPC = к, а значит, подмножество
{ж е Rn xTQx ^ l}, Q = СТРС
пространства состояний системы (5)-(6) является притягивающим (к, п)-цилиндром.
Доказательство теоремы 2. В соответствии с теоремой 1 подмножество е Rn | sTKTPKs ^ 1} системы (12) является притягивающим (к, п)-цилиндром, если выполнены условия
(П.2)
KM (I -K+K) = 0,
(П.3)
PKMK + + (KMK+)TP + «P PKN
(KN )TP
—aG
0.
Для существования регулятора (9) такого, чтобы для замкнутой системы (12) выполнялось условие (П.2), необходимо и достаточно, чтобы уравнение
К (А + ВХБ)(1 -К+К ) = 0 ^ КВХВ(1 -К+К ) = -КА(1 -К+К)
было разрешимо относительно Х. В соответствии с леммой 3 это так в том и только в том случае, если выполнено
(П.4) КВ(КВ)+КА(1 - К+К)(Б(1 - К+К))+И(1 - К+К) = КА(1 - К+К), причем все соответствующие матрицы Х могут быть параметризованы как
(П.5)
X =(KB)+KA(K+K - I)(D(I - K+K))+
+ Y - (KB)+KBYD(I - K+K)(D(I - K+K))+,
где V - произвольная матрица соответствующей размерности. Согласно лемме 4 (П.4) и (П.5) равносильны (15) и (17) соответственно.
С учетом выражений м = А + ВХИ, N = С + ВХД условие (П.3) может быть переписано в виде
PKAK + + (KAK+)TP + aP PKC (KC )TP -aG
+
+
P K B 0
X [DK+ F] + ( PKB X [DK+ F] )T x 0
и после подстановки (17) и применения обозначений (14) представлено как
(П.6)
PH1 + HjP + aP PH:
H?P
2
a G
+
PH3 0
Y
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.