Адаптивные наблюдатели физических состояний линейных динамических систем тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Ласточкин Константин Андреевич
- Специальность ВАК РФ00.00.00
- Количество страниц 174
Оглавление диссертации кандидат наук Ласточкин Константин Андреевич
Введение
Глава 1. Обзор предметной области и обобщенная постановка задачи
1.1 Задача оценивания состояний линейных динамических систем
1.2 Обзор методов оценивания состояний линейных систем
1.2.1 Робастные методы оценивания состояний
1.2.2 Оценивание состояний на базе теории инвариантности
1.2.3 Адаптивные методы оценивания состояний
1.2.4 Выводы по литературному обзору
1.3 Линейные системы с перепараметризацией
1.3.1 Расширенная наблюдаемость систем с перепараметризацией
1.4 Обобщенная постановка задачи
1.4.1 Задача 1. Идентификация значений функций от параметров нелинейных по параметрам регрессионных уравнений
1.4.2 Задача 2. Адаптивное оценивание состояний при отсутствии возмущений
1.4.3 Задача 3. Адаптивное оценивание состояний при наличии возмущений
Глава 2. Идентификация значений функций от параметров
нелинейных по параметрам регрессионных уравнений
2.1 Основные преобразования
2.2 Алгоритм идентификации значений функций от параметров нелинейных по параметрам регрессионных уравнений
2.3 Сравнительное моделирование
2.4 Выводы по главе
Глава 3. Оценка физических состояний линейных систем с
перепараметризацией
3.1 Предварительные преобразования
3.2 Адаптивный наблюдатель Люенбергера
3.3 Алгебраический адаптивный наблюдатель
3.4 Сравнительное моделирование
3.5 Выводы по главе
Глава 4. Оценка физических состояний линейных систем с
перепараметризацией при неизвестной модели возмущения
4.1 Мотивация
4.2 Предварительные преобразования
4.3 Адаптивный наблюдатель состояний
4.3.1 Выбор инструментальной переменной
4.4 Моделирование
4.5 Выводы по главе
Заключение
Список основных обозначений
Список литературы
Приложение А. Справочные данные
А.1 Общие сведения из теории автоматического управления
А.2 Общие сведения из математического анализа
А.3 Общие сведения из теории оптимизации
А.4 Общие сведения из теории идентификации
А.5 Общие сведения из гармонического анализа
Приложение Б. Доказательства
Б.1 Доказательства к главе
Б.2 Доказательства к главе
Б.3 Доказательства к главе
Б.4 Доказательства к главе
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Разработка адаптивных наблюдателей переменных состояния с улучшенной точностью сходимости при наличии возмущений в измерениях выходного сигнала2023 год, кандидат наук Воробьев Владимир Сергеевич
Адаптивные алгоритмы оценивания переменных состояния электромеханических систем2018 год, кандидат наук Базылев, Дмитрий Николаевич
Идентификационные методы для синтеза адаптивных наблюдателей нелинейных систем2016 год, кандидат наук Арановский, Станислав Владимирович
Синтез интервального наблюдателя для линейных систем с переменными параметрами2013 год, кандидат наук Чеботарев, Станислав Геннадьевич
Итеративный метод синтеза адаптивных наблюдателей для нелинейных систем2020 год, кандидат наук Синетова Мадина Мансуровна
Введение диссертации (часть автореферата) на тему «Адаптивные наблюдатели физических состояний линейных динамических систем»
Введение
Актуальность темы. Прикладные проблемы управления техническими системами и технологическими процессами характеризуются большим числом внешних (сигнальных) и внутренних (параметрических) неопределенностей. Типично сформулированная инженерами и формализованная математически цель управления должна достигаться одновременно без качественных измерений полного вектора состояний и при отсутствии достоверной информации о структуре, параметрах и возмущениях системы. В этих условиях возникает целый спектр, с одной стороны, важных для приложений, а с другой стороны, интересных для развития математических теорий, методов и алгоритмов актуальных задач. Одной из таких задач является восстановление полного вектора состояний линейных динамических систем с неизвестными параметрами при действии неконтролируемых внешних возмущений.
Степень разработанности проблемы. Задача оценивания состояний динамических систем восходит к трудам Д. Люенбергера и Р. Калмана, которые являются основоположниками детерминированной и стохастической теорий оценивания, соответственно. Данная диссертационная работа сосредоточена исключительно на развитии методов решения детерминированной постановки задачи оценивания, то есть при отсутствии случайных возмущений в системе и измерениях.
Более 60 лет продолжается разработка различных подходов к распространению базовых результатов Д. Люенбергера на классы систем с параметрической и/или сигнальной неопределенностью. Все полученные к сегодняшнему дню наработки укрупненно могут быть разделены на три группы.
а) Робастные методы. Эта группа в основном связана с совершенствованием (и созданием новых) оффлайн методов расчета параметров корректирующей обратной связи в базовой структуре наблюдателя Люенбергера. Разрабатываются и совершенствуются различные методы расчета, позволяющие на этапе параметрического синтеза наблюдателя заложить гарантии качества оценивания неизмеряемых состояний системы и дополнительно решить некоторые задачи оптимизации (Н2, норм передаточной функции, квадратичного функционала в линейно-квадратичной задаче, размера инвариантного (или ограничивающего) эллипсоида в задачах, связанных с подавлением внешних возму-
щений и пр.). Общими ограничениями таких подходов является необходимость i) априорного знания амплитуды возмущения и размаха параметрической неопределенности, ii) удовлетворения параметрической неопределенности системы специальным параметризациям. Робастные методы в разное время развивали такие зарубежные и отечественные исследователи как S. Bhattacharyya, J. Doyle, K. Zhou, S. Boyd, I. Petersen, Б.Т. Поляк, М.В. Хлебников, П.С. Щербаков, И.Г. Владимиров, А.П. Курдюков, Д.В. Баландин, М.М. Коган, А.Г. Александров, В.Н. Честнов, С.К. Коровин, В.В. Фомичев, А.В. Ушаков, Р.О. Оморов и др.
б) Оценивание на базе теории инвариантности. Основой методов этой группы является идея обеспечения нечувствительности процесса восстановления неизмеряемых состояний по отношению к параметрическим и/или сигнальным возмущениям. Инвариантность достигается с помощью алгебраического исключения обобщенного возмущения из уравнений ошибки наблюдения, или с помощью силового подавления его влияния на ошибку оценивания корректирующими обратными связями в классе функций с большими коэффициентами или разрывными сигналами. Условиями реализуемости наблюдателей на базе теории инвариантности является, во-первых, знание размаха неопределенности системы (для попадания на поверхность скольжения), а во-вторых, выполнение строгих условий согласованности (например, размерность возмущения не должна превосходить размерность измеряемого выхода). Основным конкурентным преимуществом методов этой группы выступает отсутствие необходимости знания структуры и параметров генераторов сигнальных возмущений, а также применимость решений при разрывных возмущениях. Приложение методов теории инвариантности к задаче во становления состояний прежде всего связано с именами C. Edwards, S. K. Spurgeon, B. L. Walcott, T. Floquet, J.-P. Barbot, M. Darouach, P. Kudva, S. Zak, A. Levant, L. Fridman, Y. Shtessel, K. Khalil, J. Slotine, В. И. Уткин, А. С. Позняк, С. А. Краснова, В. А. Уткин, А. Н. Жирабок и др.
в) Адаптивные алгоритмы. Наблюдатели из этой группы одновременно выполняют оценку неизмеряемых состояний и идентификацию неизвестных параметров системы. Благодаря этой, в сущности, простой идее, использование информации о размахе параметрической неопределенности при синтезе не требуется. Вместо этого классические адаптивные наблюдатели для асимптотической сходимости оценок состояний к истинным значениям требуют выполнения условия неисчезающего возбуждения некоторой функции от измеряемых сигналов
(управления и выхода). В течение продолжительного периода времени это условие ограничивало практический интерес к методам адаптивного восстановления состояний, поскольку в различных интерпретациях и трактовках оказалось эквивалентно i) глобальному частотному богатству управления со степенью равной динамическому порядку системы, ii) полной наблюдаемости расширенной системы, включаещей состояния и неизвестные параметры. Усилиями G. Chowdharry, R. Ortega, Y. Pan, S. B. Roy, А. А. Бобцова, С. В. Арановского и многих других исследователей это условие удалось ослабить до требования конечного возбуждения регрессора, эквивалентного частотному богатству управления на интервале времени или локальной полной наблюдаемости расширенной системы. Однако даже при выполнении этого ослабленного условия сходимости существующие адаптивные наблюдатели позволяют оценить не физические, а только виртуальные состояния особых форм пространства состояний (неизвестные параметры в математической модели системы должны быть умножены только на измеряемые сигналы), что существенно снижает потенциал их использования в приложениях в сравнении с робастными и инвариантными наблюдателями. Развитие методов синтеза адаптивных наблюдателей состояний во многом определили K. Narendra, G. Luders, R. Carroll, D. Lindorf, G. Kreisselmeier, A. Annaswamy, P. Ioannou, R. Marino, P. Tomei, A. Isidori, R. Ortega, S.B. Roy, D. Efimov, А.А. Бобцов, В.О. Никифоров, А.А. Пыркин, С.В. Арановский, Н.Н. Карабутов и пр.
Анализ и сравнение укрупненных групп методов синтеза наблюдателей состояний линейных динамических систем позволил выделить объект и предмет исследования, а также сформулировать актуальное направление совершенствования существующих решений.
Объектом исследования являются наблюдатели координат состояний линейных динамических систем.
Предметом исследования является построение адаптивных наблюдателей состояний.
Цель диссертационного исследования заключается в создании метода адаптивного восстановления физических, а не виртуальных состояний линейных динамических систем для ситуации, когда неизвестные параметры в математической модели системы умножены на неизмеряемые сигналы.
Данная цель определила следующие основные задачи:
31) Разработать алгоритм идентификации значений функций от параметров нелинейных по параметрам регрессионных уравнений.
32) Применить алгоритм, полученный при решении З1, для синтеза адаптивных наблюдателей физических состояний линейных систем для ситуации, когда неизвестные параметры в математической модели системы умножены на неизмеряемые сигналы.
33) Расширить решение 32 на класс линейных систем с сигнальными ограниченными возмущениями с неизвестной динамической моделью.
Основные положения, выносимые на защиту:
П1) Разработан алгоритм идентификации, позволяющий идентифицировать значения функций от параметров нелинейных по параметрам регрессионных уравнений.
П2) Предложен метод построения адаптивных дифференциальных и алгебраических наблюдателей физических состояний линейных систем, позволяющий восстанавливать координаты состояния в ситуации, когда неизвестные параметры в математической модели системы умножены на неизмеряемые сигналы.
П3) Получен метод построения адаптивных наблюдателей физических состояний линейных систем, обеспечивающий восстановление координат состояний системы в ситуации, когда неизвестные параметры в математической модели системы умножены на неизмеряемые сигналы, а на систему действует возмущение с неизвестной динамической моделью.
Соответствие паспорту специальности. Положения, выносимые на защиту, соответствуют паспорту специальности 2.3.1 - «Системный анализ, управление и обработка информации, статистика» по следующим пунктам:
4. Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений, обработки информации и искусственного интеллекта (П2, П3);
6. Методы идентификации систем управления на основе ретроспективной, текущей и экспертной информации (П2, П3);
7. Методы и алгоритмы структурно-параметрического синтеза и идентификации сложных систем (П1).
Научная новизна полученных результатов заключается в следующем:
Н1) Алгоритм идентификации значений функций от параметров нелинейных по параметрам регрессионных уравнений, в отличие от существующих решений, свободен от разрывов по формируемым оценкам, не требует априорной информации о неизвестных параметрах и функций от них и обеспечивает монотонную поэлементно экспоненциальную сходимость оценок к истинным значениям при конечном возбуждении регрессора.
Н2) Адаптивные наблюдатели физических состояний линейных систем, соответствующие положениям, выносимым на защиту П2 и П3, отличаются от известных адаптивных наблюдателей ослабленными условиями сходимости и способностью восстановления физических, а не виртуальных координат состояния в ситуации, когда неизвестные параметры в математической модели системы умножены на неизмеряемые сигналы.
Теоретическая и практическая значимость диссертационной работы определена актуальностью решения многообразия теоретических и прикладных задач управления линейными динамическими системами с неизмеряемым вектором состояний.
Методы исследования. Выносимые на защиту положения получены с применением методов теории управления, линейной алгебры, математического анализа, идентификации и оптимизации. Новый алгоритм идентификации П1 получен с помощью применения процедуры динамического расширения и смешивания, развиваемой в работах R. Ortega, А. А. Бобцова, А. А. Пыркина, С. В. Аранов-ского и др. Метод построения адаптивного наблюдателя П3 базируется на методе вспомогательного контура, развиваемого в работах А.М. Цыкунова и И.Б. Фурта-та. Доказательство основных теорем работы осуществлено с помощью аппарата функций Ляпунова.
Степень достоверности полученных результатов обеспечивается корректным использованием строгих математических методов, результатами компьютерного моделирования и наличием публикаций по теме диссертации в высокорейтинговых рецензируемых печатных и электронных изданиях.
Апробация работы. Результаты работы докладывались на следующих конференциях и семинарах:
- 31th Mediterranean Conference on Control and Automation (31-ая средиземноморская конференция по управлению и автоматизации, 26-29 июня 2023, Лимассол, Кипр);
- 32th Mediterranean Conference on Control and Automation (32-ая средиземноморская конференция по управлению и автоматизации, 11-14 июня 2024, Ханья, о. Крит, Греция);
- 2024 American Control Conference (Американская конференция по управлению, 8-12 июля 2024, Торонто, Канада);
- Всероссийская школа-конференция молодых ученых «Управление большими системами» (УБС'2023, 5-8 сентября 2023, Воронеж, Россия и УБС'2024, 10-13 сентября 2024, Новочеркасск, Россия);
- Общемосковский семинар «Теория автоматического управления» Лаборатории 7 ИПУ РАН.
Личный вклад соискателя заключается в определении цели и задачи исследования, формулировании условий ее разрешимости и создании оригинальных алгоритмов и методов, соответствующих положениям П1-П3, выносимым на защиту. Таким образом, все основные результаты диссертационной работы получены автором самостоятельно.
Публикации. Научные результаты диссертации опубликованы в 9 рецензируемых научных изданиях, из числа которых 4 публикации [1-4] - в изданиях, индексируемых в международных базах данных, приравненных к журналам категории К1 Перечня ВАК, и [5-9] публикаций - в сборниках трудов международных и всероссийских конференций.
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения и двух приложений. Полный объем диссертации составляет 174 страницы с 12 рисунками и 3 таблицами. Список литературы содержит 79 наименований.
Вспомогательные сведения из математического анализа, теорий автоматического управления, оптимизации, параметрической идентификации и гармонического анализа приведены в приложении А. Доказательства сформулированных в работе лемм, теорем и утверждений вынесены в приложение Б.
Глава 1. Обзор предметной области и обобщенная постановка задачи
В главе проведен сравнительный анализ существующих методов оценивания состояний линейных стационарных динамических систем один вход - один выход с параметрической неопределенностью. Выявлены и обозначены достоинства и недостатки существующих решений. Введен в рассмотрение новый класс стационарных линейных динамических систем с перепараметризацией и параметрической неопределенностью. Обозначены его преимущества перед классом линейных систем в задаче адаптивного оценивания неизмеряемых состояний. В виде расширенных условий наблюдаемости формализованы условия разрешимости задачи восстановления физических состояний линейных динамических систем с перепараметризацией и неизвестными параметрами. Сформулирована обобщенная постановка задачи, решению которой посвящены последующие главы.
В изложении аксиоматически используются представленные в приложении А базовые сведения из математического анализа, теорий автоматического управления, оптимизации и параметрической идентификации.
1.1 Задача оценивания состояний линейных динамических систем
Многие реальные технические системы с достаточной точностью могут быть описаны линейными моделями с постоянными параметрами (здесь и далее рассматриваются системы один вход - один выход):
х (¿) = Ах (¿) + Ви (¿), х (¿0) = х0,
у (¿) = С тх (¿), (.)
где х (¿) Е - неизмеряемые физические состояния с неизвестными начальными условиями х0, и (¿) Е К - измеряемое или формируемое управление, А Е Кпхп, В Е Кпх1 - неизвестная матрица и вектор, С Е - известный вектор, формирующий измеряемый выход у (¿) Е К. Знание вектора С мотивировано прикладными задачами, в которых обычно координаты х (¿) имеют физи-
ческий смысл, а измеряемый выход формируется путем вырезания из х (Ь) измеряемого датчиком элемента у (Ь) = хг (Ь), % Е {1,... ,п}. Пары (Ст, А) и (А, В) полностью наблюдаемы и управляемы, соответственно (определения и критерии управляемости и наблюдаемости приведены в приложении А).
Одной из базовых задач теории управления является задача стабилизации, то есть приведение состояний линейных систем из произвольных ограниченных начальных состояний хо к началу координат. Если состояния х (Ь) измеряемы, пара матриц (А, В) известна и управляема, то эта задача может быть решена с использованием обратной связи по состоянию:
и (Ь) = -Кх (Ь), (1.2)
где строка К Е К1хп выбрана из условия тах^е (Лг (А — В К))) < 0 и может быть
г
рассчитана, например, модальным методом (см. теорема А5 из приложения А):
АМ — ИАге< = ВН,
л * (1.3)
К = НМ—1,
где матрица Аге* и вектор Н выбираются так, что а {А} П а {Аге*} = 0, а пара (Н, Аге*) наблюдаема.
Однако поскольку состояния системы недоступны для измерения, а параметры матриц А и В неизвестны по постановке задачи, обратная связь (1.2) нере-ализуема, и естественным образом возникает задача синтеза динамической обратной связи в следующих видах:
и (Ь) = —Кгх(Ь), (1.4а)
и (г) = —К (г) х (г) , (1.4б)
где:
(1.4а) - робастная динамическая обратная связь (Кг обеспечивает тах^е (Лг (А — ВКГ))) < 0 для всех матриц из известных семейств);
г
(1.4б) - адаптивная динамическая обратная связь (законы изменения К (Ь) и х (Ь) совместно обеспечивают асимптотическую устойчивость положения равновесия системы (1.1)). В частном случае К (Ь) может быть оценкой параметров К модального регулятора (1.2), (1.3).
Для реализации обратных связей (1.4а) и (1.4б) требуется формирование оценок состояний системы (1.1) таким образом, что:
lim \\x(t)\\ = lim \\x(t) - x (t)|| = 0 (exp), (1.5)
где x (t) - оценка состояний системы, x (t) - ошибка восстановления/наблюдения/ оценивания, exp - аббревиатура, означающая экспоненциальную скорость сходимости с произвольным показателем.
Задача оценивания/восстановления неизмеряемых состояний системы (1.5) с произвольной скоростью сходимости разрешима для систем с полностью наблюдаемой парой (Cт, A). Далее в обзоре рассматриваются исключительно методы решения задачи (1.5), а вопросы построения закона формирования динамического коэффициента K (t) и формул (процедур) расчета параметров Kr выносятся за рамки как настоящего обзора, так и всей диссертационной работы.
В целях корректного анализа методов из литературных источников принимается выполненным следующее классическое допущение.
Допущение 1.1. Реализуемое в системе управление u (t) ограничено и обеспечивает ограниченность состояний x (t) для всех t > t0.
Замечание 1.1. Кроме рассмотренной в этом подразделе проблемы стабилизации системы по динамической обратной связи, практика изобилует другими задачами, требующими оценки вектора неизмеряемых состояний системы. Например, диагностика отказов, мониторинг и регистрация неизмеряемых переменных технологических процессов, построение цифровых двойников и т.д.
1.2 Обзор методов оценивания состояний линейных систем
Проблема оценивания состояний динамических систем восходит к работам Д. Люенбергера [10] и Р. Калмана [11], в которых задача (1.5) была сформулирована для систем с известными матрицами. Современные работы посвящены распространению этих фундаментальных результатов на класс систем с параметрической неопределенностью (1.1), и для достижения цели (1.5) используют методы робастного, инвариантного и адаптивного оценивания. Рассмотрим эти подходы.
1.2.1 Робастные методы оценивания состояний
Стандартный наблюдатель Люенбергера описывается следующим уравнением:
х (Ь) = Апх (Ь) + Впи (Ь) + Ь{у (Ь) — Стх (Ь)) , х (Ь0) = х0, (1.6)
где Ап Е Кпхп - матрица номинальных параметров системы, Вп Е Кпх1 - матрица номинальных коэффициентов усиления по управлению, Ь Е Кпх1 - корректор.
Если в системе (1.1) реализуются равенства А = Ап, В = Вп, то, как следует из уравнения (в этом разделе обзора переопределим е (Ь) = — х (Ь)):
е (Ь) = (Ап — ЬСт) е (Ь) ,е (Ьо) = хо — хо, (1.7)
наблюдатель (1.6) решает поставленную задачу (1.5) при гурвицевости Ап — ЬСт.
Если А = Ап и/или В = Вп, то вместо (1.7) приходим к следующему уравнению:
е (Ь) = Ах (Ь) + Ви )Ь) — Апх (Ь) — Впи (Ь) — Ь (у (Ь) — Стх (Ь)) =
= (Ап — ЬСт) е (Ь) + (В — Вп) и (Ь) + (А — Ап)х(Ь). ( ' )
Робастные наблюдатели состояний основываются на идее обеспечения выполнения целевого условия (1.5) не для одной пары известных матриц Ап, Вп, а для некоторого заранее заданного и известного семейства матриц. С точки зрения устойчивости траекторий (1.8) можно выделить две различные ситуации.
А. Задача робастной фильтрации. Допущение 1.1 выполнено, сигнал и (Ь) измеряем, но недоступен для формирования. В этих условиях, наблюдатель (1.6) не позволяет решить поставленную задачу (1.5) без дополнительных ограничений на класс сигнала и (Ь). Если и Е Ь2, то поставленная цель (1.5) может быть достигнута, и дополнительно возникает задача Н7 фильтрации, то есть назначения заданного ^ > 0 отношения Ь2 нормы ошибки е (Ь) к Ь2 норме сигнала и (Ь):
,// е2 (в) ( < Ъ ]
У V и
I 7
7 е2 (в) (1з < 7 ХЦ и2 (в) (1з. (1.9)
¿0
Если же и Е Ьж и А гурвицева, то (1.6) обеспечивает только сходимость ошибки оценивания в некоторую ограниченную область фазового пространства и возникает задача ее минимизации в некотором смысле.
Б. Задача о линейном динамическом регуляторе. Управление есть линейная функция от состояний наблюдателя, то есть и (¿) = —Кгх (¿), а коэффициенты обратной связи Кг, наряду с корректором Ь доступны для назначения. В этой ситуации, путем совместного расчета Кг и Ь возможно обеспечить (1.5).
Для решения этих задач в робастной теории выполняют параметризацию имеющихся в матрицах А и В параметрических неопределенностей. Например, часто используется структурированная форма (такие возмущения еще называют ограниченными по норме) [12]:
А = Ап + глаЛиЛ, В = Вп + ЕвАвнв , (1.10)
где матричные неопределенности Ал е Шрах<а и Ав Е х<в удовлетворяют ограничениям
\\аЛ\\ < 1, \\Ав|| < 1,
а весовые матрицы ГА Е КпхрА, нл е ш<ахп, Ев Е Кпхрв, Ив Е хп известны.
Альтернативным вариантом является аффинная параметризация [13]:
Я (д) = (А (д) , В (д)) ЕП
П.= \ Я (д): Я (д) = £дгЯг; = 1,дг > о) . (Ы1)
I г=1 г=1 J
Независимо от выбранной параметризации неопределенности обычно дополнительно предполагается, что Ап гурвицева (этого всегда можно добиться путем предварительной коррекции номинальной части системы).
Рассмотрим возможные решения задачи фильтрации и управления линейным динамическим регулятором при наличии структурированной (1.10) или аффинной (1.11) неопределенности.
1.2.1.1 Задача робастной фильтрации
Поскольку в задаче фильтрации вход и (г) предполагается недоступным для формирования, то успех ее решения полностью зависит от априорных предположений о классе этого сигнала. Различают задачи фильтрации в стохастической постановке (например, и (г) - случайный белый шум с нулевым средним) и детерминированной (например, и Е Ь2 или и Е Ьж). В этом обзоре ограничимся рассмотрением некоторых решений задачи фильтрации в детерминированной постановке.
А. фильтрация
Задача фильтрации состоит в получении оценки состояний х (г) такой, что при и Е Ь2 выполнено условие (1.5) и при х0 = 0 для заданного ^ > 0 верно (1.9) для всех неопределенностей (1.10) или (1.11).
На сегодняшний день решение этой задачи получено как для структурированных (1.10), так и для аффинных (1.11) неопределенностей (см. соответственно [14; 15] и [16-19]). Для структурированной неопределенности решение получается в терминах решений двух связанных уравнений Риккати (2-Риккати подход). Для случая аффинной неопределенности решения получаются в терминах линейных матричных неравенств, выводимых на базе квадратичных функций Ляпунова как независящих [16; 17], так и зависящих [18; 19] от параметра. Подробный сравнительный обзор существующих решений может быть найден в [20]. В этой же работе ограничимся описанием одного алгоритма, доставляющего (1.5) и (1.9) при аффинной неопределенности.
Решение задачи фильтрации, как правило, строится с помощью наблюдателя, задаваемого следующим уравнением:
х(г) = Сх(г) + Ьу (г) ,х(г) = х0. (1.12)
В отличие от (1.6), здесь входной сигнал и (г) при формировании оценок состояний не используется, а для расчета доступен не только корректор Ь, но и матрица С, которая более не фиксируется равной номинальной матрице системы Ап. Процедуру расчета этих параметров дает следующая теорема:
Теорема 1.1. Пусть У1,У2 и Р1, Р2 -решения линейных матричных неравенств (ЛМН)
Pi P2 P2 P2
> 0,
где
üii + П1г Yi + PiBi I * Yi + YT P2Bi 0
-Y2I 0 I
< 0, yi = 1,...k, (1.13)
= PiAi + Y2Ct, Ü2,i = P2Äi + Y2Ct,
относительно У1 Е шпхп, У2 Е Кп и Р1 Е шпхп, Р2 Е Кпхп при заданном 0.
Тогда параметры С = Ь = Р—1У2 доставляют выполнение целевых
условий (1.5) и (1.9).
Доказательство приведено в [20].
У наблюдателя (1.12), рассчитанного путем решения ЛМН (1.13), возможно выделить три основных недостатка. Во-первых, это выполнение цели (1.5) только при удовлетворении неопределенностью заранее принятой параметризации (1.11), что, на самом деле, свойственно всем робастным решениям. Во-вторых, это излишний консерватизм, заложенный в процедуре синтеза и связанный с использованием общей функции Ляпунова для s вершин многогранника (1.11). В-третьих, это достижение цели (1.5) только при выполнении ограничительного условия u Е L2. Для устранения второго недостатка в [18; 19] развиты процедуры, решающие задачу (1.9) на основе функции Ляпунова, зависящей от параметра.
Б. Метод инвариантных эллипсоидов
В более распространенном на практике случае u Е L2, u Е Lж и при гур-вицевости матрицы Än — LCT на основании (1.8) можно сделать вывод только об асимптотической сходимости ошибки оценивания по норме в некоторую трубку:
lim \\e (t)\\ ^ emax:
где emax зависит как от оценки сверху на сигнал (B — Bn) u (t) + (A — Än) x (t), так и от выбранного корректора L.
Более аккуратное описание асимптотического поведения ошибки для этой ситуации может быть получено с помощью понятия инвариантного эллипсоида системы.
Эллипсоид с центром в начале координат
Ее = {в е Кп: втР-1в < 1} ,Ре > 0
называется инвариантным для системы (1.8) + (1.10), если при всех неопределенностях || Да || < 1, || Ад || < 1 и всех управлениях \и (Ь)\ < 1 верно:
1) во е Ее ^ в (Ь) е Ее для всех Ь > Ь0;
2) в0 е Ее ^ в (Ь) ^ Ее при Ь ^ о.
Матрица Ре е Кпхп называется матрицей эллипсоида Ее.
Очевидно, что для рассматриваемой системы (1.8) существует бесконечно много инвариантных эллипсоидов. Так как достичь цели (1.5) в задаче фильтрации при и е Ьо, А = Ап и/или В = Вп оказывается невозможно средствами робастного управления, то остается только попытаться заключить ошибку в (Ь) в минимальный из всех эллипсоидов. Минимальность эллипсоида можно понимать по-разному, наиболее часто в литературе в качестве критерия минимальности принимается минимизация суммы квадратов полуосей эллипсоида или, эквивалентно, минимизация следа матрицы Ре эллипсоида [21]. Строго задача минимизации суммы квадратов полуосей элипсоида формулируется следующим образом.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Адаптивное управление в условиях запаздывания, неполной информации о параметрах и переменных состояния системы2015 год, доктор наук Пыркин Антон Александрович
Метод синтеза адаптивных наблюдателей для нестационарных систем с полиномиальными параметрами2021 год, кандидат наук Данг Бинь Хак
Адаптивное оценивание нестационарных параметров с использованием метода внутренней модели2023 год, кандидат наук Нгуен Хак Тунг
Каскадный синтез наблюдателей состояния динамических систем2003 год, доктор технических наук Краснова, Светлана Анатольевна
Адаптивные наблюдатели линейных нестационарных систем в условиях неизмеряемых возмущений2021 год, кандидат наук Низовцев Сергей Игоревич
Список литературы диссертационного исследования кандидат наук Ласточкин Константин Андреевич, 2025 год
Список литературы
1. Глущенко А.И., Ласточкин К. А. Адаптивный наблюдатель состояний и возмущений линейных систем с перепараметризацией // Автоматика и телемеханика. - 2023. -№ 11. - С.115-146.
2. Glushchenko A., Lastochkin K. Monotonous Parameter Estimation of One Class of Nonlinearly Parameterized Regressions without Overparameterization // Automatica. - 2024. - Vol. 163. - P. 111561 (1-6).
3. Glushchenko A., Lastochkin K. Exponentially Stable Adaptive Observation for Systems Parameterized by Unknown Physical Parameters // IEEE Transactions on Automatic Control. - 2024. - Vol. 69. - No. 8. - P.5635-5642.
4. Glushchenko A., Lastochkin K. Instrumental Variables based DREM for Online Asymptotic Identification of Perturbed Linear Systems // IEEE Transactions on Automatic Control. - 2025.- Vol. 70.- No. 2. - 1320-1327 p.
5. Glushchenko A., Lastochkin K. Parameter Estimation-Based Observer for Linear Systems with Polynomial Overparameterization // 31st Mediterranean Conference on Control and Automation (MED). - 2023 . - P. 795-799.
6. Glushchenko A., Lastochkin K. Extended Adaptive Observer for Linear Systems with Overparameterization // 31st Mediterranean Conference on Control and Automation (MED). - 2023. - P. 789-794.
7. Glushchenko A., Lastochkin K. Parameter Estimation-Based Extended Observer for Linear Systems with Polynomial Overparametrization // 32nd Mediterranean Conference on Control and Automation (MED). - 2024. - P. 143-148.
8. Glushchenko A., Lastochkin K. Parameter Estimation-Based States Reconstruction of Uncertain Linear Systems with Overparameterization and Unknown Additive Perturbations // 2024 American Control Conference (ACC). - 2024. - P. 34583464.
9. Глущенко А.И., Ласточкин К. А. Адаптивное восстановление состояний двухмассовой электромеханической системы при постоянном возмущении // Управление большими системами: сборник научных трудов XIX Всероссийской школы-конференции молодых ученых. - Воронеж: ВГТУ, 2024. - С. 18-25.
10. Luenberger D. G. Observing the state of a linear system // IEEE Transactions on Military Electronics. - 1964. - Vol. 8.- No. 2. - P. 74-80.
11. Kalman R. E., Bucy R. S. New Results in Linear Filtering and Prediction Theory // Journal of Basic Engineering. - 1961. - Vol. 83. - P. 95-108.
12. Petersen I. R. A stabilization algorithm for a class of uncertain linear systems // Systems & Control Letters. - 1987. - Vol. 8.- No. 4. - P. 351-357.
13. Geromel J. C., Peres P. L. D., Bernussou J. On a convex parameter space method for linear control design of uncertain systems // SIAM Journal on Control and Optimization.- 1991.- Vol.29.- No. 2. - P. 381-402.
14. Fu M., de Souza C. E., Xie L. H^ estimation for uncertain systems // International Journal of Robust and Nonlinear Control.- 1992.- Vol. 2.- No. 2.-P. 87-105.
15. Xie L., de Souza C. E. On robust filtering for linear systems with parameter uncertainty // Proceedings of 1995 34th IEEE Conference on Decision and Control. -1992.- Vol.2.- P. 2087-2092.
16. Geromel J. C., Oliveira M. C. De. H2 and H^ robust filtering for convex bounded uncertain systems // IEEE Transactions on Automatic Control.- 2001.-Vol. 46.- No. 1.- P. 100-107.
17. Jin S. H., Park J. B. Robust H2, Hfiltering for polytopic uncertain systems via convex optimisation // IEEE Proceedings-Control Theory and Applications. -2001.- Vol. 148.- No. 1.- P. 55-59.
18. Robust H2 and Hfiltering for uncertain linear systems / Z. Duan, J. Zhang, C. Zhang, E. Mosca//Automatica. - 2006.- Vol.42.- No. 11.- P. 1919-1926.
19. Lacerda M. J., Oliveira R. C. L. F., Peres P. L. D. Robust H2 and Hfilter design for uncertain linear systems via LMIs and polynomial matrices // Signal Processing.- 2011.- Vol.91.- No. 5.- P. 1115-1122.
20. Gao H., Li X. Robust filtering for uncertain systems. - Cham, Switzerland: Springer.- 2014.- 253 p.
21. Поляк Б. Т., Хлебников М. В., Рапопорт Л. Б. Математическая теория автоматического управления: учеб. пособие. - М. : ЛЕНАНД.- 2019. - 500 с.
22. Petersen I. R. A Stabilization Algorithm for a Class of Uncertain Linear Systems // Systems & Control Letters. - 1987. - Vol. 8.- No. 4. - P. 351-357.
23. Poznyak A. S. Advanced mathematical tools for automatic control engineers: Volume 1: Deterministic Systems. - Elsevier.- 2010. - 803 p.
24. Хлебников М. В. Робастная фильтрация при неслучайных возмущениях: метод инвариантных эллипсоидов // Автоматика и телемеханика. - 2009. -№ 1.- С. 147-161.
25. O'Reilly J. Observers for linear systems. - Academic press.- 1983. - 252 p.
26. Petersen I. R. A Riccati equation approach to the design of stabilizing controllers and observers for a class of uncertain linear systems // 1985 American Control Conference.- 1985.- P. 772-777.
27. Boyd S., Ghaoui L. El., Feron E., Balakrishnan V. Linear Matrix Inequalities in System and Control Theory. - Philadelphia: SIAM.- 1994.- 205 p.
28. Lien C. H., Yu K. W. LMI optimization approach on robustness and H^ control analysis for observer-based control of uncertain systems // Chaos, Solitons & Fractals.- 2008.- Vol.36.- No. 3.- P. 617-627.
29. Perruquetti W., Barbot J.P. Sliding mode control in engineering.- N.Y. : Marcel Dekker.- 2002. - 407 p.
30. Alwi H., Edwards C., Tan C. P. Fault detection and fault-tolerant control using sliding modes. - London : Springer.- 2011. - 340 p.
31. Y. Shtessel, C. Edwards, L. Fridman and A. Levant. Sliding mode control and observation. - New York : Springer New York.- 2011. - 369 p.
32. V. Utkin, A. Poznyak, Y. Orlov and A. Polyakov. Road map for sliding mode control design. - New York : Springer International Publishing.- 2020. - 134 p.
33. Yang F., Wilde R. W. Observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. - 1988. - Vol. 33.- No. 7. - P. 677-681.
34. DarouachM., Zasadzinski M., Xu S. J. Full-order observers for linear systems with unknown inputs // IEEE Transactions on Automatic Control. - 1994. - Vol. 39.-No. 3.- P. 606-609.
35. Dimassi H., Dimassi A., Belghith S. Continuously-implemented sliding-mode adaptive unknown-input observers under noisy measurements // Systems & Con-
trol Letters. - 2012.- Vol.61.- No. 12.- P. 1194-1202.
36. Utkin V. I. Sliding modes in control and optimization. - Springer Science & Business Media.- 2013.- 285 p.
37. Slotine J.J.E., Hedrick J.K., Misawa E.A. On sliding observers for nonlinear systems // Journal of Dynamics, Systems, Measurement, and Control. - 1987. - Vol. 109.- P. 245-252.
38. Edwards C., Spurgeon S. K. On the development of discontinuous observers // International Journal of Control.- 1994.- Vol. 59.-No. 5. - P. 1211-1229.
39. Edwards C., Spurgeon S. K., Patton R. J. Sliding mode observers for fault detection and isolation//Automatica. - 2000.- Vol. 36.-No. 4. - P. 541-553.
40. Edwards C., Tan C. P. A comparison of sliding mode and unknown input observers for fault reconstruction // European Journal of Control. - 2006. - Vol. 12.-No. 3.- P. 245-260.
41. Darouach M., Zasadzinski M., Boutat-Baddas L. Discussion on "A comparison of sliding mode and unknown input observer for fault reconstruction" // European Journal of Control.- 2006.- Vol. 12.- No. 3.- P. 261-266.
42. Floquet T., Edwards C., Spurgeon S. K. On sliding mode observers for systems with unknown inputs // Journal of Adaptive Control and Signal Processing. -2007.- Vol. 21.- No. 8-9.- P. 638-656.
43. Isidori A. Lectures in feedback design for multivariable systems. - Basel, Switzerland : Springer International Publishing.- 2017. - 414 p.
44. K. Kalsi, J. Lian, S. Hui, S. H. Zak Sliding-mode observers for systems with unknown inputs: A high-gain approach // Automatica. - 2010. - Vol. 46.- No. 2. -P. 347-353.
45. Zhu F. State estimation and unknown input reconstruction via both reduced-order and high-order sliding mode observers // Journal of Process Control. - 2012. -Vol. 22.- No. 1.- P. 296-302.
46. Краснова С.А., Уткин В.А. Каскадный синтез наблюдателей состояния динамических систем. - М. : Наука.- 2006. - 272 с.
47. Floquet T., Barbot J.-P. A canonical form for the design of unknown input sliding mode observers // Advances in Variable Structure and Sliding Mode Control. -
2006.- Vol.334.- P. 271-292.
48. Cho Y. M., Rajamani R. A systematic approach to adaptive observer synthesis for nonlinear systems // IEEE Transactions on Automatic Control. - 1997. - Vol. 42.-No. 4. - P. 534-537.
49. Cecilia A., Costa-Castello R. Addressing the relative degree restriction in nonlinear adaptive observers: A high-gain observer approach // Journal of the Franklin Institute.- 2022.- Vol.359.- No. 8. - P. 3857-3882.
50. Antsaklis P. J., Michel A. N. Linear systems. - New York : McGraw-Hill.-1997.- 672 p.
51. Carroll R., Lindorff D. An adaptive observer for single-input single-output linear systems // IEEE Transactions on Automatic Control.- 1973.- Vol. 18.-No. 5. - P. 428-435.
52. Luders G., Narendra K. S. An adaptive observer and identifier for a linear system // IEEE Transactions on Automatic Control.- 1973.- Vol. 18.- No. 5.-P. 496-499.
53. Narendra K. S., Kudva P. Stable adaptive schemes for system identification and control-Part I // IEEE Transactions on Systems, Man, and Cybernetics. - 1974. -Vol.6.- P. 542-551.
54. Ioannou P. A., Sun J. Robust adaptive control. - New York : McGraw-Hill.-1996.- 834 p.
55. Zhang Q. Revisiting different adaptive observers through a unified formulation // Proceedings of the 44th IEEE Conference on Decision and Control. - 2005. -P. 3067-3072.
56. Kreisselmeier G. Adaptive observers with exponential rate of convergence // IEEE Transactions on Systems, Man, and Cybernetics. - 1977.- Vol.22.- No. 1.-P. 2-8.
57. Прокопов Б. И. О построении адаптивных наблюдателей // Автоматика и телемеханика. - 1981. - Т. 22.- № 5. - С. 95-100.
58. A. Bobtsov, A. Pyrkin, A. Vedyakov, A. Vediakova, and S. Aranovskiy A Modification of Generalized Parameter-Based Adaptive Observer for Linear Systems with Relaxed Excitation Conditions // IFACPapersOnLine. - 2022. - Vol. 55.-No. 12. - P. 324-329.
59. Efimov D., Fradkov A. Design of impulsive adaptive observers for improvement of persistency of excitation // International Journal of Adaptive Control and Signal Processing.- 2015.- Vol.29.- No. 6. - P. 765-782.
60. Aranovskiy S., Ushirobira R., Korotina M., Vedyakov A. On Preserving-Excitation Properties of Kreisselmeier's Regressor Extension Scheme // IEEE Transactions on Automatic Control. - 2023.- Vol. 68.- No. 2. - P. 1296-1302.
61. Aranovskiy S., Bobtsov A., Ortega R., Pyrkin A. Performance Enhancement of Parameter Estimators via Dynamic Regressor Extension and Mixing // IEEE Transactions on Automatic Control. - 2017. - Vol. 62.- No. 7. - P. 3546-3550.
62. Baev S., Shkolnikov I., Shtessel Y., Poznyak A. Parameter identification of non-linear system using traditional and high order sliding modes // American Control Conference. - 2006. - P. 1-6.
63. Boyd S., Sastry S. S. Necessary and sufficient conditions for parameter convergence in adaptive control // Automatica. - 1986. - Vol. 22.- No. 6. - P. 629-639.
64. Ortega R., Nikiforov V., Gerasimov D. On modified parameter estimators for identification and adaptive control. A unified framework and some new schemes // Annual Reviews in Control. - 2020. - Vol. 50. - P. 278-293.
65. Glushchenko A., Petrov V., Lastochkin K. Regression Filtration with Resetting to Provide Exponential Convergence of MRAC for Plants with Jump Change of Unknown Parameters // IEEE Transactions on Automatic Control. - 2023. - Vol. 68.-No. 8.- P. 5127-5134.
66. Glushchenko A., Lastochkin K. Unknown piecewise constant parameters identification with exponential rate of convergence // International Journal of Adaptive Control and Signal Processing. - 2022. - Vol. 37.- No. 1. - P. 315-346.
67. Ortega R., Aranovskiy S., Pyrkin A. A., Astolfi A., Bobtsov A. A., New Results on Parameter Estimation via Dynamic Regressor Extension and Mixing: Continuous and Discrete-Time Cases // IEEE Transactions on Automatic Control. - 2021. -Vol. 66.- No. 5. - P. 2265-2272.
68. Ключев В.И. Теория электропривода. - М : Энергоатомиздат.- 2001. -
704 с.
69. Wang, L., Ortega, R., Bobtsov, A., Romero, J. G., Yi, B. Identifiability Implies Robust, Globally Exponentially Convergent On-line Parameter Estimation // In-
ternational Journal of Control.- 2024.- Vol.97.- P. 1967-1983.
70. Ortega R., Gromov V., Nuno E., Pyrkin A., Romero J. G. Ortega R. Parameter estimation of nonlinearly parameterized regressions without overparameterization: application to adaptive control // Automatica. - 2021. - Vol. 127. - P. 109544.
71. Bhattacharyya S. P., SouzaE. De. Pole assignment via Sylvester's equation// Systems & Control Letters. - 1982. - Vol. 1.- No. 4. - P. 261-263.
72. Dudarenko N. A., Slita O. V., Ushakov A. V. Algebraic conditions of generalized modal control//IFAC Proc. Volumes. - 2012.- Vol.45.- No. 13.- P. 150-155.
73. Polyak B. T., Smirnov G. Large deviations for non-zero initial conditions in linear systems//Automatica. - 2016.- Vol.74.- P. 297-307.
74. Ким Д.П. Теория автоматического управления. Т.2. Многомерные, нелинейные, оптимальные и адаптивные системы.- М. : ФИЗМАТЛИТ.- 2016.440 с.
75. Chen C.-T. Linear System Theory and Design, 3rd ed. - Oxford, U.K. : Oxford Univ. Press.- 1999.- 334 p.
76. Korovin S. K., Fomichev V. V. State Observers for Linear Systems with Uncertainty. - Berlin, New York: : De Gruyter.- 2009. - 253 p.
77. Tao G. Adaptive control design and analysis. - John Wiley & Sons.- 2003. -
637 p.
78. Aranovskiy S. Parameter Estimation with Enhanced Performance. -Habilitation.- 2021.- 105 p.
79. Поляк Б. Т. Введение в оптимизацию. - М. : Наука.- 1983. - 384 с.
Приложение А
Справочные данные
А.1 Общие сведения из теории автоматического управления
В этом приложении собраны некоторые используемые в тексте диссертации вспомогательные определения и теоремы, относящиеся к теории автоматического управления [74].
Определение А.1. [75, ъ 144] Система (1.1) или пара матриц (А, В) называется управляемой, если для любых начальных условий х (¿0) = х0 и любого конечного состояния XI существует управление и (¿), переводящее состояние х (¿) из х0 в XI за конечное время.
Теорема А.1. [75, ^ 145] Система (1.1) или пара матриц (А, В) управляема в смысле определения А1 если и только если
Теорема А.2. [75, е. 235] Если А е Кпхп, В е пара (А, В) управляема, то для любой Аге1 е Кпхп найдется К такое, что
Определение А.2. [75, ъ 153] Система (1.1) или пара матриц
также управления и (¿) и выхода у (¿) системы на [¿0, ] достаточно для однозначного определения значений начальных условий х (¿0) = х0.
АВ
Л, (А + ВК) = Л, (Аге/) У г = 1, п.
(Ст, А называется наблюдаемой, если для любых неизвестных начальных условий х (¿0) = х0 существует число ¿I > 0 такое, что знание матриц Ст, А, а
Теорема А.3. [75, с. 156] Система (1.1) или пара матриц (Ст, А) наблюдаема в смысле определения А2 если и только если
f CT \
C TA
rank >
< C TAn~l /
= п.
Теорема А.4. [75, с. 250] Если А е Кпхп, Ст е К1хп и пара (Ст, А) наблюдаема, то для любой матрицы Аге/ е Кпхп найдется вектор Ь е Кп такой, что
\г (А + ЬСт) = Лг (Аге/) Уъ =
Теорема А.5. [75, с. 240] Если пара (А, В) управляема, пара (Н, Аге/) наблюдаема и а {А} П а {Аге/ } = 0, то существует и единственно решение уравнения Сильвестра
АМ - МАге/ = ВН,
такое, что вектор К = -НМ-1 гарантирует Л{ (А + В К) = Л{ (Аге/) УЪ = 1, п.
Определение А.3. [76, с. 135] Инвариантными нулями системы (1.16) или триплета (Ап, Б, Ст) называются все числа в е С такие что
rank
sI - An -D CT 0
< n + m.
Определение А.4. [54, c. 127] Передаточная функция
bmsm + Ьт-ism-i + ... + bo
W (s) =
sn + an-\sn~l + ... + a0
называется строго-положительно вещественной (СПВ) если и только если
1) она не имеет полюсов в области Re [s] > 0;
2) Re [W (ju)] > 0 для всех —ж < и < ж;
3) lim u2Re [W (ju)] > 0, где j - мнимая единица.
Определение А.5. [75, с. 130] Состояния автономного уравнения
X(t) = f (x), x (to) = xo, (A.1)
асимптотически устойчивы при / (0) = 0 , если для ограниченных х0 верно х (¿) ^ 0 при £ ^ ос.
Определение А.6. Матрица А е Кпхп называется гурвицевой, если
Re{Лг (А)} < 0, Уг = Т~п.
Теорема А.6. [75, ^ 130] Состояния уравнения (А.1) при / (х) = Ах асимптотически устойчивы если и только если матрица А е Кпхп гурвицева.
А.2 Общие сведения из математического анализа
В этом разделе приводятся некоторые базовые сведения из математического анализа.
Определение А.7. [54, ъ 72] Функция /: ^ К непрерывна, если для всех е > 0 существует некоторое 8 > 0 такое, что
Ух - у\\ < е ^ (х) - / (у)| <8.
Определение А.8. [54, c. 783] Функция /: ^ Кт непрерывно дифференцируема если для всех х е существуют непрерывные функции ^^,
где i = 1, n, j = 1, m.
Определение А.9. [23, c. 251] Функция f—1: Rm — Rn называется обратной к f: Rn — Rm, если для всех x E Rn верно f-1 (f (x)) = x.
Теорема А.7. [23, c. 325] Если f: Rn — Rn непрерывно дифференцируемая функция такая, что det {Vx f (x)} = 0 для всех x E Rn, то f-1: Rn — Rn существует.
Лемма А.1. [77, c. 75] Для любого устойчивого реализуемого оператора H2 (t, s) [.] и соответствующего выхода y (t) = H2 (t, s) [u (t)] верна импликация:
u E Lp ^ y E Lp, p E [1, to] .
Лемма А.2. [77, c. 80] Если f E Lto и f E Lp, p E (0, to), то lim f (t) = 0.
t—УТО
Лемма А.3. [78, Section 3.A.1] Рассмотрим скалярную систему
x (t) = —a2 (t) x (t) + b (t), x (to) = x0,
где x (t) E R и a, b:R> — R - кусочно непрерывные функции. Если a E L2 и b E L\, то lim x (t) = 0.
t—ж
Лемма А.4. [54, с. 74] Рассмотрим неотрицательные функции f :R> — R, g:R> — R. Если f (t) < g (t) для всех t > t0 и g E Lp, p E (0, ж), то f E Lp. Лемма А.5. [77, с. 83] Если f E Lp, 1 < p < ж, то g (t) = H (s) [f (t)] E и lim g (t) = 0 для любой устойчивой и строго реализуемой передаточной
t—У^О
функции H (s) [.].
А.3 Общие сведения из теории оптимизации
В этом разделе приводятся некоторые базовые сведения из теории оптимизации [79].
Определение А.10. [54, с. 784] Непрерывно дифференцируемая функция /: Кп ^ К называется выпуклой на Кп если
/ (а) > / (Ь) + Уъ! (Ь) (а - Ь), Уа, Ь е Кп.
Определение А.11. [54, с. 784] Вектор х* е Кп называется точкой глобального минимума функции /: Кп ^ К если / (х*) < / (х) , Ух е Кп.
Лемма А.6. [54, с. 784] Если /: Кп ^ К непрерывно дифференцируема и выпукла на Кп, тогда х* е Мп - глобальный минимум /: Кп ^ К если и только если / (х*) = 0.
А.4 Общие сведения из теории идентификации
В этом разделе приводятся условия идентифицируемости неизвестных параметров линейного регрессионного уравнения, а также базовые сведения о процедуре синтеза градиентного закона идентификации неизвестных параметров линейного регрессионного уравнения.
Рассмотрим линейное регрессионное уравнение:
у (г) = (г) в, (А.2)
где у (г) е К, ( (г) е - измеряемые сигналы, а в е - неизвестные параметры.
Целью параметрической идентификации является получение оценок неизвестных параметров в в каждый момент времени г таким образом, что
lim
t
в (t) — в =0, (A.3)
где в (г) есть оценка параметров в в момент времени г.
Для решения этой задачи допустимо использовать текущие измерения и всю предысторию, то есть у (т), ( (т), г0 < т < г.
Приведем условия, при которых формально существует решение задачи
(А.3).
Определение А.12. Параметры в называются идентифицируемыми, если существует число г1 > 0 такое, что знание сигналов у (г) , ( (г) на [г0, г1 ] достаточно для однозначного определения их значений.
Конструктивные критерии идентифицируемости даны в следующих утверждениях.
Утверждение А.1. [69] Параметры в линейного регрессионного уравнения (А.2) идентифицируемы, если и только если существует множество {г,},^, г, > г0 такое, что
rank
{ ф (ti) ф (t2) ••• Ф (tn) }
= n.
Утверждение А.2. [69] Параметры в линейного регрессионного уравнения (А.2) идентифицируемы, если и только если ( е FE.
Для построения закона формирования оценок в (г) часто применяют градиентный метод оптимизации, в соответствии с которым в рассмотрение вводится квадратичная форма
,;(в,г) = 2(у (г) - у (г))2 = |у2 (г), (А.4)
где у (г) = фт (г) в (г) - оценка сигнала у (г), а у (г) = у (г) - у (г) - ошибка, вызванная:
а) фт (г) в (г) = фт (г) в,
или
б) в (г) = в.
Тогда, чтобы получить алгоритм идентификации, устраняющий ошибку у (г) и потенциально сходящийся к в, логично изменять в (г) в направлении наискорейшего убывания функции J (в, ^, то есть в направлении антиградиента, что позволяет получить градиентный закон идентификации:
в (г) = -г^т J (в, г) = -Гф (г) (у (г) - у (г)), (А.5)
где Г = Гт > 0 - матрица коэффициентов усиления.
Для каждого момента времени г функция J (в, ^ выпукла на Кп, и в (г) = в
есть глобальный минимум для всех г > г0. Однако функция J (в, ^ может достигать минимум и когда в (г) = в, поскольку уравнение, полученное применением леммы А6
Vт J (в, г) = ф (г) (фт (г) в (г) - у (г)) = о
в общем случае, имеет бесконечное число решений (матрица ф (г) фт (г) е Кпхп всегда вырождена при п > 1). Это наблюдение мотивирует введение следующего определения.
О пр еделение А.13. [54, с.185] Пространством минимизаторов функции J (в, г) называется множество
ü := {& (t) E Rn: ф (t) (фТ (t) & (t) — y (t)) = 0}
Свойства закона (A.3) представлены в следующей теореме. Теорема А.8. [54, с. 184] Закон идентификации (A.5) гарантирует
i) У E Lж П L2,9 E Loo;
ii) если ф E LX), ф E LX), то
lim \y(t)\ =0, lim §(t) =0, lim § (t) E ü;
tt
t
ш) если ( е и ( е РЕ, то
т>00
lim \у (г)| =0 (ехр), lim в (г) =0 (ехр),
где в (г) = в (г) - в.
Таким образом, в общем случае градиентный закон идентификации (А.5) не обеспечивает минимизацию функции (А.4). При ( е ( е гарантируется минимизация функции (А.4) и сходимость оценок в пространство минимизаторов. При выполнении условий ( е и ( е РЕ, закон (А.5) гарантирует достижение цели (А.3).
Процедура синтеза (А.4)-(А.5) часто используется в основном тексте работы для построения законов идентификации параметров различных регрессионных уравнений.
В этом приложении собраны некоторые основные факты из гармонического анализа и приведена одна новая вспомогательная лемма, использующаяся при доказательстве утверждений 4.4 и 4.6.
Определение А.14. [63] Сигнал и (г) е является стационарным, если существует равномерный по г0 предел
где Яи (г) называется автоковариацией сигнала и (г).
Определение А.15. [63] Спектральная мера стационарного сигнала и (г) е это результат преобразования Фурье автоковариационной матрицы
А.5 Общие сведения из гармонического анализа
ц+т
Яи (г):
—со
Утверждение А.3. [63] Пусть y (t) = H (s) u (t), где H (s) это m x n реализуемая матричная передаточная функция с действительной импульной переходной функцией H (t). Тогда, если сигнал u (t) G Rn стационерен, то автоко-вариация и спектральная мера y (t) определены следующим образом:
+то +то
Ry (t) = J f H (n) Ru (t + П - T2) HT (T2) dndT2,
—TO —TO
Sy (w) = H* (jw) Su (w) HT (jw) =H (—jw) Su (w) HT (jw) .
где H* (jw) эрмитова матрица.
Определение А.16. [63] Стационарный сигнал u (t) G Rn называется частотно богатым порядка n, если носитель спектральной меры Su (w) сигнала u (t) содержит не менее n точек.
Определение А.17. [63] Кросс-корреляцией между стационарными сигналами u (t) G Rn и y (t) G Rn называется равномерный по t0 предел
t0+T
Ryu (t) = Тт T J y (t) uT (t + T) dT,
to
Определение А.18. [63] Кросс-спектральной мерой сигналов u (t) G Rn и y (t) G Rn называется преобразоваение Фурье от их кросс-корреляции:
+TO
Syu (w) = J Ryu (T) dT.
—TO
Утверждение А.4. [63] Пусть y (t) = H (s) u (t), где H (s) это реализуемая устойчивая m x n матричная передаточная функция с действительной импульсной переходной функцией H (t). Тогда, если сигнал u (t) G Rn стационарен, то кросс-корреляция и кросс-спектральная мера сигналов u (t) и y (t) определены следующим образом:
+TO
Ryu (t)= J H (Ti) Ru (t + Ti) dTi,
—TO
Syu (w) = H* (jw) Su (w), где H* (jw) - эрмитова матрица.
Лемма А.7. Пусть u (t) G RT и y (t) G RT - стационарные сигналы. Тогда rank {Ryu (0)} = n если и только если существуют Т > 0 и а > 0 такие, что
t+T
det ^ J y (r) uT (r) dr
> а > 0, yt > t0.
(A.6)
Доказательство:
Достаточность. Определение кросс-корреляционной матрицы означает, что существуют Т0 > 0 и числа 11,12 одного знака такие, что
to +To
hRyU (0) < T- I У (r) uT (r) dr < £2RyU (0),
(A.7)
to
откуда
{
to+To
ITdet {RyU (0)} < Tndet ^ J y (r) uT (r) dr } < t2det {Ryu (0)} ,
to
}
и следовательно, если rank {Ryu (0)} = n, то неравенство (A.6) выполнено.
Необходимость. Для всех T > 0 существует постоянная а0 > 0 такая, что а = а0Тт > 0, что позволяет переписать неравенство (A.6) в следующем виде:
t+T
det ^ J y (r) uT (r) dr
> аоТт > 0, yt > to.
(A.8)
Разделив левую и правую часть выражения (A.8) на Тт получим:
1
Т т
t+T
det' 'y (t) uT
y (t) u' (t) dr
t
> ao
(A.9)
и следовательно
|det{Ryu (0)}| = Km T^
T
detj J y (t) uT (t) dr|
> lim a0 = a0 > 0,
T
откуда rank {Ryu (0)} = n.
Приложение Б Доказательства
В этом приложении собраны доказательства сформулированных в работе утверждений, лемм и теорем.
Б.1 Доказательства к главе 1
Доказательство утверждения1.1. Доказательство утверждения выполним конструктивно. Выберем функцию Пг (ш), следующим образом:
Пг (ш) = ш
кп
ктах = тах ¡52 кп, к2, ■ ■ ■ ^к
I I
¿о
}
(Б.1)
Тогда верно равенство:
к
ПТ (ш) Т (х) = £ аоП шктаххг- = 0 ¿=1
к Пх к-
= 52 аошктах-ку (шх1) 1 П х^ = 52 аош 0 ¿=2 о
ктах Ху кг] Пх , \к - ■
3 ПМ*)^,
¿ = 1
(Б2)
которое позволяет сконструировать функцию Тт (ёт (ш) х) следующим образом:
к — У^ к - П.
™тах ^ ~
тт (Ёг (ш) х) = 52 аош тах "
П (шхгр =
¿=1
Пхо
= £ ао П (Ёт (ш) хр,
о ¿=Пхо (Пх 1)
(Б.3)
где
Ёг (ш) х =
Х'2 ■ ■ ■ г
о
го
Пх
йтах— к-у -+ 1
Т
ш К1з х1 шх2 ■ ■ ■ шхГ.
откуда следует равенство (1.94).
Выполнение ограничений следует из справедливости по построению (Б.1)-(Б.3) неравенств:
Пх
пх ктах- = к^^
ктах кз > 0 ^ 13 (ш) = сгзш1 > ш +1, (Б.4)
¡=1
пХ к
что позволяет сделать вывод о неоднородности отображения Т (х) = ^ аз П хГ1чг
з ¡=1
в смысле определения 1.2.
Б.2 Доказательства к главе 2
Доказательство леммы 2.1. I. Подставим функцию z (t) из (1.103) в дифференциальное уравнение для Y (t) из (2.14):
Y (t) = e-a(t-t0(t) z (t) = e-a(t-t0(t) фт (t) ф (в) = Ф (t) ф (в), (Б.5)
теперь решение уравнения (Б.5) подставим в формулу k (t) • Labadj {Ф (t)} Y (t), получив в результате выражение (2.13):
k (t) • Labadj {Ф (t)} Y (t) = k (t) • Labadj {Ф (t)} Ф (t) ф (в) =
= Lab A (t) ф (в) = A (t) Саьф (в) = A (t) фаЬ (в) = Yab (t) . (Б.6)
II. При ф е FE на отрезке [г+, ге] для всех г > ге справедливо неравенство (1.72), позволяющее записать:
А(г) = к [г) • йег {ф (г)} = к (г) • йег |} е-°(т-*)ф (т) фт (т) йт | > (б 7)
> kminйeг [ае-^-^¡2п] > 0, откуда следует А (г) > А^п = ктпйег {ае-0^-^ 12п} > 0 для всех г > ге.
Доказательство леммы 2.2. I. Справедливость записи (2.15)-(2.16) доказывается приведенными в главе выкладками (2.3)-(2.5), поэтому здесь остается доказать выполнение для всех t > te неравенства \MK (t)\ > MK > 0 при ф Е FE на отрезке [t+, te].
II. По предположениям (1.100) и (1.101) можем записать
MK (t) = det {Tv (Sy (Me) ^)} = det {Ty (Sy (Me) 9)} = = det {Пк (Me) V (9)} = det {П (Me)} det {V (9)} >
> MleK (t) det {V (9)} = det1« {Tg (Eg (A) Yob)} det {V (9)} =
= det1« {Tg (Eg (A) фаЬ)} det {V (9)} = (Б.8)
= det1« {Пе (A) g (фаъ)} det {V (9)} = = det1« {Пе (A)} det1« {g (фаЬ)} det {V (9)} >
> AlJe (t) det1« {g (фаЬ)} det {V (9)} .
Поскольку по предположения rank {g (фаъ)} = ne, rank {V (9)} = пк, а по доказанному в лемме 2.1 A (t) > Amin > 0 при ф Е FE на отрезке [t+, te], то на модуль выражения (Б.8) существует следующая оценка снизу:
\Mk (t)\ > A^n \detln {g (фаъ)} det {V (9)}| = M > 0, (Б.9)
что завершает доказательство леммы 2.2.
Б.3 Доказательства к главе 3
Доказательство леммы 3.1. I. Зададим ошибку:
e (t) = £ (t) - х (t) - fi (t) фа (9) - P (t) фъ (9). (Б.10)
Дифференцируя (Б.10) по времени, имеем:
e (t) = Ao£ (t) + фа (9) y (t) + фъ (9) u (t) - Akх (t) - Ky (t) -- (Akfi (t) + Iny (t)) фа (9) - (AkP (t) + InU (t)) фъ (9) = = Ao£ (t) - AkX (t) - Ky (t) - Akfi (t) фа (9) - AkP (t) фъ (9) = (. ) = Ake (t).
Решение уравнения (Б.11) имеет вид:
е (г) = Фо (г) е (го) = Фо (г) С (го). (Б.12)
Подстановка (Б.12) в (Б.10) позволяет получить уравнение (3.1б).
Подстановка (Б.12) в (Б.10) и умножение полученного выражения на Ср позволяет в терминах (3.4) записать ^ (г) = фт (г) фе (в).
Теперь, проводя с этим уравнением операции (Б.5), (Б.6), пользуясь тождествами С0фе (в) = ф (в) и СаЪф (в) = фаЪ (в), имеем уравнение (3.1а).
II. Доказательство выполнения для всех г > ге неравенства А (г) > А^п > 0 при ф е FE на отрезке [г+, ге] совпадает с выкладками (1.72), (Б.7).
Доказательство леммы 3.2. I. По определению 1.2 и предположению 1.4 в силу:
Ё5 (А)=Ё5 (А) А, Ёд (А)=Ёд (А) А, УаЪ (г) = А (г) фаЪ (в) , из (1.100) имеет место равенство:
Тз (А) УаЪ) = Тд {Ёд (А) Уаъ) в. (Б.13)
Тогда, умножив выражение (Б.13) на ай] {Тд (Ёд (А) УаЪ)}, имеем регрессионное уравнение (3.9), пользуясь которым, по выражению (1.101) получаем:
Тя {Ёе (Мв) У в) = Тх {Ёх (Мв) У в) влв (в). (Б.14)
Умножив выражение (Б.14) на ай] {Тх (Ёх (Мв) Ув)}, получаем регрессионное уравнение (3.10).
Векторизовав первое уравнение из (3.6), с учетом свойств уес (АВ) =
(I ® А) уес (В) = (Вт ® I) уес (А), имеем:
{1п ® Ат (в) - Гт ® 1п) уес (М) = уес {СВт (в)) . (Б.15)
Поскольку уравнения (3.6), (Б.15) имеют единственное решение, то \йег{1п ® Ат (в) - Гт ® 1п} \ > 0, а значит, домножив (Б.15) на союзную мат-
рицу adj {In 0 AT (0) — Гт 0 In}, можем записать:
det )I{0 AT (0) — Гт 0 In} vec (M) = = adj {In 0 AT (0) — Гт 0 In} vec (CBT (0)) .
(Б.16)
Выполним операцию, обратную векторизации {уес 1 {■}), и подставим результат во второе уравнение системы (3.6):
det {In 0 AT (0) — Гт 0 In} B (0)
ч
h(°ab ) (Б 17)
vec-1{adj {In 0 AT (0) — Гт 0 In} vec (CBT (0))}T L (0).
J(OAB )
В соответствии с предположением 1.5 и выражением (3.10), верно:
Mab (t) AT (0) = vec— (LatРфУав (t)),
Mab (t) BT (0) = [LbРфУав (t)]T, (Б.18)
Mab (t) B (0) = LbDфУав (t).
Умножив (Б.17) на Щ (Mab ) = MAB+1In, воспользовавшись свойствами
cndet {A} = det {cA} ,cn—1adj {A} = adj {cA} A e Rnxn, и подставив (Б.18), получим:
Tj (Sj (Mab ) ©ab ) = Щ (Mab ) J (©ab ) = MABJ (©ab ) = = MAB+1^ec—1{adj )In 0 AT (0) — Гт 0 In} vec (CBT (0))}T = = vec—1{ Mab adj {In 0 vec—1 (Lat РфУав) —
—MabГт 0 In} vec (ö(LbРфYab)t) У,
Th (Sh (Mab ) © ab ) = Щ (Mab ) H (©ab ) = MAB+1(t)H (©ab ) =
= MA2/(t)det {In 0 AT (0) — Гт 0 In} B (0) =
= det {In 0 vec—1 (LatРфУав (t)) — Mab (t) Гт 0 In} (LbРфУав (t)),
(Б19)
где Sj (Mab ) = Sh (Mab) = Mab.
На основании уравнений (Б.17) и (Б.19) можем записать регрессионное уравнение относительно параметров корректирующей обратной связи Люенбер-
гера (3.11). Теперь, объединение выражений (3.10) и (3.11) позволяет получить (3.8).
II. По доказанному в лемме 3.1, при ф е FE на отрезке [г+, ге] для всех г > ге верно А (г) > Атщ > 0, а по предположениям 1.4 и 1.5 верно:
det2 {G (фаъ)} > 0, det2 {X (в)} > 0,
det {П (А)} > А1 (t), det {Пе (Me)} > Mf (t),
учитывая rank {J (Qab )} = n из разрешимости при выполнении допущения 1.5 системы уравнений (3.6), имеем выполнение для всех t > te следующих неравенств при ф G FE:
IMe (t)l = Idet {Tg (Eg (А) фаЬ)}| = Idet {П (A)} det {G (фаъ)} >
> Idet {G Ш}1 A^^in = M > 0,
IMab (t)| = \det {Tx (Ex (Me) Уе )}| = Idet {Щ (Me)} det {X (ОД >
> Idet {X (0)}I M (t)\ > Idet {X (0)}I \detl& {G (Фаъ)}\Ae± = (Б.20) = Mab > 0,
Ml (t)\ = \det{ Tj (Ej (Mab ) Yab)} \ = det {J (Qab )} MnA+
n2 +
AB
> \det {J (Qab )}\MnB = Ml > 0.
>
Тогда оценка снизу на регрессор MK (t) для всех t > te имеет вид:
\Mk (t)| = \Mz (t) MnL (t)\ > Mn/Bml = Mk > о- (Б.21)
Доказательство леммы 3.2 завершено.
Доказательство теоремы 3.1. По доказанному во второй главе (2.17), при использовании закона настройки (3.12) и ф G FE в силу (Б.21) для всех t > te оказывается справедлива оценка:
\\k(t)W < e-Y"M(t-te) ||«(te)y , (Б.22)
откуда следует экспоненциальная сходимость параметрической ошибки К (t) к нулю с регулируемой параметром yk > 0 скоростью.
Введем в рассмотрение квадратичную форму:
V = XTPX + e—YM(t—tx),
(Б.23)
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.