Управление летательными аппаратами в условиях действия ограниченных возмущений и неполной информации о состоянии тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Семион Александр Александрович

  • Семион Александр Александрович
  • кандидат науккандидат наук
  • 2022, ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 108
Семион Александр Александрович. Управление летательными аппаратами в условиях действия ограниченных возмущений и неполной информации о состоянии: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Национальный исследовательский университет «Высшая школа экономики». 2022. 108 с.

Оглавление диссертации кандидат наук Семион Александр Александрович

ВВЕДЕНИЕ

Актуальность темы исследования

Предмет исследования

Цель исследования

Задачи исследования

Научная новизна и значимость

Практическая ценность работы

Достоверность результатов

Личный вклад автора

Методы исследования

Апробация работы

Публикации

Положения, выносимые на защиту

Структура и содержание работы

ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ

ГЛАВА 2 РЕГУЛЯТОР С КОЭФФИЦИЕНТАМИ, ЗАВИСЯЩИМИ ОТ СОСТОЯНИЯ

2.1 Постановка задачи

2.2 Уравнение Риккати с параметрами, зависящими от состояния

2.3 Регулятор с дискретно изменяющимися параметрами

2.4 Хранение коэффициентов в памяти

ГЛАВА 3 УПРАВЛЕНИЕ ПРИ НЕПОЛНОЙ ИНФОРМАЦИИ О ПАРАМЕТРАХ И СОСТОЯНИИ ОБЪЕКТА

3.1 Постановка задачи

3.2 Постановка задачи в условиях внешних воздействий

3.3 Построение наблюдателя

3.4 Алгоритм оптимизации

3.5 Синтез регулятора

ГЛАВА 4 ЭФФЕКТЫ ЗАДЕРЖКИ В ЛИНЕЙНЫХ СИСТЕМАХ

4.1 Постановка задачи

4.2 Синтез управления по первому приближению

4.3 Нахождение параметров мажорирующей системы

ГЛАВА 5 ДИФФЕРЕНЦИАЛЬНАЯ ИГРА С НУЛЕВОЙ СУММОЙ

5.1 Постановка задачи

5.2 Классическая дифференциальная игра

5.3 Дифференциальная игра с распределенной информацией

5.4 Дифференциальная игра с помехами

ГЛАВА 6 МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ

6.1 Математическое моделирование SDC регулятора

6.2 Математическое моделирование управления и адаптивного фильтра

6.3 Математическое моделирование системы с задержкой и последействием

6.4 Классическая дифференциальная игра

6.5 Дифференциальная игра с распределенной информацией

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

Введение

Актуальность темы исследования

В современном мире активно разрабатываются и используются различные беспилотные аппараты. Популярность снискали вертолеты с несколькими винтомоторными группами - коптеры. Их применяют для разведки, фотограмметрии, перевозки грузов. Ведутся разработки различных алгоритмов управления подобными дронами [1]. Бортовые системы летательных аппаратов постоянно совершенствуются, их вычислительные мощности растут, а энергопотребление и вес уменьшаются. Таким образом стал возможным полет миниатюрных вертолетов (квадрокоптеров) весом в несколько десятков грамм.

Одновременно с ростом технологического уровня бортовой электроники растут и требования к алгоритмам, осуществляющим стабилизацию летательных аппаратов. При этом, основным критерием оценки качества и синтеза алгоритма системы управления является оптимальность [2] с точки зрения минимума функционала качества. В большинстве методов конструирования алгоритмов оптимальных систем управления рассматривается функционирование системы в полностью наблюдаемом пространстве состояний. Однако на практике, не смотря на повышение качества измерительного оборудования, система управления все еще может нуждаться в наблюдателе, проводящим оценку состояния управляемого объекта, так как априорная и текущая информация может быть неполной или искаженной. Это связанно как с ошибками в показаниях измерительного оборудования, так и сложностью самой системы.

Более того, математическая модель аппарата может не учитывать какие-либо эффекты или же параметры управляемого объекта могут оказаться отличными от заложенных. Нередко при разработке

математической модели реального летательного аппарата закладывают некоторую область отклонения его характеристик от расчетов, а саму математическую модель описывают нелинейными дифференциальными уравнениями.

При исследовании нелинейных систем могут применять методы, описанные в работах А.М. Ляпунова [3], [4]. При синтезе управляющих воздействий обычно довольствуются рассмотрением первого приближения, иными словами задачу управления нелинейным объектом сводят к линейной задаче, а синтез управления основывается на исследовании линеаризованной системы на устойчивость. Основные приемы линеаризации нелинейных уравнений связаны с использованием рядов Тейлора и последующим синтезом управлений по первому приближению [5], [6], [7], [8], [9]. Линейность структуры системы первого приближения и квадратичный функционал качества приводят к решениям, основанным на использовании уравнений типа Риккати. При таком синтезе управления не учитываются начальные условия системы и остаточные нелинейные члены разложения ряда Тейлора. Вследствие этого устойчивость нелинейной системы с таким управлением может не обеспечиваться [2].

Линеаризация, основанная на разложении в ряд Тейлора, не всегда позволяет получить удобную модель. Так, например в [10] автору пришлось прибегнуть к упрощению нелинейной модели, так как изначальная линеаризованная модель не является управляемой по Калману.

Другим подходом может выступать линеаризация обратной связью, применимая для определенного класса нелинейных систем. Модели этого класса позволяют провести координатное преобразование исходной динамической модели, представляющее нелинейную систему в виде

линейной системы с нелинейной обратной связью [11]. Такое преобразование используется для синтеза регуляторов, обеспечивающих асимптотические свойства устойчивости системы, и используют аппарат функций Ляпунова [12], [13], [14].

Идея представления нелинейных объектов в виде линейных моделей с параметрами, зависящими от состояния объекта (State Dependent Coefficients) и синтеза управления по этим моделям была заложена в начале 60-х годов [15]. Разработка данного метода актуальна и сейчас [16], [17], [18].

Если наложить на систему управления требования по минимизации квадратичного функционала качества, то это позволит перейти от уравнения Гамильтона-Якоби-Беллмана к уравнению типа Риккати с параметрами, зависящими от состояния (State Dependent Riccati Equation).

Такой подход относительно прост и оптимален, однако не лишен своих недостатков, таких как, например, неоднозначность эквивалентных преобразований [19].

Определенную сложность также представляет собой создание эффективного алгоритма решения матричного уравнения типа Риккати с параметрами, зависящими от состояния, работающего в темпе функционирования объекта на вычислительных мощностях бортовых микроконтроллеров.

Кроме вышеописанных проблем, возникающих при построении при построении регулятора, в системе могут возникать эффекты, связанные с задержкой управляющего воздействия или получения данных о состоянии. Таким образом, состояние объекта начинает изменяться только через некоторое время, после изменения входного воздействия. Так, например, при полетах на углах атаки, близких к критическим, ошибки управления,

возникающие из-за задержек по управлению, сильно сказываются на качестве полета [20]. В подобных условиях регуляторы, синтезированные без учета запаздываний, могут оказаться недостаточно эффективными для выполнения поставленной задачи [21].

В современных работах интервал возможных задержек исследуется на устройчивость. Алгоритм управления выбирается таким образом, чтобы обеспечить устойчивость системы при всех возможных значениях величины задержки [22].

В данном диссертационном исследовании предлагается исследовать выделить такое значение задержки, при котором значения функционала качества максимальны. Заметим, что не всегда к подобному случаю приводит наибольшая величина из интервала.

Кроме вышеописанных задач, представляет интерес задача коллективного взаимодействия квадрокоптеров [23]. В диссертационном исследовании рассмотрена задача коллективного перехвата аппарата противника. Она формулируется в терминах теории дифференциальных игр.

Становление данной теории связано с именами R.P. Isaacs [24], J.V. Breakwell [25], Л.С. Понтрягина [26] [27], Е.Ф. Мищенко [28], Б.Н. Пшеничный [29] и др. В конце 70-х годов прошлого века выделилась часть прикладной теории дифференциальных игр, посвященная задачам преследования, убегания, защиты цели [30], [31]. В работах Л.С. Понтрягина и Е.Ф. Мищенко [26], [27], [28], посвященным в линейным дифференциальным играм, получены достаточные условия завершения преследования. Н.Н. Красовский, А. И. Субботин [30] и их коллеги изучали позиционные дифференциальные игры в задачах сближения и уклонения. Л.А. Петросян в своей книге [32] подводит итоги развития теории дифференциальных игр в приложении к конфликтно-управляемым

системам на середину 70-х годов. Дальнейшее развитие было сделано благодаря работам А.А. Меликяна, Л.С. Вишневецкого, Н.В. Овакимян [33], [34], [35], [36], В.С. Пацко, С.С. Кумкова [37], [38]. На 18 и 19 международных конгрессах по автоматическому управлению (WC IFAC) имелись отдельные секции, на которых рассматривались доклады, связанные с теорией дифференциальных игр и практикой применения этой теории к задачам управления в конфликтных состояниях [31].

В отдельной главе диссертации даны предположения о синтезе стабилизирующих регуляторов в условиях, когда в системе наблюдаются эффекты задержки и последействия.

В данном диссертационном исследовании были рассмотрены основные проблемы, возникающие при построении фильтра и системы управления летательных аппаратов, функционирующих в условиях интервальных неопределенностей различной природы. Рассмотрена задача коллективного перехвата аппарата противника.

Предмет исследования

Системы управления квадрокоптерами и их узлами, функционирующими в условиях неполной информации о состоянии, параметрах и взаимодействии со средой, описываемыми обыкновенными нелинейными дифференциальными уравнениями.

Цель исследования

Изучение методов синтеза замкнутого контура фильтра и управления квадрокоптером, описанным нелинейной моделью в условиях различных интервальных неопределенностей параметров. Создание новых алгоритмов и методик, позволяющих более эффективно выполнять поставленную задачу управления.

Задачи исследования

Для достижения поставленных целей в рамках диссертационного исследования предлагается:

1. Разработать удобные для реализации на микроконтроллерах методы и алгоритмы синтеза нелинейных регуляторов, основанные на уравнении Риккати с параметрами, зависящими от состояния;

2. Разработать фильтр состояния объекта, действующий эффективно в условиях интервальных неопределенностей различной природы;

3. Исследовать влияние эффектов задержки и последействия на систему и разработать алгоритм робастной стабилизации, позволяющий справляться с данными эффектами;

4. Сравнить полученный алгоритм фильтрации с известными алгоритмами;

5. Сравнить известные нелинейные регуляторы с полученными алгоритмами

6. Исследовать проблему управления несколькими агентами в задаче преследования.

Научная новизна и значимость

К основным результатам работы, показывающим научную новизну и значимость, можно отнести следующие:

1. Разработанные алгоритмы конструирования и реализации нелинейных стабилизирующих регуляторов для нелинейных динамических систем;

2. Разработанный алгоритм синтеза адаптивного фильтра, позволяющего провести идентификацию параметров нелинейной динамической системы;

3. Полученный алгоритм синтеза робастного регулятора, позволяющего стабилизировать систему под влиянием эффектов последействия и задержки по управлению;

4. Рассмотрена задача управления несколькими агентами, как проблема оптимального управления, т.е. дифференциальной игры с нулевой суммой.

Практическая ценность работы

Результаты могут использоваться при решении задач фильтрации и стабилизации широкого класса летательных аппаратов, описывающихся непрерывными нелинейными системами.

Достоверность результатов

Результаты, полученные в процессе работы над диссертацией, получены в результате строгих математических выводов. Алгоритмы управления проверены на моделях, описывающих объект исследования с помощью численного математического моделирования.

Личный вклад автора

Результаты личной работы автора заключаются в разработке методов и алгоритмов конструирования управляющих воздействий, а также методов и алгоритмов оценки состояния наблюдаемой нелинейной системы Численные эксперименты проведены автором самостоятельно на собственных вычислительных мощностях.

Методы исследования

Используются доказанные методы исследования динамических систем и синтеза регуляторов. В частности, используются:

1. методы теории устойчивости;

2. методы теории управления;

3. теория дифференциальных уравнений;

4. метод аналитического конструирования оптимальных систем.

Проверка полученных дифференциальных уравнений проводилась в программном пакете Maple. Компьютерное моделирование проводилось в пакете MATLAB Simulink.

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Управление летательными аппаратами в условиях действия ограниченных возмущений и неполной информации о состоянии»

Апробация работы

Результаты диссертационного исследования докладывались на следующих конференциях:

1. Семион А. А Nonlinear Adaptive Filter and Control of Quadcopter // Московский семинар по электронным и сетевым технологиям (MWENT-22), Москва, 9 - 11 июня 2022;

2. Семион А.А., Преснова А.П. Optimal Control of Car Active Suspension Control under Delays // XVI Международная конференция «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого), Москва, 1 - 3 июня 2022;

3. Семион А.А. Адаптивное координатное управление нелинейным неопределенным объектом // XIII всероссийское совещание по проблемам управления ВСПУ-2019, Москва, 17 - 20 июня 2019;

4. Semion A. A. A method for realization of nonlinear state-dependent coefficients regulators based on microcontroller memory // Московский семинар по электронным и сетевым технологиям совместно с Сибирской конференцией по управлению и связи, Москва, 14 - 16 марта 2018;

5. Семион А.А. Управление перевернутым маятником регулятором, с коэффициентами, зависящими от состояния // Межвузовская научно-техническая конференция студентов, аспирантов и

молодых специалистов им. Е.В. Арменского, Москва, 19 февраля -01 марта 2018;

6. Семион А. А. Оценка использования памяти при реализации

нелинейных регуляторов, с коэффициентами, зависящими от состояния, в квазилинейных системах управления // Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2017», Москва, 10 - 14 апреля, 2017

Результаты диссертационного исследования докладывались на аспирантском семинаре факультета компьютерных наук ВШЭ

Публикации

Список опубликованных статей, отражающих основные результаты диссертации:

Работы, опубликованные автором в рецензируемых научных изданиях, входящих в международные системы цитирования Scopus и WoS:

1. Semion A.A. A method for realization of nonlinear state-dependent coefficients regulators based on microcontroller memory // Moscow Workshop on Electronic and Networking Technologies, MWENT 2018 - Proceedings, 14-16 March 2018, Moscow

2. Semion A., Presnova A. Optimal Control of Car Active Suspension Control under Delays // 16th International Conference on Stability and Oscillations of Nonlinear Control Systems (Pyatnitskiy's Conference) (STAB). IEEE, 2022. Ch. 60. pp. 1-4.

Работы, опубликованные автором в научных журналах входящих в подготовленный в НИУ ВШЭ список журналов высокого уровня:

3. Афанасьев В. Н., Семион А. А. Дифференциальные игры с несколькими преследователями и одним уклоняющимся // Проблемы управления. 2021. №1, С. 24-35

4. Семион А. А. Метод использования памяти микроконтроллера при реализации нелинейных регуляторов, с коэффициентами, зависящими от состояния // Информационные технологии и вычислительные системы. 2017. № 4. С. 64-70;

5. Афанасьев В. Н., Семион А. А. Регулятор с дискретно изменяемыми параметрами // Проблемы управления. 2014. № 5. С. 14-19.

Публикации соискателя в других изданиях:

6. Афанасьев В. Н., Семион А. А. Управление объектом в условиях запаздывания и последействия с интервальной длительностью // Автоматизация. Современные технологии, 2020. Т. 74. № 4. С. 170175;

Положения, выносимые на защиту

Разработанные алгоритмы стабилизирующих регуляторов с параметрами, зависящими от состояния и их способ реализации на микроконтроллерах;

Разработанные алгоритм синтеза адаптивного фильтра, идентифицирующего параметры системы;

Алгоритм синтеза SDС управления, использующего результаты идентификации, полученные фильтром;

Разработанные алгоритмы синтеза стабилизирующих регуляторов, противодействующих эффектам последействия и задержки по управлению;

Разработанные алгоритмы управления несколькими агентами в задаче преследования;

Численное моделирование поведения летательного аппарата при использовании предложенных алгоритмов.

Структура и содержание работы

Диссертация состоит из введения, шести глав, заключения и списка использованной литературы.

Во введении поставлены цели работы, проведен анализ их актуальности, и изложено краткое содержание диссертации.

В первой главе сформулирована задача стабилизации летательного аппарата.

Во второй главе описан алгоритм синтеза стабилизирующего регулятора с параметрами, зависящими от состояния.

В третьей главе приведен алгоритм синтеза адаптивного фильтра, позволяющего провести идентификацию параметров нелинейной динамической системы для последующего их использования в алгоритме управления системой, а также алгоритм синтеза робастного регулятора, стабилизирующего систему, функционирующую в условиях влияния на неё эффектов последействия и задержки по управлению.

В четвертой главе сделано предложение о построении робастного регулятора, действующего в условиях наличия эффектов задержки и последействия.

В пятой главе подробно разобрана задача дифференциальной игры, как проблема оптимального управления. Т.е. с введением квадратичного функционала дифференциальная игра рассматривается как игра с нулевой суммой.

В заключительной главе проведено математическое моделирование динамических систем под управлением предложенных алгоритмов.

Глава 1 Постановка задачи

В диссертации предлагается рассмотреть в качестве объекта управления вертолет с четырьмя моторами с пропеллерами (квадрокоптер), установленными на крестообразной раме. Пропеллеры имеют фиксированный угол атаки. Наклон аппарата осуществляется за счет разности тяг моторов.

Необходимо синтезировать управление, способное стабилизировать аппарат горизонтально в полете.

В задачах, связанных с представлением вращения тела, удобным способом описания вращения тел, является алгебра кватернионов -гиперкомплексных чисел с тремя мнимыми единицами. Она позволяет уменьшить вычислительную сложность операций поворота векторов в трехмерном пространстве благодаря более экономичному представлению поворота тела, а также некоторым свойствам кватернионной алгебры, связывающим производную кватерниона, кватернион и угловые скорости тела.

Кватернионная алгебра впервые была предложена Уильямом Гамильтоном в 1843 году и используется по сей день, преимущественно в задачах ориентации твердых тел. Так, например в книге Бранец В.Н. и Шмыглевский И.П. [39] описан как сам математический аппарат кватернионов, так и применение его в задачах стабилизации летательных аппаратов. При построении управления моделью, описывающей поворот тела с помощью алгебры кватернионов возможно появление проблем, связанных с невозможностью обеспечить асимптотическую устойчивость в точке, где первая компонента кватерниона обращается в ноль. Для

15

примеров систем построено управление с использованием аппарата функций Ляпунова, где в данной точке управление доопределено. Показано так же управление, использующее переход от кватернионов к управляющим косинусам.

Yaguan Yang в [10] описывает способ редукции модели, описывающей положение летательного аппарата в алгебре кватернионов. Применение этого метода позволяет использовать линеаризацию путём разложения в ряд Тейлора и отсечения всех членов выше первого порядка, для последующего синтеза линейного квадратичного регулятора.

В работе [40] рассматривается кватернионная модель квадрокоптера к которой применяется линеаризация обратной связью для построения стабилизирующего управления. В работе показано сравнение кватернионной алгебры и описания поворота аппарата в пространстве с помощью углов Эйлера, показывающее эффективность представления в терминах кватернионной алгебры.

В работе [41] математическая модель квадрокоптера сформулирована с использованием углов Эйлера, а затем проведена линеаризация обратной связью. Так же в статье описан способ построения автопилота для следования заданной траектории.

Как правило, их математические модели описываются в углах Эйлера и матрицах поворота: [42], [43], [41] и [44], однако в [45] показано, что использование кватернионов оптимально с точки зрения производительности.

Часть научных работ описывает управление квадрокоптером с помощью ПИД-регулятора [46]. В своем отчете [44] Randal W. Beard формулирует математическую модель квадрокоптера с использованием матриц поворота. Он предлагает построить управление аппаратом на

основе пяти ПИД-регуляторов. Так же в работе рассматривается использование камеры, прикрепленной к днищу аппарата, для определения координат квадрокоптера.

В докладе [43] на конференции International Conference on Robotics and Automation задача стабилизации квадрокоптера была решена построением управления на основе теории функций Ляпунова. Модель аппарата сформулирована в углах Эйлера-Крылова. Авторы построили установку для отработки алгоритма стабилизации и подбора параметров аппарата.

В докладе [8] авторы формулируют математическую модель аппарата, используя алгебру кватернионов. Они ставят перед собой задачу следования заданной траектории. Управление представляет собой линейно-квадратичный регулятор. Моделирование произведено с учетом возможных внешних возмущений. Так в работе приведены пред посадочные маневры, однако сама посадка в статье не рассматривается.

Для дальнейших рассуждений нам понадобится математическая модель квадрокоптера, которая приведена в [44], где для описания вращения аппарата используется алгебра кватернионов.

Математическая модель летательного аппарата представляет собой нелинейную систему обыкновенных дифференциальных уравнений:

d 1

— p(t) = - [ui(t) - (lz - Iy)q(t)r(t)], d 1

— q(t) = - [U2(t) - (Ix - Iz)p(t)r(t)],

dt ly

jt-r(t) = 1 [u3(t) - (Ix - Iy)p(t)q(t)], d 1

-цШ = г [-РЮШ - q(t)X2(t) - r(t)Ut)], (1)

d 1

-¡¡bit) = 2 [P(t)Ao(t) + r(t)A.2(t) - q(t)A3(t)],

d 1

=- [q(t)A0(t) - r(t)Ai(t) + p(t)A3(t)],

d 1

= 2 WW + ЧЮЬЮ - V(t)h(t)l

где Ix, I у, Iz - компоненты тензора инерции,

p(t), q(t), r(t) - угловые скорости по крену (ось x), тангажу (ось y) и рысканью (ось z) в системе координат, связанной с аппаратом,

A0(t),A1(t),A2(t),A3(t) - компоненты кватерниона, описывающего поворот квадрокоптера в пространстве,

u1(t), u2(t), u3(t) - моменты, возникающие под действием разности тяг моторов.

Оси системы координат, связанной с аппаратом показаны на рисунке

1:

Рисунок 1. Оси координат и вращательные моменты Так как основной темой исследования являются алгоритмы управления, моменты будут рассмотрены в общем виде. Аэродинамические эффекты, особенности работы бесколлекторных двигателей, вопрос дифференциации скоростей двигателей не будет рассмотрен, а управление аппаратом будет осуществляться напрямую через моменты по осям. Заметим, что получить конкретные значения угловых скоростей р^ пропеллеров из требуемых моментов можно получить путем решения системы:

(Р?+р|-р|-р|),

2 2 2

= (-РГ + Р2 + Рз - Р4),

и3 = с(р\ + р2 + рЗ- р1), У тд = Ъ(р\ + + - р^),

где I - длина луча квадрокоптера, бис- некоторые коэффициенты, получаемые экспериментальным путем.

Система дифференциальных уравнений (1) представляет упрощенную модель, описывающую вращение аппарата в пространстве. Она не описывает поступательное движение аппарата, а также не учитывает наличие внешних воздействий; задержки и другие эффекты, с которыми приходится сталкиваться на практике. Некоторые из приведенных эффектов будут рассмотрены отдельно на упрощенных моделях в соответствующих главах.

Необходимо отметить, что в представлении (1) система не является управляемой при линеаризации или применении подхода SDC. Однако Yaguan Yang в [10] показывает способ редукции данной модели с 7 до 6 координат состояния, описывающей положение летательного аппарата в алгебре кватернионов, но с заменой действительной части кватерниона. Он доказал, что действительный компонент кватерниона можно не включать в

вектор состояний, заменив A0(t) на A0(t) = f (A(t)) =

Этот способ позволяет представить систему (1) в управляемом виде. Итоговая система представима в стандартном виде:

где х = (p(t) q(t) r(t) A1(t) A2(t) A3(t))T - вектор пространства состояний,

u(t) = (u1(t) u2(t) u3(t))T - вектор управлений,

Jl — A^(t) — A2 (t) — Aj (t) . Это является следствием из условия нормированности кватерниона на единицу:

JA20( t)+ A2(t) + A22(t) + Aj(t) = 1.

X(t) = A(x(t))x(t) + Bu(t),

(2)

Л(хОД) =

/ 0 0 0 0 0

0 0 'у 0 0 0 0

'у-и 0 0 0 0

1 -» 1/(А(9) 0 0 0

0 0 — 2Г(^) 0 2р(0

0 0 1 — 2р(0 0 )

(ь 0 0

0 1 ~у 0

0 0 1

0 0 0

0 0 0

(3)

в =

(о 0 0)

В качестве задачи управления будет стоять задача стабилизации аппарата в горизонтальном положении, т.е. приведении всех углов Эйлера

к нулю или, что тоже самое кватерниона к значению Л^) = (1 0 0 0)т. Угловые скорости машины должны быть приведены к нулю. Будет рассмотрен вариант с полностью измеримым вектором состояния, а также случай, когда дополнительно необходимо синтезировать наблюдатель.

В данной главе был проведен обзор некоторых результатов теории автоматического управления в области управления беспилотными квадрокоптерами, описан объект управления в терминах кватернионной алгебры.

В следующей главе будет рассмотрен алгоритм синтеза нелинейного регулятора.

Глава 2 Регулятор с коэффициентами, зависящими от

состояния

До недавнего времени наиболее частым подходом к построению систем управления являлись линеаризация нелинейной модели целевой системы и синтез линейного регулятора по полученной линейной модели. Однако сейчас публикуется все больше исследований, направленных на создание нелинейных или квазилинейных регуляторов. Одним из алгоритмов получения таких регуляторов является метод представления исходной нелинейной системы в виде системы с коэффициентами, зависящими от состояния (State Dependent Coefficients). После чего, при наличии квадратичного функционала качества в такой задаче управления, появляется возможность построения регулятора на основе решения матричных уравнений типа Риккати с параметрами, зависящими от состояния (State Dependent Riccati Equation). Нахождение решения этого уравнения в темпе функционирования объекта, что не всегда осуществимо в условиях ограниченности производительности управляющей электроники.

В данном исследовании предлагается рассмотреть 2 алгоритма, позволяющих применять подход c SDC представлением исходной нелинейной системы и решением уравнения Риккати с коэффициентами, зависящими от состояния для синтеза регулятора динамических систем с достаточно быстрыми процессами.

Первый метод предполагает установку в управляющем устройстве некоторого вычислителя, который занимается получение решения уравнения Риккати в темпе функционирования объекта.

Второй метод является приближенным, позволяющим смягчить требования к производительности управляющего устройства, однако его

22

применение доступно только для определенного класса систем. Метод заключается в расчете коэффициентов усиления нелинейного регулятора с использованием значений состояний системы в конкретных точках траектории. Описываемый метод объединяет идеи синтеза регуляторов для систем с коэффициентами, зависящими от состояния, gain-scheduled регуляторов и метод использования промежуточного буфера с быстрым доступом к нему (кэширования).

Результаты этой главы были опубликованы в следующих работах автора: [18], [47], [48], [49].

2.1 Постановка задачи

Пусть детерминированная нелинейная система описывается следующим уравнением:

jtx(t) = f(x(t)) + D(x(t))w(t) + B(x(t))u(t),

x(to) = Xo, y(t) = Cx(t),

u(t) e u, w(t) ew,te [t0, tf], где x(0EC1([to,tf],Rn) , o,tf],Rk) принадлежат

(4)

uQ)EC1([to,tf],Rr) и w(0E пространствам непрерывно

дифференцируемых функций соответствующих размерностей.

Здесь х(€) состояние системы х Е Пх,Х0 Е Пх - множество возможных начальных условий системы; у Е Ят , т < п - измеряемые переменные объекта (выход системы); и(€) - управление; ж^) -возмущение; f(х) , Б(х),В(х) - непрерывные матрицы-функции. Предполагается, что для всех х система (4) управляема. Кроме того, будем полагать, что функции f(х), И(х), В(х) достаточно гладкие такие, что при

любых ( ¿0,х0) едтхпх проходило бы одно и только одно решение уравнения (4) х( ¿0,х0) .

Предполагается, что неконтролируемое возмущение w(t), которое может быть как детерминированным, так и стохастическим, характеризуется следующим отношением:

Пх, или в общем виде £ Ж

Возмущение будем рассматривать, как действие некоего игрока-противника, препятствующему успешному выполнению задачи управления. В качестве возмущения могут выступать, например, различные воздушные потоки.

Введем двух игроков и и рассмотрим задачу управления как их дифференциальную игру.

Управления и(*:) £ и и w(t) £ Ж будут иметь обратную связи по состоянию.

Введем функционал качества дифференциальной игры

Здесь матрица Q - по крайней мере, положительно полуопределенная, матрицы Я, Р- положительно определенные. Вопрос выбора конкретных значений матриц выходит за рамки данной работы. Некоторые идеи по данному вопросы были даны в работе [50].

|ш( 0| < о"(х(0), Vt > 0,

(5)

где|ш;(г:)| < ^¿(х(^), I = 1,/с, г: > 0, ^¿(х(^) > 0 заданы для всехх £

(6)

Со

Целью управления и(€) при противодействии процесса t ) является построение такого управляющего воздействия ( = (х(£),и(1),ж(£)) , которое обеспечит минимум функционала качества.

Предполагается, что ограничения, наложенные на процессы и(€) и , можно учесть соответствующим назначением матриц Я , Р .

Допустимыми элементами % = ( х(^, и(€), в поставленной задаче

будем считать функции класса х(^) Е Сг([с0,^],Рп) ,и() Е

В основе необходимого для дальнейших исследований преобразования математической модели объекта (4) лежит методология «расширенной линеаризации», называемой также как «параметризация системы коэффициентами, зависящими от состояния» (SDC-линеаризация) [19].

Предположение 2.1. Функции f(х(t)) и дf(х(t))/дхi(t), I = !,••• ,п непрерывны по х Е П.х и f(0) = 0.

Предположение 2.2. Матрицы й(х(^), В(х(и дй(х(^)/дх^), дВ(х(t))/дхi(t) , I = !,••• ,п непрерывны по хЮ Е и

0(х(1)) Ф 0,

в(х(о) ф 0х(г) е ах.

При выполнении Предположений 2.1 и 2.2, используя БЭС линеаризацию, исходная нелинейная система (4) может быть представлена в виде модели системы

^х(1) = А(х(1))х(1) + Б{х(1))ж(1) + (7)

в(х(г))и(г), х(г) = х0, у(г) = Сх(г)

Здесь А(х&))х&) = f(х(t)), А(х(£)),0(х({)),В(х(1))\х Е Пх ^ Яп.

Заметим, что при п> 1 представление f(х(t)) = А(х(1))х(£) не

является единственным. Проблема выбора наилучшей матрицы А( х( ))

25

остается открытой и для каждого конкретного случая решается отдельно [2].

Будем считать, что система (7) поточечно-управляема.

Определение 1. Рассмотрим множество #(t) £ Дп, t0 < t < tf. При заданном t данное множество состоит из всех точек ^(x(t))x(t) + 5(x(t))u(t) пространства , которые получаются, при Vu(t) £ i/. Таким образом, V t, при котором 3x( t), справедливо

^x(t) £ #(t) , t0 < t < t^ и множество #(t) содержит все точки x(tj) = xj, i = 0,1,2, ... траектории x(t) при управлении u(t).

Если для Vx( tj) £ #(t), i = 0,1,2, ... выполняется условие Калмана -условие управляемости линейных систем с постоянными параметрами

mn#[£(x( t))|4(x(t))fl(x(t))|i42(x( t))fl(x(t))| ...|i4n-1(x(t))fl(x(t))] n , Vx £ H(t), тогда параЛ^^)) и 5(x(t)) поточечно управляема.

2.2 Уравнение Риккати с параметрами, зависящими от

состояния

Предположение 2.3. Пусть /(x( t)) , D(x(t)) , fi(x(t)) достаточно гладкие функции такие, что функция V(x(t)), определенная как

K(x(t))= inf sup /(x(t),u(t),w(t)), (8)

дифференцируемая функция при любых допустимых стратегиях игроков Gw, £ L2(0, to).

Предположение 2.4. Функция K(x( t)), определенная в (8) локально Липшицева в Пх.

Оптимальные стратегии с обратной связью в дифференциальной игре для игроков Gu и Gw в задаче, в которой время окончания переходного

процесса большое по сравнению с динамикой системы определяются выражениями

т

3х(0

T

-lnT/^ff)} (9)

dx(t)

где вектор 9K(x(t)}/9x(t) определяется решением уравнения Гамильтона-Якоби-Айзекса [51]:

/(*(t)} + 1*T(t)CTQC*(t)

¿И^К^)}«-1^)} (10)

Т

- D(x(t)}P-1DT(^(t)}] =0

с граничным условием К(0) = 0 , так при управлениях (9), обеспечивающих устойчивость системе: lim x(t) = 0.

Исходная система с управлениями (9) определяется выражением

^х(0=/(х(0)-[Бт(х)Я-1Б(х)-

т

От(х(0)Р-1О(х(С))] {Ц} , х(£с) = х0, (11)

у(0 = Сх(0.

тт Если определить как 5(х(^)х(0 , т.е. =

5(х)х(*:), то, как показано в [19], субоптимальные законы управления 1^(2:) и и (*:) с обратной связью в рассматриваемой задаче определяются выражениями

и(0 = -Я-1Вт(х^))5(х^))х(1),

ы(1) = Р-10т(х(1))5(х(1))х(1), (12)

где положительно определенная матрица Б(х(^) является

поточечным решением матричного уравнения типа Риккати с параметрами, зависящими от состояния

5(х(^)А(х(^) + Ат(х(^)5(х(^)

- 5(х(1))[В(х(1))Я-1Вт(х(1))

- 0(х(1))Р-10т(х(Щ5(х(1)) + СTQС =0

Тогда уравнение системы (11) можно переписать в виде

(13)

(14)

-х(1) = ^х(Ь)) - П(х(1))5(х(1))х(1), х(^) = х0 ,у(€) =

С х( ), где

П(х(*)) = Вт(хЮ)Я-1В(хЮ) - 0т(хЮ)Р-10(х(1)) (15)

Отметим, что система (14) устойчива, если матрица П(х( , по крайней мере, положительно полуопределена для Ух( t ) Е Пх . Это нетрудно показать, применяя второй метод Ляпунова. Введем функцию Ляпунова У1(х( ¿)), такую, что

ы1[1х(т<У1(х(^)<ы2[1х(т , аУ1(х(^)/си<-ы3[1х(т , V х(О Е пх

где ^{|х|}, I = 1,2,3, = 0, ^{|х|} > 0 скалярные неубывающие функции. Как следует из второго метода Ляпунова, что если выполняется

следующее условие

йУ1(х) _ дУ1(х) ах(г) М дх М

< -ш3{1х1}, (16)

то система устойчива. Принимая во внимание (14), перепишем условие (16)

дд^Г (Пх) - П(х(0)5(х(0)х(0) < -(03{1хЦ (17)

Назначим У1(х) в виде У1(х(^) = хт(£)5(х)х(£) и ^3{|х|} в виде ы3{Ш} = хт(t)СтQСх(t).

После ряда трансформаций неравенство (17) будем иметь вид

= -хта)Б(ха))[Вт(ха))я-1В(ха)) -0т(х(1))Р-10(х&))]5(х&))х&) = -хт(1)5(х(1))п(х&))5(х&))х&) < 0, Ух.

Таким образом, по крайней мере положительно полу определённость матрицы П(х( обеспечивает устойчивость системы (14) в смысле (16). 2.3 Регулятор с дискретно изменяющимися параметрами

Как видно, реализация субоптимальных управлений вида (12) в задачах дифференциальных игр в нелинейной постановке задачи требует решения уравнения (13) в темпе функционирования объекта. При достаточно большой размерности пространства состояний решение этого уравнения требует больших вычислительных ресурсов.

Сделаем предложение о построении регулятора с дискретно изменяющимися параметрами. Заметим, что на решение уравнения Риккати бортовой вычислитель затрачивает некоторое ненулевое время. Таким образом, полученное решение основывается на данных о состоянии системы с некоторой задержкой. Предлагается сделать некоторую оценку работы регулятора, коэффициенты которого меняются так часто, как часто вычислитель находит решение уравнения Риккати в процессе полета.

Разобьем интервал [^, на N отрезков. Начало каждого отрезка

имеет номер ¿0,11, ■■■ Лы-1, которому соответствует состояние системы

29

х0, хх, ...,!. Значения состояния системы х^, соответствующее началу каждого из отрезков, определяет значения параметров матриц Л(х^), ^(х^), Б(х^) . Эти матрицы с постоянными параметрами используются для вычисления положительно определенной матрицы 5(х^) как решения уравнения Риккати:

^(х^ЯЧх^Д-1^) (18)

- ^т(х^)Р-1^(х^)]5(х^) + С^С = 0

Таким образом, матрица 5(х^) вычисляется в интервале [¿:0, ^ ] в счетном количестве значений траектории х^ , ¿ = 0,1, .,^-1 . Вычисленное значение матрицы в момент используется в регуляторе на всем интервале [ ^¿+1], ^ = 0,1,..., N — 1. В начале следующего интервала управляющее устройство запоминает текущее состояние х^, к которому пришла система и начинает вычисление матрицы 5(х^) для него. Таким образом возможно вычисление решения уравнения Риккати онлайн.

Управления в каждом интервале [¿¿, ¿¿+1] , у = 0,1, — 1 определяются выражениями

и(0 = — Я-^^Ж^МО, (19)

0 = Р-1ЯТ(х05(х;)х(0 Траектория движения объекта с управлениями (19) определяется решением уравнения

£х(0 = /(х(0) — [БТ(х(0)Я-1Б(х(0) — (20)

ЯТ(х(0)Р-1Я(х(0)]5(хОх(0, х(¿0) = х0,1 = 0, ...^ — 1

Заметим, что длина отрезка [¿¿^¿+1] зависит от мощностей

управляющего устройства, которое вычисляет решение уравнения (18).

Очевидно, что при т = ¿¿+1 — ^ ^ 0 , ¿ = 0,1, ...^ — 1 , т.е. при

30

уменьшении интервалов разбиения, Нт£(х(^),т) ^ 5(х^^+1),т) , ¿ = 0,1,..., N — 1. Оценка качества работы такого подхода дана в работе [52].

Рассмотрим случай, когда в качестве возмущения выступает белый шум. Оценим влияние возмущений на результат управления объектом, используя его модель (7). Пусть в качестве возмущений, действующих на входе объекта, будет белый шум с характеристиками

М[ш(0] = 0, М[1(0шт(т)] = — т), М[х(^)шт(0] = 0

и пусть решение уравнения, описывающее исходную систему с изменяющимися от интервала к интервалу значениями параметров регулятора, описывается выражением

= /(х) — £(х)Д-1£Т(х)5(х;)х(0 + £(х)ш(0

У(0 = Сх(0 (21)

х(*:0) = х0,1 = 0,..., N

где матрица вычисляется в каждый момент I в соответствии с уравнением

5(х;)л(х;) + лт(х;)5(х;) — (22)

5(х;)[ят(х;)д-1я(х;)]5(х;) + с^с = 0.

и сохраняет свое значение в регуляторе и(= —Я-1БТ(х)5(^^)^(^ до следующего момента + 1.

Уравнение для ковариационной матрицы = М[х(г:)хТ(г:)]

состояния объекта будет описываться следующим соотношением:

а .

шх(1)

А(Х) - В(Х)Я-1Вт(Х)

N-1

ь=о

+ х&)

А(х) - В(х)Я-1Вт(х)

ха)

N-1

т

+ Б (Х)\кОт(Х)

Х(1о) = М[х(1о)х1(1о)]

Отметим, что при т = 1+1-11^0 , 1 = 0,1, ■..,N-1 значения параметров матрицы Х(€) будут стремиться к значениям матрицы х(€), т.е. Х(€) ^ х(Ь), которая определяется решением уравнения

-^(О = {А(х) - В(х)Я-1Вт(х)5(х)}Х&) аЬ

+ х(г){А(х) - В(х)Я-1В1 (х)5(х)}т + Б(х)ш01(х)

х&о)=М[х&о)хтЬо)]

Заметим, что приведенный выше алгоритм требует вычисления уравнения Риккати в темпе функционирования объекта, что в свою очередь требует наличия быстрого вычислителя в управляющем устройстве. Реализация подобной системы не всегда возможна, однако существует класс систем, для которых в силу ограниченности пространства состояний возможно применить модификацию алгоритма управления.

Здесь и далее М - знак математического ожидания. Пусть х(t ) Е X -множеству возможных состояний. Пусть множество х ограничено. Тогда каждый элемент х1 вектора состояния х(^) находится в некотором интервале х1 Е [т1,Б1]. Разобьем данный интервал на отрезки длиной £1. Таким образом, мы получим п - мерное разбиение множества X на сетку.

В силу непрерывности хЮ в узлах сетки находятся возможные состояния хI.

Рассчитаем и сохраним в память управляющего устройства 5(xj) -решения уравнения Риккати

S(xfM(xf) + ЛТ(Х;№) - 5(xi)[ßT(xi)^-1ß(xi) -DT(xi)P-1D(xi)]5(xi) + CTQC = 0.

В процессе работы регулятора будем находить ближайший к текущему x(t) узел сетки x^. Управления представляются в форме (19).

Очевидно, что при г1 ^ 0 , i = 1, ...,п , т.е. при уменьшении интервалов разбиения, lim 5(xj) ^ S(x(t)), i = 0,1, ...,n.

2.4 Хранение коэффициентов в памяти

Использование предложенного управления требует решения уравнения (13) в темпе функционирования объекта. Вычислительных ресурсов бортового компьютера дрона может быть недостаточно для достаточно быстрого вычисления решения.

Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Список литературы диссертационного исследования кандидат наук Семион Александр Александрович, 2022 год

// // */ //

О 2 4 6 8 10

г

Рисунок 19. График функционалов регуляторов, построенных при

разных задержках

На графике видно, что предложенный регулятор, построенный при наихудшем случае величины последействия, достигает меньших значений функционала качества. К сожалению, полученное управление не способно стабилизировать систему при наличии задержки по управлению.

Получим величину наихудшего запаздывания управления благодаря полученным на прошлом этапе величине последействия и решению

уравнения Риккати. Для этого представим — у) = — +

где К = тогда

й

— г(0 = (/ + тЛт — у£^)-1 • (Л + Лт — График производной нормы М(т) (59) представлен на рисунке 20:

Рисунок 20. График производной нормы М(т) для мажоранты с

задержкой

В качестве наихудшей величины задержки по управлению выберем верхнюю границу интервала у = 0.3.

Используя полученные значения длительности последействия т = 1.115 и задержки у = 0.3 найдем решение уравнения Риккати для мажорирующей динамической системы (110)

-^(0 = (/ + тАт - уВК)-1 • (А + + (/ + тАг - уВК)-1 • Ви(г)

at

- = /1.3146 1.4777Л (1.4777 1.6769/.

Полученное таким способом управление способно стабилизировать исходную систему (109) с последействием и задержкой по управлению. График переходного процесса показан на рисунке 21:

Рисунок 21. График траектории системы с последействием и задержкой

6.4 Классическая дифференциальная игра

Смоделируем дифференциальную игру, в которой каждый игрок

имеет полную информацию, т.е. игру с глобальной информацией. Пусть

имеется один злоумышленник, три преследователя. Тогда динамика

93

дифференциальной игры описывается обыкновенным линейным дифференциальным уравнением

= -^(^(о-усо),*^) = [-3 о]т

АХ2(0 = -^(Х2(О-у(О),Х2(£0) = [з о]т

_ ЛрС-) (^ ^^ -чГ+ЛЛ -V Л _ Го пТТ

р

£*3(0 = -^(*з(0-у(0),*з(*о) = [4 1]т

_ ЛрС-) ^^ ^^ v Л _ Г/1 1 тт

р

= - ^^ [*1(0 + *2(0 + *з(0] -

у^о) = [0 3]т

Здесь параметры &р(г:) и определяются решениями следующих уравнений:

ас Гр ге

ас Ге Гр

Пусть игра длится до 4х секунд, а радиус поимки злоумышленника состовляет £ = 0.04.

Параметры штрафа в функционале качества составляют гр = 1, ге = 2, др = 1, = 2, = 20, = 0.05.

Параметры ^р( и имеют траектории, показанные на рисунке

Рисунок 22. Процессы изменения параметров кр(€) и ке(€)

На последующих рисунках представлены графики переходных процессов различных, рассмотренных выше задач. На рисунке Рисунок 23 показаны траектории преследователей и уклоняющегося в классической игре без шумов и с шумами. Обе игры закончились перехватом злоумышленника, т.е. выполняется условие 112(^)11 <£ , < 4с (^ = 3.58с первом случае и ^ = 3с - во втором, где с - условное машинное время).

При моделировании классической дифференциальной игры с центрированными шумами используется исходная модель с теми же начальными условиями.

Уклоняющийся - Преследователи

-

г \

3-2-101234 Время окончания игры:3,58с

Уклоняющийся Преследователи

!

3-2-101234 Время окончания игры:3с

Рисунок 23. Переходные процессы «задачи преследования» в простой

игре без шумов и с шумами

Обе игры закончились перехватом злоумышленника, т.е. выполняется условие 1^(^)11 < £, Ьг<4с (Ьг = 3.58с первом случае и ^ = 3с - во втором, где с - условное машинное время).

6.5 Дифференциальная игра с распределенной информацией

Предположим, что начальное положение игроков не изменилось и является таким же как в предыдущем разделе. В данном разделе проведем моделирование дифференциальной игры, в которой каждый игрок имеет ограниченную информацию о других игроках, участвующих в той же игре. Пусть матрица чувствительности изменяется три раза во времени, что можно выразить следующим образом:

"1111" 1111 1111' .1111.

В первый период времени злоумышленника «видит» только один возможный преследователь, двое других преследователя «видят» первого преследователя и следуют за ним, в следующий период времени, уклоняющегося злоумышленника видят уже два преследователя и пытаются «поймать» его, в то время как оставшийся преследователь следует за другими преследователями. В конечный период времени каждый из игроков «видит» друг друга, и сама дифференциальная игра становится игрой с глобальной информацией, т.е. классической дифференциальной игрой.

Воспользуемся случаем дифференциальной игры с распределенными стратегиями, взятым в качестве базового, и добавим шумы. Все операции по получению решения, проводятся аналогично операциям в предыдущем разделе. На рисунке 24 показаны траектории преследователей и уклоняющегося в игре с распределенными стратегиями без шумов и с шумами.

10 0 1 0 111 0 0 11 10 0 1

s? =

1011 0111 1011 1001

s, =

Рисунок 24. Переходные процессы «задачи преследования» в игре с распределенной информацией без шумов и с шумами

На графиках ромбом показаны моменты подключения к преследованию уклоняющегося злоумышленника при вхождении в зоны чувствительности преследователей, т.е. в моменты обнаружения его. Графики, помещенные в верхней части Рисунок 24, показывают успешное выполнение задачи перехвата, т.е. выполняется условие ||г( t )|| < £, < 4 с, ^ = 3.88 с. В нижней части Рисунок 24 демонстрируется неуспешное выполнение задач перехвата, т.е. условия ||г( ¿)|| > £, ¿0 < г: < ^ и игра останавливается по истечению назначенного время игры t = ^ = 4 с.

В данная глава была посвящена математическому моделированию предложенных в работе алгоритмов.

ЗАКЛЮЧЕНИЕ

Диссертация посвящена решению задач фильтрации и стабилизации нелинейных неопределенных динамических объектов.

В работе описаны алгоритмы реализации SDRE управления в условиях ограниченности машинных ресурсов;

Синтезирован адаптивный фильтр Калмана-Бьюси, позволяющий провести идентификацию параметров системы и противодействовать шумам;

Синтезировано SDRE управление, использующее результаты идентификации, полученные фильтром;

Синтезировано управление, способное стабилизировать систему под вилянием эффектов задержки и последействия;

Синтезировано управление множеством преследователей и уклоняющегося в задаче дифференциальной игры с нулевой суммой.

Список литературы

1. Suleiman A., Zhang Z., Carlone L., Karaman S., Sze V. Navion: A

2mW Fully Integrated Real-Time Visual-Inertial Odometry Accelerator for Autonomous Navigation of Nano Drones // IEEE Journal of Solid State Circuits, Vol. 54, No. 4, Апрель 2019.

2. Афанасьев В.Н. Управление нелинейными неопределенными динамическими объектами. URSS, 2015.

3. Ляпунов А.М. Общая задача теории устойчивости движения. ОНТИ, М., 1935.

4. Ляпунов А.М. Общая задача об устойчивости движения. М.-Л., 1950.

5. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Гос. изд-во физмат литературы, 1959.

6. Лурье А.И. Некоторые нелинейные задачи теории автоматического регулирования. М.: Гостехиздат, 1951.

7. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высш. школа, 2003.

8. Reyes-Valeria E., Enriquez-Caldera R., Camacho-Lara S., Guichard J. LQR Control for a Quadrotor using Unit Quaternions: Modeling and Simulation // International Conference on Electronics, Communications and Computing (CONIELECOMP). 2013. pp. 172 -178.

9. Ahmad F., Kumar , Bhandari A., Patil P.P. Simulation of the

Quadcopter Dynamics with LQR based Control // Proc. SPIE 12176, International Conference on Algorithms, Microchips and Network Applications. Zhuhai, China. 2020. pp. 326-332.

10. Yang Y. Analytic LQR Design for Spacecraft Control System Based on Quaternion Model // JOURNAL OF AEROSPACE ENGINEERING. JULY 2012. Vol. 25. No. 3. pp. 448-453.

11. Isidori A. Nonlinear Control Systems. London: Springer, 3rd edition, 1995.

12. Kofman E., Hamovich H., Seron M.M. A systematic method to obtain ultimate bounds for perturbed systems // International Journal of Control, No. 80 (2), 2007. pp. 167-178.

13. Kofman E. Non conservative ultimate bound estimation in LTI perturbed systems // Automatica, No. 41 (10), 2005. pp. 1835-1838.

14. Kofman E., Hamovich H., Fontenla F., Seron M.M. Control design with guaranteed ultimate bound for feedback linearizable systems // Proc. of the 17th World Conference IFAC, July 2008. pp. 242-247.

15. Pearson J.D. Approximation methods in optimal control // Journal of Electronics and Control, 1962.

16. Mracek C.P., Cloutier J.R. Full envelope missile longitudinal autopilot design using the state-dependent Riccati equation method. // In Proc. of the AIAA Guidance, Navigation, and Control Conference. New Orleans, LA. 1997. pp. 1697-1705.

17. Афанасьев В.Н. Управление нелинейными объектами с параметрами, зависящими от состояния // А и Т. 2011. No. 4. pp.

43-56.

18. Афанасьев В.Н., Семион А.А. Регулятор с дискретно изменяющимися параметрами // Проблемы управления, May 2014. pp. 14-20.

19. Tayfun Q. On the Existence of Solutions Characterized by Riccati Equations to Infinite-Time Horizon Nonlinear Optimal Control Problems // Proc. 18th World Conf. IFAC, 28.08. — 2.09. Milano (Italy). 2011. pp. 9618-9626.

20. SHEN L., HUANG D., Wu G. Time delay compensation in lateral-directional flight control systems at high angles of attack // Chinese Journal of Aeronautics, Vol. 34, No. 4, 2021. pp. 1-18.

21. Ghiggi I., Bender A., Gomes da Silva Jr. J.M. Dynamic Non-rational Anti-windup for Time-delay Systems with Saturating Inputs // Proceedings of the 17th World Congress The International Federation of Automatic Control. Seoul. 2008. pp. 277-282.

22. Das D.K., Ghosh S., Subud B. Delay-dependent robust stability analysis and stabilization of linear systems using a simple delay-discretization approach // IFAC-PapersOnLine. 2018. Vol. 51. pp. 572-579.

23. Cimino M.G.C.A., Lazzeri A., Vaglini G. Combining stigmergic and flocking behaviors to coordinate swarms of drones performing target search // 6th Conference on Information, Intelligence, Systems and Applications (IISA). Corfu. 2015.

24. Айзекс Р. Дифференциальные игры. М.: Мир, 1967. 480 с. pp.

25. Breakwell J.V., Merz A.W. Toward a Complete Solution of the Homicidal Chauffeur Game // Proceedings of the 1st International Conference on the Theory and Applications of Differential Games. Amherst, Massachusetts. 1969.

26. Понтрягин Л.С. О линейных дифференциальных играх. 1 // Доклады Академии наук СССР. 1967. Vol. 174 - № 6. pp. 12781280.

27. Понтрягин Л.С. О линейных дифференциальных играх. 2 // Доклады Академии наук СССР. 1967. Vol. 175. - № 4. pp. 764766.

28. Мищенко Е.Ф. О некоторых игровых задачах преследования и уклонения от встречи // Автоматика и телемеханика, 1972.

29. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1969. 150 pp.

30. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.Наука, 1974.

31. Basar T., Moon J. Riccati Equations in Nash and Stackelberg Differential and Dynamic Games. // Preprints of the 19th World Congress IFAC,July 9-14. Toulouse, France. 2017. pp. 9957-9964.

32. Петросян Л.А. Дифференциальные игры преследования. Л.: Изд-во Ленингр. Ун-та, 1977. 224 pp.

33. Вишневецкий Л.С., Меликян А.А. Оптимальное преследование на плоскости при наличии препятствия // Прикладная математика и механика, Vol. 46, No. 4, 1982. pp. 613-620.

34. Меликян А.А., Овакимян Н.В. Игровая задача простого преследования на двумерном конусе, Vol. 55, No. 5, 1991. pp. 741-751.

35. Melikyan A.A. Geometry of Pursuit-Evasion Games on Two-Dimensional Manifolds // S. 0rgensen, M. Quincampoix (eds.) Annals of the International Society of Dynamic Games. Boston: Birkhauser. 2007. Vol. 9.

36. Hovakimyan N., Melikyan A.A. Geometry of Pursuit-Evasion on Second Order Rotation Surfaces // Dynamics and Control, No. 10, 2000. pp. 297-312.

37. Кумков С.С., Пацко В.С., Ле Менек С. Два слабых преследователя в игре против одного убегающего // Автоматика и телемеханика, No. 10, 2014. pp. 73-96.

38. Kumkov S.S., Le Menec S., Patsko V.S. Solvability Sets in Pursuit Problem with Two Pursuers and One Evader // Preprints of the 19th World Congress IFAC. Cape Town, South Africa. August 24-29, 2014. pp. 1543-1549.

39. Бранец В.Н., Шмыглевский И.П. Применение кватернионов в задачах ориентации твердого тела. Москва: Издательство "Наука", 1973.

40. Esmail M.S., Merzban M.H., Khalaf A.A.M., Hamed H.F.A., Hussein A.I. Attitude and Altitude Tracking Controller for Quadcopter Dynamical Systems // IEEE Access, No. 10, Май 2022. pp. 53344 - 53358.

41. Белинская Ю.С., Четвериков В.Н. Управление четырехвинтовым

вертолетом // Наука и образование. май 2012. No. 05. pp. 157171.

42. Павловский В.Е., Яцун С.Ф., Емельянова О.В., Савицкий А.В. МОДЕЛИРОВАНИЕ ДИНАМИКИ ПОЛЕТА КВАДРОКОПТЕРА // Робототехника и техническая кибернетика, No. 4, 2014. pp. 49-57.

43. Samir Bouabdallah P.M.R.S. Design and Control of an Indoor Micro Quadrotor // IN PROC. OF International Conference on Robotics and Automation. 2004. Vol. 5. pp. 4393 - 4398.

44. Beard R.W. Quadrotor Dynamics and Control, Brigham Young University, Brigham, 2008.

45. Diebel J. Representing Attitude: Euler Angles, Unit Quaternions, and Rotation, Stanford University, Stanford, 2006.

46. Yoon J., Doh J. Optimal PID control for hovering stabilization of quadcopter using long short term memory // Advanced Engineering Informatics, No. 53, Август 2022.

47. Семион А.А. Метод использования памяти микроконтроллера при реализации нелинейных регуляторов, с коэффициентами, зависящими от состояния // Информационные технологии и вычислительные системы, No. 4, 2017. pp. 64-70.

48. Семион А.А. Разработка автопилота для квадрокоптера // Качество. Инновации. Образование., No. 6, 2016. pp. 53-67.

49. Семион А.А. A method for realization of nonlinear state-dependent coefficients regulators based on microcontroller memory // Московский семинар по электронным и сетевым технологиям

совместно с Сибирской конференцией по управлению и связи. Москва. 2018.

50. Брайсон А., Хо Ю-Ши. Прикладная теория оптимального управления. М.: Мир, 1972.

51. Субботин А.И. Минимаксные неравенства и уравнения Гамильтона-Якоби. М.: Наука, 1991.

52. Афанасьев В.Н., Матвеева Н.А. Построение управления для нелинейной системы с квазипостоянными параметрами регулятора. // Проблемы управления, No. 1, 2018. pp. 37-46.

53. Bogdanov A., Carlson M., Harvey G., Hunt J., Kieburtz D., Merwe R., Wan E. State-dependent Riccati equation control of a small unmanned helicopter // in Proc. AIAA Guidance, Navigation, and Control Conference and Exhibit. Texas, USA. 2003.

54. Kalman R., Bucy R. New Results in Linear Filtering and Prediction Theory // Journal of Basic Engineering. 1961. Vol. 83. No. 1. pp. 123-141.

55. Пугачев В.С. Теория случайных функций и её применение в задачах автоматического управления. 3rd ed. М.: Физматгиз, 1996.

56. Семион А.А. Nonlinear Adaptive Filter and Control of Quadcopter // Московский семинар по электронным и сетевым технологиям (MWENT-22) (Москва). Москва. 2022.

57. Семион А.А., . Адаптивное координатное управление нелинейным неопределенным объектом // XIII Всероссийское

совещание по проблемам управления ВСПУ-2019. Москва. 2019.

58. Гамкрелидзе Р.В. О скользящих оптимальных режимах // Докл. АН СССР. 1962. Vol. 143. No. 6. pp. 1243-1245.

59. Афанасьев В.Н. Управление неопределенными динамическими объектами. М.: ФИЗМАТЛИТ, 2008. 208 pp.

60. Афанасьев В.Н., Каперко А.Ф., Кулагин В.П., Колюбин В.А. Метод адаптивной фильтрации в задаче восстановления параметров космического излучения // Автоматика и телемеханика, No. 3, 2017. pp. 15-33.

61. Zhang J., Xia X. Identifiability Problems of Time-delay HIV Models // Proceedings of the 17th World Congress The International Federation of Automatic Control. Seoul. 2008. pp. 283-288.

62. Marino F., Giacomelli G. Pseudo-spatial coherence resonance in an excitable laser with long delayed feedback // Chaos: An Interdisciplinary Journal of Nonlinear Science, Vol. 27, 2017. P. 114302.

63. Zhao Y.P., He P., Saberi Nik H., Ren J. Robust adaptive synchronization of uncertain complex networks with multiple time-varying coupled delays // Complexity, Vol. 20, May 2019. pp. 62-73.

64. Афанасьев В.Н., Семион А.А. Управление объектом в условиях запаздывания и последействия с интервальной длительностью // Автоматизация. Современные технологии., Vol. 74, No. 4, 2020. pp. 170-175.

65. Семион А.А., Преснова А.П. Optimal Control of Car Active Suspension Control under Delays // XVI Международная

конференция «Устойчивость и колебания нелинейных систем управления» (конференция Пятницкого). Москва. 2022.

66. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968.

67. Афанасьев В.Н., Семион А.А. Дифференциальные игры преследования с несколькими преследователями и одним уклоняющимся // Проблемы управления, No. 1, 2021. pp. 24-35.

68. Qu Z., Simaan M.A. Design of distributed game strategies for networked agents // Proceedings of the 1st IFAC Workshop on Estimation and Control of Networked Systems (NecSys'09). Venice, Italy. 2009. pp. 270-275.

69. Ho Y.C., Bryson A.E., Baron S. Differential Games and Optimal Pursuit-Evasion Strategies // IEEE Trans. Automatic Control. 1965. Vol. AC-10. pp. 385-389.

70. Цыпкин Я.З. Основы информационной теории идентификации. М.: Наука, 1984.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.