Метод синтеза субоптимальных управлений для неопределенных нелинейных динамических систем тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Преснова Анна Павловна
- Специальность ВАК РФ05.13.01
- Количество страниц 114
Оглавление диссертации кандидат наук Преснова Анна Павловна
ВВЕДЕНИЕ
ГЛАВА 1. СИНТЕЗ ОПТИМАЛЬНЫХ И СУБОПТИМАЛЬНЫХ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДА «РАСШИРЕННОЙ ЛИНЕАРИЗАЦИИ»
1.1 Синтез оптимальных систем управления. Основные методы линеаризации нелинейных динамических систем
1.2 Проблема синтеза оптимального управления нелинейной системой
1.2.1 Постановка задачи
1.2.2 Необходимые условия оптимальности управления
1.2.3 Оптимальное управление при фиксированном времени окончания переходного процесса
1.3 Метод «расширенной линеаризации» в задаче оптимального управления
1.3.1 Метод «расширенной линеаризации»
1.3.2 Синтез оптимального управления линеаризованной системой с параметрами, зависящими от состояния
1.3.3 Оптимальное управление при неограниченном времени переходного процесса
1.4 Синтез субоптимального управления линеаризованной системой с параметрами, зависящими от состояния
1.4.1 Уравнение Риккати с параметрами, зависящими от состояния
1.4.2 Асимптотическая устойчивость системы при субоптимальном управлении
Выводы по первой главе
ГЛАВА 2. КОНСТРУИРОВАНИЕ АЛГОРИТМОВ ОПТИМИЗАЦИИ НЕЛИНЕЙНЫХ НЕОПРЕДЕЛЕННЫХ СИСТЕМ УПРАВЛЕНИЯ
2.1 Общая структура алгоритмов оптимизации нелинейных неопределенных систем
2.2 Алгоритм оптимизации нелинейной неопределенной динамической системы
2.2.1 Значение гамильтониана на оптимальной траектории
2.2.2 Основная конструкция алгоритмов оптимизации, основанная на поведении гамильтониана вдоль оптимальной траектории
2.3 Алгоритмы оптимизации нелинейных систем, линеаризованных с помощью метода «расширенной линеаризации»
2.4 Демонстрация работы алгоритма параметрической оптимизации в задаче управления нелинейной системой
2.4.1 Сравнение субоптимального управления и управления с параметрической оптимизацией для модельного примера
2.4.2 Сравнение работы алгоритмов параметрической оптимизации различной эффективности
Выводы по второй главе
ГЛАВА 3. СИНТЕЗ СУБОПТИМАЛЬНОГО УПРАВЛЕНИЯ, КОНТРОЛИРУЮЩЕГО ПОДАЧУ ПРЕПАРАТОВ В МОДЕЛИ ИММУННОЙ СИСТЕМЫ ЧЕЛОВЕКА ПРИ НАЛИЧИИ ВИЧ
3.1 Проблема поиска оптимального лечения ВИЧ
3.1.1 Необходимость математического моделирования
3.1.2 Иммунная система человека и вирус ВИЧ
3.1.3 Математическая модель иммунной системы человека при наличии ВИЧ в организме
3
3.2 Синтез управления с параметрической оптимизацией для модели
иммунной системы человека при наличии ВИЧ
3.3 Компьютерное моделирование
Выводы по третьей главе
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
Введение
Актуальность исследования
Развитие науки и техники, а также бурное развитие компьютерных технологий и увеличение вычислительных мощностей позволяет человеку проектировать сложные автоматизированные системы, к которым предъявляются повышенные требования к надежности, качеству выполняемой работы и быстродействию. В то же время применение современных методов математического моделирования процессов, описывающих поведение сложной системы, позволяет проводить численные эксперименты, в которых можно произвести настройку параметров системы для достижения желаемых результатов, а также проанализировать ее поведение в различных ситуациях.
Для получения наиболее приближенного к реальности описания поведения объекта синтезируемые математические модели динамических процессов представляют в виде системы нелинейных дифференциальных уравнений. Такие системы заключают в себе определенную трудность в случае возникновения необходимости синтеза управляющих воздействий. Поэтому проблема управления нелинейными динамическими системами является актуальной на сегодняшний день и не имеет общего решения. [Афанасьев, 2007, 2015; Васильев, 2000; Гребеников, Рябов, 1979; Дорф, Бишоп, 2004]. Кроме того, современное развитие программного обеспечения требует развивать математический аппарат, позволяющий на практике использовать качественные и приближенно-аналитические методы исследования нелинейных управляемых динамических систем [Рейссиг и др., 1974; Еграшкина, Седова, 2015]. Данные методы необходимы для обеспечения оптимальных условий работы, для повышения безопасности функционирования системы, для отслеживания влияния различных параметров системы на качество ее работы [Барбашин, 1967; Ляпунов, 1950; Малкин, 1952; И.К.КИаШ, 1996].
Степень разработанности проблемы
В диссертации рассматривается задача управления нелинейными неопределенными объектами. В литературе неопределенными называются объекты с неполной информацией о параметрах или помехах, действующих на них [Афанасьев 2015; Емельянов, Коровин, 2004]. Такая неопределенность в системах возникает из-за отсутствия полной априорной информации о параметрах объекта и его состоянии на момент начала управления. Кроме того, сложность самих процессов, происходящих в системе, а также постоянно изменяющиеся внешние условия не позволяют синтезировать полную и точную математическую модель объекта.
При синтезе управляющих воздействий для нелинейных неопределенных объектов применение аналитических методов, как правило, наталкивается на вычислительные трудности, поэтому синтез оптимальных управлений невозможен.
В работе для решения поставленной задачи будет использоваться метод «расширенной линеаризации» [Pearson, 1962; Rugh, 1986; Steinfeld, Tsiotrasy, 2010] Этот метод, как и другие методы линеаризации нелинейных систем (например, линеаризация обратной связью, линеаризация с помощью ряда Тейлора), позволяет для полученной линеаризованной системы применять методы, используемые в теории управления линейными системами. При использовании метода «расширенной линеаризации» исходная система нелинейных дифференциальных уравнений может быть представлена в псевдолинейной форме. В этом случае система уравнений имеет линейную структуру, но параметры полученной системы зависят от состояния объекта в данный момент времени. В зарубежной литературе такое представление систем получило название SDC (State Dependent Coefficient). При использовании этого метода возникают некоторые вопросы связанные с возможной неоднозначностью представления исходной нелинейной системы в виде SDC, кроме того, не решен вопрос о проверке полученной линеаризованной системы на управляемость.
Использование квадратичного критерия качества в задачах с неограниченным временем переходного процесса, а также линеаризованная модель объекта, дают возможность при синтезе управляющих воздействий перейти от необходимости поиска решения скалярного уравнения в частных производных Гамильтона-Якоби-Беллмана к уравнению типа Риккати с параметрами, зависящими от состояния. Этот метод синтеза оптимальных управляющих воздействий для нелинейных систем управления в литературе имеет название SDRE-метода (State Dependent Riccati Equation, SDRE) [Cimen, 2008]. Однако решение полученного уравнения в темпе функционирования объекта является не менее сложной задачей, чем нахождение решения уравнения Гамильтона-Якоби. Несмотря на это, данный метод успешно применяется при решении задач построения управлений для объектов различной физической природы [Menon, Ohlmeyer, 1999; Ruderman et al., 2011; Salamci, Gokbilen, 2007].
Для решения полученного уравнения Риккати с параметрами, зависящими от состояния, и поиска управляющих воздействий в данной работе предложен метод формирования алгоритмов оптимизации нелинейных систем управления, основанный на применении функций допустимых значений управляющих воздействий. В вариационном исчислении этими функциями являются гамильтонианы.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Гарантирующее управление нелинейными объектами: на примере тяжеловодного ядерного реактора2014 год, кандидат наук Окунькова, Евгения Вячеславовна
Численно-аналитические алгоритмы построения стабилизирующих регуляторов для слабонелинейных непрерывных и дискретных систем управления2019 год, кандидат наук Даник Юлия Эдуардовна
Управление летательными аппаратами в условиях действия ограниченных возмущений и неполной информации о состоянии2022 год, кандидат наук Семион Александр Александрович
Синтез дискретно-непрерывных систем управления на основе эталонных переходных процессов1998 год, кандидат технических наук Айдинян, Андрей Размикович
Анализ и синтез особых оптимальных управлений нелинейными динамическими объектами2014 год, кандидат наук Зотов, Александр Викторович
Введение диссертации (часть автореферата) на тему «Метод синтеза субоптимальных управлений для неопределенных нелинейных динамических систем»
Цель работы
Целью данной диссертационной работы является синтез оптимальных и субоптимальных управляющих воздействий в задачах управления нелинейным неопределенным динамическим объектом, представляемым в виде SDC математической модели, при фиксированном и неограниченном времени переходного процесса.
Задачи исследования
Для достижения поставленных целей сформулированы следующие задачи исследования:
а) для задач управления нелинейными объектами с квадратическим
функционалом качества и фиксированным интервалом времени
переходного процесса:
• решить задачу условной оптимизации для объекта с ограничениями на управляющие воздействия;
• получить условие равномерной асимптотической устойчивости системы с синтезированным управлением;
• получить условие, описывающее поведение гамильтониана на оптимальной траектории;
• обосновать использование метода «расширенной линеаризации» для получения БЭС-модели;
• решить задачу построения управления с использованием БЭС-модели;
б) для задач построения управления нелинейными объектами с квадратическим функционалом качества при неограниченном времени переходного процесса:
• синтезировать регулятор с параметрами, зависящими от состояния, обеспечивающий равномерную асимптотическую устойчивость системе управления;
• установить значение гамильтониана, достижимое при субоптимальном управлении, синтезированном с использованием БЭС-модели;
• разработать новый алгоритм параметрического управления, использующий поведение гамильтониана при соответствующем управлении и состоянии системы;
• провести анализ устойчивости нелинейной системы управления при применении алгоритма параметрической оптимизации;
в) проверка эффективности полученных решений
• провести синтез, с использованием полученных теоретических результатов, управляющих воздействий для модели иммунной системы человека при наличии вируса ВИЧ в организме;
• проверить эффективность предлагаемого управления с параметрической оптимизацией регулятора методами математического моделирования.
Методологическая база исследования
В ходе исследования были использованы: методы теории устойчивости; методы теории управления; теория дифференциальных уравнений; метод аналитического конструирования оптимальных систем. Компьютерное моделирование проводилось с использованием пакета Simulink MATLAB.
Основные положения, выносимые на защиту:
Представлен новый метод формирования алгоритмов оптимизации нелинейных неопределенных систем управления, основанный на свойстве функции гамильтона принимать определенные значения на оптимальной траектории. Получен общий вид алгоритмов и получено условие, при котором параметрическая оптимизация обеспечивает асимптотическую устойчивость исходной системе управления.
Для задач синтеза управлений нелинейными динамическими системами, представляемыми математическими моделями с линейной структурой и параметрами, зависящими от состояния (БЭС-модель), с квадратическим функционалом качества и незаданным интервалом времени управления:
• установлено значение гамильтониана, достижимое при субоптимальном управлении, синтезированном с использованием БЭС-модели;
• разработан алгоритм субоптимального координатного управления с оптимизацией параметров регулятора, обеспечивающий устойчивость нелинейной системы с управлением;
• проверена эффективность построенного субоптимального управления с параметрической оптимизацией регулятора, путем математического конструирования и последующего математического моделирования системы медикаментозного лечения человека при наличии вируса ВИЧ.
Личный вклад автора в разработку проблемы
В диссертации представлены результаты исследований, выполненные самим автором и при его участии. Личный вклад автора заключается в разработке метода алгоритмического конструирования управляющих воздействий, происходящих с двумя различными скоростями в зависимости от значения гамильтониана. Автором было проведено сравнение субоптимального управления и управления с параметрической оптимизацией на модельном примере. А также лично автором была исследована и решена задача синтеза субоптимального управления, контролирующего подачу препаратов в модели иммунной системы человека при наличии ВИЧ.
Степень достоверности и апробация результатов
Достоверность теоретических результатов обеспечивается строгостью доказательств соответствующих предположений и теорем, а работоспособность алгоритма подтверждается результатами компьютерного моделирования.
Основные результаты по теме диссертации опубликованы в 5 работах, из них 3 - в рецензируемых научных журналах, индексируемых международными базами цитирования Web of Science и Scopus [Afanas'ev, Presnova, 2018; Presnova, Afanasiev, 2019; Presnova, 2019]. Еще 2 работы опубликованы в журналах,
включенных в перечень научных изданий ВАК [Преснова, 2018; Афанасьев, Преснова, 2018]. Различные аспекты работы докладывались на конференциях: 7th IFAC Symposium on Systems Structure and Control (SSSC) (Sinaia, Romania, 2019); International Conference "Optimal Control and Differential Games" dedicated to the 110th anniversary of L. S. Pontryagin (Москва, 2018); 17th IFAC Workshop on Control Applications of Optimization (Екатеринбург, 2018); III International Conference on Computer Simulation in Physics and beyond (Москва, 2018); Научно-технической конференции студентов, аспирантов и молодых специалистов МИЭМ НИУ ВШЭ им. Е.В. Арменского (Москва, 2014, 2015); Международной научной конференции студентов, аспирантов и молодых учёных «Ломоносов» (Москва, 2011, 2012, 2014). Обсуждение результатов работы проводились на научных семинарах департамента прикладной математики МИЭМ НИУ ВШЭ, кафедры «Систем автоматического управления» МГТУ им. Н.Э. Баумана.
Теоретические и практические результаты использовались при выполнении научно-исследовательской работы в рамках гранта № 16-8-00522 федерального государственного бюджетного учреждения «Российский Фонд Фундаментальный Исследований» «Аналитические и алгоритмические методы синтеза регуляторов для нелинейных неопределенных объектов, основанные на использовании уравнений Беллмана-Айзекса в задачах дифференциальных игр» и гранта № 19-0800535 федерального государственного бюджетного учреждения «Российский Фонд Фундаментальный Исследований» «Аналитические и алгоритмические методы теории управления неопределенными нелинейными объектами с координатно-параметрической оптимизацией».
Благодарность
Автор выражает искреннюю благодарность своему научному руководителю, доктору технических наук, профессору Валерию Николаевичу Афанасьеву за неоценимую поддержку в любых ситуациях и неиссякаемую любовь к своей работе.
Глава 1. Синтез оптимальных и субоптимальных управляющих воздействий с использованием метода «расширенной линеаризации»
1.1 Синтез оптимальных систем управления. Основные методы линеаризации нелинейных динамических систем
Для получения наиболее приближенного к реальности описания поведения объекта управления (авиационно-космического, технологического, биомедицинского), синтезируемые математические модели динамических процессов представляют в виде системы нелинейных дифференциальных уравнений. Зачастую в таких системах отсутствует полная априорная информация о параметрах объекта и его состоянии на момент начала управления. Такие системы заключают в себе определенную трудность в случае возникновения необходимости синтеза управляющих воздействий. Несмотря на это, главными критериями качества возникающих новых систем управления остаются устойчивость и оптимальность.
В настоящее время метод функций Ляпунова является наиболее универсальным и эффективным методом для исследования на устойчивость моделей систем [Ляпунов, 1950; Демидович, 1967; Еграшкина, Седова, 2015; Еругин, 1955; Летов, 1981]. Работы А.М. Ляпунова являются фундаментальными в данном направлении, так как именно в них впервые появилось математически строгое определение понятия устойчивости, были получены первые результаты по проверке на устойчивость нелинейных систем. К сожалению, до сих пор нет общего алгоритма построения функций Ляпунова, что делает применение данного метода в некоторых задачах затруднительным [Мирошник, Никифоров, Фрадков, 2000].
Классическая теория устойчивости так же развивалась в работах Е.А. Барбашина [Барбашин, 1967], Н.Н. Красовского [Красовский, 1959], Е.А. Гребеникова и Ю.А. Рябова [Гребеников, Рябов, 1979], В.И. Зубова [Зубов, 1957], Н.Г.Четаева [Четаев, 1965] и других ученых.
Технический прогресс и новые возможности прошлого столетия пробудил интерес математиков к системам с высокой точностью и к нелинейным системам. Для их исследования стали привлекаться методы функционального анализа [Егупов, Пупков, 2004; Пупков, Капалин, Ющенко, 1976], а для решения проблемы оптимального управления с середины XX столетия стали использоваться методы вариационного исчисления.
Современные формулировки оптимального управления начинались с задач, рассмотренных американским математиком Ричардом Беллманом и русским математиком Львом Понтрягиным в XX веке. Интересно, что принцип минимума Понтрягина представляет собой обобщение уравнений Эйлера-Лагранжа из классического вариационного исчисления [Понтрягин, Болтянский, Гамкрелидзе, 1969]. Это обобщение можно рассматривать как результат Гамильтонова подхода к вариационным задачам. А метод динамического программирования, можно рассматривать как результат подхода Гамильтона-Якоби к вариационным задачам.
Центральным понятием динамического программирования Беллмана
является принцип оптимальности [Беллман, Калаба, 1969]. Целью динамического
программирования является использование принципа оптимальности для
представления задачи динамической оптимизации в виде рекуррентного
соотношения. В данном методе решение нелинейной задачи оптимального
управления влечет за собой решение дифференциального уравнения в частных
производных Гамильтона-Якоби-Беллмана, которое трудно решить аналитически.
Существует несколько исследований, направленных на аппроксимацию решения
этого уравнения. Особого внимания в этой области заслуживают работы таких
ученых, как М. Атанс, М. Фалб [Атанс, Фалб, 1968], Р. Калман [Калман и др., 1971 ],
Н.Н. Моисеев [Моисеев, 1971], А. М. Летов [Летов, 1981], Н.Н. Красовский
[Красовский, 1959], А.А. Красовский [Красовский, 1963], А.А. Фельдбаум
14
[Фельдбаум, 1963], Я. З. Цыпкин [Цыпкин, 1984], Ф. Л. Черноусько [Черноусько, Колмановский, 1978], С. В. Емельянов [Емельянов, 1967] и других.
В общем виде задача оптимального управления формулируется следующим образом:
1) задать в виде дифференциальных уравнений или уравнений в конечных разностях динамику поведения объекта;
2) определить, исходя из реальных возможностей системы, множество допустимых траекторий в виде ограничений на координаты состояния. Задать допустимую область значений управляющих воздействий.
3) сформулировать цели управления;
4) определить функционал качества.
Отыскание управления, которое принадлежит допустимой области значений управляющих воздействий, при котором достигается минимум функционала качества, является основной задачей конструирования оптимальной динамической системы управления с полной информацией. Системой с полной информацией называется такая система, для которой известно множество возможных траекторий и начальное состояние объекта, известны цели управления, функционал качества, а также множество допустимых управлений [Солодовников, 1954].
Особое внимание заслуживает метод аналитического конструирования
оптимальных систем управления [Летов, 1981], основанный на минимизации
функционала качества. Этот метод первоначально разрабатывался на основе
применения классического вариационного исчисления. Основы аналитического
конструирования представлены в [Афанасьев, 2003, 2005; Афанасьев,
Колмановский, Носов, 2003]. При использовании данного метода синтез
управления и выбор параметров для создания оптимальной системы,
минимизирующей функционал качества, происходит на стадии ее проектирования.
Поэтому необходима вся информация об объекте, о внешних воздействиях на
систему, о динамике внутренних процессов в системе, то есть этот метод
применяется в условиях полной информации о системе. Важной особенностью
аналитических методов является то, что при решении конкретной задачи
15
получается общее решение для целого класса задач. Кроме того, данные методы часто применяются для линеаризованных моделей исходных нелинейных объектов.
Так как в настоящей работе рассматриваются нелинейные системы управления, то методы теории аналитического конструирования оптимальных систем управления будут применены к линеаризованной модели исходного нелинейного неопределенного объекта. Однако, если линеаризация является приближением (например, линеаризация рядом Тейлора, когда отбрасываются нелинейные члены), то она, как правило, не сможет обеспечить синтез глобального закона управления для исходной нелинеаризованной системы. Такая линеаризация позволяет перейти от исходной нелинейной модели к приближенной модели, описанной линейными дифференциальными уравнениями. В таком случае при синтезе управления никак не учитываются ни начальные условия системы, ни остаточная нелинейная составляющая разложения ряда Тейлора. Поэтому необходимо использовать другие методы линеаризации систем.
Для сохранения свойств нелинейных систем, в последние годы развиваются методы линеаризации, при которых происходит эквивалентное представление исходных систем. К таким методам относится метод линеаризации обратной связью [Isidori, 1995; Alvarez-Ramirez et al., 2000; Четвериков, 2013, Mehra R., 2014], а также метод «расширенной линеаризации» (extended linearization) [Pearson, 1962; Cloutier, Cockburn, 2001, Cimen T.D. 2011, Афанасьев, 2015].
Основы метода линеаризации обратной связью разработаны в дифференциальной геометрии. Этот метод представляет собой использование отображения из нелинейного пространства в линейное пространство. После чего становится возможным применение методов линейного управления. Когда закон управления разработан в преобразованных координатах, он должен быть преобразован обратно в исходные координаты. А это значит, что преобразование должно быть обратимо. Отсюда следует неизбежный недостаток линеаризации обратной связью в том, что она применима не для всех систем.
Для метода «расширенной линеаризации» в публикациях, относящихся к данной тематике, применяют различные названия, например, «кажущаяся линеаризация» (apparent linearization [Mracek, Cloutier, 1996]), «расширенная (экстенсивная) линеаризация» (extended linearization [Cimen, 2008]), «представление в виде системы с параметрами, зависящими от состояния, SDC» (State-Dependent-Coefficient factorization [Erdem, Alleyn, 2004; Cloutier, Cockburn, 2001]). Важное преимущество этого метода состоит в том, что вся нелинейность системы сохраняется. Однако, при этом такое преобразование не является однозначным. На сегодняшний день не решена задача выбора оптимального SDC-представления для исходной нелинейной системы, а также нет общего алгоритма исследования полученных линеаризованных систем на устойчивость.
Работа Персона [Pearson, 1962] была одной из первых работ, в которой для синтеза управления нелинейным объектом исходная система была представлена в виде эквивалентной линейной модели с параметрами, зависящими от состояния. Но только в конце XX века этот метод начал более плотно разрабатываться учеными и применяться на практике. Так, например, разработка предложенного метода в задачах управления детерминированными нелинейными объектами в отсутствии каких-либо возмущений была продолжена в работах [Banks et al., 2007].
При использовании метода «расширенной линеаризации» исходная система нелинейных дифференциальных уравнений может быть представлена в псевдолинейной форме. В этом случае система уравнений имеет линейную структуру, но параметры полученной системы зависят от вектора состояния.
Так как основной проблемой при построении оптимального управления в
случае нелинейных систем управления является решение уравнения в частных
производных Гамильтона-Якоби-Беллмана, то основные поиски направлены на
построение его приближенного решения. Использование квадратичного критерия
качества в задачах с неограниченным временем переходного процесса, а также
модель объекта, полученная с применением метода «расширенной линеаризации»,
позволяют при синтезе управления перейти от необходимости поиска решения
скалярного уравнения в частных производных Гамильтона-Якоби-Беллмана к
17
уравнению типа Риккати с параметрами, зависящими от состояния. Этот метод синтеза субоптимальных управляющих воздействий для нелинейных систем управления в литературе имеет название SDRE-метода (State Dependent Riccati Equation, SDRE [Cimen, 2008; Marconi, Isidori, 2007]). Такой метод позволяет создавать эффективные конструкции управления с нелинейной обратной связью, сохраняя нелинейности в состояниях системы.
Однако, решение полученного уравнения Риккати с параметрами, зависящими от состояния объекта, является отдельной сложной задачей. Решением данной проблемы в случае задач управления в простейших постановках (низкая размерность системы, независимость параметров штрафа функционала качества от состояния объекта и пр.) является использование математических пакетов символических вычислений. При дискретизации для решения алгебраического уравнения Риккати, если это позволяет делать динамика объекта, можно использовать вычислительные процедуры типа Рунге-Кутта. Вычислительные затраты, необходимые для точной реализации SDRE-метода, являются его основным недостатком [Friedland, 2007; Cimen, 2008; Erdem, Alleyn, 2004; Shamma, Cloutier, 2003].
В данной главе будет показано, что при неограниченном интервале управления регуляторы, в основе которых лежит использование алгебраического матричного уравнения типа Риккати, параметры которого зависят от состояния, обеспечивают нелинейной системе равномерную асимптотическую устойчивость и оптимальность.
1.2 Проблема синтеза оптимального управления нелинейной системой
1.2.1 Постановка задачи
В данной работе будем рассматривать нелинейные объекты, описывающиеся дифференциальным уравнением вида
Шх(г) = 1(х(г)) + В(х(г))и(г), х(?0) = х0, ш
(1.1)
где х() =
Я" ,г<
го ,г/
} - состояние системы; х(-) еОх, Ох - область
(открытое связанное множество) Я", содержащая начало; х0 е Х0 еОх-множество допустимых значений начальных условий системы;
и
(•) = {и(г)
Яг ,г
го ,г/
действительные
- управление; 1(х(г)), В(х(г))
непрерывные матрицы-функции.
Будем считать, что функция /* (х(г), и (г)), определенная в виде
1 * (х(г), и (г)) = / (х(г)) + В( х(г ))и(г), непрерывна и удовлетворяет условиям Липщица, то есть существует некоторая постоянная Ь > 0 такая, что выполняются условия:
1 *( х(г), и (г)) - / *( 2 (г), у(г ))| < Ь(\х(г) - 2 (г) + |и (г) - v(г )|), //( х(г), и (г)) - //(2 (г), и (г ))| < Ь(\х(г) - 2 (г) + |и (г) - у(г )|).
Таким образом, относительно системы (1.1) выполняются теоремы о локальном существовании, единственности и непрерывной зависимости на конечном интервале решения х (г, г0, х0) уравнения (1.1) от начальных условий. На управляющее воздействие и (г) наложено ограничение вида
(1.2)
|||и(г)||Я Шг < Еи
(1.3)
где Я - положительно определенная матрица, Еи - положительное число. В дальнейшем ограничение (1.3) будем для краткости записывать как и (•) е и.
Сформулируем задачу синтеза оптимального управления для исходной нелинейной системы (1.1).
Зададим функционал качества в виде
1
J(х(-), и (•)) = к(х(гг)) +1 Ь(х(г), и (г))Шг,
(1.4)
0
элементы функционала (1.4) К(х(г/)) и Ь(х(г),ы(г)) отвечают следующим
предположениям: Ь( х(г), ы (г)) - непрерывная действительная функция, заданная на
Я" х Яг х|г0, гг ], К(х(?/)) - действительная функция на Я" х|г0,г/ ^. В
диссертации используются квадратические функционалы качества. В силу этого, функционал (1.4) для системы (1.1) принимает вид
3(х(-),ы(•)) = -х )¥х(гт) + { х т(г^х(г) + ы т(г)Яы(г)}Сг, (1.5)
г0
здесь симметрические матрицы Q и Р положительно полуопределенные. Ограничения на управление задаются матрицей Я, которая является положительно определенной симметрической матрицей.
Задача нахождения оптимального управления заключается в отыскании такой функции ы(г), принадлежащей допустимой области управляющих воздействий, при которой достигается минимум функционала качества (1.5) и при этом система достигает цели управления.
Предположение 1.1. В случае, когда допустимое управление подчиняется ограничению ы(•) е и, предполагается возможность выбором матриц Q и Я, при учете матрицы В( х(г)), синтезировать управление ы (•), принадлежащее внутренней
области множества и .
Таким образом, предполагается возможность выполнения условия (1.3) [Красовский, 1987].
1.2.2 Необходимые условия оптимальности управления
Построим гамильтониан в виде
н (х(г), ы(г ),Л(г)) = Ь(х(г), ы(г)) + Лт (г)[ / (х(г)) + В( х(г ))ы(г)], (1.6) где функция Н (х(г), ы (г ),Л(г)) определена и непрерывна для (г, х,ы) е Я х Я" х Яг, г е |г0,г г ] и предполагается дважды дифференцируемой.
Вспомогательная функция (множитель Лагранжа) Л(г) и ее краевое значение определены далее.
В общем случае (" > 1) оптимальное управление нелинейным объектом (1.1) определяется необходимыми условиями оптимальности:
шх(г)=|дН(мтТ, х(,0)=х0,
Ш Д(() = \дН(х(г),и(<),Л(0) 1Т (1.7)
Шг I дх I
Л( г 1) = ^х( г 1),
дН (х(г), и(г),Л(г)) ди
= 0, (1.8)
где
(1.9)
Н (х(г), и (г)Д(г)) = 1 [хТ (г)дх(г) + иТ (г) Яи ( г) ] +
+ ЛТ (г) [ / (х( г)) + В( х(г))и (г)].
Система дифференциальных уравнений (1.7) образует сопряженную систему, связанную с основной задачей [Ким, 2007].
Важное свойство дополнительной переменной Л(1) состоит в том, что
оптимальное управление, при выполнении предположения 1.1, является точкой стационарности гамильтониана (1.9).
Так как критерием оптимальности управления является минимум функционала качества, рассмотрим уравнение, описывающее поведение функционала на оптимальной траектории.
Пусть (г0, х0) - начальная точка и и()еи - допустимое управление,
переводящее (г0, х0) в х(гг). Тогда функционал (1.5) принимает определенное значение для г е [г0 ,г/].
Пусть J ( г, х( г)) - непрерывно дифференцируемая функция на О.х с Я" х [г0, г/, которая удовлетворяет условиям [Атанс, Фалб, 1968]:
1 (г, х(г)) сОх , г е[^, гг ],
2. J (г, х(г)) = J (г, х(г), и (г)), г е[ г0, ^ ]
в таком случае можно получить:
М (г, х(г)) _ дJ(г, х(г)) + дJ(г, х(г)) dx(t)
Жг дг
дJ (г, х(г)) дJ (г, х(г))
дг
С другой стороны, из (1.4)
+
дх
дх Жг [ / (х(г)) + в( х(г ))и (г)].
(1.10)
си (г, х(г)) Жг
= -Ь(х(г), и (г)).
(111)
Сравнивая правые части (1.10) и (1.11), получаем
+ 1(х(г), и (г)) + ^дШ [/(х(г)) + в( х(г ))и (г)] = 0. (1.12)
Учитывая, что гамильтониан имеет вид (1.6), тогда для г е[г0, гг ] при
дJ (г, х(г)) оТ/Л предположении, что---= л (г), имеем
дх
дJ (г, х(г))
дг
+ н
х(г), и (г),
дJ (г, х(г)) дх
= 0.
(1.13)
Обозначим минимум функции J (г, х(г)) через J0 (г, х(г)):
J0 (г, х(г)) = inf J (г, х(г), и (г)).
иеи
(114)
Уравнение (1.13) в общем случае при выполнении условия (1.14) примет вид
дJ (г, х(г))
дг
+ тт Н
иеи
х(г), и (г)
дJ (г, х(г))' дх
= 0.
(1.15)
Обозначим и0 (г) - управление, при котором выполняется условие (1.14), тогда
и0 (г) е и - является оптимальным управлением. Можно записать, что
дJ0 (г, х0)
дг
+ н
' 0 дJ0(г,х0)Л
х , и ,
дх
= 0.
(1.16)
Таким образом, уравнение (1.16) является дополнительным необходимым
условием оптимальности. Уравнение (1.15) с краевым условием
22
г^/»=^(х(./))=(117)
является уравнением Гамильтона - Якоби.
1.2.3 Оптимальное управление при фиксированном времени окончания переходного процесса
Используя приведенные выше необходимые условия оптимальности (1.7) -(1.8) и полученное дополнительное условие оптимальности (1.15), будем искать оптимальное управление объектом (1.1).
Оптимальное управление существует, если найдется такая непрерывная положительно определенная скалярная функция V(г, х(г)), называемая функцией
Беллмана V: О ^ Я+,
V (s, x) = inf
u(-)e U
1 tf
- J { xT (t )Qx(t) + u T (t) Ru (t)} dt
(1.18)
2 ■
Предположение 1.2 Предположим, что f (x(t)), B(x(t)) являются достаточно
гладкими функциями, что функция V(t, x(t)), определенная в виде (1.18),
дифференцируема при любых допустимых управлениях u (-)eU.
Предположение 1.3 Пусть функция V(t, x(t)), определенная в (1.18),
удовлетворяет условиям Липшица в Q x.
Как известно, значением назначенной функции V (t, x (t)) является решение
дифференциального уравнения первого порядка в частных производных Гамильтона-Якоби-Беллмана [Беллман, Энджел, 1974; Атанс, Фалб, 1968]
^ V (t,x (t)) + min H i x(t), u (t), ^ V (t,x(t)) 1 = 0,
dt *w \ w'ах J ' (119)
1 T
V (tf, x(tf )) = 2 xT (tf ) Fx (tf ), где H - гамильтониан
НI х(г), и(г)
дУ (г, х (г)) дх
■1 [ х Т (* )0х (г) + и т(г) Яи (г)
дУ (г, х (г)),
(1.20)
Функция Н х(г), и (г),
+ ^д^" [1 (х (г)) + в (х(г ))и (г) ]■
л дУ (г, х(г ))л
дх
определена,
непрерывна
и
дифференцируема для (х, и,г) е Я" х Яг х Я, г е[г0,гг ], здесь Ат (г) принимается равной
дУ (г, х(г))
Л1 (г) =
дх
(1.21)
Если предположение 1.1 выполняется, тогда оптимальное управление и0 (г) является точкой стационарности гамильтониана (120) и определяется соотношением
дН
х(г), и (г)
дУ (г, х(г))' дх
ди
= Яи (г) + в т (х(г)) {«М» \ =о,
дх
(1.22)
д2 Н
х(г), и (г),
дУ (г, х(г)) дх
у _
откуда
ди2
и и(г) = - я-1 в т( х (г))
Я у 0,
дУ (г, х (г)) 1т
(1.23)
дх ] '
где функция У (г, х(г)) является решением уравнения Гамильтона-Якоби-Беллмана
(1. 19). Запишем его в развернутом виде: дУ(г, х(г)) дУ(г, х(г))
+
-/(х(г))
дг дх
-:1дУ(дд^В(х(г))Я-вТ(х(()) + 12,) = о, (1.24)
1 Т
У (г т, х(г т)) = 2 хт (г т) ¥х(г т).
Лемма 1.1. Если оптимальное управление для нелинейной системы
Шх (г) = / (х(г)) + в (х(г ))и( г), ш
х(го) = хо
существует, то оно единственно и определяется уравнением
х(г))р(г,х(г)) 1Т,
и "(г) = - Я-1 В'(х(г)) Г ' | , (1.25)
где вектор дУ(г, х(г)) отвечает решению уравнения Гамильтона-Якоби-Беллмана
дх
дУ (г, х(г)) + дУ (г, х(г)) -
дг дх 1/1 с/л
- 2 ^^^^^^ В( х(г)) ЯВ т( х(г)) {¿М^ + 2 2ХМ0 = 0, (1.26) 1 Т
V (г/, х(гг)) = 2 хТ (гг) ^).
Доказательство леммы 1.1. Установлено, что экстремальное управление (1.25) соответствует минимуму (по крайней мере локальному) значения
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Геометрический подход к решению задачи оптимального синтеза стационарных гладких систем управления2000 год, доктор физико-математических наук Кондратьев, Геннадий Вячеславович
Алгоритмическое и программное обеспечение синтеза робастных регуляторов по критерию минимума Н-норм в задачах управления движением и стабилизации ЗУР2005 год, кандидат технических наук Миронов, Павел Никитич
Построение эффективных автоматических технологических процессов на основе их моделирования в замкнутых эксплуатационных областях2001 год, доктор технических наук Акаев, Александр Борисович
Моделирование и синтез субоптимальных переключаемых систем при наличии дискретных неточных измерений2019 год, кандидат наук Немыченков Григорий Игоревич
Синтез управления неопределенными динамическими объектами на основе прямой и обратной минимаксных задач1998 год, доктор физико-математических наук Коган, Марк Михайлович
Список литературы диссертационного исследования кандидат наук Преснова Анна Павловна, 2020 год
Список литературы
1. Аксенов Г.С., Фомин В.Н. Синтез адаптивных регуляторов на основе метода функций Ляпунова // Автоматика и телемеханика. 1982. № 6. С. 126-137.
2. Атанс М., Фалб П. Оптимальное управление. М.: Машиностроение, 1968. 764 с.
3. Афанасьев В.Н. Алгоритмический метод построения управлений нелинейным неопределенным объектом // Проблемы управления. 2015. № 5. С. 1419.
4. Афанасьев В.Н. Аналитическое конструирование детерминированных конечномерных систем управления. М.: МИЭМ, 2003. 160 с.
5. Афанасьев В.Н. Аналитическое конструирование непрерывных систем управления. М.: РУДН, 2005. 148 с.
6. Афанасьев В.Н. Динамические системы управления с неполной информацией: алгоритмическое конструирование. М.: УРСС, 2007. 216 с.
7. Афанасьев В.Н. Управление неопределенными динамическими объектами. М.: Физматлит, 2008. 208 с.
8. Афанасьев В.Н. Управление нелинейными неопределенными динамическими объектами. М.: ЛЕНАНД, 2015. 224 с.
9. Афанасьев В.Н., Данилина А.Н. Алгоритмическое конструирование систем управления с неполной информацией. М.: МИЭМ, 1992. 150 с.
10. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления. М.: Высшая школа, 2003. 615 с.
11. Афанасьев В.Н., Носов В.Р., Прокопов Б.И. Адаптивное управление. М.: МИЭМ, 1987. 150 с.
12. Афанасьев В.Н., Орлов П.В. Субоптимальное управление нелинейным объектом, линеаризуемым обратной связью // Изв. РАН ТиСУ. 2011. № 3. С. 13-22.
13. Афанасьев В.Н., Преснова А.П. Формирование алгоритмов оптимизации нестационарных систем управления на основе необходимых условий оптимальности // Мехатроника. Автоматизация. Управление. 2018. №2 3. С. 153-159.
14. Афанасьев В.Н., Фурасов В.Д. Построение самонастраивающихся регуляторов на основе векторных функций Ляпунова // ДАН СССР. 1976. Т. 226. № 5. С. 1029-1031.
15. Ахутин В.М., Нефедов В.П., Сахаров М.П. и др. Инженерная физиология и моделирование систем организма. Новосибирск: Наука, 1987. 237 с.
16. Барбашин Е.А. Введение в теорию устойчивости. М.: Наука, 1967. 223 с.
17. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. М.: Наука, 1969. 120 с.
18. Беллман Р., Энджел Э. Динамическое программирование и уравнения в частных производных. М.: Мир, 1974. 207 с.
19. Васильев С.Н. К интеллектному управлению // Нелинейная теория управления и ее приложения. М.: Физматлит, 2000. С. 57-126.
20. Галактионов В.Г. Иммунология: Учебник. М.: Нива России, 2000. 488 с.
21. Гребеников Е.А., Рябов Ю.А. Конструктивные методы анализа нелинейных систем. М.: Наука, 1979. 431 с.
22. Демидович Б.П. Лекции по математической теории устойчивости. М.: Наука, 1967. 472 с.
23. Дорф Р., Бишоп Р. Современные системы управления. М.: Лаборатория базовых знаний, 2004. 832 с.
24. Еграшкина Ж.Е., Седова Н.О. Устойчивость и стабилизация нелинейных систем обыкновенных дифференциальных уравнений в терминах линейных матричных неравенств // Нелинейный мир. 2015. № 1. С. 3-15.
25. Егупов Н.Д., Пупков К.А. Методы классической и современной теории автоматического управления. Синтез регуляторов систем автоматического управления. Т. 3. М.: МГТУ им. Н.Э. Баумана, 2004. 656 с.
26. Емельянов С.В. Системы автоматического управления с переменной структурой. М.: Наука, 1967. 336 с.
27. Емельянов С.В., Коровин С.К. Стабилизация неопределенных динамических объектов с непрерывным временем // Новые методы управления сложными системами. М.: Наука, 2004. С. 87-148.
28. Еругин Н.П. Качественные методы в теории устойчивости // ПММ. 1955. Т. 19. Вып. 2. С. 227-236.
29. Зубов В.И. Методы А.М. Ляпунова и их применение. Л.: Изд-во ЛГУ, 1957. 241 с.
30. Калман Р., Фалб П., Арбиб М. Очерки по математической теории систем. М.: Мир, 1971. 398 с.
31. Ким Д.П. Теория автоматического управления. Т.2. Многомерные, нелинейные, оптимальные и адаптивные системы. М.:Физматлит, 2007. 440 с.
32. Красовский А.А. Динамика непрерывных самонастраивающихся систем. М.: Физматгиз, 1963. 468 с.
33. Красовский Н.Н. К задаче управления с неполной информацией // Изв. АН СССР. Техническая кибернетика. 1976. № 2. С. 3-7.
34. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматлит, 1959. 211 с.
35. Летов А.М. Математическая теория процессов управления. М.: Наука, 1981. 256 с.
36. Лю Б. Теория и практика неопределенного программирования. М.: БИНОМ. Лаборатория знаний, 2005. 416 с.
37. Ляпунов А.М. Общая задача об устойчивости движения. М.-Л.: Гостехиздат, 1950. 471 с.
38. Малкин И.Г. Существование функций Ляпунова // Изв. Казанского физ.-матем. общества. 1929/30. Т. 4. С. 51-62.
39. Малкин И.Г. Теория устойчивости движения. М.: ГИТТЛ, 1952. 431 с.
40. Мирошник И.В., Никифоров В.О., Фрадков А.Л. Нелинейное и адаптивное управление сложными динамическими системами. СПб: Наука, 2000. 550 с.
41. Моисеев Н.Н. Численные методы в теории оптимальных систем. М.: Наука, 1971. 424 с.
42. Носов В.Р., Прокопов Б.И. Асимптотическая устойчивость в целом самонастраивающихся систем с эталонной моделью // Прикладная математика и механика. 1977. Т. 41. Вып. 5. С. 850-858.
43. Павлов Б.В., Соловьев И.Г. Системы прямого адаптивного управления. М.: Наука, 1989. 130 с.
44. Петров Б.Н., Крутько П.Д. Алгоритмическое конструирование оптимальных регуляторов при неполной информации о состоянии объекта возмущений // Изв. АН СССР. Техническая кибернетика. 1972. №6. С. 188-199.
45. Петров Б.Н., Рутковский В.Ю., Крутова И.Н., Земляков С.Д. Адаптивное координатно-параметрическое управление нестационарными объектами. М.: Наука, 1980. 244 с.
46. Покровский В.В. Эпидемиология и профилактика ВИЧ-инфекции и СПИД. М.: Медицина, 1996. 246 с.
47. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В. Математическая теория оптимальных процессов. Издание второе. М.: Наука, 1969. 384 с.
48. Преснова А.П. Метод алгоритмического конструирования в задаче медикаментозного лечения ВИЧ // Качество. Инновации. Образование. 2016. № 5. С. 33-41.
49. Преснова А.П. Метод расширенной линеаризации в задаче управления неопределенным нелинейным объектом // Качество. Инновации. Образование. 2016. № 2. С. 31-40.
50. Преснова А.П. Оптимальное и субоптимальное управление нелинейным объектом с использованием метода расширенной линеаризации // Автоматизация. Современные технологии. 2018. Т. 72. № 12. С. 563-569.
51. Приспосабливающиеся автоматические системы // Под ред. Э. Мишкина, Л. Брауна. М.: Изд-во иностр. лит., 1963. 630 с.
52. Прокопов Б.И. О синтезе адаптивных систем с эталонной моделью прямым методом Ляпунова // Изв. АН СССР. Техническая кибернетика. 1974. № 2. С. 167172.
53. Пупков К.А., Егупов Н.Д., Гаврилов А.И., Зверев В.Ю., Коньков В.Г., Милов Л.Т., Мочалов И.А., Мышляев Ю.И., Трофимов А.И. Методы робастного, нейро-нечеткого и адаптивного управления. М.: Изд-во МГТУ им. Н.Э. Баумана, 2001.
54. Пупков К.А., Капалин В.И., Ющенко А.С. Функциональные ряды в теории нелинейных систем. Серия: Теоретические основы технической кибернетики. М.: Наука, 1976. 448 с.
55. Рейссиг Р., Сансоне Г., Конти Р. Качественная теория нелинейных дифференциальных уравнений. М.: Наука, 1974. 319 с.
56. Рытик П.Г. и др. Этиотропная комбинированная химиотерапия ВИЧ-инфекции // Клиническая медицина. 2000. № 5. С. 13-19.
57. Солодовников В.В. Основы автоматического регулирования. Теория. М.: Машгиз, 1954. 1117 с.
58. Справочник по теории автоматического управления // Под ред. А.А. Красовского. М.: Наука, 1987. 712 с.
59. Фельдбаум А.А. Основы теории оптимальных автоматических систем. М.: Государственное издательство физико-математической литературы, 1963. 553 с.
60. Фрадков А.Л. Схема скоростного градиента и ее приложение в задачах адаптивного управления // Автоматика и телемеханика. 1979. № 9. С. 90-101.
61. Цыпкин Я.З. Основы информационной теории идентификации. М.: Наука, 1984. 320 с.
62. Черноусько Ф. Л., Колмановский В. Б. Оптимальное управление при случайных возмущениях. М.: Физматлит, 1978. 352 с.
63. Четаев Н.Г. Устойчивость движения. М.: Наука, 1965. 176 с.
64. Четвериков В.Н. Динамически линеаризуемые системы управления // Научное издание МГТУ им. Н.Э. Баумана. 2013. С. 251-262.
65. Шестаков А.А. Обобщенный прямой метод Ляпунова для систем с распределенными параметрами. М.: УРСС, 2007. 320 с.
66. Ядыкин И.Б. Оптимальное адаптивное управление на основе беспоисковой самонастраивающейся системы с обучаемой эталонной моделью // Автоматика и телемеханика. 1979. № 2. С. 65-79.
67. Alvarez-Ramirez J., Meraz M., Velasco-Hernandez J. Feedback control of the chemotherapy of HIV // Int. J. Bifuraction Chaos 10 (9), 2000. P. 2207-2219.
68. Afanas'ev V., Presnova A. Algorithms for the Parametric Optimization of Nonlinear Systems Based on the Conditions of Optimal System // IFAC-PapersOnLine, 2018. Vol. 51. Is. 32. Ch. 45. P. 428-433.
69. Banks H.T., Lewis B.M., Tran H.T. Nonlinear feedback controllers and compensators: a state-dependent Riccati equation approach // Computational Optimization and Applications, 2007. Volume 37. Issue 2. P. 177-218.
70. Bell G.J. Mathematical model of clonal selection and antibody production Part I // Journal Theoretical Biology 29, 1970. P. 191-232.
71. Bell G.J. Mathematical model of clonal selection and antibody production Part II // Journal Theoretical Biology 33, 1971. P. 339-378.
72. Bell G.J. Mathematical model of clonal selection and antibody production Part III // Journal Theoretical Biology 33, 1971. P. 379-398.
73. Chang H., Astrofi F. Control of HIV Infection Dynamics by the Enhancement of the Immune System // Proc. 17th World Conf. IFAC, Seoul, Korea, 2008. July 6-11. P.12217-12222.
74. Cheng C.F., Chang C.T. Viral load analysis of a biodynamical model of HIV-1 with unknown equilibrium points // Proceedings of the 2004 IEEE Conference on Control Applications, Taipei, Paiwan, 2004. P. 557-561.
75. Cimen T.D. State-Dependent Riccati Equation (SDRE) Control: A Survey // Proc. 17th World Conf. IFAC, Seoul, Korea, July 6-11, 2008. P. 3761-3775.
76. Cloutier J.R., Cockburn J.C. The state-dependent nonlinear regulator with state constraints // Proc. of the American control conference, Arlington, VA, 2001.
77. Erdem E.B., Alleyn A.G. Design of a class of nonlinear controllers via state-dependent Riccati equation // IEEE Trans. on control systems technology, 2004. № 12. P. 2986-2991.
78. Fister K.R., Lenhart S., McNally J.S. Optimising chemotherapy in an HIV Model // Electronic Journal of Differential Equations, 1998. No. 32. P. 1-12.
79. Friedland B. Quasi-optimum control and the SDRE method // Proc. 17th IFAC sympos. on automatic control in aerospace. Toulouse, France, 2007. P. 762-767.
80. Gee S., Tian Z., Lee T. Nonlinear control of a dynamic model of HIV-1 // IEEE Trans. Biomed. Eng. 52 (3), 2005. P. 353-361.
81. Khalil H.K. Nonlinear systems. Michigan State University. Prentice-Hall, 1996. P.734.
82. Isidori A. Nonlinear Control Systems. London: Springer, 3rd edition, 1995. 549 p.
83. Joshi H.R. Optimal Control of an HIV immunology Model // Optim. Control Appl. Methods, 2002. Vol. 23. P. 199-213.
84. Kirschner D., Lenhart S., Serbin S. Optimal control of the chemotherapy of HIV // Journal of Mathematical Biology, 1997. Vol. 35. P. 775-792.
85. Marconi L., Isidori A. A unifying approach to the design of nonlinear output regulaters // Advances in control theory and applications. Springer, 2007. P. 185-200.
86. Menon P.K., Ohlmeyer E.J. Integrated Design of Angel Missile Guidance and Control Systems // Proc. 17th Mediterranean Conf. on Control and Automation (MED99). Haifa, Israel, June 28-30, 1999. P. 1470-1494.
87. Mracek C.P., Cloutier J.R. Control designs for the nonlinear benchmark problem via the State-Dependent Riccati Equation Method // International Journal of Robust and Nonlinear Control, 1998. Vol. 8. P. 401-433.
88. Mracek C.P., Cloutier J.R. Missile longitudinal autopilot design using the state-dependent Riccati equation method // Proc. of the international conference on nonlinear problems in aviation and aerospace, Daytona Beach, FL, 1996. P. 387-396.
89. Nowak M.A., Bangham C.R. Population dynamics of immune responses to persistent viruses // Science, 1996. Vol. 272. P.74-79.
90. Pearson J.D. Approximation methods in optimal control // Journal of Electronics and Control, 1962. № 12. P. 453-469.
91. Perelson A., Kirschner D., DeBoer R. The Dynamics of HIV infection of CD4+T Cells // Mathematical Biosciences, 1993. P. 81-125.
92. Perelson A., Nelson P. Mathematical analysis of HIV-1 dynamics in vivo // SIAM Review, 1999. Vol. 41(1). P. 3-44.
93. Perelson A., Neumann A., Markowitz M. et al. HIV-1 Dynamics in vivo: clearance rate, infected cell lifespan, and viral generation time // Science, 1996. Vol. 271. P. 15821586.
94. Presnova A. Algorithmic method for modeling the optimal treatment of patients with HIV // Journal of Physics: Conference Series, 2019. No. 1163. P. 1-6.
95. Presnova A., Afanasiev V. Suboptimal Control of Nonlinear Dynamic System with Unlimited Transition Process Time // IFAC-PapersOnLine, 2019. Vol. 52. No. 17. P.42-47.
96. Ruderman M., Weigel D., Hoffmann F., Bertram T. Extended SDRE control of 1-DOF robotic manipulator with nonlinearities // 18 WC IFAC (Milano, Italy), 2011. P. 10940-10945.
97. Rugh W. An extended linearization approach to nonlinear system inversion // IEEE Transactions on Automatic Control, 1986. Vol. 31. No. 8. P. 725-733.
98. Sakayanagi Y., Nakayama D., Shigeki N. et al. Clarification of free parameters of state-dependent coefficient form: effect on solving state-dependent Riccati Inequality // 17th WC IFAC. Seoul, 2008. P. 182-187.
99. Shamma J.S., Cloutier J.R. Existence of SDRE stabilizing control // IEEE Transactions on Automatic Control, 2003. Vol. 48(3). P. 513-517.
100. Souza J.F., Caetano M., Yoneyama T. Optimal control applied to the antiviral treatment of AIDS // Proceedings of the 39th IEEE Conference on Decision and Control, Sydney, Australia, 2000. P. 4839-4844.
101. Steinfeld B.A., Tsiotrasy P. A state-dependent Riccati equation approach to atmospheric entry guidance // AIAA Guidance, Navigator and Control Conference Toronto, Ontario, Canada, 2010. P. 1-20.
102. Stengel R.F., Ghigliazza R., Rulkarni N. et al. Optimal control of innate immune response // Optimal Control Appl. and Methods, 2002. Vol. 23. P. 91-104.
103. Wodarz D., Nowak M.A. Mathematical models of HIV pathogenesis and treatment // BioEssays, 2002. Vol. 24. P. 1178-1187.
104. Wodarz D., Nowak M.A. Specific therapy regimes could lead to long-term immunological control of HIV // Proceedings of the National Academy of Sciences, 1999. Vol. 96. № 6. P. 14464-14469.
105. Zurakowski R., Teel A.R. A model predictive control based scheduling method for HIV therapy // Journal of Theoretical Biology, 2006. Vol. 238. P. 368-382.
106. Zurakowski R., Teel A.R. Enhancing immune response to HIV infection using MPC-based treatment scheduling // In Proceedings of the 2003 American Control Conference, June, 2003.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.