Об одном методе решения задач гарантирующего управления с неполной информацией для линейных динамических систем тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат наук Стрелковский Никита Витальевич

  • Стрелковский Никита Витальевич
  • кандидат науккандидат наук
  • 2016, ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова»
  • Специальность ВАК РФ01.01.02
  • Количество страниц 103
Стрелковский Никита Витальевич. Об одном методе решения задач гарантирующего управления с неполной информацией для линейных динамических систем: дис. кандидат наук: 01.01.02 - Дифференциальные уравнения. ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова». 2016. 103 с.

Оглавление диссертации кандидат наук Стрелковский Никита Витальевич

Введение

Глава 1. Задача гарантированного позиционного наведения с

неполной информацией в заданный момент времени

1.1 Постановка задачи

1.2 Метод пакетов программ

1.3 Расширенная задача программного наведения

1.4 Критерий разрешимости

1.5 Построение наводящего пакета программ

1.6 Пример

Глава 2. Задача гарантированного позиционного наведения с

неполной информацией к заданному моменту времени

2.1 Постановка задачи

2.2 Задача пакетного наведения с семейством допустимых моментов наведения

2.3 Расширенная задача программного наведения с семейством допустимых моментов наведения

2.4 Критерий разрешимости

2.5 Построение наводящего пакета программ

2.6 Пример

Глава 3. Алгоритм решения задачи гарантированного

позиционного наведения для линейных управляемых

систем в условиях неполной информации

3.1 Алгоритм решения задачи пакетного наведения

3.1.1 Генерация однородных сигналов

3.1.2 Идентификация моментов расслоения однородных

сигналов

3.1.3 Идентификация кластеров множества допустимых начальных состояний и кластерных позиций в моменты расслоения однородных сигналов

3.1.4 Проверка критерия разрешимости

3.1.5 Проверка наводимости нулевого пакета программ

3.1.6 Построение наводящего пакета программ

3.1.7 Вычисление элементов наводящего пакета программ для особых кластеров

3.2 Построение е-наводящей позиционной стратегии

3.3 Примеры

3.3.1 Пример построения кластерных позиций

3.3.2 Пример построения позиционной стратегии по наводяшему пакету программ

Заключение

Список литературы

Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Об одном методе решения задач гарантирующего управления с неполной информацией для линейных динамических систем»

Введение

Проблема построения оптимальных стратегий управления с обратной связью в условиях неопределенности возникла во второй половине прошлого века в контексте инженерных задач, прежде всего, задач об автоматическом регулировании техническими системами. Для таких задач характерны два фактора неопределенности - действие на управляемую систему неконтролируемых динамических возмущений и неполнота информации о состояниях системы. В обеих ситуациях (и в комбинированных ситуациях) решения требуют применения принципа управления с обратной связью, позволяющего использовать всю доступную текущую информацию о системе для выработки решений о ее управлении в реальном времени.

Приняты два основных типа описания системных неопределенностей -вероятностный, предполагающий наличие той или иной статистической информации о факторах неопределенности, и детерминированный, предполагающий отсутствие такой информации. В последнем случае факторы неопределенности обычно подчиняют априорным детерминированным ограничениям типа включений.

Настоящая диссертация следует в русле исследований задач управления при детерминированных ограничениях на факторы неопределенности. В рамках этого направления изучение задач управления при неконтролируемых динамических входах привело к созданию во второй половине прошлого века теории антагонистических дифференциальных игр. Большой вклад в ее становление и развитие внесла уральская школа по теории управления, возглавлявшаяся с конца 1960-х до начала 2000-х Н. Н. Красовским. Созданная этой школой теория позиционных дифференциальных игр [1-6] разрешает фундаментальные вопросы о существовании равновесий в классах стратегий управления с обратной связью (позиционных стратегий управления), о структуре оптимальных стратегий, предлагает серию оригинальных методов их построения. Теория имеет последователей за рубежом [7; 8]

Важную роль в развитии теории линейных дифференциальных игр сыграли Л. С. Понтрягина [9-11], посвященные решению задач преследования, и

их развитие и обобщение в трудах Е. Ф. Мищенко [12], М. С. Никольского [13], П. Б. Гусятникова [14], Л .А. Петросяна [15].

Теория позиционных дифференциальных игр позволяет рассматривать задачу управления, стоящую перед каждым из двух игроков-антагонистов, как задачу оптимального гарантирующего управления, в которой воздействия игрока-противника (динамические возмущения) могут формироваться про оль-ным, не известным управляющему игроку механизмом в пределах априорно заданных детерминированных ограничений. Искомая позиционная стратегия управляющего игрока при этом гарантирует наилучшее (либо требуемое) качество движению системы при наихудшей реализации динамического возмущения. В данном контексте теорию позиционных дифференциальных игр называют также теорией гарантирующего (либо гарантированного) управления.

Теория гарантирующего управления, концентрируясь на задачах управления в условиях неопределенных динамических помех, традиционно предполагает, что управляющие обратные связи используют полную информацию о текущих состояниях системы. В рамках теории рассматривались также подходы к задачам гарантирующего управления при наличии как неконтролируемых динамических возмущений, так и неполной информации о текущих состояниях [16-19]. Эти исследования позволили дать адекватную формализацию таких задач, сформулировать двойственные задачи, разрешимость которых выступает альтернативой разрешимости исходных задач, и указать общую структуру искомых позиционных стратегий управления.

С этими исследованиями смыкается теория оценивания управляемых систем, нацеленная на синтез максимальной текущей информации о состояниях системы, используемой для выработки управляющих воздействий. Такая информация обычно представляется в виде так называемых информационных множеств, объединяющих все состояния системы, не противоречащие текущей истории наблюдений. Для описания информационных множеств привлекаются эволюционные уравнения в бесконечномерных пространствах, аналоги уравнений Гамильтона-Якоби, конструируются аппроксимации множествами заданной структуры [20-24].

Другой подход к восстановлению не доступной прямому наблюдению информации о системе в процессе ее движения предложен в теории динамического обращения управляемых систем [25-30].

Теория совмещает методологию позиционного управления с принципом регуляризации из теории некорректно поставленных задач и нацелена, прежде всего, на решение задач идентификации в режиме реального времени текущих значений неконтролируемых переменных входов. Ряд разделов теории посвящен методам динамической идентификации ненаблюдаемых компонент состояний в условиях неполной информации и использованию этих методов для управления с обратной связью. Наконец, следует упомянуть методы, направленные на решение задач стабилизации и адаптивного управления при неполной информации [31; 32].

Среди общих подходов к исследованию задач гарантирующего управления центральное место занимают метод стабильных множеств [1;2], метод обобщенных решений уравнений Гамильтона-Якоби [3;33], метод программных итераций [4], метод стохастического программного синтеза [1], метод неупреждаю-щих стратегий. Последний метод, восходящий к пионерским работам по формализации дифференциальных игр 1960-70-х годов [34-36] и развитый школой Н. Н. Красовского в контексте теории позиционных дифференциальных игр [4], служит базой основного метода настоящей работы — метода программных пакетов.

В области исследований по развитию методов позиционного управления и неупреждающих стратегий для решения задач гарантированного управления системами с неопределенностями активно работает группа западных математиков, лидирующую роль в которой играет французский специалист по теории управления М. Кюнкампуа (М. Quincampoix) [37-41]. Работы этой группы, связанные с методом неупреждающих стратегий, выполняются в традиционной для этого метода парадигме: исследуются варианты его применения при неопределенностях, вызываемых неконтролируемыми переменными входами. При этом сохраняется традиционное определение неупреждающих стратегий - как преобразований программ-входов в программы-управления, подчиненные условию вольтерровости (физической осуществимости, неупреждаемости). Такое определение применяется и в тех случаях, когда к неопределенности, вызываемой воздействием на систему неконтролируемых входов, присоединяется и собственно неполная информация о системе. Предполагается [38], что на управляемую систему действуют два неконтролируемых входа - наблюдаемый и ненаблюдаемый, а состояния системы наблюдениям не доступны. Следует

отметить, что такая постановка не затрагивает типичную ситуацию, когда состояния системы наблюдаются частично. Эту же особенность имеет и постановка, где принимается, что неполнота информации заключается в статистическом характере сведений о начальном состоянии [40]. В области исследований по тематике управления распределенными системами следует выделить работы И. Ласецкой (I. Lasiecka) и Р. Триггиани (R. Triggiani) [42], Ф. Трольца (F. Troltzsch) [43] и В. Барбу (V. Barbu) [44]; эти работы связаны с развитием метода динамического программирования, выявлением достаточных условий оптимальности высокого порядка и усовершенствованием техники уравнений Риккати для задач квадратичной оптимизации.

Центральным инструментом, используемым в диссертационной работе, является метод программных пакетов, предложенный Ю. С. Осиповым и А. В. Кряжимским [45; 46]. Данный метод, являющийся новым и оригинальным, представляет собой модификацию метода неупреждающих стратегий из теории позиционных дифференциальных игр, адекватную задачам гарантирующего управления при неполной информации. Традиционные неупреждаю-щие стратегии (известные также, как квазистратегии) отражают основное качественное свойство программных реализаций управлений с обратной связью как реакций на программные реализации динамических возмущений — свойство вольтерровости (неупреждаемости). Его содержание состоит в том, что истории программных реакций управления на разные программные реализации возмущений совпадают между собой, если это имеет место для последних (для реализаций возмущений). Классическая постановка задачи гарантирующего управления с неполной информацией не предполагает воздействия на систему динамических возмущений: неопределенность вызывается лишь дефицитом информации о состояниях системы. При этом программные реализации обратных связей реагируют на реализации начальных состояний и истории управления. Поскольку в этой ситуации единственным неопределенным элементом выступает неизвестное начальное состояние, естественной модификацией неупреждающей стратегии становится отображение «начальное состояние — программная реализация управления» или, что то же, семейство программ управления, параметризованное начальными состояниями (стесненными априори заданным множеством допустимых начальных состояний). Выявление аналога свойства неупреждаемости такого отображения (семейства) не является

тривиальной задачей, тем не менее, такое свойство было найдено и формализовано [45; 46].

Семейства программ управления, обладающие данным свойством, стали аналогом неупреждающих стратегий из теории позиционных дифференциальных игр и получили рабочее название программных пакетов. Общая схема применения программных пакетов, реализованная в работах Ю. С. Осипова и А. В. Кряжимского, состоит в следующем. Программные пакеты трактуются как идеализированные процедуры управления, близкие к программным. Исходной задаче о гарантирующем управлении в классе обратных связей сопоставляется аналогичная задача в классе программных пакетов. Устанавливается эквивалентность этих задач. Утверждение об эквивалентности и ряд сопутствующих результатов открывают возможность решения исходной задачи путем решения значительно более простой задачи, поставленной в классе программных пакетов.

В диссертации развивается подход, обозначенный в работе [47] для линейных динамических систем с линейным наблюдаемым сигналом.

Целью данной работы является построение конструктивных условий разрешимости задач гарантированного позиционного наведения в момент и к моменту времени для линейных управляемых систем в условиях неполной информации об их фазовых состояниях, конструктивных алгоритмов построения наводящих пакетов программ и разработка метода конструирования гарантирующего позиционного управления по наводящему пакету программ.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Осуществить переход к расширенной задаче программного наведения для линейных управляемых динамических систем и установить ее эквивалентность задаче пакетного наведения.

2. Получить критерий разрешимости расширенной задачи программного наведения в момент времени и к моменту времени.

3. Для задач пакетного наведения, разрешимых в момент времени и к моменту времени, получить достаточные условия существования наводящего пакета программ.

4. Разработать конструктивную процедуру построения гарантирующего позиционного управления линейной динамической системы по наводя-

щему пакету программ при наблюдении линейного сигнала о состояниях этой системы.

Основные положения, выносимые на защиту:

1. Сформулирована и доказана теорема об эквивалентной разрешимости задачи пакетного наведения и расширенной задачи программного наведения для линейных динамических систем с наблюдаемым линейным сигналом.

2. Сформулирован и доказан критерий разрешимости расширенной задачи программного наведения для линейных управляемых динамических систем в момент времени и к моменту времени.

3. Предложены и обоснованы конструктивные условия для определения элементов наводящего пакета программ в задачах пакетного наведения в момент времени и к моменту времени.

4. Построена процедура построения ^-наводящей позиционной стратегии по наводящему пакету программ.

Научная новизна:

1. Задача о гарантирующем позиционном управлении при неполной информации в заданный момент времени была впервые сведена — через посредство задачи о гарантирующем управлении в классе программных пакетов — к задаче программного управления расширенной управляемой системой (случай линейных систем с линейным наблюдаемым сигналом и конечным множеством допустимых начальных состояний). На базе решений последней задачи были сконструированы искомые гарантирующие обратные связи.

2. Выполнено исследование задачи о гарантирующем позиционном управлении при неполной информации к заданному моменту времени, в результате которого получен критерий ее разрешимости и условие минимума для определения элементов наводящего пакета программ с семейством допустимых моментов наведения.

Основные методы исследования. В работе используются методы теории линейных дифференциальных уравнений, теории гарантирующего управления, элементы функционального и выпуклого анализа.

Теоретическая и практическая значимость Диссертация носит теоретический характер; представленные в работе алгоритмы могут быть использованы для численных экспериментов.

Апробация работы. Результаты настоящей работы были представлены в виде научных докладов на следующих конференциях и семинарах:

— международная научная конференция «Ломоносов» (Москва, 2013, 2014, 2015 гг.);

— научная конференция «Тихоновские чтения» (Москва, 2014, 2015 гг.);

— научная конференция «Ломоносовские чтения» (Москва, 2014 г.);

— 13th Viennese Workshop on Optimal Control and Dynamic Games (Вена, Австрия, 2015 г.);

— научно-исследовательский семинар кафедры оптимального управления факультета ВМК МГУ имени М. В. Ломоносова под руководством академиков РАН А. В. Кряжимского и Ю. С. Осипова, профессора Н. Л. Григоренко.

Публикации. Основные результаты по теме диссертации изложены в 8 печатных изданиях, 3 из которых изданы в журналах, рекомендованных ВАК [48-50], 5 — в тезисах докладов [51-55].

Все результаты, вошедшие в диссертацию и в перечень опубликованных работ, получены автором самостоятельно. В совместных работах научному руководителю А. В. Кряжимскому принадлежат постановка задачи.

Объем и структура работы. Диссертация состоит из введения, трёх глав и заключения. Полный объём диссертации составляет 103 страницы с 8 рисунками и 3 таблицами. Список литературы содержит 91 наименование.

В первой главе рассматривается задача гарантированного позиционного наведения в заданный момент времени. Вводятся основные понятия метода пакетов программ для линейных систем — однородные сигналы, параметризованные допустимыми начальными состояниями, моменты их расслоения и кластеры множества допустимых начальных состояний, соответствующие моментам расслоения однородных сигналов. Вводится расширенная задача программного наведения и доказывается её эквивалентность задаче пакетного наведения, про которую, в свою очередь, известно, что она эквивалентна задаче гарантированного позиционного наведения. Сформулирован и с помощью теоремы об отделимости выпуклых множеств доказан критерий разрешимости расши-

ренной задачи программного наведения. Предлагается конструктивный метод построения наводящего пакета программ, который по содержанию основан на аналоге условия максимума из классической теории оптимального управления.

Во второй главе диссертации рассматривается задача гарантированного позиционного наведения к заданному моменту времени. Каждому допустимому начальному состоянию, вообще говоря, соответствует некоторый момент наведения из заданного конечного множества. Доказано, что данная задача эквивалентна задаче пакетного наведения с семейством допустимых моментов наведения, а последняя эквивалентна расширенной задаче программного наведения с семейством допустимых моментов наведения. С помощью конструкций, аналогичных введённым в первой главе, сформулирован и доказан критерий разрешимости и построена конструктивная процедура построения наводящего пакета программ.

В третьей главе для задачи гарантированного позиционного наведения в заданный момент времени предложен формальный алгоритм её решения. Проверка критерия разрешимости сводится к конечномерной задаче оптимизации вогнутой функции на выпуклом множестве, а для поиска наводящего пакета программ используются численные методы, ранее применявшиеся для решения классических задач терминального управления. Отдельно рассматривается случай, когда для некоторых кластеров множества допустимых начальных состояний условие максимума не даёт достаточной информации для построения соответствующего элемента наводящего пакета программ. Для обработки этого случая применяется модифицированный алгоритм построения особых управлений в линейных системах. Далее приводится процедура построения -наводящей стратегии по наводящему пакету программ и доказывается соответствующая теорема сходимости.

Благодарности. Автор глубоко благодарен своему научному руководителю А. В. Кряжимскому за постановку задач и внимание к работе. Автор благодарит Ю. С. Осипова за поддержку в работе и полезные советы.

Глава 1. Задача гарантированного позиционного наведения с

__и и

неполной информацией в заданный момент времени 1.1 Постановка задачи

Рассмотрим линейную управляемую динамическую систему, описываемую обыкновенным дифференциальным уравнением

= А(р)х(Ь) + В (г)и(г) + ф); (1.1)

здесь £ — время, меняющееся на ограниченном фиксированном отрезке [£о,$] ненулевой длины, х(Ъ) € — состояние системы в момент времени £, и(Ъ) € — значение управления в этот момент; А(-), В(•), с(-) — непрерывные функции, определенные на {¿0,$] и принимающие значения в пространстве (п х п)-матриц, пространстве (п х т)-матриц и пространстве соответственно. Пусть Р С — выпуклый компакт, описывающий мгновенный ресурс управления.

Под программным управлением (программой) будем понимать всякую измеримую ограниченную по Лебегу функцию и(^) : [¿0,$] ^ Р. Множество всех программ обозначим Ы. Для всякой точки х0 € и всякой программы и(^) € Ы решение (по Каратеодори) дифференциального уравнения (1.1), определенное на отрезке [Ь^] и удовлетворяющее начальному условию х(Ь0) = х0, назовем движением системы из начального состояния х0 под действием программы и(^) и будем обозначать его х(^х0,и(;)).

Пусть задано конечное множество Х0 С Будем считать, что управляющей стороне априори известно, что начальное состояние системы содержится в Х0, но само это начальное состояние не известно. Будем называть Х0 множеством допустимых начальных состояний. Пусть также задано выпуклое замкнутое целевое множество М С

Пусть, наконец, задана кусочно-непрерывная слева функция Q(•) на ^0,$], принимающая значения в пространстве матриц размерности д х п (матрица-функция наблюдения).

Перед управляющей стороной стоит задача гарантированного позиционного наведения, состоящая в формировании такой программы управления, ко-

торая гарантирует попадание состояния х('в) системы в конечный момент $ в заранее заданную сколь угодно малую окрестность целевого множества М. В процессе движения управляющая сторона формирует искомую программу по-зиционно (по принципу обратной связи), получая в каждый текущий момент времени £ сигнал у(¿) = (^(Ъ)х(Ъ) о состоянии х(Ъ) системы в этот момент.

Формально решение задачи ищется в классе позиционных стратегий управления с памятью.

Воспроизведем определение позиционной стратегии с памятью из работы [46]. Введем множества, на которых определим области определения обратных связей. Для каждого т € (10,Щ через Ыт обозначим множество сужений на [¿о,т) всех программ и() € Ы; элементы этого множества будем называть программами до момента т. За формально примем произвольное одноэлементное подмножество множества Р. Для каждого т € (10,Щ через Ут, обозначим множество всех функций у() : [Ъ0,т] ^ К9; элементы этого множества будем называть наблюдениями до момента т.

Позиционную стратегию (управляющей стороны) определим формально, как произвольную конечную последовательность

5 =(аг,и^1, (1.2)

где Ь0 = а0 < ... < аг+\ = $ и, при каждом г = 0,... ,г + 1, ^ — отображение декартова произведения Уа. хЫа1 в множество Р; каждый момент = 0,... ,г, назовем моментом корректировки управления, а отображение ^ — обратной связью в момент &{, соответствующими позиционной стратегии Б.

Управляемым процессом с начальным состоянием х0 € Х0 под действием позиционной стратегии Б (1.2) будем называть тройку (и(),х(),у(•)) такую, что и() € и, х() = х(^\х0,и(^)), у(Ъ) = Q(t)x(t) (Ъ € [Ь,$]) и для каждого г = 0,... ,г выполняется

и(г) = и(а1) = иг(уа1 (),иа.(г € [aг,aг+l)),

где иа. (•) - сужение и(^) на [¿о,&г) и уа.(•) - сужение у(^) на [Ьо^к функцию и(•) будем называть программой, функцию х(^) - движением и функцию у( ) - наблюдением в управляемом процессе (и( ),х( ),у(•)).

Определенный таким образом управляемый процесс существует и единственен [46].

Таким образом, задача гарантированного позиционного наведения состоит в том, чтобы по произвольному, наперед заданному £ > 0, выбрать такую позиционную стратегию управления с памятью, что, каково бы ни было начальное состояние х0 системы из множества Х0 допустимых начальных состояний, движение х(^) в управляемом процессе под действием выбранной позиционной стратегии, исходящее в момент 10 из состояния х0, в момент $ приходит в состояние х($), принадлежащее ^-окрестности целевого множества М.

Точная постановка задачи (допускающая также наличие малых помех в канале наблюдения) дана в работах [45; 46].

1.2 Метод пакетов программ

Рассмотрим однородную систему

±(г) = А(г)х(г), (1.3)

соответствующую (1.1). По формуле Коши ее решение имеет вид:

х() = Г (Ъ ,и)х0,

где Г(Ь,в) — матрица Коши (матрицант [56]), удовлетворяющая матричному уравнению

й

-Г(1,8) = -Г(1,8)А(8), г(1,1) = Е (1,8 € [10,$]).

Для каждого х0 € Х0 введем обозначение

дХ0(I) = Я(1)Г(I,Ц)Х0 (I € [ЬД); (1.4)

функцию дХ0(•) будем называть однородным сигналом, соответствующим допустимому начальному состоянию х0 € Х0. Однородный сигнал, соответствую-

щий какому-либо допустимому (не специфицированному) начальному состоянию, будем называть просто однородным сигналом.

Замечание 1.1. Из предположений о непрерывности функции А(^) и кусочной непрерывности слева функции Q(•) на отрезке [Ь^] очевидно следует кусочная непрерывность слева всякого однородного сигнала д(^) на отрезке [^А].

Множество всех допустимых начальных состояний х0 € Х0, соответствующих данному однородному сигналу д(•) до момента времени т € [Ь^], обозначим Х0(т|#(-)). Таким образом,

Xо(т\д() = {хо € Хо : д] = 9х0)\[¿о,т]}

здесь и далее д(•)\[^0;Т], где т € [Ь^] — сужение однородного сигнала д(^) на отрезок [10,т].

Замечание 1.2. Для каждого однородного сигнала д(^) множество Х0(т|#(-)) монотонно сужается при увеличении т: Х0(т"\д(•)) С Х0(т'\д(•)) для всех т',т" € таких, что т' < т".

Семейство программ (иХо(•))Х0€х0 будем называть пакетом программ, если оно удовлетворяет следующему условию неупреждаемости: для любых однородного сигнала д() момента т € и допустимых начальных состояний х'{),х'0) € Х0(т!#(•)) при почти всех £ € [Ъ0,т] выполняется равенство их0(О = их> ВД.

Замечание 1.3. В работе [47] (см. следствие 2.1) приведенное выше определение выступает в качестве критерия того, что семейство программ, параметризованное допустимыми начальными состояниями, является идеализированным пакетом программ в смысле определения из [46]. В данной дисеер-тации будем использовать термин «пакеты программ» вместо «идеализированные пакеты программ».

Будем называть пакет программ (иХ0(•))Х0€х0 наводящим, если для всякого допустимого начального состояния х0 € Х0 движение из х0, соответствующее программе иХ0(•), в момент $ принимает значение в целевом множестве М: х($\х0,иХ0(•)) € М. В этом случае будем говорить также о наводимости пакета программ (иХ0(•))Х0€х0. Если существует наводящий пакет программ, то говорим, что задача пакетного наведения разрешима.

Теорема 1.1. [47, теорема 2.1] Задача гарантированного позиционного наведения разрешима тогда и только тогда, когда разрешима задача пакетного наведения.

Замечание 1.4. В работе [47] задача пакетного наведения определена как «точная идеализированная задача пакетного наведения».

В связи с результатом, установленным в теореме 1.1, в данной дисеертации сосредоточимся на выводе условий разрешимости задачи пакетного наведения.

Обозначим множество всех однородных сигналов С. Имеем С = {дХ0(•) : х0 € Х0}. Для произвольного однородного сигнала д(^) введем множество

С0(д() = { д(•) € С : Пт (~д^0 + С) - д(и + 0) = о}

исходно совместимых с ним однородных сигналов и момент времени

Т1(0(-)) =тах^ т€ тах т^ ^ - д(^ .

назовем первым моментом расслоения однородного сигнала д(^). Здесь и далее | • | — норма в конечномерном евклидовом пространстве.

Замечание 1.5. Ясно, что если Т\_(д(;)) < то для произвольного достаточно малого ( > 0 найдется однородный сигнал д(•) € С0(д(•)) такой, что д(Ь) = д(Ь) при некотором Ь € (т1(д(•)),т1(д(•)) + £].

Если т1(д(•)) < введем множество СМ) = {д(•) € С0Ш) : Пт (д(п(д(•)) + () - д(п(д(•)) + ()) = о|

всех однородных сигналов из С0(д(•)), совпадающих с д( ) в правосторонней окрестности момента т1(д( )) (заметим, что вложение С1(д( )) С С0(д( )) с необходимостью строгое), и момент времени

Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Список литературы диссертационного исследования кандидат наук Стрелковский Никита Витальевич, 2016 год

Список литературы

1. Красовский Н. Н. Управление динамической системой. — Москва: Наука, 1985. — 520 с.

2. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные игры.

— Москва: Наука, 1974. — 456 с.

3. Субботин А. И. Минимаксные неравенства и уравнения Гамильтона-Якоби.

— Москва: Наука, 1991. — 216 с.

4. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах управления. — Москва: Наука, 1981. — 288 с.

5. Krasovskii N. N., Subbotin A. I. Game-theoretical control problems. — New-York: Springer-Verlag, 1988. — 517 pp.

6. Krasovskii A. N., Krasovskii N. N. Control under lack of information. — Basel: Birkhäuser, 1995. — 322 pp.

7. Feedback stabilization and Lyapunov functions / F. H. Clarke, Yu.S. Ledyaev, L. Rifford, R. J. Stern // SIAM Journal of Control and Optimization. — 2000.

— Vol. 39, no. 1. — Pp. 25-48.

8. Clarke F. H., Ledyaev Yu. S., Subbotin A. I. The synthesis of universal feedback pursuit strategies in differential games // SIAM Journal of Control and Optimization. — 1997. — Vol. 35, no. 2. — Pp. 552-561.

9. Понтрягин Л. С. К теории дифференциальных игр // Успехи мат. наук.

— 1966. — Т. 21, № 4 (130). — С. 219-274.

10. Понтрягин Л. С. О некоторых дифференциальных играх / // Доклады АН СССР. — 1964. — Т. 156, № 4. — С. 738-741.

11. Понтрягин Л. С. Линейные дифференциальные игры преследования // Мат. сборник. — 1980. — Т. 112, № 3. — С. 307-330.

12. Понтрягин Л. С., Мищенко Е. Ф. Задача об уклонении от встречи в линейных дифференциальных играх // Дифференциальные уравнения. — 1971.

— Т. 7, № 3. — С. 436-445.

13. Никольский М. С. О квазилинейной задаче убегания // Доклады АН СССР.

— 1975. — Т. 221, № 3. — С. 539-542.

14. Гусятников П. Б. Об уклонении от встречи в линейной дифференциальной игре // Прикладная математика и механика. — 1974. — Т. 38, № 3. — С. 417-421.

15. Петросян Л. А. Дифференциальные игры преследования. — Ленинград: Изд-во Ленингр. ун-та, 1974. — 224 с.

16. Красовский Н. Н., Осипов Ю. С. Задача управления с неполной информацией // Механика твердого тела. — 1973. — № 4. — С. 5-14.

17. Кряжимский А. В. Дифференциальная игра наведения в условиях неполной информации // Украинский математический журнал. — 1975. — Т. 75, № 4. — С. 521-526.

18. Кряжимский А. В. Альтернатива в линейной игре наведения-уклонения с неполной информацией // Доклады АН СССР. — 1976. — Т. 230, № 4. — С. 773-776.

19. Krasovskii N. N. Control under incomplete information and differential games // Proceedings of the International Congress of Mathematicians. — Helsinki: 1978.

— Pp. 152-163.

20. Куржанский А. Б. Управление и наблюдение в условиях неопределенности.

— Москва: Наука, 1977. — 392 с.

21. Куржанский А. Б. О синтезе управлений по результатам наблюдений // Прикладная математика и механика. — 2004. — № 4. — С. 547-563.

22. Куржанский А.Б., Точилин П.А. К задаче синтеза управлений при неопределенности по данным финитных наблюдателей // Дифференциальные уравнения. — 2011. — Т. 47, № 11. — С. 1599-1607.

23. Kurzhanski A. B., Valyi I. Ellipsoidal Calculus for Estimation and Control. — Basel: Birkhauser, 1995. — 321 pp.

24. Черноусько Ф. Л. Оценивание фазового состояния динамических систем : метод эллипсоидов. — Москва: Наука, 1988. — 319 с.

25. Осипов Ю. С., Кряжимский А. В. О моделировании управления в динамической системе // Известия АН СССР. Серия техн. киберн. — 1983. — Т. 21, № 2. — С. 38-47.

26. Осипов Ю. С., Васильев Ф. П., Потапов М. М. Основы метода динамической регуляризации. — Москва: Изд. МГУ, 1999. — 237 с.

27. Осипов Ю. С., Кряжимский А. В., Максимов В. И. Методы динамического восстановления входов управляемых систем. — Екатеринбург: Изд. УрО РАН, 2011. — 291 с.

28. Maksimov V. I., Pandolfi L. Dynamical reconstruction of unknown inputs in nonlinear differential equations // Applied Mathematical Letters. — 2001. — Vol. 14. — Pp. 725-730.

29. Osipov Yu. S., Kryazhimskii A. V. Inverse Problems for Ordinary Differential Equations: Dynamical Solutions. — London: Gordon and Breach Publishers, 1995. — 625 pp.

30. Keesman K. J., Maksimov V. I. On feedback identification of unknown characteristics: a bioreactor case study // International Journal of Control. — 2007. — Vol. 81, no. 1. — Pp. 134-145.

31. On the robust stabilization of nonlinear uncertain systems with incomplete state availability / G. Bartolini, A. Levant, A. Pisano, E. Usai // Journal of Dynamical Systems, Measurement and Control. — 2000. — Vol. 122. — Pp. 738-745.

32. Kanellakopulos I., Kokotovic P. V., Morse A. S. Adaptive non-linear control with incomplete state information // International Journal of Adaptive Control and Signal Processing. — 1992. — Vol. 6. — Pp. 367-394.

33. Lions P. L. Optimal control and viscosity solutions // Lecture Notes Math. — 1985. — Vol. 1119. — Pp. 94-112.

34. Elliott R. J., Kalton N. Values in differential games // Bulletin of the American Mathematical Society. — 1972. — Vol. 78, no. 3. — Pp. 291-486.

35. Roxin E. Axiomatic approach in differential games // Journal of Optimization Theory and Applications. — 1969. — Vol. 3, no. 3. — Pp. 156-163.

36. Rull-Nardzevski C. A theory of purcuit and evasion // Advances in Game Theory. — 1964. — Pp. 113-126.

37. Clark J. M. C., Vinter R. B. On the interpretation of non-anticipative control strategies in differential games and applications to flow control // Lecture Notes in Control and Information Science. — 2004. — Vol. 301. — Pp. 29-47.

38. Quincampoix M, Veliov V. Optimal control of uncertain systems with incomplete information for the disturbances // SIAM Journal of Control and Optimization. — 2005. — Vol. 43, no. 4. — Pp. 1373-1399.

39. Gao Y, Lygeros J., Quincampoix M. The reachability problem for uncertain hybrid systems revisited: a viability theory perspective // Hybrid Systems: Computation and Control. 9th International Workshop, HSCC 2006, Santa Barbara, CA, USA, March 29-31, 2006. Proceedings. — Springer-Verlag, 2006. — Pp. 242256.

40. Cardaliaguet P., Quincampoix M. Detemninistic dufferential games under probability knowledge of initial condition // International Game Theory Review. — 2008. — Vol. 10. — Pp. 1-16.

41. Buckdahn R., Quincampoix M. Value function of differential games without Isaacs conditions. An approach with non-anticipative strategies // International Journal of Game Theory. — 2013. — Vol. 42. — Pp. 989-1020.

42. Lasiecka I., Triggiani R. Control theory for partial differential equations: continuous and approximation theories. Abstract parabolic systems. — Cambridge University Press, 2000. — 1067 pp.

43. Troltzsch F. Optimal control of partial differential equations. Theory, methods and applications. — Providence, Rhode island: American mathematical society, 2010. — 399 pp.

44. Barbu V. Analysis and control of infinite dimensional systems. — Boston: Academic press, 1993. — 476 pp.

45. Осипов Ю. С. Пакеты программ: подход к решению задач позиционного управления с неполной информацией // Успехи мат. наук. — 2006. — Т. 61, № 4 (370). — С. 25-76.

46. Осипов Ю. С., Кряжимский А. В. Идеализированные пакеты программ и задачи позиционного управления с неполной информацией // Труды Института математики и механики УрО РАН. — 2009. — Т. 15, № 3. — С. 139-157.

47. Осипов Ю. С., Кряжимский А. В. О разрешимости задач гарантирующего управления для частично наблюдаемых линейных динамических систем // Математическая теория управления и дифференциальные уравнения, Сборник статей. К 90-летию со дня рождения академика Евгения Фроловича Мищенко. — Москва: МАИК, 2012. — Т. 277. — С. 152-167.

48. Кряжимский А. В., Стрелковский Н. В. Задача гарантированного позиционного наведения линейной управляемой системы к заданному моменту времени при неполной информации. Программный критерий разрешимости // Труды Института математики и механики УрО РАН. — 2014. — Т. 20, № 4. — С. 168-177.

49. Кряжимский А. В., Стрелковский Н. В. Программный критерий разрешимости задачи позиционного наведения с неполной информацией. Линейные управляемые системы // Труды Института математики и механики УрО РАН. — 2014. — Т. 20, № 3. — С. 132-147.

50. Стрелковский Н. В. Построение стратегии гарантированного позиционного наведения для линейной управляемой системы при неполной информации // Вестник Московского университета. Серия 15. Вычислительная математика и кибернетика. — 2015. — № 3. — С. 31-38.

51. Стрелковский Н. В. К одному методу решения задач гарантирующего управления с неполной информацией для линейных динамических систем // Ломоносов-2013: Материалы XX Международной научной конференции студентов, аспирантов и молодых ученых: секция вычислительная

математика и кибернетика»; 9-12 апреля; Москва, МГУ имени М.В. Ломоносова, факультет ВМК: Сборник тезисов. — Москва: Издательский отдел факультета ВМК МГУ, 2013. — С. 147-149.

52. Стрелковский Н. В. Об условиях разрешимости задачи гарантирующего управления в условиях неполной информации для линейных динамических систем с конечным множеством начальных состояний // Ломоносов-2014: Материалы XXI Международной научной конференции студентов, аспирантов и молодых ученых: секция вычислительная математика и кибернетика»; 7-11 апреля; Москва, МГУ имени М.В. Ломоносова, факультет ВМК: Сборник тезисов. — Москва: Издательский отдел факультета ВМК МГУ,

2014. — С. 71-73.

53. Стрелковский Н. В. О разрешимости задачи гарантированного позиционного наведения управляемой системы к моменту времени в условиях неполной информации // Научная конференция "Тихоновские чтения". Тезисы докладов. — Москва: 2014. — С. 41-42.

54. Стрелковский Н. В. Построение наводящего пакета программ и соответствующей ему позиционной стратегии в задаче гарантированного позиционного наведения для линейной управляемой системы при неполной информации // Ломоносов-2015: Материалы XXII Международной научной конференции студентов, аспирантов и молодых ученых: секция вычислительная математика и кибернетика»; 13-17 апреля; Москва, МГУ имени М.В. Ломоносова, факультет ВМК: Сборник тезисов. — Москва: Издательский отдел факультета ВМК МГУ, 2015. — С. 141-142.

55. Strelkovskii N. V. Program packages method for solving closed-loop guidance problem with incomplete information for linear systems // 13th Viennese Workshop on Optimal Control and Dynamic Games. Scientific program. — Vienna:

2015. — P. 104.

56. Гантмахер Ф.Р. Теория матриц. — 2-е изд. — Москва: Нау^, 1966. — 576 с.

57. Красовский Н. Н. Игровые задачи о встрече движений. — Москва: Наука, 1970. — 420 с.

58. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. — Москва: Наука, 1977. — 624 с.

59. Габасов Р. Ф, Кириллова Ф. М. Оптимизация линейных систем. — Минск: Изд. БГУ им. В. И. Ленина, 1973. — 246 с.

60. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи. — Москва: Наука, 1980. — 320 с.

61. Rockafellar R. T. Convex Analysis. — Princeton University Press, 1970. — 472 pp.

62. Киселёв Ю.Н., Аввакумов С.Н., Орлов М.В. Оптимальное управление. Линейная теория и приложения. — Москва: МАКС Пресс, 2007. — 272 с.

63. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления. — Москва: Физматлит, 2001. — Т. 1. — 616 с.

64. Васильев Н. C. Активный вычислительный метод поиска глобального минимума вогнутой функции // Журнал вычислительной матемематики и математической физики. — 1984. — Т. 24, № 1. — С. 152-156.

65. Васильев Ф. П. Численные методы решения экстремальных задач. — 2-е изд. — Москва: Наука, 1988. — 552 с.

66. Нестеров Ю. Е. Методы выпуклой минимизации. — Москва: Изд. МЦНМО, 2010. — 263 с.

67. Габасов Р. Ф, Кириллова Ф. М. Построение последовательных приближений для некоторых задач оптимального управления // Автоматика и телемеханика. — 1966. — № 2. — С. 5-17.

68. Гиндес В. Б. Один метод последовательных приближений для решения линейных задач оптимального управления // Журнал вычислительной мате-мематики и математической физики. — 1970. — Т. 10, № 1. — С. 216-223.

69. Гиндес В. Б. Об особом управлении в оптимальных системах // Известия вузов. Математика. — 1967. — № 7. — С. 34-42.

70. Бронштейн Е. М. Аппроксимация выпуклых множеств многогранниками // Современная математика. Фундаментальные направления. Геометрия. — 2007. — № 22. — С. 5-37.

71. Gruber P. M. Approximation of convex bodies. — Basel: Birkhauser, 1983. — Pp. 131-162.

72. Кряжимский А. В., Осипов Ю. С. Об одном алгоритмическом критерии разрешимости игровых задач для линейных управляемых систем // Труды Института математики и механики УрО РАН. — 2000. — Т. 6, № 1. — С. 131-140.

73. Дарьин А.Н., Куржанский А.Б. Метод вычисления инвариантных множеств линейных систем большой размерности при неопределённых возмущениях // Доклады РАН. — 2012. — Т. 446, № 6. — С. 607-611.

74. Кряжимский А. В., Максимов В. И., Осипов Ю. С. О позиционном моделировании в динамических системах // Прикладная математика и механика. — 1983. — Т. 47, № 6. — С. 709-714.

75. Fagnani F., Maksimov V., Pandolfi L. A recursive deconvolution approach to disturbance reduction // IEEE Transactions on Automatic Control. — 2004. — Vol. 49, no. 6. — Pp. 907-921.

76. Kryazhimskii A. V., Osipov Yu. S. On positional calculation of ^-normal controls in dynamical system // Problems of Control and Information Theory. — 1984. — Vol. 13, no. 6. — Pp. 425-436.

77. Subbotin A. I. Generalized solutions of first-order PDEs. — Basel: Birkhauser, 1995. — 314 pp.

78. Айзекс Р. Дифференциальные игры. — Москва: Мир, 1967. — 480 с.

79. Батухтин В. Д. Об одной игровой задаче наведения с неполной информацией // Прикладная математика и механика. — 1982. — Т. 44, № 4. — С. 579-591.

80. Габасов Р. Ф, Гиндес В. Б. К оптимальным процессам в линейных системах с двумя ограничениями на управляющие воздействия // Автоматика и телемеханика. — 1965. — Т. 26, № 6. — С. 966-976.

81. Габасов Р. Ф., Кириллова Ф. М. Качественная теория оптимальных процессов. — Москва: Наука, 1971. — 508 с.

82. Гиндес В. Б. К задаче минимизации выпуклого на множестве конечных состояний линейной системы управления // Журнал вычислительной мате-мематики и математической физики. — 1966. — Т. 6, № 6. — С. 962-970.

83. Григоренко Н. Л. Задача управления с доминирующей неопределенностью // Труды Института математики и механики УрО РАН. — 2013.

— Т. 19, № 4. — С. 64-72.

84. Григоренко Н. Л. Игровая задача управления тремя динамическими системами с заданными моментами окончания // Труды Математического института им. В. А. Стеклова. — 2012. — Т. 277. — С. 81-88.

85. Крекнин А. А., Субботин А. И. Игровая задача преследования в условиях неполной фазовой информации о преследуемой системе // Дифференциальные системы управления, УНЦ АН СССР. — 1979. — С. 21-33.

86. Кряжимский А. В., Филиппов С. Д. Об игровой задаче наведения для двух точек на плоскости в условиях неполной информации // Задачи управления с неполной информацией, Труды ИММ УНЦ АН СССР. — 1976. — Т. 19.

— С. 62-77.

87. Максимов В. И. Задачи динамического восстановления входов бесконечномерных систем. — Екатеринбург: Изд. УрО РАН, 2000. — 304 с.

88. Пак В. Е. Задача наведения с неполной информацией // Известия АН СССР. Серия техн. киберн. — 1976. — № 4. — С. 29-36.

89. Понтрягин Л. С. Линейная дифференциальная игра убегания // Труды МИАН СССР. — 1971. — Т. 112. — С. 30-63.

90. Математическая теория оптимальных процессов / Л. С. Понтрягин, В. А. Болтянский, Р. В. Гамкрелизде, Е. Ф. Мищенко. — 4-е изд. — Москва: Наука, 1983. — 393 с.

91. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач. — 2-е изд. — Москва: Наука, 1979. — 285 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.