Оптимальное управление при функциональных ограничениях на помеху тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат наук Серков, Дмитрий Александрович

  • Серков, Дмитрий Александрович
  • кандидат науккандидат наук
  • 2014, Екатеринбург
  • Специальность ВАК РФ01.01.09
  • Количество страниц 207
Серков, Дмитрий Александрович. Оптимальное управление при функциональных ограничениях на помеху: дис. кандидат наук: 01.01.09 - Дискретная математика и математическая кибернетика. Екатеринбург. 2014. 207 с.

Оглавление диссертации кандидат наук Серков, Дмитрий Александрович

Оглавление

Введение

Историко-библиографическая справка

Мотивация и предмет диссертации

Цель работы

Методы исследования, научная новизна, теоретическая и практическая ценность

Апробация работы и публикации

Структура работы

Глава 1. Оптимальный гарантированный результат при компактных множествах помех

1. Динамика системы

2. Стратегии и движения

3. Пример: изменение пучка конструктивных движений при изменении класса помех

4. Показатель качества и оценка стратегий

5. Непосредственные соотношения для гарантии при различных классах помех

6. Пример: изменение оптимальной гарантии при изменении класса помех

7. Неулучшаемость стратегий с полной памятью

7.1. Доказательство теоремы 7.1

Глава 2. Оптимальное управление в случае Ьр-компактных ограничений на помеху

8. Построение оптимальной стратегии при компактных множествах помех

8.1. Стратегия UL

8.2. Доказательство теоремы 8.1

8.3. Случай конечного набора «тестовых» управлений

9. Конструктивные варианты: регулярный программный максимин

10. Пример оптимальной минимаксной стратегии при программных помехах

11.0 разрешимости в классе позиционных стратегий

Глава 3. Оптимальный риск в задаче управления при функциональных ограничениях на помеху

12. Критерий Ниханса-Сэвиджа в стационарном случае

13. Формализация задачи управления на основе критерия Ниханса-Сэвиджа

14. Непосредственные соотношения для риска при различных классах помех

15. Пример оптимальной по риску стратегии

16. Сравнение оптимальной гарантии и минимального риска

17. Достаточное условие неулучшаемости по риску стратегий с полной памятью

17.1. Доказательство теоремы 17.1

Глава 4. Управление оптимальное по риску и отдельные свойства

функции минимального риска

18. Программные итерации функции сожаления

19. Построение оптимальных по риску стратегий

19.1. Оптимальная по риску стратегия Usl

19.2. Доказательство теоремы 19.1

19.3. Случай конечного набора «тестовых» управлений в задаче минимизации риска

20. Случай регулярности программного максимина функционала сожаления

21. Отдельные результаты для случая терминального показателя качества

Заключение

Список обозначений

Приложения

22. Измеримые функции и множества

23. Представление предела программных движений

24. Двойные и повторные пределы

Литература

Список иллюстраций

1.1 Схема работы стратегии ие

2.1 Схема работы стратегии Оь

2.2 Задача преследования «с люфтами»

3.1 Вид функции Л(-) при а = 0.2, Ь= 1, ¿0 = 0, $ = 25

3.2 Вид обратной связи иг- в случае |ло| ^ (6 — а)($ — ¿о)

3.3 Вид обратной связи и, в случае (6 — а)— ^ ^

{b + a){д-tl})

3.4 Вид обратной связи С^ в случае ^ (Ь + — ¿о)

3.5 Движения системы, порожденные стратегией 0 из начальной позиции (¿0.20) = (0, 7) при помехах • • ■

3.6 Движения системы, порожденные стратегией С из начальной позиции ¿о) — (0, —25) при помехах г>,~ „ -,(•), _ ч(-)

Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Оптимальное управление при функциональных ограничениях на помеху»

Введение

Историко—библиографическая справка

Современная математическая теория динамических систем и оптимальных процессов охватывает широкий круг актуальных задач, включает большое число разнообразных методов управления, наблюдения, оценивания и реконструкции, имеет прочные связи с другими разделами математики и многочисленные приложения. Ее становление относится к середине ХХ-го столетия и связано с именами отечественных и зарубежных математиков Р. Беллмана, H.H. Красовского, Л.С. Понтрягина. Существенный вклад в ее развитие внесли Э.Г. Альбрехт, В.Д. Батухтин, В.Г. Болтянский, Р.Ф. Габасов, Р.В. Гамкрелидзе, П.Б. Гусятников, А.Я. Дубовицкий, С.Т. Зава-лищин, М.И. Зеликин, Ф.М. Кириллова, A.B. Кряжимский, А.Б. Куржанский,

A.A. Меликян, A.A. Милютин, Е.Ф. Мищенко, Ю.С. Осипов, H.H. Петров, Л.А. Петросян, Б.Н. Пшеничный, А.И. Субботин, В.М. Тихомиров,

B.Е. Третьяков. А.Г. Ченцов, Ф.Л. Черноусько, A.A. Чикрий, C.B. Чистяков, В.А. Якубович, J.P. Aubin, M. Bardi, E.N. Barron, T. Basar, P. Bernhard, A.E. Bryson, F.H. Clarke, M.G. Crandall, R.J. Elliot, L.C. Evans, W.H. Fleming, A. Friedman, Ho Yu-Chi, R. Isaacs, R.E. Kaiman, N.J. Kalton, G. Leitman, P.L. Lions, G.J. Olsder, E. Roxin, P. Varaiya, J. Warga и многие другие ученые (см. [1-73] и библиографию к ним).

Тематика диссертации примыкает к той части этой теории, в которой изучаются качественные свойства функций оптимального результата и способы построения оптимальных стратегий управления, использующих обратную связь. В основе используемой конструкции обратной связи лежит метод экстремального сдвига на стабильное множество.

Истоки метода экстремального сдвига и понятия стабильного множества лежат в теории позиционных дифференциальных игр, развитой в научной школе H.H. Красовского [20-27,64,74-82]. Фундаментальный вклад в труды по теории позиционного управления, наблюдения и восстановления динамики внесли А.Б. Куржанский [29,65,83,84], Ю.С. Осипов [67,85-88], А.И. Субботин [27,47, 89,90], A.B. Кряжимский [67,88,91,92], В.Е. Третьяков [81, 93], А.Г. Ченцов [47, 90, 94, 95]. Активная роль в этих исследованиях принадлежит Э.Г. Альбрехту, Б.И. Ананьеву, В.Д. Батухтину, Ю.И. Бердыше-ву, С.А. Брыкалову, B.JI. Гасилову, М.И. Гусеву, Х.Г. Гусейнову, С.Н. Зава-лищину, A.B. Киму, А.Ф. Клейменову, А.И. Короткому, A.I1. Красовскому, Н.Ю. Лукоянову, В.И. Максимову, О.И. Никонову, B.C. Пацко, H.H. Петрову, В.Г. Пимснову, А.Н. Сесекииу, И.Ф. Сивергиной, H.H. Субботиной, A.M. Та-расьеву, В.И. Ухоботову, В.Н. Ушакову, Т.Ф. Филипповой, А.Ф. Шорикову и их ученикам (см. [14,19,32,35,64,82,96-130]).

Мотивация и предмет диссертации

В теории дифференциальных игр [1,26,27,47, 131] рассматривается ситуация активного противодействия помехи намерениям управляющей стороны. В этих условиях естественным образом возникают предположения о наличии стороны, осуществляющей формирование помехи исходя из целей, противоположных целям управления, а также об осведомленности этой стороны о состояния управляемой системы и/или о действиях управляющей стороны. Такая характеристика помехи с необходимостью влечет конструкцию оценки действий управляющей стороны на основе минимаксного критерия. Этот тип задач управления хорошо изучен в рамках указанной теории, для него построены эффективные решения.

Вместе с тем, известны многочисленные задачи управления, в которых помеха заведомо не имеет антагонистического характера, иначе говоря

(а) поведение помехи не связано со значениями рассматриваемого показателя качества и

(б) не зависит от состояния управляемой системы или действий управля-

ющей стороны.

К таким задачам относятся, например,

— управление материальными системами при наличии природных воздействий (управление транспортными средствами, управление ирригационными, гидро-энергегическими системами, локализация пожаров, наводнений, техногенных загрязнений и т. п.);

— управление малыми (не имеющими доминирующего положения) экономическими объектами в изменяющихся макроэкономических условиях.

В этих задачах, также можно строить оптимальный гарантированный результат управления, но приписывание помехе возможности реагировать на состояние объекта управления, на управляющие воздействия и/или противодействовать управляющей стороне может ухудшить этот результат, отвечающий содержанию исходной задачи управления.

Отметим в этой связи, что между антагонистической помехой и наихудшей помехой имеется существенное различие. Эти понятия часто отождествляют полагая, что более жесткие предположения о характере помехи — предположение об антагонистическом характере ее поведения — не изменят решение исходной задачи, а лишь дадут «дополнительные гарантии». В отдельных случаях такая подмена характера помехи объяснима повышенными требованиями к гарантированному результату, сложным или не до конца изученным механизмом взаимодействия контролируемых и неконтролируемых параметров управляемой системы. Однако, чем бы ни диктовалась такая подмена характера помехи, во многих случаях это приводит к качественному изменению задачи управления. Именно, существенно изменяются значение оптимального результата. Как следствие, в новой задаче гарантированный результат, отвечающий исходной задаче управления, не достигается.

Таким образом, задачи управления при неантагонистической помехе имеют самостоятельное значение и содержательные предпосылки.

Свойство «антагонистичности» можно понимать как способность помехи изменяться в зависимости от действий управляющей стороны и/или состояния управляемой системы. Отталкиваясь от такого понимания, в качестве формального описания «нейтрального» поведения помехи можно

рассматривать тс или иные ограничения на ее изменение в зависимости от изменения фазового состояния системы или управления. В отличие о г «ресурсных» ограничений, выражаемых, обычно, мгновенными геометрическими или интегральными ограничениями на неконтролируемые параметры управляемой системы, эти ограничения носят функциональный характер. Простейшим ограничением такого рода является предположение о программном поведении помехи, то есть предположение о юм, что помеха описывается некоторой заранее неизвестной, но фиксированной функцией времени. Другой естественный с точки зрения приложений вариант дают помехи, порождаемые некоторой неизвестной функцией Каратеодориевского типа, то есчь функцией непрерывной по пространен венной переменной и измеримой по временной.

Задачи управления с функционально ограниченной помехой исследовались как вспомогательный инструмент (см. [27,131] и библиографию в этих книгах) для решения задачи в случае помехи общего вида, а также в качестве самое юятельной проблемы [92,132,133].

Так в конструкции программного максимина Н. Н. Красовского [21,27,47] программные помехи используются для нахождения оптимального гарантированного результата и оптимальных позиционных стратегий в задаче с «произвольными» помехами. Для широкого круга задач управления стохастический программный максимин [26], в котором действуют иеупреждающие стохастические программные помехи, дает цену соответствующей дифференциальной игры.

В работах Н. I I. Барабановой и А. И. Субботина [132,133] в рамках изучения дифференциальных игр для линейных управляемых систем исследовались множества программного поглощения [76,77] для случаев, когда помеха формируется непрерывной позиционной стратегией, либо посредством полунепрерывного сверху многозначного отображения, определенного на расширенном фазовом пространстве управляемой системы. Было установлено, что указанные множества поглощения совпадают с исходным множеством, формируемым программной помехой.

Другой вид задачи управления с функциональным ограничением на поме-

ху предложен и рассмотрен в работе А. В. Кряжимского [92] в связи с изучением свойств стратегий с полной памятью. Предполагалось, что реализации помехи содержатся в некотором неизвестном -компактном подмножестве заранее заданного множества допустимых помех (далее задачи с таким ограничением на помехи, будут именоваться задачами с «£р-компактными ограничениями на помеху»). Для этого вида ограничений в указанной работе при весьма общих предположениях об управляемой системе и показателе качества устанавливается, в частности, равенство оптимальных результатов, достигаемых в классе стратегий с полной памятью [27. §95] и в классе квазистратегий.

Еще одним направлением в исследовании задач управления с неантагонистической помехой является переход от классического — минимаксного — критерия оценки управления к другой конструкции этой оценки, возможно, в большей степени отвечающим сути рассматриваемой задачи. Минимаксный критерий качества отражает эффективность управления при наиболее неблагоприятных помехах, практически не реагируя на качество управления в случаях, когда действия помехи нейтральны или благоприятны по отношению к целям управления. В этих случаях — случаях нейтрального поведения помехи — управление, оптимальное в смысле минимаксного критерия, может, вообще говоря, «упускать возможности» улучшения результата. Модельные примеры такого рода эффектов приводятся ниже (см. п. 16). В 1948 г. в работе 10. Ниханса [134] и в 1951 г. —у Л.Дж.Сэвиджа [135] введено новое понятие оптимального решения в игре двух лиц, которое по своей конструкции существенно отличается от минимаксного решения. В литературе этот подход, обычно, именуется критерием Сэвиджа.

Поясним конструкцию этого критерия применительно задаче управления при наличии динамической помехи: пусть имеется управляемая система, выделено множество допустимых помех, выбраны класс стратегий управления и некоторый показатель качества. Для допустимой (реализации) помехи найдем результат в задаче оптимального управления при этой фиксированной помехе. Затем вычислим значение показателя качества для этой же помехи и стратегии управления из выбранного класса стратегий. Превышение вто-

рой величины над первой характеризует наш риск при (сожаление о) выборе данной стратегии в случае реализации данной помехи. Стратегия, у которой верхняя граница риска (сожаления) по всем помехам минимальна, называется оптимальной в смысле критерия Сэвиджа.

Оптимальное решение в смысле Ниханса-Сэвиджа, по-существу, также выделяет группу «неблагоприятных» помех, однако делает это иным способом, не связанным непосредственно с влиянием помехи на значение показателя качества. Помехи «благоприятствующие» не менее существенны для этого критерия, чем помехи «препятствующие» достижению цели управления.

Указанные свойства критерия Ниханса-Сэвиджа делают целесообразным его применение в ситуациях, когда помеха заведомо не имеет антагонистического характера и. как следствие, изучение задач управления в формализации, основанной на этом критерии.

В литературе можно встретить различные названия критерия. В дальнейшем для его обозначения будем использовать термин «критерий минимального риска». Стратегию, оптимальную в смысле Ниханса-Сэвиджа, для краткости мы будем называть «оптимальной по риску», а величину соответствующего риска (сожаления) — «оптимальным риском».

Цель работы

Целью работы является построение теории оптимального управления динамическими системами в условиях помех, стесненных функциональными ограничениями, в формализации на основе как (классического) минимаксного критерия, так и критерия минимального риска с дальнейшим приложением к задачам оптимизации при неантагоииетической помехе.

Методы исследования, научная новизна, теоретическая и практическая ценность

Представленные в диссертации исследования опираются на подходы и методы из качественной теории дифференциальных уравнений, теории пози-

ционных дифференциальных игр и обратных задач динамики. Используются результаты из функционального анализа, дифференциальных включений и негладкого анализа.

В работе в связи с рассмотрением задач управления при не антагонистической помехе дана формализация и обоснованы методы решения задач оптимизации гарантированного результата при наличии различных видов функциональных ограничений на помеху, в частности, показано, что стратегии с полной памятью неулучшаемы и приведены условия, при которых оптимальные стратегии допускают численную реализацию; формализована и исследована задача управления на основе критерия минимального риска при наличии различных видов функциональных ограничений на помеху, в частности, для этих задач управления указан неулучшаемый класс стратегий, построено представление минимального риска в форме предела итерационных процедур и приведены условия, при которых риск-оптимальные стратегии допускают численную реализацию.

Работа носит теоретический характер. Развитый в ней математический аппарат и полученные результаты открывают возможности исследования новых задач управления. Эти результаты могут послужить основой анализа конкретных задач управления эволюционными системами, а также инструментом для разработки и обоснования эффективных алгоритмов построения управлений, разрешающих эти задачи.

Апробация работы и публикации

Результаты диссертации обсуждались на семинарах Отдела динамических систем Института математики и механики УрО РАН (руководитель В.II. Ушаков), Факультета прикладной математики и процессов управления СПбГУ (руководитель Л.А. Петросян), кафедры Оптимального управления Факультета вычислительной математики и кибернетики МГУ им. М.В.Ломоносова (руководитель Ю.С.Осипов), докладывались на заседаниях Ученого совета Института математики и механики УрО РАН; представлялись в докладах на всероссийских и международных конференциях по теории

дифференциальных уравнений, динамической оптимизации и их приложениям к задачам механики, оптимального управления и дифференциальных игр, в том числе — на Международном семинаре «Теория управления и теория обобщенных решений уравнений Гамильтона - Якоби», посвященного 60-летшо академика А.И. Субботина (Екатеринбург, 2005), международной конференции, посвященной 100-летию со дня рождения J1.C. Понтрягина (Москва, 2008), Всероссийской научной конференции «Теория управления и математическое моделирование», посвященной памяти профессора Н.В.Азбелева (Ижевск, 2008), Международной конференции «Актуальные проблемы теории устойчивости и управления» (Екатеринбург, 2009), Всероссийской конференции «Алгоритмический анализ неустойчивых задач» (Екатеринбург, 2011), Международном семинаре 1FAC «Control Applications of Optimisation», (Юваскула, Финляндия, 2009), Международном семинаре IFAC «Adaptation and Learning in Control and Signal Processing» (Анталия, Турция, 2010), 18 Всемирном конгрессе IFAC (Милан, Италия, 2011).

Основные результаты диссертации опубликованы в работах [136-154], из которых 17 [136, 138-146, 148-154] — в зарубежных и российских рецензируемых научных журналах, рекомендованных ВАК.

Структура работы

Работа состоит из введения, списка обозначений, четырех глав, приложения и списка литературы.

В списке обозначений приводятся краткие определения используемых обозначений и, по возможности, дается отсылка к их точному определению.

В первой главе работы приведены постановки задачи оптимального гарантированного управления при неизвестной помехе связанной темп или иными ограничениями функционального характера (при программных ограничениях, при помехах, порожденных функциями каратеодориевского типа), даются их первоначальные свойства и соотношения, связывающие такие постановки задачи с задачами управления в иных постановках:

— классической [27] (при произвольных помехах),

— задачей управления при 1/р-компактных ограничениях на помехи [92].

В частности,

— даны непосредственные неравенства, связывающие оптимальные га-рантированнные результаты во всех рассматриваемых постановках задачи (теорема 5.1);

— отмечено достаточное условие, при котором введение указанных функциональных ограничений на помеху не приводит к изменению задачи управления, то есть оптимальный гарантированный результат и разрешающие стратегии управления совпадают с соответствующими элементами для задачи управления при помехах общего вида (замечание 5.1);

— приведен пример существенного изменения пучка конструктивных движений, порождаемого позиционной стратегией управления, при переходе от произвольных помех к программным помехам (пункт 3), а также пример существенного изменения оптимальной гарантии при введении такого ограничения на помеху (пункт 6);

— показана неулучшаемость позиционных стратегий с полной памятью при всех рассмотренных видах функциональных ограничений на помех)', то есть установлено равенство оптимальных гарантированных результатов при всех рассмотренных видах функциональных ограничений на помеху с оптимальным гарантированным результатом в классе квазпстратегий; таким образом, установлена и эквивалентность соответствующих задач управления (теорема 7.1).

Во второй главе отмечены способы построения коструктивных разрешающих стратегий, в частности:

— приводятся классы управляемых систем и конструкции оптимальных стратегий, которые допускают численную реализацию (теоремы 8.1, 8.2, 9.1);

— приведен иллюстративный пример применения предложенных конструкций (пункт 10);

— показано, что при 1/р-компактных ограничениях на помеху (наиболее слабое из рассматриваемых ограничений па помеху) оптимальная гарантия может, вообще говоря, существенно меняться при переходе от чисто позиционных стратегий управления, не зависящих от начальной позиции, к стра-

*

тегиям с полной памятью о движении системы (пункт 11); это мотивирует рассмотрение задачи именно в классе стратегий с полной памятью.

В третьей главе рассматриваются вопросы применения критерия Нихан-са-Сэвиджа к задачам управления при наличии динамических помех, в частности:

— приводится краткое обсуждение критерия, предложенного Нихасом и Сэвиджем, в стационарном случае (пункт 12);

— дается постановка задачи оптимизации (минимизации) риска при рассматриваемых функциональных ограничениях на помеху (пункт 13);

— приводятся непосредственные соотношения, связывающие значение минимального риска при различных функциональных ограничениях на помеху и в различных классах разрешающих стратегий (теорема 14.1);

— приводится пример решения простой задачи в случае программных ограничений на помеху (пункт 15);

— на примере системы с простыми движениями сравниваются результаты, в задаче формализованной на основе критерия минимального риска, с результатами, базирующимися на классическом — минимаксном критерии (пункт 16);

— даются достаточные условия, обеспечивающие при рассматриваемых видах ограничений на помеху совпадение минимального риска в классе стратегий с полной памятью с оптимальным риском в классе квазистратегий (теорема 17.1), (достаточные условия неулучшаемости стратегий с полной памятью в задаче минимизации риска).

В четвертой главе понятия и построения предыдущей части конкретизируются и развиваются в конструктивном направлении, а именно

— приводится построение функции минимального риска, основывающееся на методе программных итераций [37,68-72,95, 130, 155-159] (теорема 18.1);

— даются достаточные условия, существенно упрощающие вычисление риск-оптимальной стратегии при рассматриваемых ограничениях на помех)' (теоремы 19.1, 19.2);

— исследуе1ся случай, когда программный максимин функционала сожа-

ления совпадает с величиной минимального риска при 1/р-компактных ограничениях на помеху (теорема 20.1); по аналогии с задачами оптимизации гарантии этот случай назван риск-регулярным;

— приводятся отдельные свойства функционалов минимального риска и оптимального результата для показателя качества терминального типа (пункт 21).

Глава 1

Оптимальный гарантированный результат при компактных множествах помех

В главе приведены постановки задачи оптимального гарантированного управления при неизвестной помехе связанной различными ограничениями функционального характера (при программных помехах, помехах, порожденных функциями каратеодориевского типа), даются их первоначальные свойства и соотношения, связывающие такие постановки задачи с задачами управления в иных постановках:

— классической [27] (при произвольных помехах),

— задачей управления при компактных множествах помех [92].

В частности,

— отмечены достаточные условия, при которых введение (рассматриваемых) функциональных ограничений на помеху не приводит к изменению задачи управления, то есть оптимальный гарантированный результат и разрешающие стратегии управления совпадают с соответствующими элементами для задачи управления при помехах общего вида;

— показано, что при при компактных множествах помех (наиболее слабое из рассматриваемых ограничений на помеху) оптимальная гарантия существенно меняется при переходе от позиционных стратегий управления к стратегиям с полной памятью о движении системы и реализации управления, что обосновывает формализацию задачи именно в этом классе стратегий;

— приведены примеры существенного изменения пучков конструктивных движений, порождаемых стратегиями, при переходе от произвольных помех

к помехам, удовлетворяющих одному из функциональных ограничений, а также существенного изменения оптимальной гарантии при введении такого ограничения на помехи.

1. Динамика системы

В параграфе дается описание динамики рассматриваемой управляемой системы и используемые в дальнейшем обозначения отдельных множеств и объектов.

Рассматривается управляемая система, описываемая обыкновенным дифференциальным уравнением

х(т) = ¡(т.х(т),и{т),у{т)), г € Г:=[*о.0] С К, (1.1)

и начальным условием х(1о) — го € С0 С М", где «:=» означает «равно по определению». Реализации управления и(-) и помехи у(-) предполагаются измеримыми по Борелю функциями, удовлетворяющими геометрическим ограничениям

и(т)бРсШр, у(т) едсмд, те Т. (1.2)

Множества всех таких реализаций управления и помехи обозначим соответственно Ы и V. Множества Со, V и О, суть компакты в соответствующих евклидовых пространствах.

В отношении функции /(•) будем предполагать, что

— она определена и непрерывна по совокупности аргументов в области

— локально липшицева по второй переменной

||/(т, XI, и, у) - ¡(т,Х2Л1, V) || ^ Ь1{3)\\х1 Х'21|. (1.3)

где (г, х\), (т, жг) £ 5", и £ V, у € <2, 5 — любое ограниченное подмножество из Мп+1, Lf(S) — константа Липшица, зависящая от множества 5;

— удовлетворяет условию подлинейного роста:

||/(т,^и^)ИЩ1 + ||:г||), /О О

при любых (т, X. и, у) £ Т х Шп х V х о,.

При указанных условиях решение в смысле Каратеодори задачи Коши (1.1) существует на всем интервале [¿о, и единственно для любых реализациях управления и(-) е Ы и помехи г>(-) £ V (см. [8, 11.4]). Для всех е

Т х М", ?¿(•) е и, ?;(•) е V обозначим х(-

),?->(•)) решение в смысле Каратеодори задачи (1.1) с начальным условием = 2'*.

Выделим следующее подмножество пространства состояний системы (1.1):

С:=с1ГхКп {(г, е [*о,0] хГ |

х = х(тЛ0.20,и(-).у(-)).*0 е (?().«(■) еи.у{-) е v}.

Проверяется, что в силу определения и свойств управляемой системы (1.1), (1.2) множество С компактно в Мп+\ и при любых и(-) Е Ы, у(-) Е V, Е С движение а;(-, ¿*, г*, и(-), ■*;(•)) не покинет С вплоть до момента д. Обозначим я(С) максимум нормы правой части системы (1.1) в области С х V х

х(С):= шах \\/{т,х,и,у)\\. (1.4)

(т,х)£о

Будем говорить, что для системы (1.1) выполняется условие седловой точки [27], если для всех (г, х) Е С, 5 Е М" справедливо равенство

пиитах (б. /(т,х,и.у)) — тахтт (з./(т, х, и, и)). (1.5)

иеТ ьеО. ' и^Р

2. Стратегии и движения

В этом пункте определяются множество стратегий управления и пучки конструктивных движений, порожденных стратегией, при тех или иных ограничениях на помеху. Приводятся свойства этих пучков. В частности, устанавливается отношение включения между пучками движений при каратео-дориевских помехах и компактных множествах помех, отношение равенства между пучками движений и) и Хс(го, и); показана стабильность ин-

тегральных воронок, порождаемых пучками движений при программных и

при произвольных помехах. Эти свойства используются в дальнейших построениях и оценках. Построения в основном следуют идее конструктивных движений [27] — пределов пошаговых решений уравнения (1.1) при кусочно-постоянных реализациях управления.

Для произвольных (f*,2*) G G, v(-) 6 V и и(-) Е U введем следующие обозначения

X(t*.z*M,v(-)) :=clc(M;Rll) {x{-,U,z*.u(-),v(-)) | u(-) £ U), (2.1) X(U,z*. -u(-), V) :=clC([f>iö];R,.) y(-)) I v(-) £ V}, (2.2)

X(G0):=clC№) IJ X(tQ,zoM.v(-))- (2-3)

-'oef-'ü

где с1д' Z обозначает замыкание множества Z С X в топологии пространства X, а C([t*. г?]; К") — множество непрерывных функций из [t*. $] в М" с нормой равномерной сходимости.

В дальнейшем для zo Е Gq будут также использоваться обозначения

X(zlhu(-),V):=X(t0,z{hu(-),V). X(G0,U,v(-)):= U X(z0M,v(-)).

Пусть

д7.;= \ Д G 2Т \ {0} I |Д| < СХ). min г = /0. тахт = I ;

[ теД тбД J

здесь | Д | обозначает количество элементов во множестве Д. Для всякого Д Е Ат определим единственный кортеж

(т,-),-е0..пд € т!д1, пд:=|Д|-1,

сохраняющий естественный порядок в Т {ti > Tj_i, г Е 1..дд), и числа

Б(Д) := тахгг —гг_1, с1(Д) := min щ — Tj_i.

г'еь.пд гб1..(пл-1)

Отметим, что длина интервала [гЛд_1, тпд) не участвует в опрделении величины с!(Д). Элементы множества Ат будем называть разбиениями отрезка

Т. Каждое разбиение Д порождает дизъюнктное покрытие интервала [¿о -системой интервалов [г?_1.Тг), Тг_\,Тг Е Д, г Е 1..пд. Для всех Д Е Дт и Ь Е Т определим ^ :=шах{г Е 0..пд | т^ ^ £}; таким образом, выполняется включение ¿- Е [тг-(, т)г+1).

Для произвольного Д Е Дг обозначим Уд С ¿/ и Уд С V подмножества реализаций, соответственно, управления и помехи непрерывных справа и кусочно постоянных на интервалах, порождаемых разбиением Д и положим

Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Список литературы диссертационного исследования кандидат наук Серков, Дмитрий Александрович, 2014 год

Литература

1. Айзеке Р. Дифференциальные игры. М: Мир, 1967. с. 480.

2. Алексеев В.М., Тихомиров В.М., Фомин C.B. Оптимальное управление. Наука, 1979. с. 430.

3. Беллман Р. Динамическое программирование. Москва: Изд-во иностр. лит., 1960. с. 400.

4. Беллман Р., Калаба Р. Динамическое программирование и современная теория управления. Москва: Наука, 1969. с. 118.

5. Благодатских В.И., Филиппов А.Ф. Дифференциальные включения и оптимальное управление // Труды МИАН им. В.А.Стеклова. 1985. Т. 169. С. 194-252.

6. Болтянский В.Г. Математические методы оптимального управления. Москва: Наука, 1966. с. 308.

7. Брайсон А., Ю-Ши Хо. Прикладная теория оптимального управления. Москва: Мир, 1972. с. 544.

8. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. Москва: Наука, 1977. с. 624.

9. Габасов Р.Ф., Кириллова Ф.М. Качественная теория оптимальных процессов. Москва: Наука, 1971. с. 508.

10. Гамкрелидзе Р.В. Основы оптимального управления. Тбилиси: Изд-во Тбилисского университета, 1975. с. 256.

11. Гусятников П.Б. Теория дифференциальных игр. Изд-во МФТИ, 1982. с. 99.

12. Дубовицкий АЛ., Милютин A.A. Необходимые условия слабого экстремума в общей задаче оптимального управления. Москва: Наука, 1971. с. 113.

13. Жуковский В.И. Конфликты и риски. РосЗИТЛП Москва. 2007. с. 456.

14. Завлищин С.Т., Сесекин А.Н. Импулсные процессы: модели и приложения. М.: Наука, 1991. с. 256.

15. Зеликин М.И. Оптимальное управление и вариационное исчисление. М.: Едиториал УРСС, 2004. с. 160.

16. Зубов В.И. Лекции по теории управления. М.: Наука, 1975. с. 496.

17. Иоффе А.Д., Тихомиров В.М. Теория экстремальных задач. М.: Наука, 1974. с. 480.

18. Кларк Ф. Оптимизация и негладкий анализ. М.: Наука, 1988. с. 280.

19. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. Урал, отделение, 1993. с. 184.

20. Красовский H.H. Теория управления движением. М.: Наука, 1968. с. 476.

21. Красовский H.H. Игровые задачи о встрече движений. М.: Наука, 1970. с. 420.

22. Красовский H.H. Экстремальное управление в нелинейной позиционной дифференциальной игре//Докл. АН СССР. 1972. Т. 203, №3. С. 520-523.

23. Красовский H.H. Дифференциальная игра сближения-уклонения. I // Изв. АН СССР: Техн. кибернет. 1973. № 2. С. 3-18.

24. Красовский H.H. Дифференциальная игра сближения-уклонения. II // Изв. АН СССР: Техн. кибернет. 1973. № 3. С. 22-42.

25. Красовский H.H. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226, №6. С. 1260-1263.

26. Красовский H.H. Управление динамической системой. М: Наука, 1985. с. 520.

27. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. Москва: Наука, 1974. с. 456.

28. Кротов В.Ф., Гурман В.И. Методы и задачи оптимального управления. М.: Наука, 1973. с. 448.

29. Куржанский А.Б. Управление и наблюдение в условиях неопределенности. М.: Наука, 1977. с. 392.

30. Ледяев Ю.С., Мищенко Е.Ф. Экстремальные задачи в теории дифференциальных игр//Труды МИАН им. В.А.Стеклова. 1988. Т. 85. С. 147-170.

31. ЛейтманДж. Введение в теорию оптимального управления. Наука, 1968. с. 190.

32. Максимов В.И. Задачи динамического восстановления входов бесконечномерных систем. Екатеринбург: Изд-во УрО РАН. 2000. с. 305.

33. Матвеев В.А., Якубович В.А. Абстрактная теория оптимального управления. Санкт-Петербург: Изд-во Санкт-Петербурского государственного университета, 1994. с. 363.

34. Мордухович Б.Ш. Методы аппроксимации в задачах оптимизации и управления. М.: Наука, 1988. с. 360.

35. Петров H.H. Теория игр. Ижевск: Изд-во Удмуртского госуниверситета, 1997. с. 196.

36. Петросян Л.А. Дифференциальные игры преследования. Л.: Изд-во Ленинградского госуниверситета, 1977. с. 222.

37. Петросян Л.А., Чистяков C.B. Об одном подходе к решению игр преследования // Вестник ЛГУ. Сер. мат., мех., астрон. 1977. Т. 1. С. 77-82.

38. Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983.

39. Понтрягин Л.С. К теории дифференциальных игр // Успехи мат. наук. 1966. Т. 21, №4. С. 219-274.

40. Понтргяин JI.C. О линейных дифференциальных играх, 1 // Докл. АН СССР. 1967. Т. 174, №6. С. 1278-1280.

41. Понтрягин Л.С. О линейных дифференциальных играх. 2 // Докл. АН СССР. 1967. Т. 175, №4. С. 764-766.

42. Понтрягин Л.С. Математическая теория оптимальных процессов и дифференциальных игр // Труды МИАН им.В.А.Стсклова. 1985. Т. 169. С. 119-157.

43. Математическая теория оптимальных процессов / Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе [и др.]. М.: Наука, 1961. с. 392.

44. Пшеничный Б.Н. Необходимые условия экстремума. М.: Наука, 1982. с. 144.

45. Субботин А.И. Минимаксные неравенства и уравнения Гамильто-на-Якоби. Москва: Наука, 1991. с. 216.

46. Субботин А.И. Обобщенные решения уравнений в частных производных первого порядка. Перспективы динамической оптимизации. Москва-Ижевск: Ин-т компьютерных исслед., 2003. с. 336.

47. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления. Москва: Наука. 1981. с. 288.

48. Fleming W., Rishel R. Deterministic and Stochastic Optimal Control. New York: Springer-Verlag, 1975.

49. Фомин В.II., Фрадков А.Л., Якубович В.А. Адаптивное управление динамическими объектами. М.: Наука, 1981. с. 447.

50. Черноусько Ф.Л. Некоторые задачи оптимального управления с малым параметром. М.: Наука, 1980.

51. Черноусько Ф.Л., Колмановский В.Б. Оптимальное управление при случайных возмущениях. М.: Наука, 1978. с. 352.

52. Черноусько Ф.Л., Меликян А. А. Игровые задачи управления и поиска. М.: Наука, 1978. с. 270.

53. Черноусько Ф.Л., Акуленко Л.Д., Соколов Б.Н. Управление колебаниями. М.: Наука, 1980.

54. Чикрий A.A. Конфликтно управляемые процессы. Киев: 11аукова Думка, 1992. с. 384.

55. Aubin J.P. Viability Theory. Boston: Birkhäuser, 1991.

56. Bardi M., Dolcetta I.С. Optimal Control and Viscosity Solutions of Hamilton-Jacobi-Bellman Equations. Boston: Birkhäuser, 1996.

57. Basar Т., Bernhard P. #°°-Optimal Control and Related Minimax Design Problems. A Dynamic Game Approach. Boston: Birkhauser, 1991. c. 224.

58. Basar Т., Olsder G.J. Dynamic Noncooperative Game Theory. New York: Academic Press, 1982.

59. Bensoussan A. Perturbation Methods in Optimal Control. New York, Chichester: Wiley-Gautier, 1988. c. 574.

60. Nonsmooth Analysis and Control Theory / F.H. Clarke, Yu.S. Ledyaev, R.J. Stern [и др.]. New York: Springer-Verlag, 1998. с. 278.

61. Crandall M.G., Ishii H., Lions P.-L. A user's guide to viscosity solutions of second order partial differential equations // Bulletin (New Series) Amer. Math. Society. 1992. T. 27. C. l-<57.

62. Fleming W.H., Soner H.M. Controlled Markov Processes and Viscosity Solutions. New York: Springer-Verlag, 1993.

63. Friedman A. Differential Games. New York: Wiley Interscience, 1971.

64. Krasovskii N N, Subbotin A I. Game-theoretical control problems. SpringerVerlag New York, Inc., 1988. c. 517.

65. Kurzhanski А.В., Valyi I. Elipsoidal Calculus for Estimation and Control. SCFA. Boston: Birkhauser, 1996.

66. Melikyan A.A. Generalaized Characteristics of First Order PDEs: Applications in Optimal Control and Differential Games. Boston: Birkhauser, 1998. c. 310.

67. Osipov Yu.S., Kryazhimskii A.V. Inverse Problems for Ordinary Differential Equations: Dynamical Solutions. London: Gordon and Breach Publishers, 1995. c. 625.

68. Чистяков С.В. К решению игровых задач преследования // Прикл. матем. мех. 1977. Т. 41, № 5. С. 825-832.

69. Чистяков С.В. О функциональных уравнениях в играх сближения в заданный момент времени // Прикл. матем. мех. 1982. Т. 46, № 5. С. 874-877.

70. Чистяков С.В. Программные итерации и универсальные г-оптимальные стратегии в позиционной дифференциальной игре // Докл. АН СССР. 1991. Т. 319, №6. С. 1333-1335.

71. Чистяков С.В. Операторы значения в теории дифференциальных игр // Известия Института математики и информатики Удмуртского государственного университета. 2006. Т. 3(37). С. 169-172.

72. Чистяков С.В., Никитин Ф.Ф. Теорема существования и единственности решения обобщенного уравнения Айзекса-Беллмана // Дифференц. уравнения. 2007. Т. 43, № 6. С. 757-766.

73. Vinter R. Optimal Control. Boston: Birkhüser, 2000. с. 507.

74. Красовский Н.Н. Некоторые задачи теории устойчивости движения. М.: Физматгиз, 1959. с. 211.

75. Красовский H.H., Куржанский А.Б. К вопросу о наблюдаемости систем с запаздыванием // Дифференц. уравнения. 1966. Т. 2, № 3. С. 298-308.

76. Красовский H.H., Субботин А.И. Альтернатива для игровой задачи сближения // Прикл. матем. и мех. 1970. Т. 34, № 6. С. 1005-1022.

77. Красовский H.H., Субботин А.И. О структуре дифференциальных игр // Докл. АН СССР. 1970. Т. 190, № 3. С. 523-526.

78. Krasovskii N.N., Krasovskii A.N. Control under lack of information. Berlin etc.: Birkhäuser, 1995. с. 322.

79. Красовский H.H., Репин Ю.М., Третьяков В.Е. О некоторых игровых ситуациях в теории управляемых систем // Изв. АН СССР: Техн. киберн. 1965. №4. С. 3-13.

80. Красовский H.H., Решетова Т.Н. О программном синтезе гарантирующего управления // Проблемы управления и теории информации. 1988. Т. 17, №6. С. 1-11.

81. Красовский H.H., Третьяков В.Е. Стохастический программный синтез для позиционной дифференциальной игры //Доклады АН СССР. 1981. Т. 259, № 1. С. 24-27.

82. Krasovskii A.N., Krasovskii N.N. Control under Lack of Information. Berlin etc.: Birkhäuser, 1995. с. 322.

83. Гусев М.И., Куржанский А.Б. К оптимизации управляемых систем при наличии ограничений. I. // Дифференц. уравнения. 1971. Т. 7, № 9. С. 1591-1602.

84. Гусев М.И., Куржанский А.Б. К оптимизации управляемых систем при наличии ограничений.II // Дифференц. уравнения. 1971. Т. 7, № 10. С. 1789-1800.

85. Осипов Ю.С. Дифференциальные игры систем с последействием // Докл. АН СССР. 1971. Т. 196, № 4. С. 779-782.

86. Осипов Ю.С. К теории дифференциальных игр в системах с распределенными параметрами // Докл. АН СССР. 1975. Т. 223, № 6. С.1314-1317.

87. Осипов Ю.С. Позиционное управление в параболических системах // Прикладная математика и механика. 1977. Т. 41, № 2. С. 195-201.

88. Кряжимский А.В, Осипов Ю.С. О позиционном моделировании управления в динамических системах // Изв. АН СССР: Техн. кибернет. 1983. №2. С. 51-60.

89. Субботин А.И. Обобщение основного уравнения теории дифференциальных игр // Докл. АН СССР. 1980. Т. 254, № 2. С. 293-297.

90. Субботин А.И., Ченцов А.Г. Итерационная процедура построения минимаксных и вязкостных решений уравнений Гамильтона-Якоби // Докл. РАН. 1996. Т. 348, № 3. С. 45^18.

91. Кряжимский A.B. К теории позиционных дифференциальных игр сближения-уклонения // Докл. АН СССР. 1978. Т. 239, № 4. С. 779-782.

92. Kryazhimskii А V. The problem of optimization of the ensured result: unimprovability of full-memory strategies // Constantin Caratheodory: An International Tribute. World Scientific, 1991. C. 636-675.

93. Третьяков B.E. К теории стохастических дифференциальных игр //Докл. АН СССР. 1983. Т. 269, № 3. С. 1049-1053.

94. Ченцов А.Г. О структуре одной игровой задачи сближения // Докл. АН СССР. 1975. Т. 224, №6. С. 1272-1275.

95. Ченцов А.Г. К игровой задаче наведения //Докл. АН СССР. 1976. Т. 226, № 1. С. 73-76.

96. Альбрехт Э.Г. Построение приближенных решений некоторых квазилинейных дифференциальных игр // Труды ИММ УрО РАН. 2000. Т. 6, № 1. С. 27-38.

97. Ананьев Б.И. О двойственности задач оптимального наблюдения и управления для линейных систем с запаздыванием // Дифференц. уравнения. 1974. Т. 10, №7. С. 1960-1967.

98. Батухтин В.Д. Экстремальное прицеливание в нелинейной игре сближения //Докл. АН СССР. 1972. Т. 207, № 1. С. 11-14.

99. Бердышев Ю.И. Качественный анализ областей достижимости // Космические исследования. 1996. Т. 34, №2. С. 141-144.

100. Брыкалов С.А. Непрерывная обратная связь в задачах конфликтного управления // Докл. РАН. 2001. Т. 376, № 4. С. 442-^144.

101. Вахрушев В.А., Ушаков В.Н. О вычислительной реализации процедур управления с поводырем // Прикл. матем. и мех. 2002. Т. 66, № 2. С. 228-238.

102. Конструкции теории дифференциальных игр при решении уравнений Гамильтона-Якоби / C.B. Григорьева, A.M. Тарасьев, A.A. Успенский [и др.] // Труды ИММ УрО РАН. 2000. Т. 6, № 2. С. 320-336.

103. Гусейнов Х.Г., Субботин А.И., Ушаков В.Н. Производные многозначных отображений и их применение в игровых задачах управления // Проблемы управления и теории информации. 1985. Т. 14, № 3. С. 1-14.

104. Ким A.B. Об уравнении Беллмана для систем с последействием // Изв. АН СССР: Техн. кибернетика. 1991. №2. С. 54-69.

105. Короткий А.И. Динамическое моделирование параметров в гиперболических системах // Изв. АН СССР : Техн. кибернет. 1991. № 2. С. 154-164.

106. Красовский А.Н. Синтез смешанных стратегий управления. Свердловск: Изд-во Уральского госуниверситета, 1988. с. 152.

107. Камнева JI.B. Достаточные условия стабильности для функции цены дифференциальной игры в терминах сингулярных точек // Прикл. матем. и мех. 2003. Т. 67, № 3. С. 366-383.

108. Куржанский А.Б., Никонов О.И. Эволюционные уравнения для пучков траекторий синтезированных систем управления // Докл. РАН. 1993. Т. 333, №5. С. 578-581.

109. Куржанский А.Б., Филиппова Т.Ф. Об описании множества выживающих траекторий дифференциального включения // Докл. АН СССР. 1986. Т. 289, № 1. С. 38-41.

110. Лукоянов Н.Ю. К задаче конфликтного управления при смешанных ограничениях // Прикладная математика и механика. 1995. Т. 59, № 6. С. 995-964.

111. Лукоянов Н.Ю. Минимаксное решение уравнений Гамильтона-Якоби для наследственных систем //Докл. РАН. 2000. Т. 371, № 2. С. 163-166.

112. Лукоянов Н.Ю. Функциональные уравнения типа Гамильтона-Якоби и дифференциальные игры с наследственной информацией // Докл. РАН. 2000. Т. 371, №4. С. 457-461.

113. Лукоянов Н.Ю. Стратегии прицеливания в направлении инвариантных градиентов // Прикладная математика и механика. 2004.

114. Лукоянов Н.Ю. Функциональные уравнения Гамильтона-Якоби и задачи управления с наследственной информацией. Екатеринбург: УрФУ, 2011. с. 243.

115. Осипов Ю.С., Пименов В.Г. К теории дифференциальных игр в системах с последействием // Прикл. матем. и мех. 1978. Т. 42, № 6. С. 963-977.

116. Петров H.H. О существовании значения игры преследования // Докл. АН СССР. 1970. Т. 190, №6. С. 621-624.

117. Пацко B.C., Турова В.Л. Численное решение дифференциальных игр на плоскости: Препринт, Изд-во УрО РАН. Екатеринбург, 1995. 77 с.

118. Субботин А.И., Субботина H.H. Необходимые и достаточные условия для кусочно-гладкой цены дифференциальной игры // Доклады АН СССР. 1978. Т. 243, № 4. С. 862-865.

119. Субботин А.И., Тарасьев A.M. Сопряженные производные функции цены дифференциальной игры // Докл. АН СССР. 1985. Т. 283, № 3. С.559-564.

120. Субботина H.H. Универсальные оптимальные стратегии в позиционных дифференциальных играх // Дифф. уравнения. 1983. Т. 19, № 11. С. 1890-1896.

121. Тарасьев A.M. Аппроксимационные схемы построения минимаксных решений уравнений Гамильтона-Якоби // Прик. матем. и мех. 1994. Т. 58, № 2. С. 22-36.

122. Тарасьев A.M., Успенский A.A., Ушаков В.Н. Аппроксимационные схемы и конечно-разностные операторы для построения обобщенных решений уравнений Гамильтона-Якоби // Изв. РАН: Техн. кибернетика. 1994. Т. 3. С. 173-185.

123. Subbotin A.I., Taras'ev A.M., Ushakov V.N. Generalized characteristics of Hamilton-Jacobi equations // J. Comput. Systems Sei. Intern. 1994. T. 32, №2. C. 157-163.

124. Ушаков A.B. К задаче построения стабильных мостов в дифференциальной игре сближения-уклонения // Изв. АН СССР. Техн. кибернетика. 1980. №4. С. 29-36.

125. Ушаков В.Н., Хрипунов А.П. О приближенном построении решений в игровых задачах управления // Прикл. матем. и мех. 1997. Т. 61, № 3. С. 413-421.

126. Шориков А.Ф. Минимаксное оценивание и управление в дискретных динамических системах. Екатеринбург: Изд-во Уральского госуниверситета, 1997. с. 248.

127. Kumkov S. S., Patsko V. S. Construction of singular surfaces in linear differential games // Annals of the International Society of Dynamic Games, Vol. 6: Advances in Dynamic Games and Applications / под ред. E. Altman, O. Pourtallier. Boston: Birkhauser, 2001. C. 185-202.

128. Patsko V.S., Turova V.L. Level sets of the value function in differential games with the homicidal chauffeur dynamics // International Game Theory Review. 2001. T. 3, № 1. C. 67-112.

129. Sesekin A.N. On the singularity order of optimal controls in linear-quadratic optimization problems for systems with delays // Functional Defferential equations. 1998. T. 1-2. C. 243-251.

130. Ухоботов В.И. Построение стабильного моста для одного класса линейных игр // Прикл. матем. и мех. 1977. Т. 41, № 2. С. 358-364.

131. Красовский Н.Н. Лекции no теории управления. Вып. 3. Дифференциальные игры. Свердловск: Уральский государственный университет им. А.М.Горького, 1970. с. 88.

132. Барабапова И.П., Субботин А.И. О непрерывных стратегиях уклонения в игровых задачах о встрече движений//Прикл. матем. и мех. 1970. Т. 34, № 5. С. 796-803.

133. Барабапова Н.Н., Субботин А.И. О классах с тратегий в дифференциальных играх уклонения от встречи // Прикл. матем. и мех. 1971. Т. 35, № 3. С. 385-392.

134. Niehans J. Zur Preisbildung bei ungewissen Erwartungen // Scbweizerische Zietschrift fur Volkswirtschaft und Statistik. 1948. T. 84, № 5. c. 433-456.

135. Savage L.J. The theory of statistical decision // Journal of the American Statistical association. 1951. T. 46, № 253. C. 55-67. URL: http://www.tandfonline.eom/doi/pdf/l 0.1080/01621459.1951.10500768.

136. Серков Д.А. Сильно оптимальные стратегии// Доклады АН СССР. 1991. Т. 321, №2. С. 258-262.

137. Серков Д.А. О равномерных стратегиях // Теория управления и теория обобщенных решений уравнений Гамильтона-Якоби. Труды Международного семинара, посвященного 60-летию академика А.И.Субботина. Екатеринбург, Россия, 22-26 июня 2005 г. / под ред. Н. Н. Субботина,

В. Н. Ушаков. Т. 1. Екатеринбург: Издательство Уральского университета, 2006. С. 273-284.

138. Серков Д.А. Стратегии минимаксного риска (сожаления) в системе с простыми движениями // Труды ИММ УрО РАН. 2007. Т. 13, № 3. С. 121-135. URL: http://www.mathnet.ru/links/76f25b7a5c5927a4c0fbl0bee62e3f84/timmlll.pdf.

139. Серков Д.А. Стратегия минимаксного риска (сожаления) для одного класса задач управления в условиях динамических помех // Труды ИММ УрО РАН. 2008. Т. 14, № 2. С. 192-200.

140. Серков Д.А. Стратегия минимаксного риска (сожаления) для задач управления в условиях динамических помех // Вестник Удмуртского университета. Серия 1: Математика. Механика. Компьютерные науки. 2008. Т. 2. С. 132-135.

141. Серков Д.А. Об одном свойстве конструктивных движений // Вестник Удмуртского университета. Серия 1: Математика. Механика. Компьютерные науки. 2009. Т. 3. С. 98-103.

142. Serkov D.A. On the optimal risk function for the system under dynamic disturbances // IFAC Proceedings Volumes (IFAC-PapersOnline) / под ред. Kaisa Miettinen, Pekka Neittaanmäki. Т. 7 из Control Applications of Optimization. University of Jyväskylä, Finland: International Federation of Automatic Control, 2009. C. 307-309. URL: http://www.ifac-papersonline.net/Detailed/41927.html.

143. Серков Д.А. Об одном свойстве конструктивных движений II // Вестник Удмуртского университета. Серия 1: Математика. Механика. Компьютерные науки. 2010. Т. 3. С. 64-69. URL: http://www.mathnet.ru/links/65efee793b3d7ae2bc3al91cfcd9fl0f/vuul67.pdf.

144. Серков Д.А. О некоторых свойствах задачи управления при программной помехе в формализации на основе критерия минимаксного риска (сожаления)//Труды ИММ УрО РАН. 2010. Т. 16, № 1. С. 140-151.

145. Serkov D.A. On Optimal Control under Program Disturbances // IFAC Proceedings Volumes (IFAC-PapersOnline) / под ред. Erdal Kayacan, T. 10 из Adaptation and Learning in Control and Signal Processing. Bogazici University, Turkey: International Federation of Automatic Control, 2010. C. 255-258. URL: http://www.ifac-papersonline.net/Detailed/46795.html.

146. Serkov D.A. Optimal Strategies in Control Problem under Programmed Disturbances // IFAC Proceedings Volumes (IFAC-PapersOnline) / под ред. Sergio Bittanti, Angelo Cenedese, Sandro Zampicri. T. 18. Milano: International Federation of Automatic Control, 2011. С. 11465-11470. URL: http://www.ifac-papersonline.net/Detailed/51239.html.

147. Серков Д.А. Стратегии с полной памятью и процедуры восстановления помехи для задач управления в условиях неопределенности // Тезисы докладов Международной конференции «Алгоритмический анализ неустойчивых задач», посвященной памяти В.К. Иванова. Екатеринбург: 2011.31 октября - 5 ноября. С. 270-271.

148. Серков Д. А. Гарантированное управление при функциональных ограничениях на помеху // Математическая теория игр и ее приложения. 2012. Т. 4, №2. С. 71-95.

149. Серков Д.А. Оптимальная гарантия при помехах, порожденных функциями Каратеодори // Вестник Удмуртского университета. Серия 1: Математика. Механика. Компьютерные науки. 2012. Т. 2. С. 74-83.

150. Серков Д.А. Оптимальное по риску управление при функциональных ограничениях на помеху // Математическая теория игр и ее приложения. 2013. Т. 5. С. 74-103.

151. Серков Д.А. О модельных движениях в задаче управлении при функциональных ограничениях на помеху // Вестник Южно-Уральского государственного университета. Математическое моделирование и программирование. 2013. Т. 6, №2. С. 62-73.

152. Серков Д.А. Оптимизация гарантированного результата при функциональных ограничениях на динамическую помеху // Доклады Академии Наук. 2013. Т. 450, № 3. С. 274-278.

153. Серков Д.А. Оптимальное управление при компактных в Ьр ограничениях на помеху // Вестник Удмуртского университета. Серия 1 : Математика. Механика. Компьютерные науки. 2013. Т. 3. С. 79-87.

154. Серков Д.А. О неулучшаемости стратегий с полной памятью в задаче минимизации риска II Труды ИММ УрО РАН. 2013. Т. 19. № 4. С. 222-230.

155. Ченцов А.Г. К игровой задаче наведения с информационной памятью // Докл. АН СССР. 1976. Т. 227, № 2. С. 306-309.

156. Чепцов А.Г. Об игровой задаче на минимакс функционала // Докл. АН СССР. 1976. Т. 230, № 5. С. 1047-1050.

157. Ченцов А.Г. Итерационная программная конструкция для дифференциальной игры с фиксированным моментом окончания // Докл. АН СССР. 1978. Т. 240, № 1. С. 36-39.

158. Ченцов А.Г. Об игровой задаче сближения в заданный момент времени // Математический сборник. 1976. Т. 99(141), № 3. С. 394^120.

159. Меликян A.A. Цена игры в линейной дифференциальной игре сближения//Докл. АН СССР. 1977. Т. 237, № 3. с. 521-524.

160. Натансон И.П. Теория функций вещественной переменной. М.: Наука, 1974. с. 480.

161. Окстоби Дж. Мера и категория. Москва: Мир, 1974. с. 160.

162. Roxin Е. The axiomatic approach in differential games // J. Optim. Theor. Appl. 1969. T. 3. C. 153-163.

163. Nardzewski C.R. A theory ofpersuit and evasion. Adv. in game theory. Ann. Math. Stud, 1964.

164. Рокафеллар Р. Выпуклый анализ. М.: Мир, 1973. с. 469.

165. Ченцов А.Г. Программные конструкции в дифференциальных играх с информационной памятью // Оптимальное управление системами с непределенной информацией. Свердловск: УНЦ АН СССР, 1980. с. 152.

166. Филиппов В.В. О теории задачи Коши для обыкновенного дифференциального уравнения с разрывной правой частью // Математический сборник. 1994. Т. 185, № 11. С. 95-118.

167. Иосида К. Функциональный анализ. Москва: Мир, 1967. с. 624.

Пстчено 6 чар га 2014 г т фаГла ТНЕ515 Сех

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.