Игровые задачи сближения-уклонения: обратная связь и стабильность множеств тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Латушкин, Ярослав Александрович

  • Латушкин, Ярослав Александрович
  • кандидат физико-математических науккандидат физико-математических наук
  • 2008, Екатеринбург
  • Специальность ВАК РФ01.01.02
  • Количество страниц 142
Латушкин, Ярослав Александрович. Игровые задачи сближения-уклонения: обратная связь и стабильность множеств: дис. кандидат физико-математических наук: 01.01.02 - Дифференциальные уравнения. Екатеринбург. 2008. 142 с.

Оглавление диссертации кандидат физико-математических наук Латушкин, Ярослав Александрович

Условные обозначения

Введение

• > *

1 Свойства' некоторых классов стратегий на примере дифференциальных игр с окружностью в качестве целевого множества

§1 Введение.

§2 Задача с перпендикулярными отрезками

§3 Ограничения в виде квадрата и отрезка.

§4 Случай совпадающих отрезков.

2 Дефект стабильности множеств в дифференциальных играх

§1 Введение.

§2 Постановка задачи конфликтного управления

§3 Стабильность множеств в пространстве позиций игры

§4 Дефект стабильности множеств в пространстве позиций игры

§5 Позиционная процедуры управления с поводырем первого игрока

§6 Оценка рассогласования между движениями и х{Ь) в момент $.

3 Критерии совпадения максимальных стабильных мостов в двух игровых задачах о сближении

§1 Введение.

§2 Постановка задач о сближении.

§3 Оператор стабильного поглощения и стабильные мосты в задаче о сближении в момент $.

§4 Оператор стабильного поглощения и стабильные мосты в задаче о сближении к моменту $.

§5 Критерии совпадения стабильных мостов для стационарных управляемых систем.

Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Введение диссертации (часть автореферата) на тему «Игровые задачи сближения-уклонения: обратная связь и стабильность множеств»

Данная работа посвящена некоторым задачам теории дифференциальных игр на конечном промежутке времени. Рассматриваются конфликтно-управляемые системы достаточно общего вида, стесненные геометрическими ограничениями на управления.

В работе изучаются в основном две игровые задачи управления: задача об уклонении и задача о сближении конфликтно-управляемой системы с компактным целевым множеством в евклидовом пространстве.

Для задач об уклонении исследуются вопросы, связанные с построением гарантирующего управления второго игрока и выяснением структуры этого управления.

Для задач о сближении исследуется свойство и-стабильности множеств, содержащихся в пространстве позиций игры, введенное в работах H.H. Красовского и А.И. Субботина [18,19,28,29].

Известно несколько основных подходов к формализации дифференциальных игр.

Одной из первых методик исследования дифференциальных игр явилась методика, предложенная Р. Айзексом в середине ХХ-ого столетия, базирующаяся на использовании так называемого «основного уравнения» теории дифференциальных игр. Монография Р. Айзекса «Дифференциальные игры», переведенная в 1968 году на русский язык, сыграла определенную роль в становлении теории дифференциальных игр в нашей стране.

В 60-е годы JI.C. Понтрягиным для решения линейных дифференциальных игр была введена конструкция альтернированного интеграла [41], выделяющая в пространстве позиций игры множество разрешимости — множество всех тех позиций, из которых разрешима задача о сближении. Концепция альтернированного интеграла получила развитие в работах M.C. Никольского, Е.С. Половинкина, Н.Х. Розова, А.И. Пономарева. В настоящее время усиленно продолжается разработка теории и методов вычисления альтернированного интеграла Л.С. Понтрягина, оставаясь в центре внимания специалистов по теории дифференциальных игр. Здесь отметим, работы A.B. Куржанского и его учеников [14,29], посвященные задачам синтеза управлений в системах с линейной структурой. В этих работах решение задач конфликтного управления достигается соединением модифицированных конструкций экстремального прицеливания H.H. Кра-совского и альтернированного интеграла Л.С. Понтрягина.

В 60-е годы ХХ-ого столетия H.H. Красовским была предложена концепция позиционной дифференциальной игры [18,19], которая затем последовательно развивалась им и его сотрудниками. В рамках этой концепции была разработана позиционная формализация дифференциальных игр, базирующаяся на понятии позиционных стратегий. Основным элементом разрешающих конструкций, ориентированных на решение нелинейных дифференциальных игр, являются стабильные мосты — множества в пространстве позиций дифференциальной игры, оканчивающиеся на целевом множестве и слабо инвариантные относительно некоторого набора дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Разрешающая позиционная стратегия в игровой задаче о сближении может быть построена как экстремальная к стабильному мосту стратегия.

В 70-е, 80-е годы ХХ-ого столетия теория дифференциальных игр развивалась особенно интенсивно; здесь отметим монографии H.H. Кра-совского [19,24], H.H. Красовского и А.И. Субботина [29], А.И. Субботина и А.Г. Ченцова [45]. Концепция экстремального прицеливания была перенесена на различные классы дифференциальных игр, в том числе Ю.С. Осиповым и A.B. Кряжимским на дифференциальные игры с запаздыванием [31,38]. В 80-е годы появилась возможность (развивающаяся вычислительная техника) разрабатывать методы и алгоритмы приближенного вычисления стабильных мостов и функции цены и реализовывать их на

ЭВМ для некоторых классов игровых задач.

В середине 70-х годов были опубликованы работы H.H. Красовско-го [20,23] по унификации в дифференциальных играх. В настоящей работе используется унификационное определение стабильности [20,23]. В середине 80-х годов А.И. Субботин предложил [44] понятие обобщенных решений уравнений Гамильтона-Якоби-Беллмана-Айзекса в теории дифференциальных игр, которое позволило ему рассмотреть функцию цены дифференциальной игры как такое решение и доказать существование и единственность ее при общих предположениях на конфликтно-управляемую систему. При этом использовались инфинитезимальные конструкции негладкого анализа. Эти конструкции также используются в настоящей работе.

Целью данной работы было теоретическое исследование некоторых задач об уклонении и о сближении с целью на конечном промежутке времени; изучение структуры разрешающих стратегий в задачах об уклонении и свойства стабильности в задачах о сближении.

Для достижения поставленной цели используются позиционный подход и конструкции, разработанные в рамках этого подхода. Основными элементами этих конструкций являются стабильные мосты, унификацион-ные схемы стабильности и процедуры управления с поводырем, наряду с которыми можно рассматривать и схемы, базирующиеся на экстремальном прицеливании.

Перейдем к краткому описанию содержания диссертации:

В теории дифференциальных игр представляют существенный интерес вопросы, относящиеся к структуре и свойствам различных классов стратегий. При этом принципиальным является вопрос [4,5,7-9,17,24,29,45, 64] о свойствах непрерывных стратегий и их связи с программными управлениями. Некоторым аспектам этой тематики посвящена первая глава диссертации. Этот вопрос подробно изучен [4, 5,17, 24, 29, 45, 64] для линейных управляемых систем в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности группы гомологий) некоторых связанных с задачей объектов, см. [9] .

Непрерывные по фазовому вектору стратегии образуют естественный класс законов управления, который удобен как в теоретических построениях, так и при работе с конкретными управляемыми объектами. Одно из хороших свойств этого класса состоит в том, что вопрос о наличии решений начальной задачи для системы с обратной связью решается с помощью хорошо известных из теории обыкновенных дифференциальных уравнений стандартных теорем существования.

Вместе с тем, имеются примеры несложных по своей постановке задач, разрешить которые в классе непрерывных стратегий невозможно в принципе. В таких задачах складывается в определенном смысле парадоксальная ситуация: обеспечить уклонение от терминального множества можно только с помощью разрывных стратегий. Гарантировать уклонение посредством непрерывных стратегий пе удается, несмотря на доступность всей текущей информации о движении объекта. Необходимость обрабатывать данные с помощью непрерывной функции обесценивает всю эту информацию.

Использование разрывных стратегий в теории дифференциальных игр есть принципиальное обстоятельство. Имеются дифференциальные игры, в которых невозможно построение непрерывной стратегии уклонения, являющейся компонентом седловой точки. Достаточно типична ситуация, в которой седловую точку необходимо строить в более широком классе стратегий, допускающем разрывы по фазовому вектору.

В работе [5] для линейно-выпуклого случая (линейная динамика и выпуклое целевое множество) рассматриваются однозначные позиционные стратегии, удовлетворяющие условиям Каратеодори или свойству непрерывности, получены глубокие теоремы о невозможности уклонения в классе таких стратегий.

В примере речь идет о преследовании безинерционной точки материальной точкой. В работе [4] в линейно-выпуклом случае исследуются возможности многозначных позиционных стратегий, обладающих свойством полунепрерывности по включению, доказаны соответствующие теоремы, рассмотрены многозначные стратегии для примера из [5]. Доказательства из [4,5] опираются на принцип неподвижной точки типа теоремы Какутани (а именно, на теорему Карлина и Боненбласта). При этом рассуждения существенно используют выпуклость терминального множества, из которой следует выпуклость рассматриваемого многозначного отображения. Теоремы этого типа для нелинейных дифференциальных игр без требования выпуклости целевого множества были получены в [9]. Работа [9] опирается на соответствующие свойства функционально-дифференциальных включений [8]. Эти свойства основаны на теореме Эйленберга и Монтгомери о неподвижной точке, в которой, в отличие от теоремы Какутани, не требуется выпуклости значений рассматриваемого многозначного отображения.

Результаты работы [9] позволили построить пример [7] обсуждаемого типа с невыпуклым терминальным множеством. Здесь приходится опираться на гомологические методы, что не всегда удобно в теории дифференциальных игр.

В первой главе диссертации рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.

Во всех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной точке, которая совпадает с началом координат

Х-^ -|— == 1*

Во всех примерах динамика задается одной и той же системой двух дифференциальных уравнений х = 2(1 - £)и + V.

Примеры различаются геометрическими ограничениями на управления игроков.

В первой из рассматриваемых игр (§2) геометрические ограничения задаются двумя перпендикулярными отрезками равной длины р = {и= (0,п2) : -1 < и2 < 1},

Я — — (^1,0) : -1 < 171 < 1} .

Во второй игре (§3) ограничения имеют вид отрезка и квадрата р = {и = (щ, и2) : -1 < Щ < 1, -1 < и2 < 1} , <Э = {г; = (гл,0): -2 < гл < 2} .

В третьей задаче (§4) используются два совпадающих отрезка р = {и={иъ 0): —1 < ггх < 1> , (5 = {г; = (г;1,0): -1<1Л<1}.

Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.

Можно непосредственно проверить, что в рассматриваемых в трех примерах дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. Также указаны способы уклонения с помощью управления по принципу обратной связи. В примерах, содержащихся в §2, §3, уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В задаче из §4 можно обеспечить уклонение с помощью простой непрерывной стратегии.

В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать уклонение посредством непрерывных стратегий. Ответ на этот вопрос оказывается отрицательным. Показано, что удовлетворяющие условиям Каратеодори стратегии с отклонением аргумента не могут обеспечить уклонение от терминального множества в первой и второй играх. При этом в доказательстве удалось обойтись без использования понятий и результатов алгебраической топологии. Рассуждения используют лишь очень хорошо известную теорему Шаудера о неподвижной точке, которая применяется в пространстве траекторий системы, снабженном равномерной нормой.

Во второй главе рассматривается конфликтно-управляемая система достаточно общего вида на конечном промежутке времени. Управления игроков, как и в предыдущей главе, стеснены геометрическими ограничениями. Исследуются вопросы, относящиеся к одному из центральных понятий теории позиционных дифференциальных игр — свойству стабильности. Свойство стабильности было введено в работах H.H. Красовского и А.И. Субботина [18,19,28].

В течение последующих десятилетий, начиная с 1970 года, имела место эволюция в описании этого свойства.

В [4,5,8,17] стабильность была представлена как свойство слабой инвариантности множества в пространстве позиций игры относительно некоторого семейства дифференциальных включений, связанных с динамикой конфликтно-управляемой системы. Эти дифференциальные включения содержат в качестве параметра векторы управлений второго игрока.

В середине 1970-х годов появляется новая формулировка стабильности и постепенно выкристаллизовывается новое направление, базирующееся на этой формулировке — унификация дифференциальных игр.

В 1971 г. в журнале "Прикладная математика и механика" была опубликована статья H.H. Красовского [22], посвященная минимаксному поглощению в играх сближения. В ней рассматривалась конфликтно-управляемая система без традиционного предположения о существовании седловой точки в так называемой маленькой игре. В предложенной формализации игры не исключалось, что выбор значения v[t] второго игрока может опираться на информацию о значении управления u[t] первого игрока. Тем самым при рассмотрении игры сближения к управлению второго игрока допускались функции V(t,u) — так называемые коитр-управления [22]. В статье было дано обоснование правила минимаксного прицеливания первого игрока в регулярном случае. Для обоснования этого правила были введены функции Vs(t,u), экстремальные на направлениях s (s — векторы сопряженного пространства к фазовому пространству). Введение этих функций явилось той точкой отсчета, с которой началось развитие методов унификации в дифференциальных играх. В появившихся чуть позже работах H.H. Красовского [20, 23] было дано определение унификацион-ных моделей, изучены их свойства и указаны перспективы применения в различных классах игровых задач динамики. Суть унификации заключается в том, что свойство стабильности выражается в терминах векторов s сопряженных переменных и гамильтониана конфликтно-управляемой системы. Исследования, проведенные в последующие годы, прояснили, что одна из важных направленностей унификации состоит в выражении свойства стабильности на языке анализа, в том числе выпуклого анализа. Унификация играет важную роль и при сравнении конфликтно-управляемых систем. Так, например, совершенно прозрачным становится тот факт, что две конфликтно- управляемые системы, имеющие одинаковые гамильтонианы, эквивалентны с точки зрения решения дифференциальной игры. Отметим, что тематика второй главы достаточно сильно близка к вопросам сравнения возможностей конфликтно-управляемых систем. Разным аспектам унификации, в том числе, вычислительным аспектам посвящены работы [2,51].

Следующий этап, связанный с представлением свойства стабильности, относится к началу 1980-х годов. К этому времени было рассмотрено несколько конкретных дифференциальных игр, в которых свойство стабильности можно было выразить, используя лишь конечное число дифференциальных включений и, кроме того, для некоторых из этих игр дифференциальные включения уже не ассоциировались к конкретным вектором управления второго игрока.

Таким образом, можно констатировать, что к началу 1980-х годов налицо имелось несколько представлений, используемых при описании свойства стабильности, столь важного в дифференциальных играх. Хотя эти представления различны по форме, они выделяют одни и те же стабильные мосты и, значит, эквивалентны по существу.

В первой половине 1980-х годов появилась довольно общая формулировка свойства стабильности [48,49], вобравшая в себя некоторые известные формулировки. В этой формулировке так же, как и в унификационной схеме [20,23], присутствует явно гамильтониан конфликтно-управляемой системы.

Вслед за этим, в середине 1980-х годов было получено инфинитези-мальное представление свойства стабильности [63], выраженное в терминах конусов Булигана или правых производных соответствующего множества. Как было показано А.И. Субботиным [65], это представление оказалось полезным не только при рассмотрении теоретических вопросов в дифференциальных играх, но и при исследовании обобщенных (минимаксных и вязкостных) решений уравнения Гамильтона-Якоби. Несколько позже инфи-нитезимальные конструкции, связанные с конусами Булигана, были применены при исследовании более общих уравнений в частных производных первого порядка.

Во второй главе данной диссертации показано, что конструкции, участвующие в инфинитезимальном определении свойства стабильности, удобно использовать и для некоторого расширения понятия стабильности. Это влечет расширение сферы применимости метода экстремального прицеливания H.H. Красовского [24,29].

Как правило, при работе с конкретной дифференциальной игрой приходится заменять стабильный мост некоторым приближением. Стабильный мост может иметь весьма изощренную форму, не допускающую удобного аналитического описания. Кроме того, погрешности неизбежны при реализации алгоритма управления на ЭВМ. Ниже приведена математическая конструкция, использующая понятие дефекта стабильности и позволяющая работать с необязательно стабильным множеством в пространстве позиций, решая при этом менее жесткую задачу о сближении — задачу о сближении с некоторой окрестностью цели. Дефект стабильности множества есть величина, оценивающая, в какой степени для используемого приближенного множества нарушается свойство стабильности.

В §2 второй главы приводится задача конфликтного управления, которой посвящены последующие параграфы второй главы.

Задана конфликтно-управляемая система, поведение которой на промежутке времени ¿о < $ < оо, описывается векторным дифференциальным уравнением х = f(t, х,и, у), х^о) = х°, и е Р, v Е (0.1)

Здесь х — га-мерный фазовый вектор из евклидового пространства К171, и — управление первого игрока, у — управление второго игрока, Р и <3 -компакты в евклидовых пространствах ВР и Ш4 соответственно.

Предполагается, что выполнены условия:

А) Вектор-функция /(¿, х, и, у) определена и непрерывна по совокупности переменных х, и, у) на множестве [¿0, х Ит х Р х ф и удовлетворяет условию: для любого компакта И С [¿сь^] х К171 найдется такое Ь = £(£)) Е (0,оо), что

1,х{1\щу)<Ьх{1)-х^ (0.2) для любых (¿, х^г\ и, у) Е Б х Р х ф, г = 1, 2.

Б) Существует такое число \1 Е (0, оо); что г,х,щу)\\<11{1 + \\х\ для любых (¿, х, и, у) Е [¿о, х Рт х Р х

Здесь ||/|| — норма вектора / в соответствующем евклидовом пространстве.

Рассматриваемая во второй главе дифференциальная игра является антагонистической и складывается из двух задач — задачи о сближении и задачи об уклонении [29]. В задаче о сближении, стоящей перед первым игроком, требуется обеспечить попадание движения Е системы (0.1) в момент д на заданный компакт М в Ят, каковы бы ни были при этом допустимые управления второго игрока. Решение задачи требуется обеспечить в классе позиционных процедур управления первого игрока.

Здесь для системы (0.1) не предполагается выполнение условия сед-ловой точки в маленькой игре.

Задача об уклонении, стоящая перед вторым игроком, заключается в том, чтобы выбрать допустимую стратегию Vе, обеспчивающую уклонение движений £Е [¿о,^] системы (0.1) в момент д от некоторой замкнутой е-окрестпости МЕ компакта М, каковы бы ни были при этом допустимые управления первого игрока.

Для сформулированной дифференциальной игры справедлива альтернатива [29]: существует такое замкнутое множество С [¿о, х Кгп — максимальный п-стабильный мост, что для всех исходных позиций (£*, £*) 6 разрешима задача о сближении, и для всех исходных позиций (£х, я*) £ ([¿о, х Я171) \И/Г° разрешима задача об уклонении.

Согласно принципу экстремального прицеливания [18, 28, 29], разрешающая процедура управления первого игрока для исходных позиций (£*,£*) £ может быть реализована как процедура управления с поводырем, нацеливающая движение х{Ь) системы (0.1) на поводыря, идущего по мосту ]¥°.

Весьма часто при построении разрешающих управлений мы имеем не мост а некоторое, может быть, не сильно отличающееся от него множество IV* С х Я771, удовлетворяющее краевому условию $) = = М, где обозначено И^) = : (г,х) <Е УУ}. Для точек (£*,£*) множества \¥* разрешима, вообще говоря, не исходная задача о сближении с М, а менее жесткая задача о сближении с некоторой е-окрестностью множества М.

Одна из основных задач, рассматриваемых во второй главе — задача аккуратной оценки £-окрестности в этой менее жесткой задаче о сближении. Эта оценка проводится в предположении о выполнении некоторых условий на множество Ш*.

§3 второй главы является вспомогательным.

В нем даются определения, связанные с центральным понятием теории позиционных дифференциальных игр — стабильностью множеств.

Исходя из условия (Б), наложенного на систему (0.1), и, считая, что задан некоторый компакт ТУ* в [¿о,^] х можем выбрать компактную область в = {(г,х): г Е [*о,0], |М < + 0))е^о)},

7 Е (0, оо) настолько большой, что в ней содержатся множества М) — {($, х) : х Е М}, ТУ* и все стабильные мосты ТУ, включая максимальный стабильный мост ТУ0.

В §3 вводится в рассмотрение семейство С, отображений я) С (^ж) Е £>, отвечающих векторам I из единичной сферы

5 = {I е Д™ : ||2|| =1}сГ (см. стр. ).

Заметим, что по определению, все множества ж), (£, ж, € -О х есть выпуклые компакты в Я171, содержащиеся в некотором достаточно большом шаре (7 = {д Е ВТ1 : ||р|| < г} в пространстве К171.

Далее вводятся в рассмотрение ц>ж*) — множество достижимости в момент £* Е (£*,#] (¿о <£*<£*<$) дифференциального включения ж € = ж*, [£*,£*];

- {ж* € Дт : ^ 0} , X* С Ят.

Приводятся определения 3.1 и 3.2 оператора стабильного поглощения 7Г в задаче о сближении и ^-стабильного моста в задаче о сближении, выраженные в терминах множеств X*), (£*;£*, X*) Е А X 2^™, Е б1, где А = {(£*, ¿*) : ¿о < < < — треугольное множество в [¿о, х [¿о, Здесь во введении мы не приводим эти определения, поскольку ниже приводятся соответствующие определения в более общей форме.

Следующее утверждение, важное в теории дифференциальных игр, перебрасывает мостик от свойства стабильности к вводимому ниже в этой главе понятию дефекта стабильности множеств в пространстве позиций. При этом в рассуждениях, сопутствующих этому переходу, принимается во внимание следующее важное утверждение из работы Х.Г. Гусейнова, А.И. Субботина и В.Н. Ушакова [63].

Теорема 0.1 Замкнутое множество W С D является и-стабилъным мостом в задаче о сближении тогда и только тогда, когда

1. W($) С М;

2. DW(t, х) П Fi(t, х)фф, te [£0, (£, ж, I) GdW х S. Здесь

DW(t,x) = \d£Rm:d= lim Wk~x; k—>oo tk — t tk,wk)} С W,tk[t при k —► oo, lim wk = x У , k—>oo J dW — граница множества W.

Для максимального -zi-стабильного моста W° условие 1 в теореме 0.1 превращается в равенство W°($) = М. Из свойств моста W0 вытекает

W°(t*) П 0{r-U)T{x*) ф 0, (t-.z*) g W0.

Здесь 07(:с*) ={ж£ Rm : ||ж — х*\\ < 7}, 7 > 0.

Последнее условие означает, что многозначное отображение L W°(t), t б [toi$] меняется в некотором смысле не очень быстро в точках (t*, а;*) £ W0, € [to,$) при увеличении t.

В §4 второй главы рассматривается множество W* С D: упомянутое в §3, удовлетворяющее условию W*($) = М.

Предполагается, что множество W*, подобно мосту Wудовлетворяет условию

В) W*(t*) П 0(i.t.)r(a;*) ф ф} (t„xt) в W*,t0 <U<t*<$.

Условие (В) представляется нам вполне естественным. Из него следует

DW*(U,x*) П G ф </>,(**, О G dW\ U G [¿о,^)

Пусть (t*,x*) G dW\ U G Величину e(t*,x*) = supp(DW*(t*,x*),Fi(t*,x*)) > 0 les назовем дефектом стабильности множества W* в точке (£*,£*)•

Можно сказать, выражаясь ие очень строго, что дефект стабильности множества W* в точке (¿*,£*) G dW*, i* G [¿сь^) выражает степень неинвариантности множества W* в точке (t*,a;*) относительно динамики конфликтно-управляемой системы в этой же точке (£*,&*).

В §4 показывается, что множество DW(t*,x*) в формуле для £(£+,£*) можно подменить более удобным — компактным множеством £>vW(i*, х*) - я*) П 3G, где 3G = {Зр : я G G}, так что ж*) = supp(DvW(U, ж*), ж*)). les

Пусть Г\ = {(i, х) : х G Rm} , A(i*) = П Г\. Величину e(i*) = sup G назовем дефектом стабильности множества W* в момент i* G [¿о,^)

Так определяемая неотрицательная функция е(£), t G [¿о, рассматривается нами как некоторая характеристика нестабильности (неинвариантности) множества VF*.

Стабильность множества ТУ* эквивалентна согласно теореме 0.1 равенству e(t) е 0 на [to, Отсюда следует, что в случае e(t) = 0 на правило экстремального прицеливания на поводыря, идущего по W*, гарантирует приведение движения x(t) системы (0.1) на М, если (U,x(Q) = (t*,x*) G W*.

Естественно ожидать, что малость функции е(1) на позволяет правилу экстремального прицеливания на поводыря, идущего по IV*, обеспечивать приведение движения х{Ь) системы (0.1)в малую ^-окрестность множества М. Также, по-видимому, £ может быть выражено через интед грал / к

Для обоснования этих положений вводятся условия на множество У/*

И фуНКЦИЮ &(£), £ € [¿0;

С) Существует неубывающая скалярная функция : (0, оо) —» [0, оо), ср*(5) I 0 при 5 | 0; такая, что

Н{х, + <5 • х*), + 6)) <5- (р*{6), е д\¥\ 5 6 (0,

Е) Функция е({) интегрируема по Римаиу на [¿Оэ^]

Здесь обозначено х* -1- 5 ■ X* = {ж* + 5 ■ / : / 6 X*} ; ъ(х* 4- <5 • X*, X*) = вир + 8 ■ /, X*), X* и X* — множества из Лт; р(х* + 5-/,Х*)= Ц^ + ^Я-^Ц. х*£Л*

В §5 вводится позиционная процедура управления с поводырем (И7'*-процедура управления с поводырем), отвечающая конечному разбиению Гп промежутка [£*,$] из [£о)$] и исходной позиции (£*,#*). Эта процедура отличается от известных позиционных процедур управления тем, что она сконструирована для множества ]¥* в пространстве позиций, не являющегося -и-стабильным мостом. Это обстоятельство вносит некоторую специфику в определение ТУ*-процедуры управления. При этом учитываются условия, наложенные на систему (0.1), в частности, условие (С). Сама процедура управления детально описана в §5.

В §6 второй главы выводится оценка рассогласования 115№Н ~ — между движением х(Ь) конфликтно-управляемой системы (0.1)и вспомогательным движением z(t), порожденными W*-процедурой управления первого игрока, отвечающей разбиению Гп. В силу упомянутых выше особенностей И^*-процедуры управления оценка выводится не традиционным путем суммирования традиционных локальных оценок квадрата рассогласования, а с использованием нестандартных рассуждений.

Она имеет вид s(tf)|| < + (Д(")^°(Д(П)))5 + {ti - ^)x(A(n})) + i=0

0.3)

Здесь (p°(5), X(S) — неотрицательные функции переменной S > 0, монотонно стремящиеся к нулю при

5 | 0; ДМ — диаметр разбиения Гп.

Переходя к пределу при п —оо, —» оо от пошаговых движении x{t) и z(t), отвечающих разбиениям Гп, к конструктивным движениям x(t), в итоге получаем д p{x{ti),M) < ■ Je(r)dr. (0.4)

Иными словами (конструктивное) движение, порожденное W*-процедурой управления с поводырем первого игрока, удовлетворяет включению x(ti) е Ме, е = ew. = еь{Р~и) • J e{r)dr. (0.5) и

Число е — £w* (0.5) мы трактуем как меру нестабильности множества

W*.

Замечание 0.1 Требование интегрируемости по Риману функции e(t) является достаточно жестким. Поскольку речь идет о верхней оценке, в определении дефекта стабильности можно заменить интеграл Римана верхним пределом интегральных сумм для функции e(í) при диаметре разбиения, стремящемся к нулю.

В третьей главе рассматривается та же самая, что и во второй главе, конфликтно-управляемая система (0.1) на конечном промежутке времени [¿о, .

Изучаются и сравниваются две игровые задачи о сближении с терминальным множеством М в фазовом пространстве [19,29]. В первой из них первому игроку требуется обеспечить с помощью позиционного управления попадание фазового вектора системы (0.1) на М в конечный момент времени -д. Во второй задаче требуется обеспечить с помощью позиционного управления попадание фазового вектора на М не позже момента Эти задачи являются наиболее важными в теории дифференциальных игр.

Постановка первой задачи — задачи о сближении с М в момент выглядит, на наш взгляд, несколько проще, чем постановка второй задачи, и поэтому естественно ожидать, что алгоритмы построения ее решения проще, чем алгоритмы построения решения второй задачи - задачи сближения с М не позже момента (или, что одно и то же, — задачи сближения с М к моменту Имеющийся опыт разработки алгоритмов подтверждает это. Один из первых вопросов, возникающих при сравнении этих двух задач — вопрос о выделении тех условий на систему (0.1) и терминальное множество М, при которых решения обеих задач совпадают. Решения в этих задачах мы идентифицируем с максимальными и-стабильными мостами \УП и в них. При выполнении условий, обеспечивающих совпадение и можно использовать для решения второй задачи алгоритмы построения решения более простой первой задачи.

При том позиционном подходе, который предложен в [19,29], максимальные и-стабильныс мосты и являются центральными элементами разрешающей конструкции. В §3 даются определение оператора стабильного поглощения и г/,-стабильного моста (определение 3.1-3.4) в задаче о сближении с М в момент д в достаточно общей форме (аксиоматической форме, базирующейся на системе условий А.1, А.2, А.З). Следует отметить, что эта форма записана на языке соответствующих дифференциальных включений, отвечающих "обратному" времени.

Приведем эти определения (см. [49]).

Пусть х Rm Э (t, re) i-> G(t,x) С Rm — непрерывное в хаусдорфовой метрике многозначное отображение; G(t, ж) — выпуклые компакты в Rm, удовлетворяющие включению

F(t,x) с G(t,x), (t,x) С В,

F(t,x) = со {f(t,x,u,v) : и £ Р, v € Q}; соА — выпуклая оболочка множества Л.

Пусть также задано некоторое множество Ф элементов ф и семейство {F^p : ф € Ф} отображений ify : (£,ж) ^ ^(£,ж) С (t,x) G Д удовлетворяющее условиям

А.1 Для любых (£, х,ф) Е -D х Ф множество х) выпукло, замкнуто в Rm и F^itj х) С <3(*,ж);

А.2 Для любых (t,x,l) Е В х 5 выполняется min hm,x)(l) = H(t,x,l);

А.З Существует такая скалярная функция uj*(5), (ш*(8) | 0 прг/ (5 j. что d(F^U,x*)iF^(t\x*)) < и* (|£* - t*| + ||ж* - ж*||) для (£*,ж*) гг (Г, ж*) из В, ф £ Ф.

Здесь = sup < I, f > — опорная функция множества F С feF d(FW,FW) =

- max J sup inf /W - /(2) II, sup inf /W - /(2) II I [/(i)eF(D/(2)eF(2) 11 /(2)eF(2)/W6F(i) "J хаусдорфово расстояние между F^ и из Rm.

Приведем определение оператора стабильного поглощения в задаче о сближении с М в момент д.

Пусть ¿о < < < Полагаем х*) — множество достижимости в момент дифференциального включения х € = ж*, ф е Ф;

0.6)

Х^*; Я*) = {х, Е В™ : Я* П Х^*; ж*) ^ 0} , здесь Я* Сй™

Определение 0.1 (см. [49]) Оператором стабильного поглощения тг в задаче о сближении с М в момент $ назовем отображение тг : Л х , заданное соотношением тг(£*;£*, Я*) = р|Х^*;Л#*); Здесь А = {(£>,£*) 6 х [¿0,#] : £* < £*}

Определение 0.2 (см. [49]) Замкнутое множество \¥ С И назовем и-стабилъным мостом в задаче о сближении с М в момент д, если

•&) С М; и) С тг (£*; Г, Ж(£*)) , (£*, Г) € Д.

Наряду с дифференциальными включениями (0.6), участвующими в определении п-стабильного моста V/ и отвечающими "прямому" времени, в третьей главе рассматриваются дифференциальные включения г] е ФФ(т, *[т]), г[т*] = Ф, (0.7) отвечающие "обратному" времени т € гДе

Полагается при этом г* = Ц + $ — £*, г* = ¿о + ^ —

Соответственно "обратному" времени, введем в рассмотрение Z■ф(т^т*,z*) — множество достижимости дифференциального включения (0.7) в момент т*.

Полагаем также

ЗДт*;т*,Я*) = (J гф(п-т\г*), Я* С Rm. z*eH*

Справедливо равенство тг(Ь; t*, Я*) = f| Г, Я*) = f| г*, Я*) (0.8) ч/'еФ ^еФ

Учитывая введенное выше "обратное" время т, множество W С [¿о, х Rm, рассматриваемое ранее в пространстве позиций (£, я), будем обозначать в терминах "обратного" времени т символом W С х и трактовать как множество в пространстве позиций r,z). При этом временные сечения в пространствах позиций (t, х) и {r,z) множеств W и W связаны равенством W(r), ¿ + r = to + ^, так что W(t0) - W(i?) и = W(t0).

Запишем определение w-стабильного моста в задаче о сближении с М в момент $ в терминах множеств достижимости т*, Я*), Я* С отвечающих "обратному" времени.

Определение 0.3 (см. [60]) Оператором стабильного поглощения 7г в задаче о сближении с М в момент $ назовем отображение 7г : А х 2Rm I—> 2Rm, заданное соотношением тг (т*;т*,Я*) = р|^(т*;т*,Я*); здесь (т*,т*) £ А, Н* С Rm.

Определение 0.4 Замкнутое множество W С. D назовем и-стабильным мостом в задаче о сближении с М в момент если

W(t0) С М; W(r*) Стг(т*;т*, W(r*)), (т*,т*)еД.

Из определения 0.4 следует, что максимальный -¿¿-стабильный мост УУП С £> в задаче о сближении с М в момент $ есть максимальное замкнутое множество из I), удовлетворяющее условиям

Уп(£о) = М;

0.9)

С 7г(т*;т*,МЯ(т-*)), (т*, Тф) € Д.

В соотношениях (0.9), характеризующих максимальный и-стабильный мост УУ0, участвуют наряду с начальным моментом ¿о пары моментов (г*, г*) Е А.

Оказывается возможным перейти от этих соотношений к характери-зации моста УУП при помощи инфинитезимальных соотношений, в которых пары (г*,г*) Е Д подменены моментами т* Е [¿(ь^) (то есть как бы слиты в один момент г*), а пары сечений (УУп(т*), УУп(т*)) — точками (т*,г*), содержащимися в УУп(т*). При этом представляется целесообразным выявить и инфинитезимальные свойства произвольного «-стабильного моста УУ, а не только моста УУ0.

Инфинитезимальные конструкции «-стабильных мостов, которые рассматриваются в §§3, 4, 5 третьей главы, тесно связаны с понятием контингентного конуса, введенным Булиганом в начале тридцатых годов предыдущего века [37]. Имеется несколько определений контингентного конуса Тп(х) непустого множества О из в точке

Определение 0.5 Множество называется контингентным конусом к & в точке х.

Здесь Вн = {Ь Е Я!* : ||Ь(| < 1}; ||Ь|( — евклидова норма вектора Ъ Е

В §3 третьей главы приводится еще одно определение тангенциального конуса Тп(х), удобное в рассуждениях, касающихся «-стабильных мостов.

Лемма 0.1 Tq(x) = П el con(ü(x]a) —x). a>0

Здесь con c¿) — x) — {Xg : A > 0, g G a) — re)} — конус в

RN: натянутый на множество (Q(x]a) — x)] el A — замыкание множества А.

С помощью этого определения тангенциального конуса становится более прозрачной связь между данными ранее неинфинитезимальными определениями u-стабильных мостов и следующим необходимым условием и-стабильности, выраженным в инфинитезимальной форме (Теорема 0.2). Предварительно введем производное множество

VW{w*) = {deRm: (М) G Ttf(w*)} отображения г i—> W(r); т G [т*, #] в точке w* — (т*, z*) G W. Здесь VV = W П {(г, z) : г G [г*, #],*<= Rm}.

Теорема 0.2 Если замкнутое мполсество W С D является и-стабилъным мостом в задаче о сближении с М в момент то необходимо выполняется z*) С f| {ТЩтф*) + Фф(т*, z*)) (0.10) ф€ Ф для всех т* G (т*, z*) G >V.

Для i¿-стабильного моста W, записанного в переменных í, ж, можно также ввести производные множества, отвечающие возрастанию и убыванию "прямого" времени t. Такие производные множества рассматривались в работах [50,52,63]. Обозначим их соответственно символами DW(t*,x*) и DW(t*,x*).

Для одного и того же ^-стабильного моста справедливы равенства для точек (£*, х*) G W ((t*,z*) = (tQ + $-t*,x*) G W)'

DW(t*,x*) = VW{t\z*), DW{t*,x*) = VW(t*,z*).

Учитывая первое равенство, запишем теорему 0.2 в виде

Теорема 0.3 Если замкнутое множество \У С. И является и-стабильным мостом в задаче о сближении с М в момент {), то необходимо, чтобы

П (Тщг^х*) — Рф(Ь*,х*)) ,

0.11)

Г,X*)

Именно в такой форме теорема 0.2 была сформулирована и доказана в работах [48,49]. Доказательство теоремы 0.2, приведенное здесь в диссертации в терминах "обратного" времени, повторяет с некоторыми изменениями доказательство из [48,49].

В §4 третьей главы определяются оператор стабильного поглощения и и-стабильный мост в задаче о сближении с М к моменту д.

Приведем эти определения.

Полагаем, что М — то же самое, что и в задаче о сближении с М в момент Пусть (£*,£*) Е А, Н С Дто

Введем обозначение мт = { м, te[t,,n [мин, г = г*.

Определение 0.6 Оператором стабильного поглощения х 6 задаче о сближении с М к моменту $ назовем отображение х : Д х 2дт I—> 2кт, заданное соотношением х(г*;Г,#)=рI и Х^^М^Н)).

Определение 0.7 Замкнутое множество IV С V назовем и-стабильным мостом в задаче о сближении с М к моменту если

С М;

W(Qcx(U;t*,W(t*)): (£*,£*) £ А.

Можно показать , что как в этой задаче о сближении, так и в задаче о сближении с М оператор стабильного поглощения определен корректно.

А именно, можно показать, что семейства {i^ : D \—> 2ят}, отвечающие различным множествам Ф и удовлетворяющие условиям А.1 — А.З, эквивалентны в том смысле, что соответствующие операторы выделяют одни и те же n-стабильные мосты W в D.

Точно так же, как в задаче о сближении с М в момент здесь можно записать определения оператора стабильного поглощения и ^-стабильного моста в терминах "обратного" времени т.

Определение 0.8 Оператором стабильного поглощения х 6 задаче о сближении с М к моменту $ назовем отображение X ■ 2дт I—> 2Rm, заданное соотношением

Х(т*;т*,#)= р| (J Z-ф (т*; г, МГ(Я));

•0еФте[т*,т,] здесь (т*,т*) € А, Я С Rm.

Определение 0.9 Замкнутое мнолсество W С D назовем и-стабильным мостом в задаче о сближении с М к моменту д, если

W(to) С М;

W(n) с X (г*; Г*, W(t*)) , (г*, г,) е А.

В §5 третьей главы изучается вопрос о выделении тех условий на систему (0.1) и множество М, при которых решения обеих задач о сближении совпадают. Основной результат третьей главы составляют критерии совпадения максимальных ^-стабильных мостов WD и W0 в задачах о сближении с М для стационарных конфликтно-управляемых систем (0.1). Приведем эти критерии. Пусть система (0.1) имеет вид dx = /(£, ж, и, v), xeRm, иеР, v £Е Q. (0.12)

Введем в рассмотрение множество WM = [to, х М С D.

Теорема 0.4 Для того, чтобы в двух задачах о сблиэюении с М, сформулированных для системы (0.12), выполнялось равенство Wn = W°, необходимо и достаточно, чтобы замкнутое мноэюество \¥м С О было и-стабилъным мостом в задаче о сближении с М в момент

Определение 0.10 Будем говорить, что максимальный и-стабильный мост в задаче о сближении с М в момент $ является монотонным, если для любых двух моментов £*, (£*,£*) € Д верно

0.13)

Теорема 0.5 Для того, чтобы в двух задачах сближении с М, сформированных для системы (0.12), выполнялось равенство — \¥°, необходимо и достаточно, чтобы мост \УП был монотонным.

Замечание 0.2 При доказательстве теорем 0.4 и 0.5 используются теорема 0.1 и теорема 0.3, сформулированная и доказанная в §3 третьей главы.

Основные результаты диссертации опубликованы в работах [10-13,34, 35,53-58,66,67].

1. Свойства некоторых классов стратегий на примере дифференциальных игр с окружностью в качестве целевого множества

В данной главе приведены примеры невырожденных дифференциальных игр на плоскости с невыпуклым терминальным множеством, показывающие, что задача уклонения в классе непрерывных по фазовому вектору стратегий может оказаться как разрешимой, так и неразрешимой в зависимости от свойств управляемой системы. При этом невырожденность игры понимается как возможность гарантировать уклонение с помощью (разрывных) законов управления по обратной связи и невозможность сделать это посредством программных управлений. Неразрешимость задачи установлена в классе стратегий с отклонением аргумента, удовлетворяющих условиям Каратеодори. Несмотря на невыпуклость терминального множества, которым служит окружность, доказательство неразрешимости удается провести с помощью достаточно простой математической техники на основе теоремы Шаудера о неподвижной точке.

§1. Введение

В теории позиционных дифференциальных игр [24, 29, 45, 64] представляет интерес вопрос о свойствах непрерывных стратегий [4,5,9,17]. Этот вопрос хорошо изучен в предположении выпуклости терминального множества. Можно ослабить это предположение до ацикличности (вырожденности групп гомологий) некоторых связанных с задачей объектов, см. [9].

В данной работе рассматриваются три примера дифференциальных игр с невыпуклым терминальным множеством, иллюстрирующие свойства непрерывных стратегий.

Во всех трех случаях игра происходит на плоскости, причем терминальным множеством является окружность с центром в начальной точке, которая совпадает с началом координат. Во всех примерах динамика задается одной и той же системой двух дифференциальных уравнений. Примеры различаются геометрическими ограничениями на управления игроков.

В первой из рассматриваемых игр геометрические ограничения задаются двумя перпендикулярными отрезками равной длины. Во второй игре геометрические ограничения имеют вид отрезка и квадрата. В третьей задаче используются два совпадающих отрезка. Поэтому третий пример фактически является одномерным, и терминальное множество можно считать двухточечным.

Можно непосредственно проверить, что в трех рассматриваемых дифференциальных играх программные управления не позволяют гарантировать уклонение от терминального множества. В работе также указаны способы уклоненияс помощью управления по принципу обратной связи. В первых двух примерах уклонение от терминального множества гарантируется с помощью одного замера фазового вектора, причем соответствующие способы управления задаются разрывными отображениями. Указаны некоторые семейства таких способов управления, зависящие от параметра. Проведена оптимизация по этому параметру. В третьей задаче можно обеспечить уклонение с помощью простой непрерывной стратегии.

В связи с этим возникает вопрос, можно ли в первых двух примерах гарантировать уклонение посредством непрерывных стратегий. Ответ на этот вопрос оказывается отрицательным. Показано, что удовлетворяющие условиям Каратеодори стратегии с отклонением аргумента не могут обеспечить уклонение от терминального множества в первой и второй играх. При этом в доказательстве удалось обойтись без использования понятий и результатов алгебраической топологии. Рассуждения используют лишь очень хорошо известную теорему Шаудера о неподвижной точке, которая применяется в пространстве траекторий системы, снабженном равномерной нормой.

Пусть движение точки описывается уравнением: х = 2(1 - +

1.1) где ж(0) = О,

1.2) £ [0,1], х £ В?. Вектора и иг? - управления двух игроков, причем должны выполняться геометрические ограничения и £ Р и г? € ф.

Терминальное множество М задано на плоскости х = (а^,^) соотношением: х\-\-х\ = 1. Таким образом, М есть окружность единичного радиуса с центром в начале координат. Положим, что функция и(Ь) измерима по Лебегу. Решение должно лежать в классе абсолютно непрерывных функций и удовлетворять дифференциальному уравнению почти всюду, то есть на множестве полной меры. Требуется так выбрать управление г?, чтобы в конечный момент времени гарантировать уклонение от терминального множества, т. е. чтобы выполнялось соотношение х{1) М при любой допустимой помехе и(Ь).

Ниже при использовании стратегий V со свойством непрерывности по фазовому вектору будем просто подставлять эти стратегии в правую часть (1.1) и рассматривать абсолютно непрерывные решения получившегося при такой подстановке дифференциального уравнения.

§2. Задача с перпендикулярными отрезками

Сначала рассмотрим управляемую систему (см. рис. 1) , в которой

Р = {и = (0,и2) : -1 <и2 <!}, {у = (г>1,0) : —1 < г>1 < 1}.

Рис. 1. Управляемая система в задаче с перпендикулярными отрезками

Убедимся в невырожденности задачи. Для этого, с одной стороны, нужно проверить, что программные управления v — vit) не позволяют гарантировать уклонение от терминального множества. С другой стороны, нужно указать обеспечивающий уклонение разрывный способ формирования v. Покажем, что программные управления v = v(t) не гарантируют уклонение от терминального множества М, даже если помеха и выбирается постоянной.

Фактически мы установим несколько большее: с помощью программных управлений нельзя обеспечить уклонение от верхней полуокружности.

Свойство 1.1 Для всякой измеримой функции V\ : [0,1] —> [—1,1] найдется константа щ G [0,1] такая, что соответствующее решение х начальной задачи (1.1), (1.2) при щ = = 0 удовлетворяет условиям х(1) G M, х2{1) > 0

Действительно, положим и2 — и2 Е [0,1] С [—1,1], и имеем т)йт)2. Тогда х2 I

Ж1(1) = j vi (т)с2т, о 1

1) = У 2(1 - т)и2(1т = и2>

0.

Поэтому

1 1 хК 1) + хЦ1) = (IУ\{т)(1т)2 + 1 - (/гл(т)<*т)!

1.

Таким образом, свойство 1.1 проверено.

Укажем способ уклонения, использующий обратную связь. При этом будет достаточно сделать лишь замер величины х2{\)

Свойство 1.2 Выберем некоторое число а Е Пусть управление г>х. строится следующим образом. При 0 < £ < | положим у\ = 1. Для | < £ < 1 возьмем — 1, если |ж2(|)| > а, и положим = —1, если

Тогда для любой измеримой функции и2 : [0,1] —» [—1,1] решение начальной задачи (1.1),(1.2) при и2 — щ = 0 и указанных У\,и2 удовлетворяет условию:

1-л/ж?(1) + ^(1)

1}. (1.3)

Отметим, что левая часть неравенства (1.3) есть расстояние от точки ж(1) до окружности М.

Доказательство. Поскольку |гг2| < 1, имеем х2{1)-х2(-)

1 I

J 2(1 — т)\и2(т)\йт < J 2(1-т)<1т =

В случае, если

1*2^)1 ><*, справедливо неравенство

Кроме того жх(1) = 1, так как в этом случае «1 = 1 при всех t из отрезка [0,1].

Поэтому у^(1) + х\{1) = у! 1 + хЦ1) > + (а - = 1 + (1.4) где - положительная величина, зависящая от а. В случае, ссли

М^)! < справедливо неравенство

N(1)1 < ы±)\ + \х2(1) - Ж2ф| < а +

При этом Ж1(1) = 0, поскольку VI = 1 для Ь Е [0, |) и г>1 = —1 для Ь Е 1]. Таким образом, *!(!) + ^ = (1.5)

Так как а < величина ^ положительна.

Итак, можно обеспечить расстояние до терминального множества не менее тт^, 2:2}, и требуемая оценка (1.3) выполняется.

Замечание 1.1 Если параметр а лежит вне интервала |) и а ф то существует такая кусочно-постоянная функция и2 : [0,1] —» [—1,1] с не более чем одной точкой разрыва, что решение начальной задачи (1.1),(1.2) прии2 = «1 = 0, соответствующее этой функции и2 = «2 СО и описанному в формулировке свойства 1.2 способу формирования удовлетворяет условию х{1) € М. Если же а = то рассматриваемый способ формирования У\ гарантирует выполнение соотношения х(1) ф. М, однако расстояние от я(1) до М может быть сколь угодно малым.

Доказательство. Рассмотрим 3 случая. а) сх < Положим и2 = и2(1) = { 3 " 2

Непосредственным интегрированием из (1.1),(1.2) находим х2{\) = х2(1) = 0. Поскольку Ж2(|) — \ > описанный в формулировке свойства 1.2 способ управления дает = 1 при всех I £ [0,1]. Поэтому £1.(1) = 1. Таким образом, 0^(1) 4-^2(1) = 1, и точка х(1) принадлежит терминальному множеству. б) а > |. Пусть и2 = 1 при всех £ е [0,1]. Тогда х2(^) — |, х2(1) = 1. Поскольку — | < а> исследуемый способ управления дает = 1 при £ £ [0, |) и VI = — 1 при £ € 1]. Получаем £1(1) = 0. Поэтому х\(1) + х\{1) = 1, и снова ж(1) е М. в) а = |. Для достаточно малого е > 0 положим и2 = 1-е при всех ¿ 6 [0,1]. Получаем х2{\) = |(1 — е), х2{1) = 1 — е. Таким образом 1Х2Ш1 = 1(1 — £) < I = а- Поэтому г>1 = 1 при £ е [0, и VI = —1 при £ £= 1]. (Подчеркнем, что здесь существенно используется то, что е отлично от нуля.) Следовательно £1(1) = 0. Поскольку 1 — у/х\(1) + £2(1) = расстояние от точки ж(1) до терминального множества М можно сделать сколь угодно малым положительным числом, взяв подходящее е. Однако это расстояние не может обратиться в нуль. Рассуждая по аналогии с доказательством свойства 1.2, можно показать, что в рассматриваемом случае траектория не может закончиться на терминальном множестве. Это завершает проверку замечания.

Замечание 1.2 Для рассматриваемой дифференциальной игры оценка (1.3) является неулучшаемой. Поэтому правая часть неравенства (1.3) есть гарантированный результат для способа назначения V, приведенного в формулировке свойства 1.2.

Доказательство. Пусть функция и2 задается следующим образом:

М*) =

0 < г < -1, I < ^ < 1

Эта функция удовлетворяет соответствующему геометрическому ограничению.) Тогда ж2(|) = ск, ж2(1) = а — Поэтому = 1 при всех £ е [0,1], а значит Ж].(1) = 1. Таким образом,

1)+^(ц = У

Поэтому достигается второе из выражений под знаком минимума в (1.3). Пусть теперь функция и2 задается следующим образом: ч2(*) =

0 < г < 1, \ < г < 1, где число е > 0 достаточно мало. В этом случае функция х{р) зависит также от величины е. Тогда — а — |е, х2(1) = а 4-1 — §£. Поскольку |ж2(^)| < а, получаем = 1 при £ е [0, и г?1 = — 1 при £ € 1], следовательно ^(1) = 0. Поэтому

1-^(1) + ®1(1) +0. Тогда 1

3 3

- - а + -е.

4 4

Устремим е 3

--а.

Таким образом, можно сколь угодно близко подойти к первому из выражений под знаком минимума в (1.3). Замечание 1.2 доказано.

Свойство 1.3 В способе управления из свойства 1.2 величину гарантированного уклонения от терминального множества молено оптимизировать путем выбора а £ (|)|)- Числу а — | соответствует максимальное значение гарантированного уклонения, равное

Доказательство. Согласно свойству 1.2, рассматриваемый способ управления обеспечивает расстояние до терминального множества М, не меньшее чем minimi, г2}, где zi = z1{a) = yi + (a - - 1, (1.6) 3

22 = 22(а) = - - а. (1.7)

См. также формулы (1.4) и (1.5).) Функции z\ — 21(a) и 22 = 2:2(0;) непрерывны для всех вещественных а. Нетрудно убедиться в существовании и единственности оптимального значения а. Действительно, на интервале | < а < | функция 21(a) строго возрастает, а функция 22(a) строго убывает, причем *(§) = о.

Значит на этом интервале лежит ровно один корень уравнения zi (а) — 22(a) (см. рис. 2). При выполнении последнего равенства функция min{2i,22} аргумента а достигает своего максимума на рассматриваемом интервале. Согласно замечанию 1.2, оценка (1.3) дает гарантированный результат.

Рис. 2. Графики функций ¿1(0:) и 22(0;)

В точке а — \ график л = г^а) касается оси а. Итак, обозначив — Z2, с помощью (1.6),(1.7) составим систему: у1+(«-^)2 =1 + *, (1.8) а + \ (1.9)

Возведем оба равенства в квадрат:

1 + а2 - \а + ^ = 1 + 2г + г2, а2 + \а + ^ =1-2г + г2. Вычитая из первого второе, получим:

1 - а = 4г . (1.10)

Решая систему линейных уравнений (1.9),(1.10), найдем оптимальные значения а = г = Свойство 1.3 доказано.

Покажем, что в рассматриваемой задаче стратегии, обладающие свойством непрерывности по фазовому вектору, не позволяют гарантировать уклонение от терминального множества. При этом будем рассматривать стратегии, содержащие отклонение аргумента и имеющие вид V — а;1(-), а^-))? где (•), а^гС") - непрерывные функции, заданные на всем отрезке [0,1]. (В частности сюда относятся стратегии с памятью.) Кроме того, полагаем, что выполняются условия Каратеодори. Таким образом, выражение v = г>(£, а^-), ЖгО)) непрерывно зависит от функций 2а(")>х2(') £ С0 при почти всяком фиксированном числе t и измеримо в смысле Лебега по t при всяких фиксированных з^-), ^(О

В частности, в этот класс попадают удовлетворяющие условиям Каратеодори позиционные стратегии V — г>(£, ^2), Где х±,Х2~ вещественные числа. Известно, что для таких стратегий абсолютно непрерывное решение начальной задачи может быть неединственным. Считаем, что стратегия гарантирует уклонение, если ни одно из движений, соответствующих этой стратегии и различным допустимым помехам, не оканчивается на терминальном множестве.

Свойство 1.4 Пусть отображение : [0,1] х С0 [—1,1] удовлетворяет условиям Каратеодори. Тогда найдется такая константа и2 £ [0,1], что начальная задача (1.1)-(1.2), где щ — 0, = г>1(£, а^-), а^-)); щ — 0, имеет хотя бы одно решение х, для которого х(1) £ М.

Замечание 1.3 Из неотрицательности щ и вида уравнения (1.1) следуетчто Х2(£) > 0 для всехЬ £ [0,1]. Поэтому удовлетворяющая условиям Каратеодори стратегия не мооюет гарантировать уклонение не только от всего терминального множества М, но и от верхней полуокружности. Аналогично устанавливается невозможность обеспечить этим способом уклонение от ниоюней полуокруэюности.

Докажем свойство 1.4. Требуется показать наличие абсолютно непрерывной функции х : [0,1] —> Я2 и числа и2 Е [0,1], удовлетворяющих соотношениям

1 = (£,£!(•), (1-11)

2 = 2(1-4)^2, (1.12) ж(0) = 0, (1.13) а*(1) + 4(1) = 1. (1.14)

Правая часть дифференциального уравнения по первой координате (1.11) совпадает с рассматриваемой стратегией. Поскольку стратегия содержит отклонение аргумента, уравнение (1.11) является функционально-дифференциальным. Краевое условие (1.14) соответствует требованию ж(1) е М.

Из (1.12),(1.13) видно, что х2(Ь) = и;(ф2, где о;(£) = ¿(2 - £). Подставляя это выражение в (1.14), находим щ = у/1 — ^(1). Исключая переменные Х2,и2 из (1.11)-(1.14), приходим к следующей начальной задаче по первой координате

1.15)

Жх(0) = 0. (1.16)

Заметим, что из-за присутствия в правой части (1.15) величины £1(1) это функционально-дифференциальное уравнение содержит опережение, даже если г>1 является стратегией с памятью или позиционной. Опережение возникло из-за краевого условия (1.14).

Остается установить разрешимость начальной задачи (1.15),(1.16), откуда будет следовать требуемое существование х, и2.

Обозначим через <5 семейство всех функций 2 : [0,1] —> [—1,1], удовлетворяющих условию Липшица с константой 1. По теореме Арцела-Асколи множество 5 есть компакт в банаховом пространстве непрерывных функций. При этом множество S выпукло. Для z(-) £ <S, t G [0,1] рассмотрим следующий нелинейный интегральный оператор t

F(z(-))(t) = J Vi{t,z{-)M-W 0

Всякая неподвижная точка этого оператора является абсолютно непрерывным решением начальной задачи (1.15),(1.16). При любой фиксированной z(-) функция F(z(-))(t) аргумента t удовлетворяет условию Липшица с константой 1, поскольку — 1 < Vi < 1. Кроме того, ,F(2:(-))(0) = 0. Неравенство — ^ — 1 справедливо для всех z{-) £ S, t £ [0,1]. Отображение F переводит выпуклый компакт S в себя. Оно является непрерывным относительно равномерной нормы пространства непрерывных функций. По теореме Шаудера отображение F имеет в множестве S хотя бы одну неподвижную точку. Таким образом, начальная задача (1.15),(1.16) разрешима. Свойство доказано.

Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК

Список литературы диссертационного исследования кандидат физико-математических наук Латушкин, Ярослав Александрович, 2008 год

1. Айзеке Р. Дифференциальные игры. "Мир", 1967.

2. Алексейчик М.И. Дальнейшая формализация основных элементов антагонистической дифференциальной игры // Мат. анализ и его прил. Ростов Н/Д: Ростов, гос. ун-т., 1975. Т. 7. С. 191-199.

3. Алгоритмы и программы решения линейных дифференциальных игр // Субботин А.И., Пацко B.C. ред. Свердловск: ИММ УНЦ АН СССР, 1984. 295 с.

4. Барабанова H.H., Субботин А.И. О классах стратегий в дифференциальных играх уклонения от встречи // Прикл. математика и механика. 1971. Т. 35. вып. 3. С. 385-392.

5. Барабанова H.H., Субботин А.И. О непрерывных стратегиях уклонения в игровых задачах о встрече движений // Прикл. математика и механика. 1970. Т. 34. вып. 5. С. 796-803.

6. Благодатских В.И., Филиппов А.Ф. Дифференциальные вклдючения и оптимальное управление // Тр. Мат. ин-та им. Стеклова. 1985. Т. 169. С. 194-252.

7. Брыкалов С.А. Две дифференциальные игры с невыпуклыми целевыми множествами // Изв. РАН. Теория и системы управления. 2002. №. 3. С. 94-101.

8. Брыкалов С.А. Конфликтно управляемые системы и дифференциальные включения // Дифференц. уравнения. 2002. Т. 38. № 3. С. 298-304.

9. Брыкалов С.А. Непрерывные стратегии в дифференциальных играх // Дифференц. уравнения. 2002. Т. 38. № 4. С. 453-459.

10. Брыкалов С. А., Латушкин Я. А. О непрерывных стратегиях уклонения от невыпуклого множества в условиях неопределенности // Автоматика и телемеханика № 116 2007, С. 122-134.

11. Брыкалов С.А., Латушкин Я.А. Об одной игровой задаче уклонения от окружности // Теория управления и обобщенные решения уравнений Гамильтона-Якоби (труды международного семинара) Том 1, стр. 197204 Изд-во УрГУ, Екатеринбург, 2006.

12. Дарьин А.Н. Синтез управлений при двойных и неоднородных ограничениях // автореферат диссертации на соискание ученой степени кандидата физ.-мат. наук. 01.01.02 дифференциальные уравнения. МГУ им. М.В. Ломоносова. Москва. 2004 г. 15с.

13. Демьянов В.Ф., Рубинов A.M. Основы негладкого анализа и квазидифференциальное исчисление. М.: Наука, 1990. 432 с.

14. Красовский H.H. Дифференциальные игры. Аппроксимационные и формальные модели // Мат. сб. 1978. Т. 107. № 4. С. 541-571.

15. Красовский H.H. Игровые задачи динамики. I// Изв. АН СССР. Техн. кибернетика. 1969. № 5. С. 3-12.

16. Красовский H.H. Игровые задачи о встрече движений. М.: Наука, 1970. 420 с.

17. Красовский H.H. К задаче унификации дифференциальных игр // Докл. АН СССР. 1976. Т. 226, № 6. С. 1260-1263.

18. Красовский H.H. К теории дифференциальных игр.// Прикл. математика и механика. 1970. Т. 34, вып. 2. С. 197-207.

19. Красовский H.H. Минимаксное поглощение в игре сближения // Прикл. математика и механика. 1971. Т. 35, вып. 6. С. 945-951.

20. Красовский H.H. Унификация дифференциальных игр // Труды Института математики и механики УНЦ АН СССР. Свердловск, 1977. Вып. 24: Игровые задачи управления. С 32-45.

21. Красовский H.H. Управление динамической системой. М.: Наука, 1985.

22. Красовский H.H., Осипов Ю.С. К теории дифференциальных игр с неполной информацией.// Докл. АН СССР. 1974. Т. 215, № 4. С. 780783.

23. Красовский Н. Я. Субботин А.И. Аппроксимация в дифференциальных играх // Прикл. математика и механика. 1973. Т. 37, вып. 2. С. 197204.

24. Красовский Н. Н., Субботин А.И. Дифференциальная игра наведения // Дифференц. уравнения. 1970. Т. 6, № 4. С. 579-591.

25. Красовский Н. Н., Субботин А.И. О структуре дифференциальных игр // Докл. АН СССР. 1969. Т. 190, № 3. С. 523-526.

26. Красовский H. H., Субботин AM. Позиционные дифференциальные игры. M.: Наука, 1974. 456 с.

27. Красовский H. Н., Субботин А.И. Смешанное управление в дифференциальной игре. // Докл. АН СССР. 1969. Т. 188, № 4. С. 745-747.

28. Кряжимский A.B., Осипов Ю.С. Дифференциально-разностная игра сближения с функциональным целевым множеством. // Прикл. математика и механика. 1973. Т. 37, вып. 1. С. 3-13.

29. Куржанский А.Б. Альтернированный интеграл Понтрягина в теории синтеза управлений //Т. Мат. Ин-та им. Стеклова. 1999. Т. 224. С. 234-248.

30. Куржанский A.B. О синтезе управлений по результатам измерений // Прикл. математика и механика.-2004.-Т.68, Вып.4. С.547-563.

31. Латушкин Я. А. О задачах уклонения от невыпуклого множества // Проблемы теоретической и прикладной математики (Труды 36-ой молодежной конференции), Институт математики и механики, стр. 278283, Екатеринбург, 2005.

32. Латушкин Я.А., Брыкалов С.А. Некоторые свойства непрерывных стратегий конфликтного уклонения от иевыпуклого множества // Тезисы международного научного семинара "Устойчивость, управление и моделирование динамических систем стр.53, Екатеринбург, 2006.

33. Никольский М.С. Об альтернированном интеграле JI.C. Понтрягина // Мат. сб. 1981. Т. 116, № 1. С. 136-144.

34. Обен Ж.-П., Экланд И. Прикладной нелинейный анализ. М.: Мир, 1988. 512 с.

35. Осипов Ю.С. Дифференциальные игры для систем с последействием // Доклады АН СССР. 1971. Т. 196. №4. С. 779-782.

36. Панасюк А.П. Уравнения динамики множеств достижимости в задачах оптимизации и управления в условиях неопределенности // Прикл. математика и механика. 1986. Т. 50, Вып. 4. С. 531-543.

37. Понтрягин Л.С. О линейных дифференциальных играх. I // Докл. АН СССР, 1967. Т. 174, № 6. С. 1278-1280.

38. Понтрягин Л.С. О линейных дифференциальных играх. II // Докл. АН СССР, 1967. Т. 175, № 4. С. 764-766.

39. Пшеничный Б.Н. Структура дифференциальных игр // Докл. АН СССР. 1969. Т. 84, № 2. С 285-287.

40. Субботин АЖ. Минимаксные неравенства и уравнения Гамильтона — Якоби. М.:Наука, 1991. 216 с.

41. Субботин АЖ. Обобщение основного уравнения теории дифференциальных игр // Доклады АН СССР. 1980. Т. 254, №2. С. 293-297.

42. Субботин А.И., Ченцов А.Г. Оптимизация гарантии в задачах управления // М.: Наука, 1981. 288 с.

43. Субботина H.H., Субботин А.И. Игровая задача управления при неполной информации // Изв. АН СССР. Техн. кибернетика. 1977, № 5. С. 1423.

44. Тарасьев A.M., Ушаков В.Н. Алгоритмы построения стабильного моста в линейной задаче сближения с выпуклой целью / / Исслед. задач минимаксного упр. Свердловск: ИММ УНЦ АН СССР, 1985. С. 82-90.

45. Тарасьев A.M., Ушаков В.Н. О построении стабильных мостов в минимаксной игре сближения-уклонения. Свердловск, 1983. 61 с. Деп. в ВИНИТИ. № 2454-83.

46. Тарасьев A.M., Ушаков В.Н., Хрипунов А.П. Об одном вычислительном алгоритме решения игровых задач управления// Прикл. математика и механика. 1987. Т. 51, вып. 2. С. 216-222.

47. Ушаков В.Н. К вопросу стабильности в дифференциальных играх // Позиционное упр. с гарантированным результатом / УрО АН СССР. Свердловск, 1988. С. 101-109.

48. Ушаков В.Н. К задаче построения стабильных мостов в дифференциальной игре сближения—уклонения // Изв. АН СССР. Техн. кибернетика. 1980, № 4. С. 29-36.

49. Ушаков В.Н. Процедуры построения стабильных мое тов в дифференциальных играх.: Дис. д-ра физ.-мат. наук: 01.01.02. Свердловск, 1991. 308 с. / Ин-т математики и механики УрО АН СССР.

50. Ушаков В.Н.,Брыкалов С.А., Латушкин Я.А. Дефект стабильности множеств в дифференциальных играх /Институт математики и механики Уральского отделения РАН. Екатеринбург, 2007. - 30 е., pul, библ. 26. - Рус. - Деп. в ВИНИТИ 18.09.2007, № 881-В2007.

51. Ушаков В.Н., Врыкалов С.А., Латушкин Я.А. Использование дефекта стабильности для формирования управления в дифференциальной игре // Вестник Удмуртского Университета. Ижевск, Вып.2, 2008, С.155-162.

52. Ушаков В.Н., Латушкин Я.А. Дефект стабильности множеств в игровых задачах управления // Труды Института математики и механики УрО РАН, Екатеринбург, 2006, том 12 №2, с. 178-194.

53. Ушаков В.Н., Латушкин Я.А. Критерии совпадения максимальных стабильных мостов в двух игровых задачах о сближении // Труды математического института им. В.А. Стеклова, 2008, Т. 262, С. 253-271.

54. Ушаков В.Н., Латушкин Я.А. Критерии совпадения стабильных мостов в двух задачах о сближении //Сб. тезисов международной конференции "Дифференциальные уравнения и смежные вопросы"им. И.Г. Петровского, Москва, 2007, С. 325.

55. Ушаков В.Н., Латушкин Я.А., Лебедев П. Д. "Критерии совпадения двух стабильных мостов в двух задачах о сближении" // Тезисы докладов Международной конференции "Дифференциальные уравнения и топология". МГУ им. Ломоносова, С. 411-412. Москва, 2008.

56. Ушаков В.Н., Хрипунов А.П. О приближенном построении решений в игровых задачах управления // Прикл. математика и механика.-1997.-Т.61, №.3. С.413-421.

57. Хрипунов А.П. Построение областей достижимости и стабильных мостов в нелинейных задачах управления.: Дис. к-та физ.-мат. наук: 01.01.02. Екатеринбург, 1992. 140с. / Ин-т математики и механики УрО РАН.

58. Ченцов А.Г. Об игровой задаче сближения в заданный момент времени // Мат. сб. 1976. Т. 99, № 3. С. 394-420.

59. Ченцов А. Г. Итерационная программная конструкция для дифференциальной игры с фиксированным моментом окончания // Докл. АН СССР. 1978. Т. 240, № 1. С. 796-800.

60. Guseinov E.G., Subbotin A.I., and Ushakov V.N Derivatives for Multivalued Mappings with Applications to Game-Theoretical Problems of Control // Problems Control Inform. Theory. 1985. Vol 14, no 6. P. 405-419.

61. Krasovskii N.N., Subbotin A.I. Game-theoretical control problems. New York: Springer-Verlag, 1987.

62. Subbotin A.I. Generalized Solutions of First-Order PDEs. The Dynamical Optimization Perspective. Boston: Birkhauser. 1995. 312 P. (System & Control: Foundation & Appl.)

63. Ushakov V.N., Brykalov S.A., Latushkin Y.A. Stable and unstable sets in problems of conflict control. Functional Differential Equations. 2008. V.15. No.3-4. PP.309-338.

64. Vladimir N. Ushakov, Sergey A. Brykalov, Yaroslav A. Latushkin The Notion of Stability Defect in Game Control Problems // Proceedings of the 11th WSEAS International Conference on Applied Mathematics, Dallas, USA, 2007, PP. 86-91.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.