Об одном методе преследования в теории дифференциальных игр тема диссертации и автореферата по ВАК РФ 01.01.02, кандидат физико-математических наук Карабаев, Эргашали Ортыкович
- Специальность ВАК РФ01.01.02
- Количество страниц 108
Оглавление диссертации кандидат физико-математических наук Карабаев, Эргашали Ортыкович
Введение.
Глава I. О методах преследования в дифференциальных играх.
§1. Постановка задачи и предварительные построенияЛб
§2. Об одном способе построения управления преследователя для одного класса линейных дифференциальных игр.
§3. Об одном обобщений третьего метода преследования в линейных дифференциальных играх
§4. Задача преследования для одного класса квазилинейных дифференциальных игр.
Г л а в а II. О преследовании по позиции в линейных дифференциальных играх.
§1. Постановка задачи и её решение в случае третьего метода.
§2. Обобщенные управления для задачи преследования в линейных дифференциальных играх
§3. Об улучшении времени преследования в линейных дифференциальных играх.
Г л а в а Ш . Квазилинейная задача преследования несколькими управляемыми объектами одного убегающего объекта.
Рекомендованный список диссертаций по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
О линейных дифференциальных и дискретных играх многих лиц с интегральными ограничениями1984 год, кандидат физико-математических наук Хамдамов, Алишер Ахмедович
Конфликтно управляемые процессы со многими участниками и дополнительными ограничениями2007 год, доктор физико-математических наук Петров, Николай Никандрович
Численные методы решения задач группового преследования2008 год, кандидат физико-математических наук Варламова, Анастасия Гаврииловна
Построение функции цены в задачах сближения уклонения нескольких преследователей с одним убегающим1998 год, кандидат физико-математических наук Синицын, Александр Владимирович
Некоторые задачи уклонения от многих преследователей2007 год, кандидат физико-математических наук Чиркова, Любовь Сергеевна
Введение диссертации (часть автореферата) на тему «Об одном методе преследования в теории дифференциальных игр»
I. В настоящей диссертации исследуются некоторые задачи теории линейных и квазилинейных дифференциальных игр преследования.
Теория дифференциальных игр - новое направление математической теории управления, она тесно связана с математической теорией оптимальных процессов, теорией игр, вариационным исчислением и теорией дифференциальных уравнений. Проблемы теории дифференциальных игр имеют своим источником такие актуальние прикладные задачи, как преследование одного управляемого объекта другим, приведение управляемого объекта в заданное состояние при неизвестных заранее возмущающих силах, задачи военного характера, задачи из экономики и др. Актуальность этих задач и большой теоретической интерес, который они представляют, обусловили быстрое развитие теории дифференциальных игр. Предметом теории дифференциальных игр явля.ется изучение управления объектами в конфликтных случаях, движения которых описываются дифференциальными уравнениями.
Первые работы теории дифференциальных игр проявились в начале 50-х годов. Начиная с этого времени дифференциальные игры являются основным предметом исследований многих советских и зарубежных ученых. Одними из первых серезных исследований являются работы американского математика Р.Айзекса, который и ввел термин "Дифференциальная игра". Он в своей монографии/ I / развил оригинальный метод решения весьма общих дифферент циальных игр, рассмотрел целый ряд прикладных задач и получил интересные результаты. В настоящее время многие специалисты занимаются развитием и применением метода Р.Айзекса ( см., например работы / 2,8,13,28,36,40-44 /. Среди зарубежных исследований следует также отметить работы А.Фридмана / 33 / , У.Флеминга У 32 У и др.
Фундаментальный вклад в теорию дифференциальных игр внесли советские ученые, возглавляемые академиками Л.С.Понтрягиным и Н.Н.Красовским. В работрах Л.С.Понтрягина / 21 /, Н.Н.Красовского / 12,13 /, Е.Ф.Мищенко / 17,18 /, Б.Н.Пшеничного I 22/, Р.В.Гам-грелидзе и Г.Л.Хараташвили / 41 /, Л.А.Петросяна /20/ дифференциальные игры рассмотрены как конфликтно-управляемые системы и предложены различные их формализации.
В / 21 а),б / Л.С.Понтрягиным получены достаточные условия для возможности завершения преследования в линейных дифференциальных играх. В / 21 а / использован формализм принципа максимума - одного из центральных методов математической теории управления.
Упрощение результатов / 21 б /, полученное Л.С.Понтрягиным и Е.Ф.Мищенко / 17 /, в конечном счете привело к созданию Л.С.Понтрягиным первого и второго ( прямых ) методов решения задачи преследования для линейных дифференциальных игр / 21 в,г /.
В исследованиях Н.Н.Красовского / 12 /Д.И.Субботина /29/, А.Г.Ченцова / 34 / и их учеников и сотрудников-изучаются позиционные дифференциальные игры, для которых сформулированы задачи сближения и уклонения, предложены реализуемые на ЭВМ процедуры управления.
В / 22 а,б / Б.Н.Пшеничным рассмотрены нелинейные дифференциальные игры общего вида, для которых им предложена процедура, определяющая необходимые и достаточные условия разрешимости задачи преследования. Интересные результаты получены в 22 в / Б.Н.Пшеничным при исследовании линейных дифференциальных игр.
В продолжение первого и второго метода Л.С.Понтрягина в / 24 а / Н.Сатимовым предложен новый метод преследования в линейных дифференциальных играх. Этот метод, который мы называем третьим методом, подробно исследуется в настоящей диссертации.
В теории дифференциальных игр более общей является ситуация, когда в игре принимают участие несколько преследователей и несколько убегающих. В этом случае дифференциальная игра называется дифференциальной игрой многих лиц. Такие игры охватывают многие задачи,например,задачу убегания одного управляемого объекта от группы преследователей,задачу избежания столкновения с несколькими препятствиями и др. Задаче преследования в дифференциальных играх многих лиц посвящены работы Н.Л.Григоренко /б /, Б.Н.Пшеничного, А.И.Чикрия и И.С.Раппопорта / 22 а,23,3б,37 /, Н.Сатимова и А.Азамова / 26 /, Н.Сатимова и М.Ш.Маматова / 27 /, С.И.Тарлинского / 30 / и др.
В нашей диссертации мы следуем формализации дифференциальных игр, предложенной Л.С.Понтрягиным / 21 /. Поэтому кратко поясним ее на задаче преследования.
Пусть движения преследующего объекта X и убегающего объекта описываются дифференциальными уравнениями
X = f(x,tD, < о-1 ) где X € И и £ - фазовые векторы, Г - п - мерное евклидово пространство, U и параметры управления преследователя и убегающего соответственно. Обозначим через
Xi и геометрические положения объектов jT и j/ соответственно, а через и остальные их координаты.
Тогда имеем • Г (I)
Процесс преследования заканчивается в тот момент времени, когда впервые выполнено равенство
0.2) или неравенство llXi-tylui, (о.з) где £ - фиксированное положительное число. В первом случае (( 0.2 )) говорят о точной поимке, во втором случае (( 0.3 )) -об £ поимке.
В игре ( 0.1 ) управления II- tt(-fc) и 1?= удовлетворяют различным ограничениям. Например, они могут удовлетворять геометрическим ограничениям: г?ев , иеР, (о.4) где G 1& Р - некоторые подмножества в пространствах Т)Р и К или интегральным ограничениям ос оо r9 (о.з) о о где р и О1 - некоторые положительные числа.
В работах М.С.Никольского / 19 а,б /, А.Я.Азимова/3 а,б/, В.Н.Ушакова / ПММ, 36, №5, 1972, с. 15 - 23. /, А.З.Фазылова / 31 / и др. рассмотрены интегральные ограничения и другие виды ограничений.
В настоящей диссертации управляющие параметры удовлетвор
- 7 яют геометрическим ограничениям ( 0.4 )*
Пуоть (4(ОС,и) \
Ясно, что в этом случае уравнения ( 0.1 ) записываются в виде одного уравнения о.б) где TvG $ 9 tl и удовлетворяют условиям ( 0.4 ), V и G - непустые подмножества пространств И и соответственно. Соотношение ( 0.2 ) или ( 0.3 ) выделяет в фазовом пространстве И некоторое множество, обычно называемое терминальным множеством игры ( О.б ) и обозначаемое буквой Ж >
В работах Л.С.Понтрягина / 21 / и его последователей дифференциальная игра рассматривается отдельно с тоски зрения преследующего и отдельно с точки зрения убегающего. В нашей диссертации изучается лишь задача преследования, сформулированная в работах / б, 13, 21, 24 /. При решении этой задачи мы будем, отождествлять себя с преследователем. Тогда управляющий параметр USР находится в нашем распоряжении. Таким образом, в каждый момент времени ^ О мы должны конструировать значение функции U(ir) управления 1С 6 V * зная уравнения ( О.б ), значения функций %($>), ^S^ Ь , и ^(S) , ir ^ 9 А-6 + в^ так, что соответствующая управлениям U(i:) и т) траектория уравнения ( О.б ), исходящая из начального состояния попадает на Jt за время, не превосходящее тем • Число называется временем преследования.
Пусть y(-t) = [i-6,i] и I(i)-[i,t*£],i>0,£фиксированное неотрицательное число. Тогда вторая часть используемой для построения IL = И (t) информации запишется в виде ^^/ j-^;' Отображения У&) и Id) считаются заданными, т.е. они входят перечень правил игры. Из этих соображений следует считать, что дифференциальная игра преследования задана, если заданы: а) фазовое пространство игры ; б) области управления параметров U и ; в) функция F ; г) терминальное множество JH ; д) отображения У а) и е) классы допустимых управлений.
Дифференциальная игра ( 0.6 ) называется линейной дифференциальной игрой в случае, когда где С постоянная матрица, (X - некоторая точка из Ц ; квазилинейной дифференциальной игрой в случае, когда где Р * Q —> Л - непрерывное ограниченное отображение.
При изучении некоторых классов квазилинейных ( следовательно, и линейных ) дифференциальных игр завершение преследования понимается в следующем смысле.
ОПРЕДЕЛЕНИЕ 0.1. Пусть €Ц \ М.
Будем говорить,что из точки %о возможно завершение преследования за время Т(%0), если можно построить борелевски измеримую функцию и* и
7Y&?)> такую, что для любой измеримой функции решение, ( траектория ) %?
041 fa), уравнения попадает на
Ж , х.ъЛШЯ для некоторого f в (о, ту 7. В некоторых параграфах настоящей диссертации завершение преследования понимается в несколько другом смысле. А именно , под стратегией ( управлением ) преследователя понимается совокупность
Т,и?, НО*-'-)}, гд разбиение отрезка [О, Т], иО>—)--ЯП*№>Т]*в V > причем 21(^*9*борелевски измеримая функция при каждом фиксированном ДГ . Пусть !/(')' [О, е°) Q- произвольная измеримая функция. Каждой точке % & $ » стратегии преследователя и функции ставится в соответствие траектория XfaZ^^Zft0,** fr^U (-*-,-)} ,&(.)}) , фазовой точки Зг следующим образом. Сужение траектории » £ Т, - решение траектория ) уравнения сужение j[-t,траектории тб^Х ) 7 Т1 , решение; уравнения и т.д.,
Ьк 1 Т] ~ Решение уравнения
4>(U(%ttK^,%0),i, V-Ш), t/a)),
ОПРЕДЕЛЕНИЕ 0.2. Пусть € JL Будем говорить, что из точки %о возможно завершение преследования за время I если существует стратегия преследователя такая, что для произвольной измеримой функции Q траектория попадает на множество Л , т.е. для некоторого
Связб между определениями 0.1 и 0.2 очевидна.: если можно из точки %о завершить преследование в смысле определения 0.1, то из этой точки возможно завершение преследования и в смысле определения 0.2 ( достаточно положить Ю— {},
Уi^) ); разумеется, что обратное утверждение неверно.
Под задачей преследования понимают задачу нахождения начальных точек, из которых возможно завершение преследования в смысле того или иного определения.
2. В этом, пункте кратко изложим основные результаты диссертации.
Диссертация состоит из введения, трех глав и списка литературы.
Похожие диссертационные работы по специальности «Дифференциальные уравнения», 01.01.02 шифр ВАК
Нестационарная задача группового преследования2012 год, кандидат физико-математических наук Банников, Александр Сергеевич
Конструирование решений в задачах конфликтного взаимодействия управляемых объектов2020 год, кандидат наук Щелчков Кирилл Александрович
Вопросы общей теории функционально-дифференциальных уравнений1984 год, доктор физико-математических наук Максимов, Владимир Петрович
Исследование математических моделей задач конфликтного взаимодействия групп управляемых объектов2024 год, доктор наук Благодатских Александр Иванович
Конфликтно управляемые процессы при взаимодействии групп управляемых объектов2005 год, кандидат физико-математических наук Благодатских, Александр Иванович
Заключение диссертации по теме «Дифференциальные уравнения», Карабаев, Эргашали Ортыкович
включение с &(Я>), ( 2.17) тогда в силу ( 2.15 ) - ( 2.17 ) включение ( 2.14 ) перепишется л; в виде Шй) с s а о). Из этого включения следует непрерывность Vf(-t) снизу. С другой стороны, из выпуклости и компактности множеств
М1 , Р и (л следует ограV ниченность и замкнутность множества ( см. леммы 2-8, стр. 30 - 33 из работы / 19 г / ). Тогда в силу работы / 5 /
Л/ см. теорему 5, стр. 63 ) множество Wft) полунепрерывно сверху ( см. также / 4 /, леммы 1,2, стр. 4,5 ). Тем самым не
А/ прерывность
WW доказана. Пусть S=5(1)CA, с (у, шг0-1))1. (2.18)
УТВЕРЖДЕНИЕ 2.4. Если , то максимум в 2.18 ) достигается на единственном векторе Ю •
Доказательство. Предположим от противного, т.е. имеются М И ^ такие, что 0 и т, ё(Ро е см, -wfrfo -1)л fcft,йа (<рЛ,жж-/;;.
Пусть
- 73
Тогда fi'/i ft, Ю= , £ <Г?о ~t) % J>
-Сс^^ШГ,^))- ССУя^Го-*)).
Так как , 1Гf?o-t)) 4 т.е. ^ sr^myc гижго-т
Последнее неравенство противоречит ( 2.18 ). Если же НФа II'= О , то легко проверить, что {-б^ЗО * Полученное противоречие доказывет единственность лП-УТВЕРЖДЕНИЕ 2.5. Пусть Тогда вектор функция в окрестности точки непрерывна по
-t и % .
Доказательства этого утверждения следует из работы / 13 а / ( см. стр. 584 ).
Теперь определим управление первого игрока следующим образом
I г ■> если f , 2Isn
В силу утверждения 2.1 множество (У^л/ выпукло и
- 74 Тогда в силу теоремы из работы / 5 / см. стр. 63 ) Uполунепрерывно сверху относительно включения.по совокупности а, #). Так как ( см. ( 2.4 ) и ( 2.19 ) ), то по определению 2.1 функция
U а, ю является допустимым управлением первого игрока.
ТЕОРЕМА. 2.2. Если to удовлетворяет условию ( 2.5 ), то управление UCi^) (( 2.19 )) гарантирует завершение игры за время 1о .
Доказательство. Пусть %* - некоторая точка из Т^ Обозначим через решение уравнения ( 2.1 ), соответствующего паре управлений Q и удовлетворяющее условию Z16), % *-> где - произвольное число из
Го> Го-а],
5 - определяется ниже. Пусть Ь t произвольная суммируемая функция со значениями из множества & . Рассмотрим решение
И[ш]>1?С')) уравнения ( 2.1 ), где
UmeUM)* произвольная суммируемая функция. Покажем, что вдоль траектории % ft], £ в, функция %ftJ) - lift], + £ , -убывающая.
Пусть 7гС1*]>0 , тогда существует положительное число
5 такое, что ftli:7 при всех в силу утверждения 2.4 существует единственная непрерывеая функция
1= P&Jf/t]), такая, что it (i7= J)
- C(V[t7, . ( 2.20 )
С другой стороны, по смыслу 'km существует точка такая, что 6 € - ) „ II £> (to-1)%*°- € сс, - т у/ ■
В силу утверждения 2.2 существует управление
U(t)6P9 такого, что с помощью управлений и Z^{-&)■> t* точка Шс е переводится в точку £(f0- € где U0)> .
Ясно, что тогда имеет место неравенство
Так как то из ( 2.20 ) получим
-ь^е, -t*
- (V£t*+eiy 6(£o-t)%> fЪ(t*
-t* т.е.
J (V&r+sh (u&y uf6])) ae . (2.21)
Ф/^г], (гуuffl)) ^ u. ( 2.22)
Обозначим через do минимальное из тех бС , для которых имеет место ( 2.22 ). Ясно, что в силу ( 2.4 ) имеет место неравенство Uo^O , тогда неравенство ( 2.21 ) имеет вид
Так как УМ и
Так как непрерывны на компактное множество, то существует такое число , что непрерывны на h£i*+ei £it,£i*i+ dot т.е.
Из произвольности следует справедливость утверждения.
Пусть преследователь применяет произвольное суммируемое управление
UI41 ИЗ U> 0^-6 4 "to . Поскольку ft[Ohh,(09%o)£ О ( см. ( 2.5 ) и ( 2.18 ) ), то для любого 4 € £О, ?ol И % £41= % ft, 0> %<?9 u[-h W) ) имеет место неравенство .Тогда из ( 2.18 ) получим, что
УМ, бсго-тм)^ c(№J,wfo-t)), о^-гг^о, т.е. € ,
Вчастности (0)%[й1 <Г Шо) или it%ff°] <? Mi. В силу ( 1.15 ) £ Jit • Теорема доказана.
II. Из ( 2.19 ) следует, что урравление W^P зависит от фазового состояния т.е. lift1=
Тогда уравнение ( 2.1 ) является нелинейным относительно . Это обстоятельство затрудняет решение поставленной задачи. Поэтому в этом пункте в каждом сегменте [4it4i+il* > -bo^O? , строится допустимое управление преследователя, зависящее только от фазового состояния С41гКё.) и переменного -Ь € £4i, 4i+il
Пусть сегмент £0, То! разделен точками на Л/ равных частей I4ly4t+ll, где ^as-Po.
Вычисляем величины = Xi), # = Hi)
Пусть
TJltth {и€Р'- (9i, ё(Го^)Р)} > С 2-23 > р , если
Uift), если 2.24 )
Ue(t)=\
Ui°(*)9 если О^ г^Л если
2.25) если
Выше мы доказали, что является допустимым управление . Аналогично доказывается, что и - допустимое управление.
Через обозначим о окрестность множества Л, т.е. Имеет место следующая теорема.
ТЕОРЕМА 2.3. Пусть , С^б^Ро произвольное суммируемое управление убегающего. Тогда для любого 0 можно указать такое б>0 , что управление XJg (( 2.25 )) переводит точку в М-Р
Доказательство. Пусть / ( 2,26 } о
Теперь докажем, что для любого можно указать такое £>Оу что для любого %e(t)€ (')>£)> Odzt^Po 1 существует такое, что
-max // $ . ( 2.27)
Предположим от противного. Тогда существует последовательность ц т О^-б^^о такая, что при оо > ® и шах И 2.28)
О ^ & с •> J. ~ % при любом где определяется соотношением ( 2.19 ). С другой стороны, из С 2.23 ) 2.25 ) следует, что %(TJejO)* - выпуклое компактное множества из К- . Тогда из последовательности I %• Ш можно выделить подпоследовательность сходящуюся к функции е%( U(■>%), +), от Я,.
Действительно,из ( 2.4 ) и ( 2.23 ) следует, что
UiG)- ЪуШ»), ti^Ui+ej.
Ясно, что при J00 имеем ° > см. ( 2.19 ) и ( 2.23 )). Из ( 2.26)следует, что %*&)€ %(U O^^fo.
Если теперь в ( 2.28 ) положим то о.
Это противоречие доказывает неравенство ( 2.27 ). Пусть
Го = -max -ткх [(&,& (й-т?7. означает максимальное расстояние от точки &CTo-t)%e (t)
V ^ до множества
Шй-i) при -t€[0,Pol.
Так как при имеем
О^б^То ( теорема 2.2 ), то из 2.27 ) получим Теорема доказана.
ПРИМЕР 2.2. Рассмотрим пример 2.1. Можно установить, что hi. = u&m+cfo- ытш)и-[-£+ <r(?o-ti)i, ц&{-и)*(£е-и)%.я МОП
Ui ft) =
Р ? если drO
O.yVi?**ели ht;>o где О - нулевой вектор из . Для управления убегающего выбираем функцию l/U)- ~ f г-ьг-^у. % луею-тои
Вычисления показывают, что То удовлетворяет уравнениюОь где и §л 6 т х ft) = (Xi ft), ОСfi rt-Jj т
Рис.I а. Пусть /=/£ ,
10
Хо= (го, 0)т, Хо=
•.е. %*СО)= fro ~ ПО, /of 0Т,
БЛОК-СХЕМА РЕШЕНИЯ ПРИМЕРА 2.2
Рис.1 б.
Список литературы диссертационного исследования кандидат физико-математических наук Карабаев, Эргашали Ортыкович, 1984 год
1. Айзеке Р. Дифференциальные игры. Мир, 1967, 480 с.
2. Батухтин В.Д., Субботин А,И. Об условиях завершения игры преследования. Изв. АН СССР,Техническая кибернетика,И,1972,с.3-8.
3. Коддингтон Э., Левинсон Н. Теория обыкновенных дифференциальных уравнений. М., ИЛ, 1958.
4. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М., Наука, 1968, 469 с.12. Красовский Н.Н.а) Игровые задачи о встрече движений. М. , Наука, 1970, 420 с.б) Дифференциальная игра сближения-уклонения I.
5. Изв. АН СССР, Техническая кибернетика, №2, 1973, с. 3-18.в) Дифференциальная игра сближения-уклонения II.
6. Изв. АН СССР, Техническая кибернетика, Ю, 1973, с. 22-42.
7. Сатимов Н., Рихсиев Б,Б. К полному исследованию обобщенного контрольного примера Л.С.Понтрягина. ДУ, т. ХУ, Ю, 1979, с. 436-443.
8. Сатимов Н., Азамов А. О задачах преследования и убегания в дифференциальных играх с произвольным числом игроков. ДАН УзССР, №10, 1979, с. 6-7.
9. Сатимов Н.,.Маматов М.Ш. Об одном классе линейных дифференциальных игр преследования и убегания. Труды ТашГУ, №670, 1981, с. 64-75.
10. Тарлинский С.И. Об одной линейной дифференциальной игре сближения нескольких управляемых объектов. ДАН СССР, 230, Ю, 1976, с. 534-537.
11. Фазылов А.З. О линейных дифференциальных играх преследования при различных ограничениях на управления игроков. Изв. АН УзССР, сер. физ.-мат. наук, £2, 1980, с. 79-80.
12. Ченцов А.Г. Об игровой задаче сближения в данный момент времени. Математ. сб., 99, №3, 1976, с. 395-420.
13. Черноусько Одна задача уклонения от многих преследователей. ПММ, 40, 1976, с. 14-24.
14. Чикрий А.А., Раппопорт И.С. Поимка убегающего несколькими преследователями. Теория оптимальных решений. Киев, 1978, с. 59-65.
15. Ъегп/шШ P. -Hn^ulae шг^сссг^ t^n cuf&wiu-а£ fycwtzi. L-eot. Jfbfab* Уп^ръш. М 3,19У?,р.1-33.а£ уалим. У JHcufi. cmrtcU. Wi, Р-10&-Н6.vrnwn, 1964, p. 195-Я 10. 41. &awkidcd$-e Я, г/., О Л. Л oU^eten
16. Ю The tosmPeZtymce pzv££ew foe (fyamlS I'ln: ^оСг^ШШг m ааш£ -th&ottf "Рыфьtied of еРайап uMth -wmltnzab wutot.
17. ШЛ. у. CwUt., 19Щ, P. Ш-Ш.
18. X) ЬэштрЬ. m putuu-t fhcOby. SttwlUz mat.,1. M, 196A, p, i-6.
19. PuazwU (^unU %€И. шси^с. W5 P, р/н>&п.
20. Ma,*., jfs Ъ, 1QW, p. H-U.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.