Линейно-квадратичные кооперативные дифференциальные игры тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат физико-математических наук Марковкин, Михаил Викторович

  • Марковкин, Михаил Викторович
  • кандидат физико-математических науккандидат физико-математических наук
  • 2006, Санкт-Петербург
  • Специальность ВАК РФ01.01.09
  • Количество страниц 106
Марковкин, Михаил Викторович. Линейно-квадратичные кооперативные дифференциальные игры: дис. кандидат физико-математических наук: 01.01.09 - Дискретная математика и математическая кибернетика. Санкт-Петербург. 2006. 106 с.

Оглавление диссертации кандидат физико-математических наук Марковкин, Михаил Викторович

Введение.

Глава 1. Линейно-квадратичные дифференциальные кооперативные игры с бесконечным временем окончания.

§ 1.1 Постановка задачи и определение дифференциальной игры

§ 1.2 Лемма о допустимом наборе управлений.

§ 1.3 Теорема о существовании равновесия по Нэшу.

§ 1.4 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов

§ 1.5 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов с перекрестными слагаемыми.

§ 1.6 Метод последовательных приближений.

§ 1.7 Построение решений кооперативной игры.

§ 1.7.1 Пропорциональное решение.

§ 1.7.2 Решения, основанные на построении характеристической функции.

§ 1.8 Процедура распределения дележа.

§ 1.9 Условие Янга.

§ 1.10 Построение супераддитвной характеристической функции

Глава 2. Линейно-квадратичные дифференциальные кооперативные игры с конечным временем окончания

§ 2.1 Постановка задачи и определение дифференциальной игры

§2.2 Теорема о существовании равновесия по Нэшу.

§ 2.3 Теорема о существовании набора управлений, доставляющего максимум произвольной сумме функционалов

§2.4 Построение решений кооперативной игры.

§2.4.1 Пропорциональное решение.

§2,4.2 Решения, основанные на построении характеристической функции.

Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Линейно-квадратичные кооперативные дифференциальные игры»

Актуальность темы. Существенным разделом математической теории игр является теория дифференциальных игр. Она имеет большое количество приложений, так как основным объектом исследования этой теории выступает математическая модель конфликтно-управляемого процесса, который развивается непрерывно с течением времени. Именно благодаря этому свойству, управление процессом оперативно реагирует на изменения системы.

Основным инструментом исследования построенной математической модели является система дифференциальных уравнений, которая описывает динамику развития процесса во времени. Цели, преследуемые игроками, описываются с помощью функций выигрыша, которые имеют различный вид, что позволяет описать множество конфликтно-управляемых процессов в терминах теории дифференциальных игр (см.[26])

Одной из первых работ по теории дифференциальных игр является [1]. В работе были предложены общие подходы к решению дифференциальных игр; одним из таких подходов является решение основного уравнения дифференциальных игр, которое часто называют уравнением Айзекса-Беллмана.

В развитие теории дифференциальных игр свой вклад в различное время внесли Красовский Н.Н., Понтрягин Л.С., Зубов В.И., Субботин

А.И., Никольский М.С., Петросян JI.A, Данилов Н.Н., Томский Г.В., Basar Т., Olsder G.J.,Yeung D. W. К. Большинство работ по дифференциальным играм посвящено некооперативным играм, в которых в качестве решения используется равновесие по Нэшу (неантагонистический случай) и ситуация равновесия (антагонистический случай) (см.[9, 10, 18,. 19, 20, 21, 28, 31, 32, 36]).

Развитие исследования решения линейно-квадратичных дифференциальных игр связано с выходом в свет работы [36]. В этой работе большое внимание уделено исследованию бескоалиционных линейно-квадратичных дифференциальных игр многих лиц, а также играм двух лиц. Дальнейшие работы направлены на более детальное изучение таких игр с дополнительными ограничениями. Для этих частных случаев выведены условия существования решений бескоалиционных игр в различных классах допустимых управлений(програмных, синтезирующих), также рассматриваются вычислительные аспекты построения решения (см. [4, 34, 35, 37, 38, 40, 41]). Более детально исследовано поведение решения линейно-квадратичных дифференциальных играх в скалярном случае (см. [39, 42, 43]). В [44, 45] показаны примеры применения линейно-квадратичных дифференциальных игр в экономической сфере.

Зачастую, самой постановкой многих задач, формализуемых как дифференциальные игры, диктуется необходимость объединения игроков в коалиции, поэтому исследование кооперативных дифференциальных недействительно актуальная задача (см.[7, 25, 29, 49, 50]).

В кооперативной теории дифференциальных игр изначально предполагается, что игроки, действуя сообща, выбирают управления, огггимальные в смысле максимизации суммарного выигрыша, и вопрос заключается в определении "справедливого" (оптимального) дележа этого суммарного выигрыша. В классической статической теории кооперативных игр сформулированы многочисленные принципы оптимальности (С-ядро, вектор Шепли, NM-решение) (см. [17, 30, 48]). Однако, попытки переноса известных в статической теории принципов оптимальности на различные виды дифференциальных игр без дополнительного исследования невозможны, так как почти всегда могут привести к выбору заведомо не реализуемых решений. Это связано с потерей динамической устойчивости (состоятельности во времени) принципов оптимальности. Это обстоятельство было впервые обнаружено Петросяном J1.A. (см. [22 ,23, 24, 26, 27]). Им же предложен метод регуляризации, основанный на построении процедуры распределения дележа (ПРД), приводящий к динамически устойчивым решениям. Этот метод впервые применяется для регуляризации решений линейно-квадратичных кооперативных дифференциальных игр.

Основной целью работы является нахождение решений линейно-квадратичных кооперативных дифференциальных игр с бесконечным и конечным временем окончания. Построение с этой целью характеристической функции различных видов в классе стратегий, гарантирующих экспоненциальную устойчивость реализуемых траекторий, для игр с неограниченной продолжительностью. Построение состоятельных во времени (динамически устойчивых) оптимальных дележей и соответствующих им ПРД. Вывод необходимых условий, гарантирующих неубыточность кооперативного поведения при неблагоприятных сценариях развития игры (условие Д.В.К. Янга) для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания.

Научная новизна. В работе впервые построены основы теории линейно-квадратичных кооперативных дифференциальных игр как с конечным, так и с бесконечным временем окончания. Это потребовало выработки новых подходов для построения характеристической функции и решений, получаемых на её основе. Предложена новая модификация метода последовательных приближений В.И. Зубова (см.[6]) для нахождения управлений оптимальных в смысле максимизации суммарного выигрыша игроков, входящих в коалицию. Произведена регуляризация классических принципов оптимальности кооперативной теории применительно к данной задаче, исследованы свойства решений.

Практическая ценность. Результаты, полученные в диссертационной работе, могут быть положены в основу теории линейно-квадратичных кооперативных дифференциальных игр. Практическая ценность работы обусловлена областью применения линейно-квадратичных дифференциальных игр. Такие игры применяются при математическом моделировании взаимодействия подвижных объектов в условиях конфликта технических и технологических процессов, а также при моделировании развития сложных социально-экономических систем. Поэтому сферу применения полученных результатов можно оценить описанной областью применения линейно-квадратичных дифференциальных игр, в которой имеет содержательный смысл кооперации игроков.

Основные положения, выносимые на защиту:

1. вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений 11 антикоал иции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания при дополнительном условии экспоненциальной устойчивости реализуемых траекторий движения,

2. построение метода последовательных приближений для определения набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,

3. построение супераддитивной характеристической функции для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,

4. построение состоятельного во времени дележа и процедуры распределения дележа, которая соответствует этому дележу, и определение необходимых условия для выполнения условия Д.В.К. Янга для линейно-квадратичных кооперативных дифференциальных игр с бесконечным временем окончания,

5. вывод необходимых и достаточных условий для существования набора управлений оптимального в смысле максимизации выигрыша коалиции при фиксированном наборе управлений "антикоалиции" для линейно-квадратичных кооперативных дифференциальных игр с конечным временем окончания.

Апробация работы. Основные результаты были доложены на семинарах кафедры математической теории игр и статистических решений, на семинаре кафедры теории управления, семинарах Центра теории игр, иа Международном семинаре "Теория управления и теория обойденных решений уравнений Гамильтона-Якоби" (Екатеринбург, 2005), на Международной конференции "Устойчивость и процессы управления" (Санкт-Петербург, 2005), на "Summer School on Game Theory in Computer Science" (Aarhus, Denmark, 2006), на семинаре "Российско-финской летней школы "Динамические игры и многокритериальная оптимизация" (Петрозаводск, 2006), на семинаре Воронежской весенней математической школы "Понтрягинские чтения-XV" (Воронеж, 2004), XXXIV научной конференции "Процессы управления и устойчивость" (Санкт-Петербург, 2003 г.), XXXV научной конференции "Процессы управления и устойчивость"(Санкт-Петербург, 2004 г.).

По материалам диссертации опубликованы работы:[12]-[16].

Структура и объем работы. Диссертация состоит из введения, двух глав, разбитых на параграфы, приложения и списка используемой литературы.

Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Список литературы диссертационного исследования кандидат физико-математических наук Марковкин, Михаил Викторович, 2006 год

1. Айзеке Р. Дифференциальные игры.-М.:Мир, 1967.

2. Григоренко H.JI. Дифференциальные игры преследования несколькими объектами.-М.: Изд-во МГУ, 1983.

3. Дзюбенко Г.Ц. Линейные дифференциальные игры с запаздыванием информации.-Кибернетика, 1973, №6, с. 81-86.

4. Жуковский В.А., Чиркий А.А. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994.

5. Зенкевич Н.А. Дифференциальные игры с дискретным поступлением информации одному из игроков,- В кн.: Вопросы механики и процессов управления. Вып. 2. Управление динамическими системами. Л.: Изд-во Ленингр. ун-та, 1978, с. 78-90.

6. Зубов В.И. Лекции по теории управления.Главная редакция физ.-мат. литературы изд-ва "Наукаи,М.,1975.

7. Клейменов А.Ф. К кооперативной теории бескоалиционных позици-оныых дифференциальных игр // Докл. АН СССР, 1990. Т. 32. №1. С.32-35.

8. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука, 1993.

9. Красовский Н.Н. Игровые задачи о встречи движений.-М.: Наука, 1970.

10. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974.

11. Ляпунов A.M. Общая задача об устойчивости движения. М.,Гостехиздат, 1950.

12. Марковкин М.В. О линейно-квадратичных неантагонистических дифференциальных играх. Труды XXXIV научной конференции аспирантов и студентов "Процессы управления и устойчивость". Издательство Санкт-Петербургского университета, 2003. С. 547 551.

13. Марковкин М.В. Условие Д.В.К. Янга для линейно-квадратичных дифференциальных игр. Сборник трудов международной конференции "Устойчивость и процессы управления", Санкт-Петербург, 2005, СПбГУ, НИИ ВМ и ПУ, Т.1, стр. 563-571.

14. Нейман Д., Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970, 709 с.

15. Никольский М.С. Линейные дифференциальные игры преследования при наличии запаздываний. Диф. уравнения, 1972, т. 8, №2, с. 260-267.

16. Петросян Л .А. Дифференциальные игры преследования. JL: Изд-во Ленингр. ун-та, 1977. 224 с.

17. Петросян Л.А. Дифференциальные игры с неполной информацией.-Докл. АН СССР, 1970, т. 195, №3, с. 558-561.

18. Петросян Л.А. Дифференциальные игры с неполной информацией.-В кн.: Успехи теории игр. Вильнюс, 1973, с. 227-233.

19. Петросян JI. А. Устойчивость решений в дифференциальных играх со многими участниками // Вестник Ленинградского унив-та, 1977, сер. 1, вып. 4, № 19, с. 46-52.

20. Петросян Л.А. Данилов Н.Н. Устойчивость решений неантагонистических дифференциальных игр с трансферабельными выигрыша-ми//Весн. Лениг. ун-та.Сер.1. 1979. Т.1.№1.

21. Петросян Л.А. Данилов Н.Н. Кооперативные дифференциальные игры.- Томск: Изд-во ТГУ, 1985.

22. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. М.: Высшая школа, 1998, 300 с.

23. Петросян Л. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивость. СПб.: Изд-во С.-П. университета, 2000, 292 с.

24. Петросян Л.А., Томский Г.В. Дифференциальные игры с неполной информацией.- Иркутск: Изд-во Иркут. ун-та, 1984-188 е.

25. Петросян Л. А., Шевкопляс Е. В. Кооперативные дифференциальные игры со случайной продолжительностью // Вестник С.-П. гос. университета, СПб.: Изд-во С.-П. гос. университета, 2000, сер. 1, вып. 4, с. 18-23.

26. Печерский С. Л., Яновская Е. Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европ. унив-та в С.-Петербурге, 2004, 459 с.

27. Понтрягин Л.С. Линейная дифференциальная игра убега-ния//Труды МИАН СССР, 1971. Т. 112. С.30-63.

28. Понтрягин JI.С. Линейные дифференциальные игры преследования. Математический сборник. Новая серия, 1980. Т. 112. Вып. 3. С.307-330.

29. Смирнов Е.Я. Стабилизация программных движений.СПб: Издательство С.-Петербургского университета, 1997. 308 с.

30. Abou-Kandil, Н., Freiling, Bertrand, P., Analytic solution fos a class of linear-quadratic open-loop Nash games, International Journal of Control 43(1986), 997-1002.

31. Abou-Kandil, H., Freiling, G., Jank, G., 1993. Necessary a nd sufficient conditions for constant solutions of coupled Ricatti equations in Nash games, System and Control Letters 21, 295-306.

32. Basar Т., Olscler G.J. Dynamic noncooperative game theory. London: Academic Press, 1982.

33. J.C. Engwerda. An equivalence in linear-quadratic theory. Automatica 39(2003)355-359.

34. J.C. Engwerda. Computational aspects of the open-loop Nash equilibrium in linear quadratic games. Journal of Economic Dynamics and Control, 22(1998) p. 1487-1506.

35. J.C. Engwerda. Feedback Nash equilibrium in the scalar infinite horizon LQ-games. Automatica 36(2000) p. 135-139.

36. J.Engwerda "LQ Dynamic Optimization and Differential Games",Wiley, 2005

37. J.C. Engwerda. On the open-loop Nash equilibrium in LQ-games. Journal of Economic Dynamics and Control, 22(1998) p. 729-762.

38. J.C. Engwerda. Solving the Scalar Feedback Nash Algebraic Riccati Equations: Eigenvector Approach.IEEE TRANSACTIONS ON AUTOMATIC CONTROL. Vol. 45, NO. 12, May 2000.

39. J.C. Engwerda. The Solution of the N— Player Scalar Feedback Nash Algebraic Riccati Equations, IEEE TRANSACTIONS ON AUTOMATIC CONTROL. Vol. 45, NO. 12, December 2000.

40. J.C. Engwerda, Bas van Aarle, J.E.J. Plasmans. Cooperative and non-cooperative fiscal stabilization policies in the EMU, Journal of Economic Dynamics and Control, 26(2002) p. 451-481.

41. J.C. Engwerda, Bas van Aarle, J.E.J. Plasmans. The (in)finite horizon open-loop Nash LQ game: An application to EMU, Annals of Operation Research 88(1999)251-273

42. Leon A. Petrsojan. The Shapley Value for Differential Games,Annals of the International Society of Dynamics Games, Volume3, 410-417.

43. Leon Petrosjan, Georges Zaccour, Time-Consistent Shapley Value Allocation of Pollution Cost Reduction, Journak of Economic Dynamics & Control, 27(2003), 381-398.

44. Shapley, Lloyd S., "A value for n-person Games "in Contributions to the theory of games, vol.11, H.W.Kuhn and A.W. Tucher, editors, Ann.Math. Studies 28, Princeton University Press, Princeton, New Jersey,1953.

45. Yeung D.W. К., Petrosyan L.A. Cooperative Stochastic Differential Games. Springer Series in Operations Research and Financial Engineering, 2005.

46. Yeung D.W. K., Petrosyan L.A. Subgame consistent cooperative solutions in stochastic differential games // Journal of Optimization Theory and Applications, 2004, vol. 120, no. 3, pp. 651-666.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.