Сильные равновесия в некоторых классах динамических игр тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат физико-математических наук Зятчин, Андрей Васильевич
- Специальность ВАК РФ01.01.09
- Количество страниц 109
Оглавление диссертации кандидат физико-математических наук Зятчин, Андрей Васильевич
Введение.
Глава 1. Позиционное сильное равновесие в дифференциальной игре.
§1.1 Определение позиционного сильного равновесия.
§ 1.2 Позиционное сильное равновесие в дифференциальной игре с линейной динамикой.
Глава 2. Позиционное сильное равновесие в стохастической дифференциальной игре.
§2.1 Достаточные условия существования позиционного сильного равновесия в стохастической дифференциальной игре
§ 2.2 Позиционное сильное равновесие в симметричной стохастической дифференциальной игре.
Глава 3. Построение парето-оптимального равновесия в динамической модели защиты атмосферы от загрязнения
§ 3.1 Постановка задачи.
§ 3.2 Равновесие по Нэшу в статической модели.
§3.3 Парето-оптимальное решение модели.
§ 3.4 Обсуждение результатов моделирования.
§ 3.5 Динамическая модель охраны атмосферы от загрязнения . 89 Литература.
Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Кооперативные стохастические игры2006 год, кандидат физико-математических наук Баранова, Елена Михайловна
Условие устойчивости против иррационального поведения игроков2012 год, кандидат физико-математических наук Белицкая, Анна Владимировна
Принцип позиционной динамической устойчивости и его применение в системах со многими управлениями2007 год, кандидат физико-математических наук Смолин, Евгений Александрович
Неантагонистические дифференциальные игры с неограниченной продолжительностью2006 год, кандидат физико-математических наук Адрианов, Алексей Андреевич
Решения кооперативных стохастических игр с трансферабельными выигрышами2019 год, доктор наук Парилина Елена Михайловна
Введение диссертации (часть автореферата) на тему «Сильные равновесия в некоторых классах динамических игр»
Актуальность темы. Теория динамических игр представляет собой бурно развивающийся в настоящее время раздел математической теории игр, которая ведет свой отсчет как самостоятельное научное направление с момента выхода книги Дж. фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» [38, 119]. Формирование отечественных научных школ по теории игр связано прежде всего с именами H.H. Воробьева и Ю.Б. Гермейера [5-7]. Актуальность теоретических и прикладных результатов, получаемых в области динамических игр, в первую очередь обусловлена реалистичностью исследуемых в этом разделе математических моделей, поскольку главной особенностью динамических игр является возможность построения математических моделей конфликтов, развивающихся во времени. В частности, в дифференциальных играх изучается класс конфликтно-управляемых процессов, в которых изменение состояния игры описывается системой дифференциальных уравнений на временном промежутке заданной продолжительности [25-27].
Определение класса стратегий, в котором ищется решение дифференциальной игры, зависит от предположений относительно информационной структуры конфликтного процесса. Будем различать два класса стратегий: программные и позиционные.
Программные стратегии зависят от начального состояния и являются функциями времени. Равновесие в программных стратегиях в неантагонистической игре исследовалось, например, в книге [68].
Позиционные стратегии зависят от времени и наблюдаемого в этот момент состояния игры [29]. Впервые проблема построения позиционного равновесия в дифференциальной игре исследована в работе [65]. Вопрос совпадения множеств равновесии в программных и позиционных стратегиях исследован в работах [91, 121].
В теории дифференциальных игр ее приложениях важным вопросом является построение позиционных сильных равновесий. В настоящее время известно несколько определений сильного равновесия [9, 37, 46, 62, 84, 106]. В диссертационной работе, в частности, исследовались сильное равновесие в широком [37] и узком [9, 46] смыслах. При этом в каждом случае под сильным равновесием понимается ситуация, в определенном смысле устойчивая относительно коалиционных отклонений игроков. Этот принцип оптимальности исследован для классов игр в нормальной и развернутой формах (см., например, [37, 49, 50, 57, 84]). Уникальность сильного равновесия состоит в том, что оно является одновременно равновесием по Нэшу и парето-оптимальным решением, т.е. удовлетворяет свойствам коллективной и индивидуальной рациональности игроков [10, 40, 54]. Основным недостатком применения концепции сильного равновесия в статике является то, что оно крайне редко встречается даже в классе игр двух лиц [37, 39, 88, 117].
В теории динамических игр при попытках нахождения сильных равновесий часто используются народные теоремы, что позволяет в некоторых случаях построить такое решение в стратегиях наказания [9, 50, 61, 81, 83, 84]. Недостатками этого подхода является необходимость согласия всех игроков на его применение, а также наличие достаточной силы коалиций для реализации угрозы наказания.
При исследовании дифференциальных игр часто используется принцип оптимальности Беллмана, что позволяет свести задачу построения оптимального решения к решению экстремального уравнения в частных производных. С помощью такой техники в ряде случаев удается найти равновесие по Нэшу или парето-оптимальное решение [21, 125]. При этом в исследуемой модели необходимо дополнительно учитывать условия существования и единственности решения системы дифференциальных уравнений, описывающей динамику игры, гладкость функции Беллмана, а также функций мгновенного и терминального выигрышей игроков. Эти условия служат основным препятствием для определения подклассов дифференциальных игр, в которых удается построить сильное равновесие. При этом до сих пор остается открытым вопрос построения позиционных сильных равновесий.
Диссертационная работа посвящена построению сильных равновесий в дифференциальных и стохастических дифференциальных играх специального вида. Исследована также динамическая модель защиты атмосферы от загрязнения в игровой постановке с целью построения парето-оптимального равновесия.
Теория дифференциальных, игр сформировалась в самостоятельный раздел в пятидесятых годах прошлого века. Начало систематических исследований в области дифференциальных игр обычно связывают с выходом книги Р. Айзекса [89] и Г. Лейтмана [98]. В это же время появились первые отечественные работы по дифференциальным играм [31, 43, 51, 52]. В частности, в работе [52] сформулированы необходимые уеловия существования равновесия в дифференциальной игре, основанные на использовании принципа максимума.
На протяжении многих лет исследования по дифференциальным играм были посвящены в основном антагонистическим дифференциальным играм. В этом направлении были достигнуты значительные результаты во многом благодаря отечественным научным школам по оптимальному управлению [22, 32, 52].
Первые работы в области неантагонистических дифференциальных игр появились в конце 60-х годов прошлого века [51, 70, 114, 115]. В них исследовались некооперативные игры дифференциальные игры со многими участниками, при этом в качестве принципа оптимальности рассматривалось равновесие по Нэшу в программных и позиционных стратегиях. Первая отечественная монография в этом направлении была написана в конце 70-х годов прошлого века [2].
Основополагающие результаты, посвященные исследованию существования и технике нахождения равновесия по Нэшу в неантагонистических дифференциальных играх, получены в работах [11, 28, 36, 59]. В частности, в работе [102] исследована проблема существования единственного решения уравнения Рикатти, играющего важную роль при построении равновесия в позиционных стратегиях в линейно-квадратичных дифференциальных играх. Позднее эти результаты применялись при исследовании математических моделей задач управления социально-экономическими системами (см., например, [76, 86, 91, 93, 95, 96, 113, 120, 121]).
Важным разделом теории игр являются кооперативные игры [53, 56, 109]. Начало систематического изучения теории кооперативных дифференциальных игр во многом связано с выходом книги [45], в которой, в частности, сформулировано новое направление исследований — динамическая устойчивость кооперативных решений. Впервые концепция динамической устойчивости была сформулирована в работе [44]. Успехи в этом направлении связаны прежде всего с работами JI.A. Петросяна, его школы и коллег [12, 20, 60, 103, 104, 105, 118, 124].
Необходимость учета неопределенностей в динамике конфликтного процесса привела к концепции стохастической игры. Модель стохастической игры впервые была построена JI. Шепли [111]. Им же был исследован класс стохастических игр двух лиц с нулевой суммой, в которых множества состояний и альтернатив конечны. При этом предполагалось, что в каждом состоянии с положительной вероятностью игра останавливается. Шепли доказал существование равновесия и оптимальных стратегий в таких играх. Обобщения результата Шепли для бескоалиционной игры получены в [77, 87, 112]. Кооперативная стохастическая игра была сформулирована и исследована в работах [41, 42, 63].
В работах [79, 80] на основе принципа оптимальности Беллмана [1, 21, 80, 125] и теории стохастических дифференциальных уравнений [90] был разработан математический аппарат стохастического оптимального управления. На его основе впервые были получены результаты в области стохастических дифференциальных игр [64-66]. В работе [32] исследованы условия существования максиминных стратегий и цены игры в стохастической дифференциальной игре. В работах [72, 94, 96, 122, 123, 125] представлены примеры, для которых были получены равновесия по Нэ-шу для стохастических дифференциальных игр в явном виде. Одним из актуальных и успешно развивающихся направлений стохастического оптимального управления и стохастических игр являются задачи на правило остановки [35, 99-101].
Модели административного управления и механизмов регулирования объемов выбросов загрязняющих веществ в атмосферу исследованы в [69, 116, 120]. В работе [85] приводится исследование оптимального выпуска фирмы при наличии штрафов за превышение допустимой концентрации загрязняющих веществ в условиях монополии. Во всех указанных выше работах математическая модель представляла собой задачу оптимального управления для одного предприятия.
Динамические игры использовались при моделировании конкурентных процессов при ограничениях на объем загрязняющих веществ многими авторами [34, 75, 78, 92, 97, 107]. Один из выводов указанных работ состоит в том, что при кооперативном поведении увеличивается не только совместный выигрыш участников, но и уменьшается уровень загрязнения. При этом не обсуждались проблемы производства при наличии штрафов за загрязнение.
В книгах [48, 108] и работе [126] приведены модели загрязнения атмосферы, предложены методы решения задач ограничения выбросов, оптимального размещения промышленных предприятий - источников выбросов, способы нормирования объемов расходования ресурсов и оптимизации штрафных санкций. Построена модель согласования интересов взаимодействующих сторон при использовании ограниченных природных ресурсов.
В работе [69] исследована модель двух регионов, один из которых является поставщиком комплектующих для второго. В монографии [125] приведено решение модели управления загрязнением окружающей среды, в которой уже учитывалась динамика накопления и поглощения загрязняющих веществ. Для этой модели исследована проблема динамической устойчивости выбранного кооперативного решения.
Работы, посвященные динамическим играм и их приложениям, продолжают появляться в различных разделах прикладной математики.
Цель диссертационной работы состоит в исследовании динамических игр на предмет разработки новой техники построения позиционного сильного равновесия, основанной на формулировке и обосновании новых достаточных условиях его существования.
Научная новизна работы. В диссертационной работе впервые предложены достаточные условия существования позиционного сильного равновесия в детерминированных и стохастических дифференциальных играх. При формализации оценки качества стратегии коалиции для позиционного сильного равновесия в широком смысле разработана специальная техника, основанная на скаляризации векторного критерия, компонентами которого являются функции выигрышей игроков, входящих в коалицию. Это позволило применить метод динамического программирования при формулировке и обосновании достаточных условий существования сильного равновесия.
Для динамической игры защиты атмосферы от загрязнения разработана техника определения такого размера штрафа, при котором парето-оптимальное решение является равновесием по Нэшу и при этом общее загрязнение атмосферы не превышает предельно допустимой концентрации. В статической постановке подобная модель изучалась в [47, 108, 126]. В основе данного исследования лежит динамическая модель, которая впервые была опубликована в статье [129]. В диссертационной работе завершено исследование этой модели и найдено решение задачи экологического дизайна.
Достаточные условия существования позиционного сильного равновесия получены в конструктивном виде, что позволяет говорить о новой технике построения сильного равновесия. Применение техники проиллюстрировано на примерах решения дифференциальных игр двух и трех лиц в случаях детерминированной и стохастической динамики. Разработанная в диссертационной работе техника при дальнейшем развитии может быть использована для построения сильных равновесий в более широких классах дифференциальных игр.
Практическая ценность работы следует из практических направлений применения результатов из области динамических игр, например, формирования долгосрочных соглашений, защиты окружающей среды, совместной разработки недр, научно-исследовательских разработок, моделей управления в экономике и менеджменте.
Основные результаты, выносимые на защиту.
1. Теоремы о достаточных условиях существования позиционного сильного равновесия в дифференциальной игре, содержащие метод нахождения подобных ситуаций. Решение примеров задач конфликтного управления для проверки разработанной техники.
2. Теорема о достаточных условиях существования позиционного сильного равновесия в стохастической дифференциальной игре и использование разработанной техники на примере игры трех лиц.
3. Построение парето-оптимального равновесия в модели защиты атмосферы от загрязнения.
Апробация работы. Основные результаты были представлены на I
- IV Международных конференциях «Теория игр и менеджмент» (Санкт-Петербург, 2007 - 2010), на Международном научном совещании «Workshop olí Networking Games and Management» (Петрозаводск, 2009), па Международной конференции «Дифференциальные уравнения и топология» (Москва, 2008), на Международной конференции «The Second International Conference on Game Theory and Applications» (China, 2007), на Международной конференции «7th Meeting on Game Theory and Practice dedicated to Energy, Environment and Natural Resources» (Монреаль, 2007), на Международном конгрессе по нелинейному динамическому анализу, посвященному 150-летию А.М. Ляпунова (Санкт-Петербург, 2007), на 12-м Международном симпозиуме «International Symposium on Dynamic Games and Applications» (София Антиполис, 2006), на российско-финской летней школе «Динамические игры и многокритериальная оптимизация» (Петрозаводск, 2006), на XXXV - XXXVII научной конференция аспирантов и студентов «Процессы управления и устойчивость» (Санкт-Петербург, 2004-2006), на V Международной научно-практической конференции «Актуальные проблемы экономики и новые технологии преподавания (Смирновские чтения)» (Санкт-Петербург, 2006), на Международной конференции «Stability and control processes» (Санкт-Петербург, 2005), а также на семинарах кафедры математической теории игр и статистических решений, центра теории игр факультета Прикладной математики - процессов управления, научном семинаре кафедры операционного менеджмента Высшей школы менеджмента СПбГУ.
По материалам диссертации опубликованы следующие работы: [1319, 23, 24, 127-133]. Из них статьи [17, 18] опубликованы в журналах из списка ВАК.
Структура и объем работы. Диссертация состоит из введения, трех глав, разделенных на параграфы, и списка литературы. Список литературы включает 133 наименования.
Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Кооперативные дифференциальные игры со случайной продолжительностью2004 год, кандидат физико-математических наук Шевкопляс, Екатерина Викторовна
Теоретико-игровые задачи со случайной продолжительностью2016 год, кандидат наук Громова, Екатерина Викторовна
Проблема динамической устойчивости соглашений в области охраны окружающей среды2008 год, кандидат физико-математических наук Павлова, Юлия Николаевна
Равновесия по Нэшу в игре голосования1998 год, кандидат физико-математических наук Культина, Мария Владимировна
Обобщенное уравнение Айзекса-Беллмана в теории дифференциальных игр2009 год, кандидат физико-математических наук Никитин, Федор Федорович
Заключение диссертации по теме «Дискретная математика и математическая кибернетика», Зятчин, Андрей Васильевич
дующие выводы:
1) Для случаев некооперативного и кооперативного поведения при значениях параметра х £ (О, Л1), А\ = производство в регионе не является прибыльным.
2) При 0 > в равновесии и при в > ^ в случае кооперации при любых значениях х £ [А\, оо) производство, при котором усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превосходит ПДК, прибыльно. Более того, поскольку при кооперативном поведении общий объем выбросов меньше, а суммарный выигрыш всех игроков больше, чем в равновесии, то кооперативное поведение является корпоративно социально устойчивым [110].
3) При соотношении параметров ^ < в < у корпоративная соци
1вс альная устойчивость сохраняется лишь при х £ [А\, А3], где А3 — ай1ь п.
26 —1"
При этом даже при отсутствии регулирования со стороны региональных административных органов суммарный выигрыш всех игроков при кооперативном поведении больше, а усредненное по региону значение концентрации загрязняющей примеси в атмосфере меньше, чем при некооперативном.
4) Показано (теорема 3.4), что при 0 < выполнено неравенство б(х) > т^(х). Поэтому величина штрафа в(х) сдерживает как индивидуальное, так и коллективное отклонение от ситуации в которой усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превосходит ПДК. В таком случае говорят, что ситуация обладает как свойством индивидуальной, так и свойством коллективной рациональности и в этом смысле решает задачу экологического дизайна.
5) В частном случае, при п — 2 и функции штрафа й(ж) ситуация д** = (п^' • • ■' является сильным равновесием в смысле определения 1.2.
6) Практически трудно прописать в законодательных актах правило назначения штрафа в(ж), поскольку размер штрафа зависит от значений параметра х. Поэтому при практической реализации функции штрафа разумно использовать ступенчатую схему (см. рис. 3.3). Идея реализации такой схемы заключается в следующем. Разобьем область определения функции я (ж), на интервалы (0, ах], (0, 0:2],., тогда
5(0:1), ж 6 (0,0:1], Й(О2), же(0,о2], к фу
-К —у а, а2 ау а, X
Рис. 3.3: Ступенчатая система штрафов.
Другими словами, определяются промежутки значений ж, при которых размер штрафа остается постоянным. Использование такой схемы требует оптимизации по разбиению, мониторинг и прогнозирование изменения параметра ж.
7) В модели предполагается, что рыночная цена продукта является убывающей функцией по суммарному объему производства. В итоге, при решении задачи защиты атмосферы появляется новая проблема, связанная с ростом цен па продукцию. Согласно (3.1.1), альтернативным подходом к снижению объемов выбросов является регулирование коэффициента пропорциональности (3 объема производства и объема выбросов. Для случая некооперативного поведения рассмотрим неравенство О > щз^-у Из него следует, что при (3 < = В\ в ситуации равновесия усредненное по региону значение концентрации загрязняющей примеси в атмосфере не превышает ПДК при любом значении параметра х > 0. В случае кооперации (3 < 2^ = В2. Понятно, что Вл < Во при п > 2. Следовательно, в случае некооперативного поведения игроки вынуждены проводить более тщательные работы по очистке собственных выбросов, чем в случае кооперации. При этом в случае кооперации игроки имеют возможность получить большую прибыль. Поэтому часть прибыли может быть направлена на улучшение технологии очистки выбросов.
§3.5 Динамическая модель охраны атмосферы от загрязнения
Определим динамическую игру С (¿о, жо), в которой в каждый момент времени Ь > 0 разыгрывается игра
Г(жОО) = (м, {КМЬ), 91,., Яп)}г=Ы) , где ж(£) удовлетворяет уравнению = /0*0, х(г0)—х0, (з.5.1) ж), ж > 0 — заданная непрерывно дифференцируемая функция. Функция выигрыша игрока г в игре С (¿о, £о) имеет вид: оо тах / е ггА^(ж(т), д*(ж(г)), дДж(т)))с£т, (3.5.2)
Чг 3 ¿0 где
3.5.3) ф((а - &<2)ж - с) - кг(х), п где к7(х) — функция штрафа игрока г, ф = X) г=1
Тогда функция выигрыша максимальной коалиции N имеет вид: оо д(-)) = шах J е~гтКм{х{т),д(х(т)))(1т, (3.5.4) о где д((о-ьд)ж-с), <1р(з < о,
Кк(х, д) = -ч « (3.5.5)
1=1
Теорема 3.5. Пусть функция /(ж) > 0, ж > 0; жо > въ ~ в < А-;(ж) = в(ж), где й(ж) определяется по правилу (3.2.8). Тогда в игре (?(£о - ^'о) ситуация = Г— в \
Я \f3dn'"' (Здп) является парето-оптимальным равновесием, при этом о;(д**) <
Доказательство. а) Из неравенства 0 < ^ следует истинность неравенства 0 < при я > 2, и Лз = -ЛЗш, > 0айр-'ЖЪ айр-Ш б) Из неравенства жо > „¿^-т ~ слеДУет истинность неравенства
10С А ^ в) По условиям теоремы — /(ж(£)) > 0, х(€) > 0. Поэтому функция х{£) является возрастающей. Из этого следует, что х^) > А3 = а?о >
А2, г > £0.
Найдем наилучший ответ игрока г на стратегию дополнительной коалиции д1* = . ■ Для этого рассмотрим следующую задачу: хф = ¡{х(г))<И, х^о) = х0. (3.5.6) оо шах [ е~гтЩ(х(т), ф)^*\{т))с1т. (3.5.7)
Чг J ¿0
Уравнение Беллмана для задачи (3.5.6)-(3.5.7) принимает вид:
О = ~ тах [Щх®, Ф)- Сг)} + 1{Х) ^. (3.5.8) Г г ох
Заметим, что максимум в правой части уравнения (3.5.8) не зависит от значений функции Беллмана. При этом для каждого £ > ¿о максимизируется функция выигрыша игрока г в одношаговой игре Г (ж) при условии, что все остальные игроки выбрали стратегию д**. По условию теоремы кг(х) = в(х) а (п + 1)0\ с 12 26 2п(1(3 ) ~ 2Ъх
Ьх > 0.
Как было показано в теореме 3.2 при х(€) > .то = А2 и в < ¿^к) наилучшим ответом игрока на стратегию дополнительной коалиции д.
• • •' Щп) ПРИ системе штрафов, определяемой правилом з(х), является стратегия д** = -щ^. Поэтому эта же стратегия является наилучшим ответом и в игре По теореме о наилучших ответах, п**=(-А-.^ щ^) является равновесием по Нэшу в игре о,хо).
Рассмотрим задачу максимизации суммарного выигрыша: оо х(£))) = тах J е~гт Км(х(т),д(х{т)))(1т. (3.5.9) 0
Уравнение Беллмана для задачи (3.5.6), (3.5.9) принимает вид:
Ш(х)^-шах{Кк{х{г).д(х(т)))} + ^^-^. (3.5.10) г ч г ах
Вновь заметим, что максимум в правой части уравнения (3.5.10) не зависит от значений функции Беллмана. При этом для каждого £ > ¿о максимизируется функция выигрыша коалиции N в одношаговой игре Г (ж), х > А3. Следовательно, задача поиска парето-оптимального решения в игре (3.5.6)-(3.5.9) эквивалента аналогичной задаче в одношаговой игре Г(ж), х >
По условию теоремы 3.5 размер штрафа, налагаемого на каждого игрока, имеет вид: ki(x) = s(x) = следовательно, 2 o(n+l)6A с 2Ь 2ndp ) 2Ьх ~ '
S^2/kl(x) — ns(x) > 7Пдг(.т), ¿=1 где гп]\т(х) определяется правилом (3.3.2). Как было показано выше x(t) > А3, t > to, и по условию теоремы 3.5 в < Следовательно, по теореме 3.3 и следствию к ней при системе штрафов s(x) любая ситуация
П , ч
Я = (gi, • • •, §п), такая, что Е = в том числе п <f* = (-щ, ■ ■ ■, -щ), г=1 ^ ' является парето-оптимальным решением в игре Г (ж). Поэтому, ситуация ~ (щй' • • •' /з!к) является парето-оптимальным равновесием в игре G(to,xo). Теорема доказана. □
Список литературы диссертационного исследования кандидат физико-математических наук Зятчин, Андрей Васильевич, 2010 год
1. Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит-ры, 1960, 400 с.
2. Вайсборд Э.М., Жуковский В. И. Введение в дифференциальные игры нескольких лиц и их приложения. М.: Советское радио, 1980, 304 с.
3. Винер Н. Нелинейные задачи в теории случайных процессов / пер. с англ. Э.М. Хазен; под редакцией Ю. JI. Климонтовича. М.: Изд-во иностр. лит-ы, 1961, 158 с.
4. Воробьев Н. Н. Устойчивые ситуации в коалиционных играх // Доклады АН СССР, 1960, т. 131, сс. 493-495.
5. Воробьев H.H. Коалиционные игры // «Теория вероятности и её применение», 1967, т. 12, вып. 2, сс. 289 -306.
6. Воробьев Н. Н. Основы теории игр. Бескоалиционные игры. М: Наука, 1984, 496 с.
7. Гермейер Ю.Б. Игры с непротивоположными интересами. М.: Наука, 1976, 328 с.
8. Гихман И.И., Скороход A.B. Стохастические дифференциальные уравнения и их приложения. Киев: Изд. «Наукова думка», Главная редакция физико-математической литературы, 1982, 569 с.
9. Грауэр Л. В., Петросян Л. А. Многошаговые игры // Прикладная математика и механика, 2004, т. 68, вып. 4, сс. 667-677.
10. Губанов В. А., Захаров В. В., Коваленко А. Н. Введение в системный анализ. Л.: Изд-во ЛГУ, 1988, 232 с.
11. Жуковский В. А., Чикрий А. А. Линейно-квадратичные дифференциальные игры. Киев: Наукова думка, 1994, 320 с.
12. Захаров В. В. О регуляризации и динамической устойчивости решений иерархических дифференциальных игр // Вестник Ленингр. ун-та, Сер. 1, 1988, Вып. 2, № 5, сс. 27-31.
13. Зенкевич Н. А, Зятчин А. В. Исследование динамической модели Макдональда Сайгела. // Математические методы исследования экономики. Монография. Под ред. H.A. Зенкевича, СПб.: Изд-во МБИ. 2004, сс. 47-56.
14. Зенкевич H.A., Зятчин A.B. Стохастическая асимметричная модель олигополии // Труды 36-й научной конференции аспирантови студентов «Процессы управления и устойчивость» под ред. Н.В. Смирнова, В.Н. Старкова. СПб.: Изд. СПбГУ, 2005, сс. 479-484.
15. Зенкевич H.A., Зятчин A.B. Модель олигополии при экологических ограничениях с позиций корпоративной социальной ответственности // Вестник СПбГУ, сер. 8, 2009, вып. 1, сс. 33-62.
16. Зенкевич H.A., Зятчин A.B. Сильное равновесие в дифференциальной игре со стохастической динамикой // Вестник СПбГУ, сер. 10, 2009, вып. 4, сс. 84-94.
17. Зенкевич H.A., Зятчин A.B. Построение сильного равновесия в дифференциальной игре многих лиц // Математическая теория игр и ее приложения, 2010, т. 2, вып. 2, сс. 42-65.
18. Зенкевич Н. А., Петросян JI. А. Проблема временной состоятельности кооперативных решений в менеджменте // Вестник С-Петерб. ун-та, сер. 8, 2007, вып. 1. сс. 7-42.
19. Зенкевич Н. А., Петросян Л. А., Янг Д. В. К. Динамические игры и их приложения в менеджменте. СПб.: Высшая школа менеджмента, 2009, 415 с.
20. Зубов В. И. Лекции по теории управления. М.: Главная редакция физико-математической литературы изд-ва «Наука», 1975, 496 с.
21. Зятчин A.B. Народная теорема в одной стохастической игре // Труды XXXVII научной конференции аспирантов и студентов «Процессы управления и устойчивость» под ред. Н.В. Смирнова, A.B. Платонова. СПб.: Изд. СПбГУ, 2006, сс. 546-549.
22. Зятчин А. В. Стохастическая модель процесса конкуренции в случае полной, неполной и асимметричной информации // Математические исследования в экономике. Монография. Под ред. H.A. Зенкевича, Д.В. Кузютина, СПб.: Изд-во МБИ, 2006, сс. 131-148.
23. Клейменов А. Ф. Задачи конфликтного управления // Прикл. математика и механика, 1975, т.39, вып.2., сс. 225-234.
24. Клейменов А. Ф. К кооперативной теории бескоалиционных позиционных дифференциальных игр // Докл. АН СССР. т. 312, № 1, 1990, сс. 32-35.
25. Клейменов А. Ф. Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей // Прикл. математика и механика, 1990, т. 54, вып. 3, сс. 389394.
26. Клейменов А. Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. УРО, 1993, 185 с.
27. Клейменов А. Ф. О решениях в неантагонистической позиционной дифференциальной игре // Прикл. математика и механика, 1997, т. 61, вып. 5, сс. 739-746.
28. Клейменов А. Ф., Семеннщев A.A. Построение решений в одной многокритериальной задаче управления фирмой // Вестн. Тамбов, гос. ун-та, сер. Естеств. и техн. наук, т. 5, Xе 4, 2000, с с. 458-459.
29. Красовский Н. Н. К задаче об игровой встрече движений. // Доклады АН СССР, 1967, т. 173, № 3, сс. 535-537.
30. Красовский Н. Н. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука. Главная редакция физико-математической литературы, 1985, 520 с.
31. Курант Р. Уравнения с частными производными // Пер. с англ.Т.Д. Вентцель, под ред. O.A. Олейник. М.: Изд-во Мир, 1964, 830 с.
32. Мазалов В. В., Реттиева А. Н. Равновесие по Нэшу в задачах охраны окружающей среды // Математическое моделирование, 2006, т. 18, № 5, сс. 73-90.
33. Мазалов В. В., Сакагучи М. Равновесие в бескоалиционной игре п лиц с выбором момента времени // Управление большими системами, 2009, вып. 26, сс. 55-78.
34. Малафеев O.A. Существование ситуаций равновесия в дифференциальных бескоалиционных играх со многими участниками // Вестн. ЛГУ, № 13, 1982, сс. 40-45.
35. Мулен Э. Теория игр. С примерами из математической экономики, М.: Мир, 1985, 200 с.
36. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение, М: Наука, 1970, 708 с.
37. Ногин В. Д. Проблема сужения множества Парето: подходы к решению // «Искусственный интеллект и принятие решений», 2008, № 1, сс. 98-112.
38. Ногин В. Д. Эффективные и собственно эффективные решения многокритериальных задач // В сб. «Методы многоцелевой оптимизации», Владивосток, 1982, сс. 59-72.
39. Петросян Л. А. Дифференциальные игры на выживание со многими участниками // Докл. АН СССР, 1965, т. 161, № 2, стр. 285-287.
40. Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками // Вестн. ЛГУ, 1977, № 19, сс. 46-52.
41. Петросян Л. А., Данилов Н. Н. Кооперативные дифференциальные игры и их приложения. Томск: Изд. Томского ГУ, 1985, 276 с.
42. Петросян JT. А. Полукооперативные игры // Вестник СПбГУ, 1998, сер. 1, вып. 2, сс. 62-69.
43. Петросян Л. А., Захаров В. В. Введение в математическую экологию. Л.: Изд. ЛГУ, 1986, 224 с.
44. Петросян Л. А., Захаров В. В. Математические модели в экологии. СПб.: Изд. СПбГУ, 1996, 253 с.
45. Петросян Л. А., Зенкевич H.A., Семина Е. А. Теория игр. М.: Высшая школа, Книжный дом Университет, 1998, 304 с.
46. Петросян Л. А., Кузютин Д. В. Игры в развернутой форме: оптимальность и устойчивовость. СПб.: Изд. СПбГУ, 2000, 292 с.
47. Петросян Л. А., Мурзов Н. В. Теоретико-игровые проблемы в механике/ / Литовский математический сборник, 1966, №VI-3, сс. 423433.
48. Понтрягин Л. С. К теории дифференциальных игр // Успехи математических наук, 1966, 21, 4 (130), сс. 219-274.
49. Печерский С. Л., Яновская Е. Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европ. унив-та в С.-Петербурге, 2004, 459 с.
50. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения многокритериальных задач. М.: Наука, 1982, 255 с.
51. Пугачев В. С., Синицын И. Н. Стохастические дифференциальные системы. Анализ и фильтрация. М.: Наука, 1990, 632 с.
52. Соболев А. И. Кооперативные игры // Проблемы кибернетики, М.: Наука, 1982, вып. 39, сс. 201-222.
53. Тироль Ж. Рынки и рыночная власть: теория организации промышленности, т. 2. СПб.: Экономическая школа, 2000, 455 с.
54. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. // Пер. с англ. М.Г. Бутрим, П.К. Катышева; под ред. А.Н. Ширяева. М.: Мир, 1978. 320 с.
55. Чистяков С. В. О бескоалиционных дифференциальных играх // Докл. АН СССР, 1981, т. 259, № 5, сс. 1052-1055.
56. Чистяков С. В. О построении сильно динамически устойчивых решений кооперативных дифференциальных игр // Вестник СПбГУ, сер.1, 1992, Вып. I. сс. 57-69.
57. Abren D., Dutta Р. К., Smith L. The folk theorem for repeated games: a NEU condition // Econometrica, 1985, Vol. 62, pp. 939-948.
58. Aumann R.J. Acceptable Points in General Cooperative n-Person Games // Contributions to the Theory of Games IV. Annals of Mathematics Study 40 / ed. by A.W. Tucker, Princeton NJ, Princeton University Press, 1959, pp. 287-324.
59. Baranova E. M., Petrosjan L.A. Cooperative Stochastic Games in Stationary Strategies // Game theory and Applications, Nova Science Publishers, 2006, Vol. 11, pp. 7-17.
60. Basar T. Existence of unique equilibrium solutions in nonzero-sum stochastic differential games // Differential games and control theory. II. /ed. E.O. Roxin, P.T. Liu, R. Sterbrg. New York: Marcel Dekker, Inc., 1977a. 201-228 p.
61. Basar T. Informationally nonunique equilibrium solutions in differential games // SIAM Journal of Control and Optimization, 1977b, 15, pp. 636-660.
62. Basar T., Olsder G.J. Dynamic Noncooperative Game Theory, 2nd Edn., Academic Press, London, 1995, 520 p.
63. Berkovitz L. D. A variational approach to differential games // In: Dresner, M., Shapley, L.S., Tucker, A.W. (ed) Advances in Game Theory, Princeton, Princeton University Press, NJ, 1964, pp. 127-174.
64. Cabo F., Escudero E., Martin-Herran G. A time-consistent agreement in an interregional differential game on pollution and trade // International Game Theory Review, 2006, Vol. 8, № 3, pp. 369-393.
65. Case J. H. Equilibrium points of n-person differential games, Ph.D. thesis, University of Michigan, Ann Arbor, MI, Department of Industrial Engineering, Tech. report No. 1967-1, 1967.
66. Cournot A. A. Memoire sur les applications du calcul des chances a la statistique judiciaire // Journal des mathématiques pures et appliquées 12, 1838, t. 3.
67. Clemhout S., Wan H. Y. Jr. Dynamic common-property resources and environmental problems // Journal of Optimization Theory and Applications, 1985, Vol. 46, pp. 471-481.
68. Dixit A. The Art of Smooth Pasting, New Jersey: Princeton University, 1993.
69. Dixit A.K., Pindyck R. S. Investment under Uncertainty, Princeton: Princeton University Press, 1994.
70. Dockner E. J., Van Long N. International pollution control: Cooperative versus noncooperative strategies / / Journal of Environmental Economics and Management, 1993, Vol. 25, pp. 13-29.
71. Feichtinger G., Wirl F. A Dynamic variant of the battle of the sexes // International Journal of Game Theory, 1993, Vol. 22, pp. 359-380.
72. Filar J.A., Schultz T.A., Thuijsman F., Vrieze O.J. Nonlinear programming and stationary equilibria in stochastic games // Mathematical Programming, 1991, Vol. 50, pp. 227-237.
73. Filar J. A., Gaertner P. S. A regional allocation of world C02 emission re-ductions // Mathematics and Computers in Simulation, 1997, 43, pp. 269-275.
74. Fleming W. H. Optimal continuous-parameter stochastic control // SIAM Review, 1969, 11, pp. 470-509.
75. Fleming W. H., Rishel R.W. Deterministic and Stochastic Optimal Control, New York: Springer-Verlag, 1975.
76. Fudenberg D., Maskin E. The folk theorem for repeated games with discounting or with incomplete information // Econometrica, 1986, Vol. 54, pp. 533-554.
77. Fudenberg D., Tirole J. Game theory. Cambridge: MIT press, 1991.
78. Gossner 0. The folk theorem for finitely repeated games with mixed strategies // Int. J. Game Theory, 1995, Vol. 24. pp. 95-107.
79. Grauer L. V., Petrosjan L. A. Strong Nash Equilibrium in Multistage Games // International Game Theory Review, 2002, Vol. 4(3), pp. 255264.
80. Hatcher A. Firm behaviour under pollution ratio standards with noncompliance // Environmental and resource economics, 2007, Vol. 38, pp. 89-98.
81. Haurie A., Krawczyk J.B., Roche M. Monitoring Cooperative Equilibria in a Stochastic Differential Games // Journal of optimization Theory and Applications, 1994, Vol. 81, pp. 79-95.
82. Herings P. J., Peeters R.J. Stationary Equlibria in Stochastic Games: Structure, Selection, and Computation // Journal of Economic Theory, 2004, Vol. 118, No. 1, pp. 32-60.
83. Holzman R., Law-Yone N. Strong Equilibrium in Congestion Games // Games and Economic Behavior, 1997, Vol. 21, pp. 85-101.
84. Isaacs R. Differential games. New York, London, Sydney: John Wiley and sons Inc, 1965.
85. Ito K. On stochastic differential equations. // Memoirs, American mathematical society, 1951. Vol. 4, pp. 1-51.
86. Jorgensen S. An exponential differential games which admits a simple Nash solutions // Journal of Optimization Theory and Applications, 1985, 45, pp. 383-396.
87. Jorgensen S., Martin-Herran G., Zaccour G. Agreeability and time-consistency in linear-state differential games // Journal of Optimization Theory and Applications, 2003, Vol. 119, №1. pp. 49-63.
88. Jorgensen S., Sorger G. Feedback Nash equilibria in a problem of optimal fishery management // Journal of Optimization Theory and Applications, 1990, 64, pp. 293-310.
89. Jorgensen S., Yeung D.W. K. Stochastic differential game model of a common property fishery // Journal of Optimization Theory and Applications, 1996, 90, pp. 391-403.
90. Jorgensen S., Zaccour G. The consistency In Cooperative Differential Games // Decision and Control in Management Sciences: Essays in Honor of Alain Haurie, Edited by G. Zaccour, Kluwer Academic Publishers, London, England, 2001, pp. 349-366.
91. Kaitala V. Equilibria in a stochastic resource management game under imperfect information // European Journal of Operational Research, 1993, 71, pp. 439-453.
92. Leitmann G. Cooperative and Non-Cooperative Many Players Differential Games, New York: Springer-Verlag, 1974.
93. Mazalov V. V. Dynamic games with optimal stopping // Game theory and Applicatoins, 1996, Vol. II. Nova Science Publishers, New York, pp. 37-46.
94. Mazalov V.V., Vinnichenko S.V. Games with optimal stopping of Wiener processes // Probability Theory and Applications, 1988, Vol. 33, pp. 590-591.
95. Mazalov V. V., Vinnichenko S.V. Optimal stopping of observations in optimal control of random walks problems // Probability Theory and Applications, 1990, Vol. 35, issue 4, pp. 669-676.
96. Papavassilopoulos G.P., Cruz J.B. On the Existence of Solutions to Coupled Matrix Riccati Differential Equations in Linear Quadratic Nash Games //IEEE Trans, on Automatic Control, 1979, Vol. AC-24, No. 1, Feb, pp. 127-129.
97. Parilina E. M. Subgame Consistency of Shapley Value in Cooperative Data Transmission Game in Wireless Network // Contributions to Game Theory and Management, 2008, SPb.: SPbSU, pp. 381-994.
98. Parilina E. M., Petrosyan L.A. Cooperative Stochastic Games in Stationary Strategies // «Game Theory and Applications», Nova Science Publishers, April 2006, Vol. 11, pp. 1-7
99. Petrosyan L.A. Bargaining in dynamic games // In: Petrosyan L., Yeung D. (ed) ICM Millennium Lectures on Games, 2003, Berlin: Springer-Verlag, pp. 139-143.
100. Petrosyan L. A., Grauer L.V. Strong Nash Equilibrium in Multistage Games // International Game Theory Review, 2004, Vol. 4, № 3, pp. 255-264.
101. Petrosjan L. A., Zaccour G. Time-Consistent Shapley Value Allocation of Pollution Cost Control // Journal of Economic Dynamics and Control, 2003, Vol. 27, № 3, pp. 381-398.
102. Petrosjan L. A., Zakharov V.V. Mathematical Models in Environmental Policy Analysis, New York: Nova Science Pbl., 1996.
103. Petrosyan L.A., Zenkevich N.A. Game Theory, World Scientific Publishing Co. Pte. Ltd, Republic of Singapore, 1996.
104. Porter M., Kramer M. Strategy and society. The link between Competitive Advantage and Corporate Social Responsibility // Harvard Business Review, 2006, pp. 1-14.
105. Shapley L.S. Stochastic Games // Proceedings of National Academy of Sciences of the USA, 1953, Vol. 39, pp. 1095-1100.
106. Sobel M.J. Non-cooperative stochastic games // Ann. Math. Studies, 1971, Vol. 42, pp. 1930-1935.
107. Sorger G. Competitive dynamic advertising: a modification of the case game // Journal of Economic Dynamics and Control, 1989, Vol. 13, pp. 55-80.
108. Starr A.W., Ho Y. C. Further properties of nonzero-sum differential games // Journal of Optimization Theory and Applications, 1969a, Vol. 3, pp. 207-219.
109. Starr A. W., Ho Y. C. Nonzero-sum differential games // Journal of Optimization Theory and Applications, 1969b, Vol. 3, pp. 184-206.
110. Tietenberg T. Environmental Economics and Policy. Pearson Education. 2007.
111. Tolwinski B., Haurie A., Lcitmann G. Cooperative equilibria in differential games // Journal of Mathematical Analysis and Applications, 1986, 119, pp. 82-202.
112. Van Damme E. E. C. Stability and perfection of Nash Equilibria, Berlin: Springer-Verlag, 1991.
113. Von Neumann J., Morgenstern O. The Theory of Games and Economic Behavior, Princeton University Press, Princeton,. 1944.
114. Yeung, D.W. K. A differential game of industrial pollution management // Annals of Operations Research, 1992, 37, pp. 297-311.
115. Yeung D. W. K. On differential games with a feedback Nash equilibrium // Journal of Optimization Theory and Applications, 1994, 82, No. 1, pp. 181-188.
116. Yeung D.W. K. A stochastic differential game model of institutional investor speculation / / Journal of Optimization Theory and Applications, 1999, 102, pp. 463-477.
117. Yeung D. W. K. Infinite-Horizon Stochastic Differential Games with Branching Payoffs // Journal of optimization Theory and Applications, 2001, Vol. Ill, pp. 445-460.
118. Ycung D.W. K., Petrosyan L. A. Subgame Consistent Cooperative Solutions in Stochastic Differential Games // Journal of optimization Theory and Applications, 2004, Vol. 120, pp. 651-666.
119. Ycung D.W.K., Petrosyan L.A. Cooperative stochastic differential games, New York: Springer Verlag, 2006, 242 p.
120. Zakharov V. One approach to allocating damage to environment // System Modelling and Optimization, New York.: Springer-Verl., 1994.
121. Zenkevich N. A., Zyatchin A.V. Cooperative solutions for games with a stochastically variable parameter //in Proceedings of the 12th International Symposium on Dynamic Games and Applications, France, 2006, p. 172.
122. Zenkevich N. A., Zyatchin A.V. Oligopoly Competition under Environmental Design // Game Theory and Applications, New York: Nova Science Publishers, Vol. 12, 2007, pp. 193-206.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.