Неантагонистические дифференциальные игры со случайными моментами выхода игроков из игры тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат наук Костюнин, Сергей Юрьевич
- Специальность ВАК РФ01.01.09
- Количество страниц 101
Оглавление диссертации кандидат наук Костюнин, Сергей Юрьевич
Содержание
Стр.
ВВЕДЕНИЕ '
Глава 1. ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ СО СЛУЧАЙНОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ. ПОСТРОЕНИЕ ФУНКЦИОНАЛА ВЫИГРЫША
1.1. Постановка задачи
1.2. Преобразование функционала выигрыша к удобному виду
1.2.1. Случай неотрицательной функции плотности выигрыша
1.2.2. Общий случай
1.3. Пример невыполнения условий представления функционала выигрыша в упрощённой форме
Глава 2. ДИФФЕРЕНЦИАЛЬНАЯ ИГРА УПРАВЛЕНИЯ ВРЕДНЫМИ ВЫБРОСАМИ
2.1. Модель игры
2.2. Функция выигрыша
2.3. Равновесие по Нэшу
2.4. Кооперативная игра
Глава 3. ДИФФЕРЕНЦИАЛЬНАЯ ИГРА С РАЗЛИЧНЫМИ МОМЕНТАМИ ВЫХОДА ИЗ ИГРЫ ЕЁ УЧАСТНИКОВ
3.1. Постановка задачи
3.2. Моменты окончания, распределённые на конечном промежутке времени
3.3. Математическое ожидание выигрыша игроков
3.4. Уравнение Гамильтона-Якоби-Беллмана
3.5. Переход к задаче оптимального управления
Глава 4. ДИФФЕРЕНЦИАЛЬНАЯ ИГРА СОВМЕСТНОЙ РАЗРАБОТ-
КИ НЕВОЗОБНОВЛЯЕМОГО РЕСУРСА
4.1. Модель игры
4.2. Решение задачи оптимального управления
4.3. Построение равновесия по Нэшу
4.4. Экспоненциальное распределение моментов окончания разработки
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
95
Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Теоретико-игровые задачи со случайной продолжительностью2016 год, кандидат наук Громова, Екатерина Викторовна
Кооперация в дискретных линейно-квадратичных играх2015 год, кандидат наук Тур, Анна Викторовна
Декомпозиционные алгоритмы построения равновесных решений в динамических играх2015 год, кандидат наук Красовский, Николай Андреевич
Линейно-квадратичные кооперативные дифференциальные игры2006 год, кандидат физико-математических наук Марковкин, Михаил Викторович
Решения кооперативных стохастических игр с трансферабельными выигрышами2019 год, доктор наук Парилина Елена Михайловна
Введение диссертации (часть автореферата) на тему «Неантагонистические дифференциальные игры со случайными моментами выхода игроков из игры»
ВВЕДЕНИЕ
Актуальность темы. Теория дифференциальных игр в настоящее время является одним из наиболее бурно развивающихся разделов математической теории игр. Главным образом это связано с тем, что математический аппарат дифференциальных игр позволяет реалистично моделировать конфликтно-управляемые процессы, непрерывно развивающиеся во времени. Так динамика фазовой переменной, описывающей состояние процесса, задаётся системой дифференциальных уравнений на некотором временном промежутке заданной продолжительности.
Теория дифференциальных игр сформировалась как отдельный раздел математической теории игр в пятидесятых годах двадцатого века. Одними из первых интересные результаты в этой области получили Р. Айзеке [45], Л. Берковитц [35], В. Флеминг [43].
Долгое время исследования были посвящены в основном антагонистическим дифференциальным играм. Значительные успехи в данной области связаны с представителями отечественной научной школы Н. Н. Красов-ским [19,20], Л. А. Петросяном [25], Л. С. Понтрягипым [29].
Толчком для развития теории пеантагонистических дифференциальных игр послужили задачи конфликтного управления со многими участниками из различных практических областей. В качестве принципа оптимальности в неантагонистических дифференциальных играх чаще всего рассматривается равновесие по Нэшу в программных или позиционных стратегиях. Основные результаты, посвящённые исследованию вопроса существования и проблемы построения равновесия по Нэшу, получены в работах А. Ф. Клейменова [11, 12], А. Ф. Кононенко [14], С. В. Чистякова [31].
Особый интерес представляют также кооперативные дифференциальные игры [9,10,23,26]. В частности, одним из важнейших направлений исследований в данной области является проблема динамической устойчивости (состоя-
тельпости во времени) кооперативного решения. Эта проблема впервые была сформулирована Л. А. Петросяном в 1977 году в работе [22]. Исследованиям проблемы динамической устойчивости посвящены также работы [23,26].
Отметим, что чаще всего дифференциальные игры рассматриваются на конечном временном промежутке (дифференциальные игры с предписанной продолжительностью). Наряду с ними, также рассматриваются и дифференциальные игры с дисконтированием на бесконечном временном промежутке.
Для многих математических моделей возникает проблема неопределённости времени существования исследуемого процесса. Такие проблемы особенно характерны для процессов, происходящих в экономике, менеджменте, экологии. Подобные задачи необходимо рассматривать на временном отрезке случайной длительности, т. е. полагать, что момент окончания процесса не задан заранее, а является реализацией некоторой случайной величины.
Впервые задача со случайной продолжительностью в игровой постановке была рассмотрена Л. А. Петросяном и Н. В. Мурзовым в работе «Теоретико-игровые задачи механики» [25]. В данной работе исследовалась дифференциальная игра преследования двух лиц, продолжительность которой задавалась некоторой случайной величиной с абсолютно непрерывной функцией распределения. Для заданной таким образом игры авторами было получено уравнение типа Айзекса-Беллмана.
Примерно в это же время в работе [64] была рассмотрена задача оптимального управления со случайным моментом окончания, где случайная продолжительность управляемого процесса связывалась со случайным моментом гибели индивидуума. В такой постановке автором решались задачи нахождения оптимального плана потребления ресурса и страхования жизни. Отметим, что задачи теории управления, связанные с оптимальным выбором наёмным работником плана страхования жизни и уровня потребления ресурса, при условии случайной продолжительности его жизни, получили своё
дальнейшее развитие в работах [38,58].
Задача управления со случайным моментом остановки в общей форме была сформулирована в работе [36]. Долгое время проблема случайной продолжительности рассматривалась премущественно в работах по теории управления. Среди них отметим работы [44,54].
В качестве целевого функционала в данных работах принято выбирать математическое ожидание интегрального функционала дохода. Одной из интересных проблем в задачах со случайной продолжительностью является проблема построения целевого функционала в упрощённой форме. Отметим, что для её решения в перечисленных выше работах, авторами вводились специальные ограничения на функции полезности и функцию распределения момента окончания.
Дифференциальные игры со случайной продолжительностью в общей постановке были введены в работе Л. А. Петросяна и Е. В. Шевкопляс [27]. В работе рассматривались дифференциальные игры со многими участниками, при этом момент окончания игры не был определён заранее, а представлял собой реализацию некоторой случайной величины с известной функцией распределения. В работах Е. В. Шевкопляс [32,33] были продолжены исследования кооперативных дифференциальных игр со случайной продолжительностью, получены важные результаты, относящиеся к проблеме динамической устойчивости кооперативных принципов оптимальности.
В теории дифференциальных игр со случайной продолжительностью [27,32,33,52] в момент окончания игры все игроки выходили из игры и прекращали свои действия одновременно, тогда как существует множество практических приложений, в которых игроки вынуждены прекращать свои действия независимо друг от друга.
В диссертационной работе вводится новый класс дифференциальных игр двух лиц со случайной продолжительностью, в которых продолжительность
игры для каждого игрока задаётся независимой случайной величиной. Полагается, что после выхода из игры первого по очереди игрока, оставшийся игрок продолжает получать доход, действуя в отсутствии конкуренции. Это приводит нас к необходимости учитывать возможный доход игроков после выхода их соперника при построении оптимальных (в том или ином смысле) стратегий в дифференциальной игре.
Также в диссертационной работе исследуется дифференциальная игра разработки невозобновляемого ресурса со случайными моментами выхода из игры её участников. Задачи оптимального потребления ограниченного ресурса, в англоязычной литературе получившие название cake-eating problems, широко распространены в теории оптимального управления благодаря своим многочисленным приложениям. Среди прочих отметим работы, связанные с нахождением оптимального плана добычи ограниченного природного ресурса в условиях неопределённиости [41,42].
В детерминированной игровой постановке задача потребления ограниченного ресурса (англ. competitive cake-eating problem) была рассмотрена в работах [40,60]. В работе [52] была рассмотрена дифференциальная игра со случайным моментом окончания, в которой игроки проводили разработку ограниченного ресурса в условиях случайной продолжительности, но в момент окончания игры прекращали разработку одновременно.
В связи с вышеизложенным, целью диссертационной работы является изучение дифференциальных игр со случайными моментами выходами из игры её участников, при этом моменты выхода игроков могут задаваться независимыми случайными величинами.
Научная новизна работы. В работе впервые введён и исследован класс дифференциальных игр двух лиц со случайной продолжительностью, в которых продолжительность игры для каждого игрока задаётся некоторой случайной величиной. С помощью данного класса игр удаётся построить
математические модели, в которых игроки, независимо могут выходить из конфликтно-управляемого процесса. Для оставшегося игрока игра переходит в задачу оптимального управления со случайной продолжительностью. Для данного класса игр получено и обосновано уравнение Гамильтона-Якоби-Беллмана, получены достаточные условия существования состоятельного позиционного равновесия по Нэшу.
Также в работе исследована проблема оптимального потребления ограниченных ресурсов на промежутке времени случайной длительности в теоретико-игровой постановке. Предложена модель совместной разработки двумя фирмами невозобновляемого ресурса в виде дифференциальной игры, продолжительность которой для каждого игрока является случайной величиной. Представлен алгоритм нахождения состоятельного позиционного равновесия по Нэшу, найденное равновесие исследовано при конкретном виде функций распределения моментов окончания разработки для игроков.
В диссертационной работе модель управления вредными выбросами, предложенная в работе [37], обобщена на случай случайной продолжительности. Исследовано полученное равновесие по Нэшу, а также построена кооперативная версия игры и исследована проблема динамической устойчивости вектора Шепли.
Практическая ценность работы заключается в применении результатов, относящихся к области дифференциальных игр со случайной продолжительностью, при математическом моделировании конфликтно-управляемых процессов. Широко известно, что дифференциальные игры являются удобными математическими моделями для описания конфликтно-управляемых процессов в экономике, менеджменте, экологии и прочих сферах человеческой деятельности. Рассмотрение таких процессов на интервале времени случайной длительности позволяет наиболее адекватно оценивать их развитие, учитывая, например, выход из строя оборудования (в задачах совместной
разработки недр или совместного управления вредными выбросами).
Основные результаты, выносимые на защиту:
1. Построена формализация дифференциальной игры двух лиц со случайной продолжительностью, в которой продолжительность игры для каждого игрока является случайной величиной, имеющей свою функцию распределения. При некоторых ограничениях проведены преобразования, приводящие функционал выигрыша игрока к стандартному интегральному функционалу.
2. Для введённого класса дифференциальных игр двух лиц со случайной продолжительностью получена система уравнений Гамильтона-Якоби-Беллмана и теорема, дающая достаточные условия существования состоятельного позиционного равновесия по Нэшу.
3. В дифференциальной игре совместной разработки невозобновляемого ресурса, в которой моменты окончания разработки ресурса для игроков являются независимыми случайными величинами, найдено в явном аналитическом виде и исследовано состоятельное позиционное равновесие по Нэшу.
4. Исследована дифференциальная игра управления вредными выбросами. В условиях случайной продолжительности получены необходимые условия существования равновесия по Нэшу. Найдено в явном виде и исследовано решение, удовлетворяющее необходимым условиям.
5. На основе игры управления вредными выбросами построена кооперативная дифференциальная игра, в которой найдены вектор Шепли, выбранный в качестве принципа оптимальности, и процедура распределения дележа, гарантирующая динамическую устойчивость вектора Шепли.
Апробация работы. Основные результаты диссертационной работы были представлены на IV - VII Международных конференциях «Теория игр
и менеджмент» (Санкт-Петербург, 2010 - 2013), на Всероссийской конференции «Устойчивость и процессы управления» (Санкт-Петербург, 2010), на Международной конференции «Constructive Nonsmooth Analysis and Related Topics» (Санкт-Петербург, 2012), на XLI - XLIII международных научных конференциях аспирантов и студентов «Процессы управления и устойчивость» (Санкт-Петербург, 2010 - 2012), а также на семинарах кафедры математической теории игр и статистических решений и центра теории игр факультета Прикладной математики - процессов управления Санкт-Петербургского государственного университета.
По материалам диссертации опубликованы следующие работы: [15-18,4850,61-63] . Из них статьи [15,16,50,63] опубликованы в журналах из списка ВАК.
Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.
Объем и структура диссертации. Диссертация состоит из введения, четырёх глав, разделённых на параграфы, заключения и списка литературы. Параграфы дополнительно разделены на подпараграфы. Список литературы включает 64 наименования.
Первая глава посвящена построению функционала выигрыша в дифференциальных играх со случайной продолжительностью.
В параграфе 1.1 вводится определение дифференциальной игры со случайной продолжительностью. Выигрыш игрока определяется как математическое ожидание интегрального функционала.
Параграф 1.2 посвящён вопросу упрощения функционала выигрыша в виде математического ожидания. В подпараграфе 1.2.1 рассматривается случай
и
неотрицательной функции плотности выигрыша. Доказывается теорема 1.1, гарантирующая существование выигрыша в упрощённой форме в этом случае. В подпараграфе 1.2.2 проводится упрощение функционала выигрыша в случае, когда на функцию плотности выигрыша дополнительных ограничений не накладывается. К сожалению, в общем случае не всегда удаётся представить функционал выигрыша в упрощённой форме. В теореме 1.2 даются достаточные условия представления выигрыша в упрощённом виде. В параграфе 1.3 приводится пример, когда достаточные условия, полученные в теореме 1.2, не выполняются. Показывается, что выигрыш в виде математического ожидания в этом случае не может быть упрощён.
Вторая глава посвящена исследованию дифференциальной игры управления вредными выбросами, которая является обобщением игры, представленной в работе [37], на случай случайной продолжительности.
В параграфе 2.1 строится теоретико-игровая модель, определяется функционал выигрыша для игроков, задаётся распределение момента окончания игры. В параграфе 2.2 к построенной модели применяются результаты параграфа 1.2. Строятся оцеики функционала выигрыша, которые позволяют показать выполнение полученных в теореме 1.2 достаточных условий. Выводится упрощённый вид функционала выигрыша. Параграф 2.3 посвящён построению равновесия по Нэшу в программных стратегиях. В качестве необходимого условия применяется принцип максимума Понтрягина [2,30], для нахождения максимума гамильтониана используются условия Куна-Таккера [1]. Полученные решения анализируются при различных распределениях момента окончания игры. В параграфе 2.4 на основе рассматриваемой неантагонистической дифференциальной игры строится кооперативная дифференциальная игра, определяется характеристическая функция [53], удовлетворяющая свойству супераддитивности [53]. В качестве принципа оптимальности выбирается вектор Шепли, его динамическая устойчивость гарантируется постро-
енной процедурой распределения дележа.
Третья глава посвящена рассмотрению класса дифференциальных игр со случайной продолжительностью и различными моментами выхода из игры её участников.
В параграфе 3.1 определяется новый класс дифференциальных игр со случайной продолжительностью. Каждый игрок имеет свой собственный момент выхода из игры. Выигрыш игрока в такой игре определяется как математическое ожидание суммы интегрального функционала и терминальной составляющей, которую получает игрок, дольше остающийся в игре.
В параграфе 3.2 определяется частный случай, когда моменты выхода из игры для игроков распределены на конечном интервале. Вводится понятие наименьшей верхней границы для случайной величины - момента выхода игрока из игры. Функции распределения доопределяются на едином отрезке.
Параграф 3.3 посвящён упрощению функционала выигрыша игрока в виде математического ожидания. Выигрыш представляется в виде суммы двух математических ожиданий. Доказываются леммы 3.1 и 3.2, с помощью которых последовательно производится упрощение ожидаемого интегрального выигрыша и ожидаемого терминального выигрыша. С помощью лемм доказывается теорема 3.1, дающая упрощенную форму для всего функционала выигрыша.
В параграфе 3.4 выводится и исследуется уравнение Гамильтона-Якоби-Беллмана. Доказывается теорема 3.3, дающая достаточное условие существования состоятельного позиционного равновесия по Нэшу в данном классе дифференциальных игр.
В параграфе 3.5 рассматривается важный частный случай дифференциальной игры со случайным моментом окончания и терминальным выигрышем. В качестве терминальной составляющей выигрыша используется функция значения в задаче оптимального управления для соответствующего игро-
ка. Это соотвествует математической модели, в которой оставшийся в дифференциальной игре игрок переходит из неё в задачу оптимального управления. Приводится доказательство теоремы 3.4, определяющей достаточное условие существования состоятельного равновесия по Нэшу в данной игре.
Четвёртая глава посвящена построению состоятельного позиционного равновесия по Нэшу в дифференциальной игре со случайной продолжительностью, моделирующей совместную разработку невозобновляемого ресурса.
В параграфе 4.1 строится модель дифференциальной игры. В игре принимают участие два игрока - фирмы, ведущие совместную разработку невозобновляемого ресурса. Для каждой фирмы момент окончания разработки является случайной величиной. После окончания добычи ресурса одной из фирм, другая продолжает разработку до своего момента окончания.
Параграф 4.2 посвящён решению задачи оптимального управления со случайной продолжительностью, в которую переходит дифференциальная игра после того, как одна из фирм прекращает разработку ресурса. Определяются функция значения и оптимальное управление.
В параграфе 4.3 с учётом функции значения игрока в задаче оптимального управления определяется его функционал выигрыша в дифференциальной игре. Состоятельное позиционное равновесие по Нэшу в игре разработки невозобновляемого ресурса строится путём решения системы уравнений Гамильтона-Якоби-Беллмана.
В параграфе 4.4 полученные равновесные стратегии анализируются для случая усечённого экспоненциального распределения. Исследуется зависимость оптимального поведения игроков от параметров распределения их моментов окончания разработки невозобновляемого ресурса. Проводится сравнение равновесия в игре в новой постановке и равновесия в дифференциальной игре со случайным моментом окончания в общепринятой постановке.
В заключении приводятся основные результаты, полученные в работе.
В диссертационной работе использована двойная нумерация формул. Первая цифра означает номер главы, вторая - номер формулы в главе. Для теорем, лемм, утверждений, замечаний и следствий используется двойная нумерация. Первая цифра означает номер главы, вторая - номер в главе. Параграфы имеют двойную нумерацию, где первая цифра означает номер главы, а вторая номер параграфа в главе. Подпараграфы имеют тройную нумерацию, где первая цифра означает номер главы, вторая - номер параграфа в главе, третья - номер подпараграфа в параграфе. Список литературы приведен в алфавитном порядке.
Глава 1
ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ СО СЛУЧАЙНОЙ ПРОДОЛЖИТЕЛЬНОСТЬЮ. ПОСТРОЕНИЕ ФУНКЦИОНАЛА ВЫИГРЫША
1.1. Постановка задачи
Рассмотрим дифференциальную игру п лиц Г(хо) со случайной продолжительностью Т — ¿о и начальным состоянием хо [25,27]. Динамика игры задаётся системой обыкновенных дифференциальных уравнений в векторной форме:
х = .. ,ип), (1.1)
х(г0) = х0,
где х, щ,..., ип) — вектор-функция с компонентами:
Ф1(г,х,щ,.. .,ип), ф2{г,х,щ,.. .,ип),.. .,Фт(г,х,и1,.. .,ип).
Функции фР(Ь, х, щ,..., ип), у = 1 ,...,т, определены при х Е Ят и Щ 6 1/{ С сотр^.
Одним из интересных вопросов теории дифференциальных игр является вопрос точного определения множества стратегий игроков. Однако в данном случае нас будет более интересовать не строгое решение игр, а лишь вывод условий приведения функционала выигрыша игрока к более простой форме. Поэтому будем полагать, что множества допустимых стратегий игроков заданы таким образом, что для любых допустимых стратегий игроков существует единственное непрерывное, по крайней мере кусочно-дифференцируемое решение системы (1.1), продолжимое на [¿о,оо).
Игра начинается в момент Ц из состояния :го, однако момент ее окон-
чания не фиксирован заранее, а является реализацией некоторой случайной величины Т. Будем полагать, что для случайной величины Т задана функция распределения которая определена при £ £ [¿о, оо) и удовлетворяет условию нормировки:
00
J = 1.
¿0
Функцию плотности выигрыша (функцию полезности) игрока ъ в момент времени т, т Е [£о>°о) будем обозначать как /¿¿(т, х{т), щ,..., ип). Будем предполагать, что при любом возможном выборе стратегий игроками функция плотности выигрыша игрока г является ограниченной кусочно-непрерывной функцией времени т (кусочная непрерывность понимается в том смысле, что на каждом отрезке функция /гДт, х(т), щ,... ,ип) может иметь лишь конечное число разрывов первого рода), для краткости будем обозначать функцию плотности выигрыша Ы(т). При сделанных предположениях функции Нг(т) являются интегрируемыми по Риману на любом отрезке т- е- Для каждого Ь £ [¿о>оо) существует интеграл
Целью каждого игрока является максимизация математического ожидания своего выигрыша
К{(г0,х0,ии ...,ип) = Е
Ы{т)<1т
и0
, г = 1,..., п,
которое задаётся в виде интеграла Лебега-Стилтьеса [13]:
оо £
К{(г0,Х0,ии ... ,ип) = у J hi{т)dтdF{t), г = 1 ,...,п. (1.2)
tо ¿0
Далее под выигрышем игрока г будет понимать именно его математическое ожидание (1.2).
Решение игры с функционалом выигрыша в виде повторного интеграла
(1.2) может представлять некоторую техническую трудность, поэтому естественным образом возникает вопрос о возможности его упрощения.
1.2. Преобразование функционала выигрыша к удобному виду
1.2.1. Случай неотрицательной функции плотности выигрыша
Предположим, что при любом выборе стратегий игроками плотность выигрыша игрока г удовлетворяет условию неотрицательности:
Ограничив таким образом множество рассматриваемых функций плотности выигрыша, сформулируем следующую теорему.
Теорема 1.1. Пусть функция плотности выигрыша = 1,... ,п удо-
влетворяет условию неотрицательности У£ Е [¿о, °°) и является ограниченной кусочно-непрерывной функцией времени Тогда выигрыш игрока г (1.2) представим в упрощённой форме:
Доказательство. Рассмотрим множество А С [¿о, оо) х [¿о> сю), заданное следующим образом:
Для сечений множества Л введем следующие обозначения (рисунок 1.1)
х(т),и1,..., ип) > 0, Ут Е [*о, оо).
(1.3)
00
ада-^т))^, ¿ = 1 (1.4)
¿о
Л = {(*,т)|* € [*о,оо),те [*о,*]}.
А = {т\^т)еА}
Ат = {ф,т) £ А}
to
/! / / i /' 1 ' / 1 /■1 ' I
/!> 1 1 I /ii!' / / / / x / I 1 ' I ' , :
/ > ' 1 ' I /
iiilljll I
'! I: / /At /,//,
/ * //
Aunt
тип1 ^ i mm /
i щшш
¡ii; / / / / / » > f / ,
a! Паш
;,',/// i f ''' / ! ' r !
to
Рисунок 1.1. Сечения множества Л.
На полупрямой [to, оо) рассмотрим меру Лебега-Стилтьеса др , отвечающую функции jP(i) [13], а также одномерную меру Лебега Равенство (1.2) в введённых обозначениях можно записать следующим образом:
^¿(¿0^0,^1,...,%)= J J hi(T)dfi
[t0,oc]
L Л
dfip, i = 1,
n.
(1.5)
При сделанных выше предположениях функция /^(т) имеет не более чем счетное множество точек разрыва С [¿о, ос). Так как /лТ(Е) = 0, а сужение функции /¿¿(г) на множество [1о,оо)\Е есть непрерывная функция, то функция Н{(т) измерима по Лебегу [21]. Но тогда и функция /гг-(т, ¿) = /1г(т), определённая на множестве А, измерима на нём «как функция двух переменных». В этом случае при выполнении условия (1.3) справедлива теорема Тонелли [21]:
[*0.°о]
/ /¿¿(т)(^т &\1р = 1
и -Аг J и [¿о,оо] и 1Ат ]
г = 1,..., п. (1.6)
Преобразуем далее правую часть полученного равенства:
J ! ы(т)<111р
В результате получаем
&\1Т = J [ к1(т)11Р(Ат)] &\1т, г — 1,..., п.
[¿0,оо]
оо
У [ Ы{т)МАт)} ¿11Т = J /ц-(г)(1 - Р(т))йт, г - 1,...,
п.
[<0,оо]
Это приводит нас к равенству
[¿о,оо]
Л
оо
J J hi(т)dflт ¿{1Р = J Ы(т){1 - ^(г))с?г, г = 1
¿0
которое совместно с выражением (1.5) и приводит нас к искомому представлению (1.4).
□
Стоит отметить, что интегралы в (1.2) и (1.4) конечны или бесконечны одновременно. Поэтому, если для любого набора стратегий щ,... ,ип функция кг(т,х(т),щ,...,ип) — Кг(т) удовлетворяет условию (1.3), то при решении игры в качестве интегрального выигрыша игрока г удобнее использовать выражение (1.4).
Следствие 1.1. Пусть функция плотности выигрыша — 1 ,...,п
неположительна Е [¿о> и является ограниченной кусочно-
непрерывной функцией времени Тогда ожидаемый выигрыш игрока % (1.2)
представим в виде (1.4)•
Доказательство. Достаточно в качестве функции плотности выигрыша игрока г рассмотреть функцию д^т) = и применить теорему 1.1. Оста-
ется только воспользоваться свойством однородности интеграла и получить требуемое равенство.
Замечание. При доказательстве теоремы и следствия существенными условиями были лишь измеримость функции к{(т) по Лебегу на множестве [¿о,оо) и ее неотрицательность (неположительность) на данном множестве. Поэтому доказательство легко может быть проведено, если заменить предположение о кусочной непрерывности функции /¿¿(т) предположением, например, об измеримости данной функции по Лебегу и ее ограниченности на любом отрезке £ (¿о,оо).
1.2.2. Общий случай
Пусть теперь на функцию плотности выигрыша не накладывается требование сохранения знака (неотрицательности или неположительности). В данном пункте будем рассматривать интегралы в правой части (1.2) как интегралы Римана (в том числе и как несобственные интегралы Римана). При таком рассмотрении правая часть (1.2) представляет собой ожидаемый выигрыш игрока г в случае абсолютной сходимости внешнего интеграла. Иными словами, для существования математических ожиданий в (1.2) необходимо и достаточно, чтобы следующие интегралы существовали в смысле несобственных интегралов Римана:
Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК
Модели устойчивой двухуровневой кооперации в дифференциальных играх2015 год, кандидат наук Колабутин, Николай Валерьевич
Задачи позиционного управления и моделирования в динамических системах1984 год, кандидат физико-математических наук Стихина, Татьяна Кабдешевна
Условие устойчивости против иррационального поведения игроков2012 год, кандидат физико-математических наук Белицкая, Анна Владимировна
Оптимальное управление линейной системой со случайными коэффициентами и квадратичным критерием качества2015 год, кандидат наук Якубенко, Илья Павлович
Обобщенное уравнение Айзекса-Беллмана в теории дифференциальных игр2009 год, кандидат физико-математических наук Никитин, Федор Федорович
Список литературы диссертационного исследования кандидат наук Костюнин, Сергей Юрьевич, 2014 год
Список литературы
1. Алексеев В.М., Тихомиров В.М., Фомин C.B. Оптимальное управление. М.: Наука, 1979. 432 с.
2. Афанасьев В.Н., Колмановский В.В., Носов В.Р. Математическая теория конструирования систем управления. М.: Высш. шк., 2003. 614 с.
3. Беллман Р. Динамическое программирование. М.: Изд-во иностр. литры, 1960. 400 с.
4. Беллман Р., Дрейфус С. Прикладные задачи динамического программирования. М.: Наука, 1965. 460 с.
5. Беллман Р., Энджел Э. Динамическое программирование и уравнения в частных производных. М.: Мир, 1974. 207 с.
6. Гелбаум Б., Олмстед Дж. Контрпримеры в анализе. М.: Мир, 1967. 234 с.
7. Зорич В.А. Математический анализ. Часть I. Изд. 4-е испр. М.: МЦН-МО, 2002. XVI, 664 с.
8. Клейменов А.Ф. Задачи конфликтного управления // Прикл. математика и механика. 1975. Т. 39. Вып. 2. С. 225-234.
9. Клейменов А.Ф. К кооперативной теории бескоалиционных позиционных игр // Докл. АН СССР. Т. 312. № 1. 1990. С 32-35.
10. Клейменов А.Ф. Кооперативные решения в позиционной дифференциальной игре многих лиц с непрерывными функциями платежей // Прикл. математика и механика. 1990. Т. 54. Вып. 3. С. 389-394.
11. Клейменов А.Ф. Неантагонистические позиционные дифференциальные игры. Екатеринбург: Наука. УРО. 1993. 185 с.
12. Клейменов А.Ф. О решениях в неантагонистической позиционной дифференциальной игре // Прикл. математика и механика. 1997. Т. 61. Вып. 5. С. 739-746.
13. Колмогоров А.H., Фомин C.B. Элементы теории функций и функционального анализа. М.: Наука, 1989. 624 с.
14. Кононенко А.Ф. О равновесных позиционных стратегиях в неантагонистических дифференциальных играх // Доклады АН СССР. 1976. Т. 231. 2. С. 285-288.
15. Костюнин С. Ю., Палестини А., Шевкопляс Е. В. Об одной дифференциальной игре, моделирующей разработку певозобновляемого ресурса // Вестник С.-Петерб. ун-та. Сер 10: Прикладная математика, информатика, процессы управления. 2013. Вып. 3. С. 73-82.
16. Костюнин С. Ю., Шевкопляс Е. В. Об упрощении интегрального выигрыша в дифференциальных играх со случайной продолжительностью // Вестник С.-Петерб. ун-та. Сер 10: Прикладная математика, информатика, процессы управления. 2011. Вып. 4. С. 47-56.
17. Костюнин С. Ю., Шевкопляс Е. В. Одна модифицированная теоретико-игровая модель регулирования вредных выбросов // Процессы управления и устойчивость: Труды 41-й международной научной конференции аспирантов и студентов / под ред. Н. В. Смирнова, Г. Ш. Тамасяна. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2010. С. 647-653.
18. Костюнин С. Ю., Шевкопляс Е. В. О выборе функции полезности в задаче разработки невозобновляемого ресурса // Процессы управления и устойчивость: Труды 43-й международной научной конференции аспирантов и студентов / под ред. А. С. Ерёмина, Н. В. Смирнова. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2012. С. 527-531.
19. Красовский H.H. Управление динамической системой. Задача о минимуме гарантированного результата. М.: Наука, 1985. 469 с.
20. Красовский H.H., Субботин А.И. Позиционные дифференциальные игры. М.: Наука, 1974. 456 с.
21. Макаров Б.M., Подкорытов А.H. Лекции по вещественному анализу. СПб.: БХВ-Петербург, 2011. 688 с.
22. Петросян Л.А. Устойчивость решений в дифференциальных играх со многими участниками // Вести. ЛГУ. 1977. № 19. С. 46-52.
23. Петросян Л.А., Данилов H.H. Кооперативные дифференциальные игры и их приложения. Изд-во Томского университета, 1985. 273 с.
24. Петросян Л.А., Зенкевич H.A., Шевкопляс Е.В. Теория игр. СПб.: БХВ-Петербург, 2012. 432 с.
25. Петросян Л.А., Мурзов Н.В. Теоретико-игровые проблемы в механике // Литовский математический сборник. 1966. VI-3. С. 423-433.
26. Петросян Л.А., Томский Г.В. Динамические игры и их приложения. Л.: Изд. ЛГУ, 1982. 251 с.
27. Петросян Л.А., Шевкопляс Е.В. Кооперативные дифференциальные игры со случайной продолжительностью // Вестник СПбГУ. 2000. Сер. 1. Вып. 4. С. 18-23.
28. Печерский С.Л., Яновская Е.Б. Кооперативные игры: решения и аксиомы. СПб.: Изд-во Европ. унив-та в С.-Петербурге, 2004. 459 с.
29. Понтрягин Л.С. К теории дифференциальных игр // Успехи математических наук. 1966. 21, 4 (130). С. 219-274.
30. Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая терия оптимальных процессов. М.: Наука, 1983. 392 с.
31. Чистяков C.B. О бескоалиционных дифференциальных играх // Доклады АН СССР. 1981. Т. 259. № 5. С. 1052-1055.
32. Шевкопляс Е.В. Уравнение Гамильтона-Якоби-Беллмана в дифференциальных играх со случайной продолжительностью // Математическая теория игр и ее приложения. 2009. Т.1. Вып. 2. С. 98-118.
33. Шевкопляс Е.В. Устойчивая кооперация в дифференциальных играх со случайной продолжительностью // Управление большими системами: сборник трудов. 2010. № 31-1. С. 162-190.
34. Basar Т., Olsder G.J. Dynamic noncooperative game theory. Society for Industrial and Applied Mathematics, 1999. 519 p.
35. Bercovitz L.D. A variational approach to differential games// Adv. in game theory, Ann. of Math. Studies. 1964. P. 127-175.
36. Boukas, E. K. and Haurie, A. and Michel, P. An Optimal Control Problem with a Random Stopping Time // Journal of optimization theory and applications. 1990. Vol. 64, NO, 3. P. 471-480.
37. Breton M., Zaccour G., Zahaf M. A Differential Game of Joint Implementation of Environmental Projects // Automatica. 2005. Vol. 41, 10. P. 1737-1749.
38. Chang F.R. Stochastic Optimization in Continuous Time. Cambridge Univ. Press, 2004, 326 p.
39. De-Paz A., Marin-Solano J., Navas J., Roch O. Consumption, investment and life strategies with heterogeneous discounting / / Insurance: Mathematics and Economics. 2014. Vol. 54. P. 66-75.
40. Dockner E., J0rgensen S., Van Long N., Sorger G. Differential games in economics and management science. Cambridge University Press, 2000. 396 p.
41. Epstein G.S. The extraction of natural resources from two sites under uncertainty // Econ. Lett. 1996. 51. P. 309-313.
42. Feliz R.A. The optimal extraction rate of a natural resource under uncertainty // Econ. Lett. 1993. 43. P. 231-234.
43. Fleming W.H. The convergence problem for differential games // Adv. in game theory, Ann. of Math. Studies. 1964. P. 175-195.
44. Giri В. С., Goyal S. К. Recent trends in modeling of deteriorating inventory // European Journal of Operational Research. 2001. Vol. 134. N 1. P. 1-16.
45. Isaacs R. Differential games. New York, London, Sydney: John Wiley and sons Inc, 1965. 416 p.
46. J0rgensen S., Zaccour G. Developments in Differential Game Theory and Numerical Methods: Economic and Management Applications // Computational Management Science. 2007. Vol. 4. N 2. P. 159-182.
47. Karp L. Non-constant discounting in continuous time // Journal of Economic Theory. 2007. Vol. 132. P. 557-568.
48. Kostyunin S. Differential games with random terminal instants // Contributions to game theory and management, vol. VI. SPb.: Graduate School of Management SPbU. 2013. P. 222-230.
49. Kostyunin S., Palestini A., Shevkoplyas E. Differential game of resource extraction with random time horizon and different hazard functions // Процессы управления и устойчивость: Труды 42-й международной научной конференции аспирантов и студентов / Под ред. А. С. Ерёмина, Н. В. Смирнова. СПб.: Издат. Дом С.-Петерб. гос. ун-та, 2011. С. 571-576.
50. Kostyunin S, Palestini A, Shevkoplyas Е. On a nonrenewable resource extraction game played by asymmetric firms // Journal of Optimization Theory and Applications [Internet]. 2013. P. 1-14. Available from: www.scopus.com
51. Marin-Solano J., Navas J. Non-constant discounting in finite horizon: The free terminal case // Journal of Economic Dynamic & Control. 2009. Vol. 33. P. 666-675.
52. Marin-Solano J., Shevkoplyas E. Non-constant discounting in differential games with random time horizon // Automatica. 2011. Vol. 47. 12. P. 26262638.
53. Peleg B., Sudholter P. Introduction to the Theory of Cooperative Games. Kluwer Academic. 2003. 378 p.
54. Perry D., Stadje W. Function space integration for annuities // Insurance: Mathematics and Economics. 2001. Vol. 29. N 1. P. 73-82.
55. Petrosjan L. A., Zaccour G. Time-consistent Shapley Value Allocation of Pollution Cost Reduction // Journal of Economic Dynamics and Control. 2003. Vol. 27. P. 381-398.
56. Petrosjan L.A., Yeung D.W.K. Subgame Consistent Economic Optimization. Birkhauser, 2012. 425 p.
57. Phelps E. S., Pollak R. A. On second-best national saving and game-equilibrium growth // Review of Economic Studies. 1968. Vol. 35. P. 185199.
58. Pliska S. R., Ye J. Optimal life insurance purchase and consumption/investment under uncertain lifetime // Journal of Banking & Finance. 2007. Vol. 31. N 5. P. 1307-1319.
59. Pollak R. A. Consistent planning// Review of Economic Studies. 1968. Vol. 35. P. 201-208.
60. Rubio S. On Coincidence of Feedback Nash Equilibria and Stackelberg Equilibria in Economic Applications of Differential Games // Journal of Optimization Theory and Applications. 2006. Vol. 128. N 1. P. 203-221.
61. Shevkoplyas E., Kostyunin S. Modelling of Environmental Projects under Condition of a Random Time Horizon // Contributions to game theory and management, vol. IV. SPb.: Graduate School of Management SPbU. 2011. P. 447-459.
62. Wrzaczek S, Shevkoplyas E, Kostyunin S. Differential Game of Pollution Control with overlapping generations // Contributions to game theory and management, vol. V. SPb.: Graduate School of Management SPbU. 2012. P. 310-320.
63. Wrzaczek S, Shevkoplyas E, Kostyunin S. A differential game of pollution control with overlapping generations // International Game Theory Review [Internet]. 2014(2). Available from: www.scopus.com
64. Yaari, M.E. Uncertain Lifetime, Life Insurance, and the Theory of the Consumer // The Review of Econimic Studies. 1965. 32(2). P. 137-150.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.