Асимптотические свойства повторяющихся игр с неполной информацией и моделирование динамики финансовых рынков тема диссертации и автореферата по ВАК РФ 08.00.13, кандидат наук Сандомирский, Федор Алексеевич
- Специальность ВАК РФ08.00.13
- Количество страниц 93
Оглавление диссертации кандидат наук Сандомирский, Федор Алексеевич
Содержание
Введение
1 Базовые факты теории повторяющихся игр
с неполной информацией
§1.1 Основные определения и классические результаты
1.1.1 Цена информации при большом числе повторений
и максимальная вариация
1.1.2 Случай бесконечных К, I и 7
§ 1.2 Сведение игры к мартингальной оптимизационной задаче
§ 1.3 Повторяющиеся игры с неполной информацией и моделирование
финансовых рынков
1.3.1 Непрерывные модели
1.3.2 Дискретные модели
2 Повторяющиеся игры с ограниченной ценой информации
§ 2.1 Мотивировка
§ 2.2 Достаточное условие ограниченности
2.2.1 Модельная одномерная задача
2.2.2 Модельная задача как редукция 2 х 2-игры
§ 2.3 Необходимое условие ограниченности цены информации
2.3.1 Модельная одномерная задача
2.3.2 Завершение доказательства Теоремы 2.2
3 Максимальная изменчивость мнения при длительном байесовском обучении
§ 3.1 Определение максимальной вариации
§ 3.2 Классические оценки максимальной вариации и проблема
расходимости
§ 3.3 Энтропийные оценки максимальной вариации
3.3.1 Неулучшаемость оценки А. Неймана
3.3.2 Другие оценки максимальной вариации через энтропию Шеннона
§ 3.4 Оценки максимальной вариации сверху: счетное множество
состояний
3.4.1 Оценки вариации скалярных ограниченных мартингалов
3.4.2 А(А')-значные мартингалы
§ 3.5 Аномальный рост максимальной вариации
3.5.1 Мартингал диадических расщеплений для р 6 Д(К)
§ 3.6 Случай континуального множества состояний
3.6.1 Оценки максимальной вариации сверху
3.6.2 Линейный рост максимальной вариации для р с нетривиальной непрерывной компонентой
4 Максимальная скорость роста цены информации в
повторяющихся играх при N —> оо
§ 4.1 Повторяющиеся игры со счетным множеством состояний:
аномальный рост цены информации
4.1.1 Игра и ее свойства
§ 4.2 Обобщение на континуальный случай: игры со всюду разрывными
платежами
§ 4.3 Регулярные одношаговые функциями выигрыша: цена
информации и е-энтропия Колмогорова
4.3.1 Оценки цены информации через е-энтропию
4.3.2 Применение к играм с регулярными одношаговыми функциями выигрыша
Заключение
Список литературы
Рекомендованный список диссертаций по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК
Теоретико-игровое моделирование биржевых торгов2013 год, кандидат наук Сандомирская, Марина Сергеевна
Многошаговые стохастические игровые задачи управления2004 год, доктор физико-математических наук Доманский, Виктор Константинович
Стратегическая рандомизация при принятии конкурентных экономических решений: теоретико-игровой подход2010 год, доктор физико-математических наук Крепс, Виктория Леонидовна
Минимаксное хеджирование европейского опциона на неполном рынке2018 год, кандидат наук Зверев, Олег Владимирович
Моделирование безарбитражных финансовых рынков с помощью хааровских интерполяций на счетном вероятностном пространстве2005 год, кандидат физико-математических наук Данекянц, Анжелика Генриковна
Введение диссертации (часть автореферата) на тему «Асимптотические свойства повторяющихся игр с неполной информацией и моделирование динамики финансовых рынков»
Введение
Представленная диссертация посвящена теоретико-игровому анализу информационных аспектов длительных многоэтапных социально-экономических взаимодействий.
Актуальность темы исследования. Социально-экономические взаимодействия людей или групп людей связаны с неопределенностью, а значит, с неполнотой информации у участников. Причем неполнота информации может меняться от участника к участнику. Ее источником может являться как различная информированность о свойствах самого взаимодействия и различные способности предвидеть будущее, так и невозможность знать достоверно все свойства оппонентов: цели, к которым они стремятся, и имеющуюся у них приватную информацию — их собственные представления о свойствах взаимодействия, о будущем и о других агентах.
Социально-экономические взаимодействия происходят во временной перспективе, и, соответственно, анализ поведения оппонентов в прошлом позволяет уточнять представления об их целях и имеющейся у них информации, а уточненные представления могут быть использованы, чтобы скорректировать поведение в будущем. Это обуславливает сложную информационную, а следовательно, и стратегическую природу продолжительных взаимодействий: выбирая план действий, необходимо учитывать не только сиюминутную выгоду, которую принесет то или иное действие, но и информацию, которую оно сообщит другим участникам.
Математическим моделированием информационных аспектов многошаговых социально-экономических взаимодействий занимается теория повторяющихся игр с неполной информацией — раздел теории игр, возникший в работах Нобелевского лауреата по экономике Р. Ауманна и М. Машлера (см. [9]). Центральную роль в теории играют асимптотические постановки при большой продолжительности взаимодействия, так как в силу сложной стратегической природы явные решения удается найти лишь в очень редких случаях. Основная часть известных результатов относится к ситуации, когда взаимодействуют лишь два игрока с полностью противоположными интересами, и неполная информация имеется лишь у одного из них (например,
см. работы Р. Ауманна, М. Машлера, Ш. Замира, Ж.-Ф. Мертенса, А. Неймана, Б. Де Мейера, Ф. Генсбиттеля из списка литературы). Однако, даже несмотря на полувековую историю дисциплины, для антагонистических игр с неполной информацией у одного из игроков остается масса открытых вопросов, на ряд из которых нам удается ответить. В частности, в диссертации даются ответы на вопросы, поставленные в недавней статье А. Неймана [27].
В последние годы источником открытых вопросов и новых методов анализа повторяющихся игр с неполной информацией стали игры, описывающие влияние асимметричности информации на динамику финансового рынка (Б. Де Мейер, X. М. Салей, А. Марино, В. Доманский, В. Крепе). В частности, из этого круга задач возник метод редукции игры к мартингальной оптимизационной задаче, введенный в работе Б. Де Мейера [12] и развитый Ф. Генсбиттелем в [21] — новейший метод анализа повторяющихся игр, активно используемый в диссертации.
Объектом исследования являются повторяющиеся антагонистические игры с неполной информацией у Игрока 2. В них два игрока N раз участвуют в антагонистической игре, заданной одношаговой функцией выигрыша Ак. Функция А^ зависит от состояния к, которое выбирается случаем из множества состояний К в соответствии с распределением р Е перед началом игры.
При этом оба игрока знают р, но лишь Игрок 1 информирован о к. На шаге п = 0,1,...А/" — 1 обоим игрокам известна история действий на предыдущих шагах, что позволяет Игроку 2 уточнять свои представления о к, анализируя действия информированного Игрока 1. Пошаговые выигрыши не наблюдаются до шага АГ — 1, после которого Игрок 1 получает от оппонента их сумму. Оба игрока рациональны и знают это описание.
Предмет исследования составляют асимптотические свойства повторяющихся игр с неполной информацией при продолжительности игры ТУ, стремящейся к бесконечности.
Назовем ценой информации в повторяющейся игре с неполной информацией разницу между выигрышем информированного игрока (Игрока 1) в ней и выигрышем, который бы он получил, забыв всю имеющуюся у него информацию. В случае конечного К из классических результатов следует, что цена информации не может по порядку превосходить при
N —>■ сю. Этот результат тесно связан с оценками максимальной вариации — величины, характеризующей максимальную изменчивость представлений в процессе байесовского обучения продолжительности N с заданным априорным распределением р £ А (К). В случае бесконечного Кире тяжелыми хвостами известные оценки теряют смысл, и встает вопрос о возможности "аномального роста" и максимальной вариации, и цены информации — быстрее у/Й при N —>■ оо. Другой вопрос связан с противоположной ситуацией. Для дискретных моделей финансового рынка с асимметричной информацией в работах Б. Де Мейера с А. Марино [13, 15] и В. Доманского [17] было установлено , что цена информации остается ограниченной при N —У оо. Однако вопрос о природе этого эффекта остался без ответа. Диссертационное исследование было вдохновлено этими вопросами и дает на них исчерпывающие ответы.
Цель исследования состоит в описании экстремальных асимптотических режимов для цены информации при большом числе повторений N — наименьшей и наибольшей возможных скоростей ее роста при N —>■ оо, а также в анализе свойств игры, ответственных за появление этих режимов.
Для этой цели в диссертации решаются следующие задачи:
• Объяснение феномена ограниченности цены информации для дискретных моделей динамики финансового рынка с асимметричной информацией. Нахождение условий, обеспечивающих ограниченность цены информации в классе "почти-честных" игр — игр, для которых единственным преимуществом Игрока 1 является его информация (этот класс содержит модели финансового рынка). Разработка подхода, позволяющего свести вопрос о поведении цены информации в общей почти-честной игре к анализу модельной задачи.
• Получение оценок максимальной вариации, сохраняющих смысл для дискретного априорного распределения р с тяжелыми хвостами. Анализ эффекта аномального роста максимальной вариации. Исследование максимальной вариации для континуального множества состояний К]
• Анализ максимальной скорости роста цены информации при N —> оо в
случае счетного К и распределения р с тяжелыми хвостами. Разработка подхода, позволяющего учитывать условия регулярности одношаговой функции выигрыша в случае континуального К при исследовании асимптотического поведения цены информации.
Методы исследования. В работе использована комбинация методов теории игр, теории вероятностей и, в частности, теории стохастического оптимального управления. Для анализа асимптотического поведения цены информации применяется подход, основанный на связи игровых постановок с задачами о максимальной вариации и их обобщениями, в том числе метод редукции игры к мартингальной оптимизационной задаче из [12] и [21]. Также используются стратегический анализ, теория возмущений для матричных антагонистических игр, методы выпуклой геометрии и методы теории аппроксимации в метрических пространствах. Оценки максимальной вариации основаны на двойственном представлении для вариации скалярных мартингалов, введенном в [11], и оценках больших уклонений.
Теоретическая и практическая значимость. Работа носит теоретический характер и ставит своей целью развитие теоретико-игровых методов анализа социально-экономических взаимодействий. Полученные результаты являются существенным продвижением в понимании эффектов, возникающих в теоретико-игровых моделях финансового рынка с асимметричной информацией. Результаты диссертации могут быть использованы при разработке курсов лекций по теории динамических игр и теории игр с неполной информацией с целью демонстрации мартингальных методов в многошаговых задачах с неполной информацией и, в частности, эффективности редукции игровых постановок к задачам мартингальной оптимизации — новейшего метода, который, несмотря на свою универсальность, был применен пока лишь к весьма ограниченному кругу задач.
Научная новизна. Игры с ограниченной ценой информации, как класс игр, ранее не рассматривались (изучались лишь конкретные модели финансового рынка, обладающие этим свойством), а общие свойства игр этого класса не анализировались. Не объяснялась и природа эффекта ограниченности цены информации в дискретных моделях финансового рынка. Общие результаты, относящиеся к играм с неполной информацией и счетным
множеством состояний, ранее отсутствовали, а эффект аномального роста цены информации не отмечался и не изучался. Все результаты диссертации получены автором лично и обоснованы строгими математическими доказательствами.
Структура работы и основные положения. Диссертация содержит 93 страницы и состоит из введения, четырех глав, заключения и списка литературы из 34 наименований.
Кратко перечислим основные результаты исследования по главам:
• В Главе 2 получено исчерпывающее объяснение эффекта ограниченности цены информации для дискретных моделей финансового рынка с асимметричной информацией. Установлен критерий ограниченности цены информации в классе почти-честных игр и описаны возможные асимптотические поведения цены информации в этом классе.
• В Главе 3 для дискретного априорного распределения р охарактеризована скорость роста максимальной вариации в степенной шкале в терминах семейства величин, измеряющих неопределенность /?, включающего энтропию Шеннона. Продемонстрирована возможность аномального роста максимальной вариации для р с тяжелыми хвостами, и построен соответствующий пример. В случае непрерывного р установлен линейный рост максимальной вариации.
• В Главе 4 показано, что максимальная скорость роста цены информации совпадает со скоростью роста максимальной вариации, а значит, эффект аномального роста имеется и для цены информации. Построен соответствующий пример. Для игр с регулярными одношаговыми функциями выигрыша получены оценки на скорость роста цены информации в терминах асимптотики колмогоровской ^-энтропии. Показано, что для игр с условиями регулярности эффект аномального роста может отсутствовать.
Апробация результатов исследования. Результаты
диссертационного исследования были представлены на следующих конференциях и семинарах:
Семинар лаборатории Теории игр и принятия решений СПб ЭМИ РАН (Санкт-Петербург, 20 января 2012);
Семинар лаборатории Чебышева "Теория вероятностей" (Санкт-Петербург, 15 мая 2012);
8-ая Международная петрозаводская конференция "Вероятностные методы в дискретной математике" и 13-ый Всероссийский симпозиум по прикладной и промышленной математике (Петрозаводск, 2-9 июня 2012);
Международная конференция "Games and Strategy in Paris" в честь шестидесятилетия С. Сорена (Париж, 11-13 июня 2012);
6-ая Международная конференция "Теория Игр и Менеджмент" GTM2012 (Санкт-Петербург, 27-29 июня 2012);
Семинар "Вероятностные проблемы управления и стохастические модели в экономике, финансах и страховании" (ЦЭМИ РАН) (Москва, 20 ноября 2012);
"Городской семинар по теории вероятностей и математической статистике" (ПОМИ РАН) (Санкт-Петербург, 14 декабря 2012);
Международная конференция "4th Nordic Triangular Seminar in Applied Stochastics" (Хельсинки, 6-8 марта 2013);
Международная конференция "The 5th Israeli Game Theory conference" (Тель-Авив, 3 июня 2013);
Семинар Центра изучения рациональности Еврейского университета (Center for the Study of Rationality) (Иерусалим, 4 июня 2013);
Международная конференция "Сетевые игры и менеджмент" NGM2013 (Петрозаводск, 23-25 июня 2013);
7-ая Международная конференция "Теория Игр и Менеджмент" GTM2013 (Санкт-Петербург, 26-28 июня 2013).
Публикации по теме диссертации. Основные результаты диссертации отражены в шести публикациях. Из них одна публикация [6] — в журнале, входящем в список ВАК; один препринт [31]; остальные публикации [7, 28, 29, 30] являются расширенными тезисами международных конференций.
1 Базовые факты теории повторяющихся игр
с неполной информацией
§ 1.1 Основные определения и классические результаты
Опишем Л^-шаговую повторяющуюся антагоничтическую игру Гдг(р) с неполной информацией у Игрока 2 (детальное изложение теории повторяющихся игр с неполной информацией может быть найдено в книгах [9, 26]). Для этого нам понадобится 4-элементный набор Г = (К, /, А), число повторений N £ N и априорное распределение р £ Д(/Г). Здесь К — множество состояний; I и 7 — множества действий Игрока 1 и Игрока 2, соответственно; А : KxIxJ-J>R — одношаговая функция выигрыша; А(К) обозначает множество всех вероятностных распределений на К. Пока будем считать, что К, I и 7 конечны (бесконечный случай обсуждается в пункте 1.1.2).
Игра устроена следующим образом. Перед ее началом случай выбирает состояние природы к £ К в соответствии с распределением р, после чего к сообщается Игроку 1. Оба игрока знают р. Далее на каждом шаге игры п = 0,1,... N — 1 игроки одновременно выбирают свои действия гп £ / и jn Е «/, основываясь на имеющейся у них к этому шагу информации, и выбранные действия публично оглашаются перед следующим шагом игры п + 1. Вклад шага игры п в полный выигрыш Игрока 1 (или же проигрыш Игрока 2) равен А^ то есть зависит не только от действий игроков на этом шаге но и от к. В процессе игры наблюдаемы только действия игроков, и, таким образом, пошаговые выигрыши остаются неизвестны Игроку 2 до последнего шага игры N - 1.
Стратегией поведения (рандомизированной) Игрока 1 называется последовательность о отображений ап : К х (/ х 3)п~1 —>• Д(/). Используя такую стратегию, Игрок 1 рандомизирует свое действие гп на шаге п в соответствии с распределением ап. которое зависит от известного ему состояния к и реализовавшейся к этому шагу истории игры /гп = (¿о, ... гп-\-, Зп-\)-Аналогично стратегия поведения (рандомизированная) г для Игрока 2 состоит из отображений тп : (/ х —>• Д(«/). Отметим, что тп не зависит от к. что
обусловлено неинформированностью Игрока 2 о состоянии природы. Стратегии
а и т вместе с априорным распределением порождают вероятностную меру ^р,а,т на множестве К х (I х После шага N — 1 Игрок 1 получает свой выигрыш
от Игрока 2 (математическое ожидание берется относительно Р^т).
Игроки преследуют строго противоположные цели, выбирая свои стратегии: Игрок 1 стремится максимизировать ддг(р, <т, т) независимо от действий оппонента, тогда как Игрок 2 хочет минимизировать gjy(p, а,т). Отметим, что функция дм(р.ст,т) задает антагонистическую игру Гдг(/з) в нормальной форме. Нижние и верхние значения игры определяются стандартным образом и даются формулами уа1[Гдг(/э)] = sup^ infr рдг(/9, сг, г) и уа1[Гдг(р)] = infт supа gj\r(p, (7,т), соответственно. Если эти значения совпадают, то говорят, что игра имеет значение val = val = val.
Для конечных /, J, и К значение игры существует. Действительно, в силу теоремы Куна (см., например, [1]) игра, в которой используются рандомизированные стратегии поведения, эквивалентна смешанному расширению игры в нормальной форме. Роль чистых стратегий в этой игре выполняют детерминистические стратегии поведения, то есть такие, которые на шаге п сопоставляют имеющейся у игрока информации его действие на этом шаге, а не вероятностное распределение на множестве действий. Если /, J, и К конечны, то конечно и число чистых стратегий, а значит, существование значения следует из классической теоремы о минимаксе Дж. фон Неймана (см. [3]).
Замечание 1.1. Обычно в литературе по повторяющимся играм с неполной информацией в качестве полного выигрыша Игрока 1 рассматривают среднее арифметическое пошаговых выигрышей, то есть делят д^(р,а,т) на N. Такая нормировка позволяет рассматривать игры бесконечной продолжительности. Мы используем иную нормировку, так как это удобно при анализе игр, моделирующих динамику финансового рынка, и игр с ограниченной ценой информации, которым посвящена Глава 2.
Нераскрывающей игрой r^TR(p) называется одношаговая версия игры Гх(/о), в которой Игрок 1 забывает к. т.е. множества стратегий игроков могут
быть отождествлены с Д(/) и Д(7), соответственно. Эквивалентное описание игры Г^^р) — смешанное расширение антагонистической игры в нормальной форме с функцией выигрыша А^- = Е^А^ • (математическое ожидание берется по распределению случайного элемента к). Для конечных К,1имеем А^- — Т^кекРк^Нз- а нераскрывающая игра отождествляется с соответствующей матричной игрой.
Для конечного множества 5 будем обозначать число элементов в нем через |5|, а само множество £ и набор натуральных чисел {1, 2, ...|5'|} будем считать неразличимыми. Множество вероятностных мер Д(б') будем отождествлять с симплексом {р Е М'5' | р3 > О, = !}• При
заданном р Е Д(5") мера одноэлементного множества {5}, в зависимости от ситуации, будет обозначаться ^({5}) или р3. Скалярное произведение векторов х1^х2 евклидова пространства М^ обозначим через (х1,х2). Одношаговую функцию выигрыша А, отвечающую набору {К, I, А) с конечными К, I и J, отождествим с набором |/| х | </|-матриц Ак. Тогда, если в нераскрывающей игре Г^ТК-(р) игроки используют стратегии х Е Д(/) и у Е Д(«/), то средний выигрыш Игрока 1 составит Рк(х>
1.1.1 Цена информации при большом числе повторений
и максимальная вариация
Пусть, как и выше, множества К, I и 7 конечны.
Предположим, что Игрок 1 использует стратегию поведения <т. Тогда Игрок 2 может найти условное распределение рп состояния природы к при условии истории /гп, реализовавшейся к шагу п. Обозначим соответствующее апостериорное распределение за рп. т.е. для любого подмножества В а К выполнено
Рп{В)=¥р,а.т{{кЕВ}\Тп),
где Тп обозначает сигма-алгебру, порожденную историей кп = (¿о (считаем 7"0 тривиальной сигма-алгеброй).
Последовательность апостериорных распределений отражает эволюцию представлений Игрока 2 о состоянии к в процессе игры. Отметим следующие ее свойства:
• рп Е А (К) — случайная вероятностная мера;
• ро = р неслучайно;
• последовательность (рп, J-n)n>o образует мартингал (см. [8]).
Обозначим через л4а(к)(р) множество всех таких А(А')-значных последовательностей случайных элементов. Пр этом вероятностное пространство не фиксировано, т.е. Л4д(к){р) состоит из пар
р= ((рП;^п)п>о, (О. (^)П>0;Р))
(более подробно о А(Х)-значных мартингалах см. в Главе 3).
Определим TV-членную вариацию р 6 -М.а(К)(р) формулой
VN[p] = Е f IK+1 - Рп 11 tv ,
\п=0 /
где ЦФЦту обозначает полную вариацию меры со знаком (заряда) Ф. То есть Умы = е; =о J^keK^l^n+idk}) - рп{{к})\. Беря супремум по всем р из А1д(k)(p)i мы получим максимальную вариацию
^n(p) = sup VN[p\.
реМА(К){р)
Максимальная вариация играет ключевую роль в асимптотических вопросах, связанных с повторяющимися играми с неполной информацией. Р. Ауманн и М. Машлер доказали фундаментальную оценку на значение игры в терминах максимальной вариации. Пусть и?(р) — значение нераскрывающей игры r^R(p). Для любой ограниченной функции и : А (К) —>• М обозначим через Cav [и] наименьшую выпуклую вверх мажоранта и как функции р из А {К), т.е.
м
Cav [и](р) = SUp ^ amU{pm), (1.1)
m=1
где супремум берется по всем М G N, {ат}т=\,...м С [0,1], и {/?m}m=i,...M С А (К), таким что J2m=l ат = 1 Я атРт = Р-
Теорема 1.1 (Р. Ауманн и М. Машлер). Пусть в наборе Г = (K,I,J, А) все множества конечны. Положим
ргюе[Гдг(р)] = val[riV(p)] - NC3Jv[uT}{p).
Тогда имеет место следующая двусторонняя оценка:
О < рпсе[Гдг(р)] < ЦАЦооФ^М, (1.2)
где ЦАЦоо = supfc)iJ|A^|.
Доказательство может быть найдено в книге [26], Теорема 2.10, с.225. Мы приводим его вариант, работающий для более общих К, I и J, в пункте 1.1.2.
Известно, что для конечного К (и даже для счетного, если р имеет не слишком тяжелые хвосты) максимальная вариация не превосходит Cy/N, где С = С(р) (классические оценки максимальной вариации обсуждаются в § 3.2). Следовательно, NCav [ur](p) является старшим членом асимптотики уа1[Гдг(р)] при N —>■ сх). Этот член отражает влияние стратегической асимметрии, присутствующей в нераскрывающей игре, на значение игры Г/у(р), тогда как поправочный член рпсе[Гдг(р)] отражает вклад информационной асимметрии.
Определение 1.1. Мы будем называть величину
рпсе[Гдг(р)] = уа1[Гдг(р)] - NCm [wr](p)
ценой информации. В литературе за ней закрепилось название "error term", что объясняется ее ролью в асимптотике значения игры при N —> сю.
Замечание 1.2. Дополнительный выигрыш, который Игрок 1 получает от имеющейся у него информации, дается формулой уа1[Г^(р)] — Nur{p). то есть, в отличие от определения цены информации, здесь из значения N-шаговой игры Гn(p) вычитается выигрыш Игрока 1, который он бы получил, забыв к. Таким образом, выгода Игрока 1 от информированности дается суммой N (Cav [ur](p) — ur(p)) и ргк;е[Гдг(р)]. Природа первого слагаемого связана с взаимодействием стратегических асимметрий, присутствующих в нераскрывающей игре, с информированностью Игрока 1. Так как этот вклад элементарным образом выражается в терминах одношаговой игры с полной информацией, он исключается в определении цены информации.
Определение 1.2. Повторяющаяся игра с неполной информацией, отвечающая набору Г; является почти-честной, если значение соответствующей нераскрывающей игрыТ^(р) — тождественный ноль как функция априорного распределения р.
В основном, в диссертации рассматриваются почти-честные игры. Отметим, что для них Сау [иг] = иг = 0, а значит
рпсе[Гдг(/э)] = уа1[Гдг(»].
Замечание 1.3. Смысл почти-честности заключается в том, что, если информированный игрок забывает имеющуюся у него информацию, то никто в игре не имеет преимущества. Иными словами, единственное стратегическое преимущество информированного игрока определяется его информацией.
Из вышесказанного следует, что цена информации в повторяющихся играх не может расти быстрее л/А^ в случае, когда имеется соответствующая оценка на максимальную вариацию. В статье [34] Ш. Замира исследовалась игра с двухэлементным множеством состояний и одношаговой функцией выигрыша, заданной матрицами
А1 = I , А0 = I . (1.3)
Эта игра является почти-честной. Было установлено, что для нее цена информации имеет порядок y/~N (см. также § 4.1). В частности, если р € А(/Г) невырождено (т.е. не сосредоточено в одной точке), то найдется набор Г такой что price[Гдг(/?)] > \/~N для любого N. Таким образом, y/~N — наибольшая возможная скорость роста цены информации в случае конечного К.
Отметим, что обычно Теорема 1.1 объединяется с оценками максимальной вариации, полученными Р. Ауманном и М. Машлером для конечного К. Соответствующий результат носит название Cav [и]-теоремы.
Теорема 1.2 (Cav [г/,]-теорема Р. Ауманна и М. Машлера). В условиях Теоремы 1.1
уа1[Гдг(р)]
Jlm -AT- = CaV И*»-
iV-> оо iV
1.1.2 Случай бесконечных К, I и 3
После естественных модификаций определения повторяющейся игры с неполной информацией и максимальной вариации обобщаются на случай несчетного К, если К — "хорошее" измеримое пространство.
Топологическое пространство называется топологически полным, если существует метрика, согласованная с топологией, превращающая его в полное метрическое пространство (см. [2], с.98). Топологически полное сепарабельное топологическое пространство К, наделенное борелевской сигма-алгеброй, называется польским пространством (см. [32], с.52). Достаточно держать в голове один из следующих примеров: конечное или счетное множество с дискретной топологией; интервал [0; 1] со стандартной топологией вещественной оси (или сама вещественная ось). Это все польские пространства с точностью до борелевского изоморфизма, то есть с точностью до биекции, сохраняющей борелевскую структуру ([32], Теорема 3.3.13, с.99). Множество А(К) борелевских вероятностных мер на польском пространстве К с топологией слабой сходимости само становится польским пространством, и, следовательно, можно определить А(/С)-значные измеримые отображения.
При рассмотрении повторяющихся игр с множествами К, I и 3, являющимися польскими пространствами, мы будем предполагать, что
• одношаговая функция выигрыша А: К х I х 3 Ш измерима;
• стратегии поведения Игрока 1 и Игрока 2 состоят из измеримых отображений со значениями в Д(/) и Д(7), соответственно.
Определение максимальной вариации в случае польского К дано в § 3.1.
Утверждение теоремы Р. Ауманна и М. Машлера (Теорема 1.1) сохраняется и в случае польских пространств К, I и 3.
Теорема 1.3. Пусть К. I и 3 в наборе Г = (К. I. 3, А) являются польскими пространствами и
• одношаговая функция выигрыша А ограничена: ЦАЦоо = зир^- < оо,
• у игр Гдг(р) и Г^Т11(р) существуют значения для любых р Е А(К) и N еп,
• выполнено хотя бы одно из двух следующих условий:
1. К конечно;
2. I и J не более чем счетны.
Тогда имеет место двусторонняя оценка
О < рпсе[Гдг(р)] < ЦАЦооФ^М
При доказательстве теоремы в случае условия 1 возникают проблемы измеримости, которые решены в работе Ф. Генсбиттеля [21]. В остальном доказательство следует классической схеме для конечных К, I и J ([26], Теорема 2.10, с.225).
Доказательство. Фиксируем е > 0. Чтобы убедиться в неотрицательности цены информации, заметим, что в игре Гдг(р) Игрок 1 может гарантировать выигрыш не меньше N(ur(p) — е), используя на каждом шаге игры свою е-оптимальную стратегию из rfR(p). В силу так называемой "splitting procedure" ([26], с.218), если Игрок 1 может гарантировать f(p) в Гдг(р), то он может гарантировать и Cav[/](p). Действительно, мы можем перейти к альтернативному описанию игры Гдг(р), считая, что состояние к с распределением р выбирает сам Игрок 1, а не случай. Пусть р представлено в виде выпуклой комбинации Em=i атРт■ Игрок 1 может выбрать к в два этапа: на первом, в соответствии с весами ат, выбрать рт\ на втором — выбрать к с распределением рт. Предположим, что после первого этапа Шпион сообщает Игроку 2 распределение рт. Игра со Шпионом эквивалентна следующей: с вероятностью ат игроки участвуют в игре Гдг(рт), т = 1. 2, ...М. От появления Шпиона выигрыш Игрока 1 может только уменьшится. Значит, уа1[Гдг(р)] не меньше amf{pm)- В итоге
Похожие диссертационные работы по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК
Информация и равновесие в многошаговых играх2012 год, доктор физико-математических наук Слобожанин, Николай Михайлович
Динамика информационных процессов в неантагонистических играх1997 год, доктор физико-математических наук Мохонько, Елена Захаровна
Игровые задачи поиска объектов1984 год, кандидат физико-математических наук Гарнаева, Галина Юрьевна
Задачи доверительного оценивания и управления с квантильным критерием в условиях неполной статистической информации2003 год, доктор физико-математических наук Тимофеева, Галина Адольфовна
Хеджирование финансовых обязательств на неполных рынках2005 год, кандидат физико-математических наук Чалов, Денис Михайлович
Список литературы диссертационного исследования кандидат наук Сандомирский, Федор Алексеевич, 2013 год
Список литературы
[1] Воробьев Н.Н., Врублевская И.Н. Позиционные игры. Москва: "Наука". 1967. 526с.
[2] Бертсекас Д., Шрив С. Оптимальное стохастическое управление. Москва: "Наука". 1985. 278с.
[3] Карлин С. Математические методы в теории игр, программировании и экономике. Москва: Мир. 1964. 838с.
[4] Колмогоров А.Н., Тихомиров В.М. е-энтропия и ^-емкость множеств в функциональных пространствах // Успехи математических наук. 1959. Т.14. Вып.2. С.3-86.
[5] Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. Москва: "Наука". 1980.
[6] Сандомирский Ф.А. Вариация мартингалов со значениями в вероятностных мерах и повторяющиеся игры с неполной информацией // Доклады академии наук. 2012. Т.447. Вып.З. С.274-276.
[7] Сандомирский Ф.А. Вариация последовательности апостериорных вероятностей и повторяющиеся игры с неполной информацией со счетным множеством состояний // Обозрение прикладной и промышленной математики. 2012. Т.19. Вып.2. С.220-222.
[8] Ширяев А.Н. Вероятность. В 2-х кн.—Изд. 4-е, доп. и перераб. // Москва: МЦНМО. 2007. 967с.
[9] Aumann R., Maschler М. Repeated Games with Incomplete Information. London: The MIT Press. 1995. 360p.
[10] Azuma K. Weighted Sums of Certain Dependent Random Variables // Tohoku Mathematical Journal. 1967. Vol.19. P.357-367.
[11] De Meyer B. The maximal variation of a bounded martingale and the central limit theorem// CORE Discussion Paper. 1996. No 96035
[12] De Meyer B. Price dynamics on a stock market with asymmetric information// Games and Economic Behavior. 2010. Vol.69 P.42-71.
[13] De Meyer B., Marino A. Continuum versus discrete time market game. Preprint 2002/111, MSE, Universite Paris 1.
[14] De Meyer B., Marino A. Repeated market games with lack of information on both sides // Cahiers de la Maison des Sciences Economiques (Universite Pantheon-Sorbonne). 2004. Vol.66.
[15] De Meyer B., Marino A. Continuous versus discrete Market games. Cowles Foundation Discussion Paper 1535, 2005.
[16] De Meyer B., Saley H. M. On the strategic origin of Brownian motion in finance // Int. Journal of Game Theory. 2003. Vol.31 (2). P.285-319.
[17] Domansky V. Repeated games with asymmetric information and random price fluctuations at finance markets // International Journal of Game Theory. 2007. Vol.36(2). P.241-257.
[18] Domansky V., Kreps V. "Eventually revealing" repeated games with incomplete information // International Journal of Game Theory. 1994. Vol.23(2). P.89-99.
[19] Domansky V., Kreps V. Repeated games with asymmetric information and random price fluctuations at finance markets: the case of countable state space. Centre d'Economie de la Sorbonne. Preprint 2009. 40, Univ. Paris 1.
[20] Domansky V., Kreps V. Repeated games with asymmetric information modeling financial markets with two risky assets // RAIRO Operations Research. 2013. Vol.47. P.251-272.
[21] Gensbittel F. Extensions of the Cav (u) theorem for repeated games with incomplete information on one side. HAL preprint. 2012.
[22] Heuer M. Optimal strategies for the uninformed player // International Journal of Game Theory. 1991. Vol.20(l) P.33-51.
[23] Mertens J.-F., Zamir S. The value of two-person zero-sum repeated games with lack of information on both sides // International Journal of Game Theory. 1971. Vol.1. P.39-64.
[24] Mertens J.-F., Zamir S. The Normal Distribution and Repeated Games // Int. Journal of Game Theory. 1976. Vol.5. P.187-197.
[25] Mertens J.-F., Zamir S. The maximal variation of a bounded martingale // Israel Journal of Mathematics. 1977. Vol.27. P.252-276.
[26] Mertens J.-F., Sorin S., Zamir S. Repeated Games. CORE Discussion Paper. 1994. №9420,9421,9422.
[27] Neyman A. The maximal variation of martingales of probabilities and repeated games with incomplete information // Journal of Theoretical Probability. 2013. Vol.26(2) P.557-567.
[28] Sandomirskii F. Repeated incomplete information games with countable state space: broken \/7V-law // The Sixth Int. Conf. Game Theory and Management GTM2012. Abstracts / Eds. by L. Petrosjan and N. Zenkevich. St.Petersburg. 2012. P.234-237.
[29] Sandomirskii F. Repeated games with incomplete information and slowly growing value // Extended Abstracts of Int. Workshop Networking Games and Management. Petrozavodsk. 2013. P.90-92.
[30] Sandomirskii F. Repeated games with incomplete information and slowly growing value // The Seventh Int. Conf. Game Theory and Management GTM2013. Abstracts / Eds. by L. Petrosjan and N. Zenkevich. St.Petersburg. 2013. P.207-209.
[31] Sandomirskiy F. Repeated games of incomplete information with large sets of states [Электронный ресурс] arXiv: 1205.6791. 2013. URL: http://arxiv.org/abs/1205.6791 (дата обращения: 9.11.2013) (1,5 п.л.)
[32] Srivastava S.M. A course on Borel sets. New-York: Springer-Verlag 1998. 261p.
[33] Vershik A. Scaling entropy and automorphisms wixh purely point spectrum. arXiv preprint arXiv: 1008.4946. 2010.
[34] Zamir S. On the relation between finitely and infinitely repeated games with incomplete information// International Journal of Game Theory. 1971. Vol.1. P.179-198.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.