Последовательное различение гипотез в схеме с альтернативными наблюдениями тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат физико-математических наук Кузнецов, Юрий Александрович

  • Кузнецов, Юрий Александрович
  • кандидат физико-математических науккандидат физико-математических наук
  • 2009, Москва
  • Специальность ВАК РФ05.13.17
  • Количество страниц 100
Кузнецов, Юрий Александрович. Последовательное различение гипотез в схеме с альтернативными наблюдениями: дис. кандидат физико-математических наук: 05.13.17 - Теоретические основы информатики. Москва. 2009. 100 с.

Оглавление диссертации кандидат физико-математических наук Кузнецов, Юрий Александрович

Введение

Глава 1. Дискретное время

§ 1.1. Постановка задачи. Свойства риска.

§ 1.2. Вероятностная модель.

§ 1.3. Конечный временной интервал.

§ 1.4. Функция риска, как эксцессивная миноранта

Глава 2. Постановка задачи в непрерывном времени

§ 2.1. Импульсная постановка

§ 2.2. Общая постановка.

§ 2.3. Основной результат

§ 2.4. Сведения из стохастического анализа

§ 2.5. "Классическая" задача

§ 2.6. Два подхода к решению

Глава 3. Нахождение оптимальной стратегии

§ 3.1. Границы областей продолжения наблюдений

§ 3.1.1. Область без переключений

§ 3.1.2. Область с переключениями.

§ 3.2. Построение стандартного управления

§ 3.3. Оптимальность

Глава 4. Сходимость

§ 4.1. Сходимость дискретных схем к непрерывным

§ 4.2. Сходимость к процессу У^ : еЩ = —^sgnYtdt + сЩ

Результаты численного моделирования

Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Введение диссертации (часть автореферата) на тему «Последовательное различение гипотез в схеме с альтернативными наблюдениями»

С развитием информационных технологий возросла потребность в эффективной обработке и принятии оптимальных решений относительно производственных, финансовых, экономических и т.п. процессов. Процессы могут быть охарактеризованы своими свойствами, имеющими как количественную, так и качественную природу. Одной из важных задач является различение нескольких утверждений (гипотез) относительно качественных характеристик процессов. Примером такого различения гипотез может быть задача радиолокации о наличии или отсутствии цели на одном из нескольких направлений, задача о нахождении оптимального вложения в финансовые инструменты (акции, опционы, фьючерсы и т.п.), выбор наилучшего лекарственного препарата среди нескольких, задача об оптимальном выборе стратегии производства или инвестиционного проекта. Во всех таких задачах необходимо исследовать качественное поведение имеющегося процесса (есть ли цель или нет в задаче радиолокации, стоит или же нет вкладывать средства в данную ценную бумагу, эффективнее или нет данный медицинский аппарат, чем другой и т.д.).

При решении таких задач первоначально строится модель поведения изучаемого процесса с несколькими качественно разными возможностями развития процесса во времени. Далее выносятся предположения (гипотезы) относительно этих характеристик и производятся наблюдения за процессом. В условиях конечности как времени наблюдений, так и ресурсов, необходимых для проведения дополнительных наблюдений, накладываются ограничения на количество возможных наблюдений.

В работе Неймана и Пирсона [39] была решена задача о различении гипотез при фиксированном количестве возможных наблюдений и при заданных ограничениях па ошибки первого и второго типов.

В дальнейшем были проведены исследования задачи о различении гипотез, когда количество наблюдений заранее не фиксировано и могло меняться в зависимости от наблюденных значений процесса. Эта так называемая задача последовательного различения двух гипотез была сформулирована Вальдом [48].

Им же была указана процедура, основанная на последовательном критерии отношения вероятностей, которая, как им было показано в совместной работе с Волфовитцем [49], оказалась оптимальной в условно вариационной задаче: при заданных ограничениях на вероятности ошибочных решений (вероятности ошибок первого и второго рода) найти процедуру, которая давала бы минимальную длительность наблюдений по обоим гипотезам. Во многих случаях последовательный критерий оказывается более эффективным, чем процедура Неймана-Пирсона с теми же ошибками первого и второго рода. Этой же задаче посвящены работы Блекуэлла и Гиршика [22], Ширяева[46], Лемана [36], Чернова [25].

В непрерывном времени задача о различении гипотез также рассматривалась. Точное решение байесовской задачи последовательного различения двух гипотез о сносе броуновского движения (в дальнейшем изложении - классической задачи) было дано А.Н. Ширяевым [17], из которого следовала и оптимальность вальдовской процедуры в случае броуновского движения.

Естественным обобщением классической является задача (первоначально возникшая из задачи радиолокации для обнаружения цели по нескольким направлениям) различения гипотез, когда наблюдаемых процессов может быть несколько (многомерная задача). При этом предполагается, что наблюдение в каждый момент времени можно проводить только за одним процессом (по одному направлению).

В литературе уже рассматривалась эта задача для дискретного времени и были получены некоторые результаты относительно функции риска и оптимальной стратегии. Задача была впервые сформулирована и изучалась А.Н. Ширяевым[1б], Кайроли и Далангом[23].

Однако задачи, встречающиеся в реальности, включают в себя время как непрерывную величину. До сих пор корректной постановки и решения задачи в непрерывном времени произведено не было. Целью работы является постановка и решение в непрерывном времени задачи о различении гипотез в схеме с возможностью переключения между наблюдаемыми процессами.

Рассмотрение этого случая опирается на решение соответствующей задачи в дискретном случае (глава 1), формулируемой следующим образом.

Предполагается, что наблюдения возможны в моменты времени, кратные некоторому параметру Д. В самом начале наблюдений разыгрывается значение некоторой случайной величины в, принимающей одно из трех возможных значений 9 = 0,1,2. Ее значение неизвестно. Пусть имеются два направления - первое и второе. По первому направлению можно наблюдать случайные величины Х\, Х2, Хз,., а по второму направлению - случайные величины Уг,У2,У3,. Распределение этих случайных величин зависит от в. В каждый момент времени можно наблюдать одно из этих двух направлений. За каждое наблюдение берется плата с > 0. В некоторый момент времени г (момент остановки относительно фильтрации, порожденной наблюдаемыми процессами) необходимо остановить наблюдения и сделать вывод в, относительно неизвестного параметра 9 (с1 = 0, если сделан вывод, что 9 — 0 и в, — 1, если сделан вывод о том, что 9 — 1, 2). Задача заключается в нахождении функции риска г =ЫЕ (а!{9 = 0, й = 1) + /31(0 = 1,2, & = 0) + ст), М) где 1(») - индикатор, а, /3 - плата за ошибки первого и второго рода соответственно.

Стратегия наблюдений состоит из правила переключения между направлениями, момента остановки и окончательного решения относительно значения неизвестного параметра 9. Предполагается известным априорное распределение параметра 9, т.е. считаются заданными вероятности щ = Р(0 = г),г = О,1,2.

Удобно ввести — Р ((9 = г| Т^) - апостериорные вероятности гипотез

9 = 1 для г = 0,1,2 в момент времени £, где ^ - это а-алгебра, порожденная наблюдениями за процессами до момента времени £. Кайроли и Даланг в [23] показали, что в задаче с дискретным временем оптимальное решение зависит от наблюдений только через апостериорные вероятности гипотез , г — 0,1,2.

Также ими было показано, что в дискретной схеме пространство возможных значений апостериорных вероятностей гипотез разбивается на две области: остановки (И) и продолжения наблюдений (С). Это означает, что если значение (тг1(^), 7Г2(£)) находится в области то в этот момент необходимо остановиться и принять решение о значении случайной величины в. Если же (■7Г1(£), 7г2(£)) находится в области С, то необходимо продолжить наблюдения. В последнем случае нужно определить, какое направление из двух следует наблюдать. Был указан способ, позволяющий оптимально выбрать направление, но он предполагает известным точное значение функции риска.

В третьем разделе доказано

Утверждение 5. В одношаговой модели оптимальный выбор направления для наблюдения устроен следующим образом: если 7Гх > 7г2 (7Г1 < 7г2), то необходимо наблюдать первое(второе) направление.

Для конечного временного интервала, когда возможно максимум п наблюдений, доказан аналог соответствующего утверждения для одномерной схемы:

Теорема 2. Функция риска в случае конечного дискретного временного горизонта [0,Т] есть Т-ая степень оператора перехода ф, примененного к функции риска от мгновенной остановки тг1,7г2) = (с}тд) (тгь7г2), где (*,!/) = ы + с, Е%гУ)/(Ат) + с) и

АЫ,у2) = Ы(У1,У2),П2Ы,У2)),

7Гг(^ъ ^2) = Р (0 = ЦГъп), г = 1,2.

В четвертом разделе для бесконечного временного интервала получена характеризация риска, как максимальной с-эксцессивной миноранты (где с-эксцессивная функция- это такая функция /(7Г1,7Г2) , что /(тгх, 7Г2) > <э/(7г1,7г2) ):

Теорема 3. Пусть у(х,у) максимальная с-эксцессивная миноранта д(х,у), и р(х,у) функция риска. Тогда и(х,у) — р(х,у), где (х,у) — — (тгьтгг) известные априорные вероятности. 7

Вторая глава посвящена различным постановкам задачи в непрерывном времени и подготовке технического аппарата для решения задачи в непрерывном времени.

При формулировке соответствующей задачи для случая непрерывного времени возникают некоторые проблемы при определении стратегии. Поскольку наблюдения производятся в непрерывном времени, необходимо определить понятие переключения. Самое простое определение стратегии переключения заключается в задании некоторой последовательности моментов остановки 71,7*2,. •, тп,. Предполагается, что на каждом интервале наблюдается какое-то направление — первое или второе. В момент происходит переключение с наблюдаемого в данный момент направления на другое. Задача заключается в определении оптимального правила переключений т1; 72,. •, тп,., момента остановки г и решающего правила минимизирующих функцию риска

Д= ^ Е (а\(в = 0, с^ = 1) + (31(6 = 1, 2, й = 0) + ст).

Т,Т1,Т2,-,ТП,.,(1)

Это так называемая импульсная постановка (импульсы - это моменты переключения). Недостатком импульсной постановки является то, что в классе импульсных стратегий может не существовать оптимального правила, хотя можно найти импульсное управление, имеющее риск, как угодно близкий к функции риска Я.

Для преодоления этого недостатка можно рассмотреть более общую постановку. В этой более общей постановке расширяется множество возможных управлений. Стратегия определяется уже не моментами переключения, а двумя функциями времени - случайными величинами и Тг(^). Смысл этих значений следующий: Т^Ь) - общее время наблюдения г-го направления в течение промежутка времени [0,£]. При этом должно быть выполнено условие Т^) 4- Т2(£) = Кроме того, эти случайные величины Т*1 (¿), Т^) должны быть неупреждающими, т.е. являются -измеримыми. Заметим, что это действительно есть расширение множества импульсных управлений, поскольку любое импульсное управление может быть реализовано как некоторое управление (Т1(*),Т2(*)), при этом ТхОО.Ггй будут неубывающими ступенчатыми функциями со скачками в моменты времени т/г.

В общей постановке расширяется и понятие правила выбора направлений для наблюдения : становится возможным одновременное наблюдение обоих направлений. Формально это означает, что точки роста функций Т\(Ь) и могут совпадать. При этом суммарное время наблюдения за процессами остается равным £ (Тх(^) + Тг(^) = £). Помимо задания Т\{Ь) и Тг(£) необходимо задать моменты остановки г и решающее правило . В общей постановке найти оптимальную стратегию достаточно сложно, поэтому мы ограничимся только стандартным правилом выбора направления. Стандартное управление (Т\{1), ТЬ^)^ определяется таким образом, что выполнено следующее условие: если > 7Г2(£), то наблюдается первое направление, если тт\{Ь) < 7Г2(£), то наблюдается второе направление. Существование такого управления (в частности, выбор управления в случае 7Гх = 7Г2(£)) рассмотрено в разделе 2 главы 3. В дискретном случае определение стандартного управления такое же, но необходимо рассматривать лишь дискретные моменты времени. Оправданность рассмотрения такого типа управлений для дискретной одношаговой модели показана в разделе 3 главы 1.

Таким образом, задача состоит в выборе оптимального момента остановки т и окончательного решения ^, минимизирующих функцию риска р (тг1,7г2) = т£ Е {а\{в = 0, = 1) + /31(0 = 1,2, й = 0) + сг). т4)

В такой постановке задача сводится к определению т (окончательное решение однозначно определяется после остановки). В дальнейшем для простоты изложения будем считать а = (3 = 1.

Третья глава посвящена нахождению оптимальной стратегии и границ областей продолжения наблюдений в задаче с непрерывным временем. Пусть

Ч>1® = ТГ1(*)/7Го(*), <Р2&) = ^ОО/тГоСО, где = Р (9 = г\ Т^), г — 0,1,2. Доказана

Теорема 4.

1. В классе марковских стандартных стратегий оптимальное правило остановки определяется как момент первого попадания вектора (у^СО» У2СО) где в некоторую область остановки наблюдений (А и I) на рис. 1). Область продолжения наблюдений разбивается на область возможных переключений между направлениями (С\ и С2) и область, где возмоэюно наблюдение лишь одного направления (В\ и В2) •

2. Границы 71 и 72, разделяющие область остановки и область продолжения наблюдений, задаются с помощью кривых 71 = 71(^1) и 72 = 72(^1), которые могут быть для каждого Ъ = 1 + ^1 найдены как решения следующей системы уравнений (в области наблюдения В\)

-»- 71) (^-1)=»- 1.

Функция риска в этой области равна . 6 — С1

Р Ы = 2с (1п С/>2) 7~- + 7-- + 02,

6 + о + (Ь+71)(Ь+72)-(71+72)-2С(1П71)(Ь-71)(Ь+72)+2С(1П72)(6-72)(Ь+71) 1 72-71 ' (¿+71-2) —2с(1п 71) (Ъ-ъ )+2с(1п 72)(Ь-72) 2 72-71

5. Граница 72, разделяющая область остановки и область продолжения наблюдений, задается в области С\ с помощью кривой 72 = 72 ((р\), которая моэюет быть найдена как решение следующего дифференциального уравнения

11 = (У^! - 21пу?1) - (1/72 - 211172) 72 Ы - 72) (1 + VI + 72) с начальным условием 72 (</?*) = 72 (<£>*), где (/?* таково, что 71 ((р*) — </?*. Функция риска в этой области равна \ О (Л \ 1 + VI ~ , С1 рОьЫ = 2с —---+ —---+ С2)

1 + ^1+^2 1 + <Р1 + Ч>1 где

С1 = 2с + с2 = 1+у,11+7а (1 - С1 - 2с(1 + - 72) 1п72) •

Рис.1. Области продолжения наблюдения и остановки

При доказательстве этой теоремы первоначально формулировалась так называемая задача Стефана с подвижными границами для функции риска. Делалось предположение о том, что функция риска удовлетворяет некоторой системе уравнений, а потом доказывалось, что найденное решение системы действительно является функцией риска. Система дифференциальных уравнений задачи Стефана для исследуемой проблемы в области В\ выглядит следующим образом: Р^ОЪЧ>2)Ч>У (1 + Ч>\ + Ч>-1) + (l/2K2V>20b ^Ы = -с,

P0b7i Ol)) — Po Ob7i ОО), < Р Ob72 Ol)) = PO Ob72 Ol)) , р'п 0b7i ОО) = (A))U 0b7i Ol)), , p'V2 Ob 72 Ol)) = (Ро)^2 Ob 72 Ol)), где

Po Оь ¥>2) = min (7Г0,1 - 7г0) = = min (Ol + ¥>2)/(l + Vi + Ф2), 1/(1 + <Pl + <P2)) • Здесь первое дифференциальное уравнение следует из общей теории оптимальной остановки марковских процессов, остальные уравнения в системе - это условия гладкости функции риска на границах областей продолжения наблюдения (условия гладкого склеивания).

Решения 71(921) и 72(^1) этой системы могут быть получены следующим образом. Для каждого фиксированного к = 1 + <¿>1 относительно некоторых неизвестных А* и В* решается система

С(ф (В*) - ф (А*)) = 2,

С (Ф (В*) - Ф (А*)) -С (В*- А*) ф (А*) = 2~2В*~к, при этом С = 2кс, Ф (7г) = (1 — 27г) In (-¡-г^) > Ф (я") = Ф' (тг) и по полученным А* и В* находятся границы

А* .В*

7i Ol) = гА* + Vi)> 72 fai) = (1 + Vi) •

Заметим, что полученная система с А* и В* аналогична системе в классической (одномерной) задаче различения гипотез (см. А.Н. Ширяев [17]) и полностью совпадает с ней при к = 1 (vi = 0). Этот факт является следствием того, что в области, где возможно наблюдение одного направления, задача становится одномерной, а значит, для границ получаются те же уравнения, что и в классической задаче. В разделе 1 главы 3 рассматривается одномерная вспомогательная задача и показывается, что выше определенные как решения системы, точки А* и В* являются границами для области продолжения наблюдений в этой вспомогательной задаче.

При доказательстве теоремы 4, в области возможных переключений между направлениями также формулировалась задача Стефана с подвижными границами для функции риска, имеющая следующий вид:

Р'^Ъ^Ы/ (1 + Vi + 4>г) + (1/2)^2fab V2V2 = -с» р'ъ fab Vi) =

Р fab 72 (vi)) = PO fab 72 fai)), k p'w fab 72 faO) = ы;2 fab 72 fao), где

Po fab V2) = min (7Г0, 1 - 7T0) = = min (Ol + ip2)/(1 + Vi + <P2), 1/(1 + Vi + V2)).

Решая эту систему, получаем для границы 72 = 72 (<£>1) (области С\) дифференциальное уравнение, вынисанное выше в утверждении теоремы.

Четвертая глава посвящена исследованию сходимости процессов управления в задаче в дискретном времени к процессу управления в непрерывном времени и рассмотрению приложений полученных результатов к теории стохастических дифференциальных уравнений.

В первом разделе рассматривается вопрос сходимости дискретных стандартных схем наблюдения ^"т^)) к непрерывной стандартной схеме наблюдения (Хтх(ф Ут2(*)) (дискретную или непрерывную схему назовем стандартной, если соответствующее управление является стандартным), где И^

У- = 10=2Т2П(*) + IV* ад

- процессы наблюдения в дискретной схеме и ад

- процессы наблюдения в непрерывной схеме, при этом выбирается стандартное управление (существование такого управления для непрерывной схемы доказано в разделе 2 главы 3). Предполагается, что наблюдения возможны в моменты времени, кратные некоторому параметру Д = п — 1,2,.

Теорема 5. Процессы наблюдения в дискретной схеме ^т^(г)) схо~ дятся по распределению к процессу наблюдения в непрерывной схеме

ХТ1(1),Ут2(1)) •' (ХтлььУтм) е [0,71 ,п оо, где управления Т2П(^)) и (Тх(^),Т2(£)) предполагаются стандартными.

Кроме того показано, что 1 ^ Вг+ / 8ёаВд(1В3

V о / X у -1 - 2

-£* + / sgn £ясШа где Bt - процесс броуновского движения относительно некоторой меры Р : dP = ехр (-10=1 W* - \1в=хТ) ехр (-19ss2W$ - \lв=2Т) dP.

Одним из применений факта сходимости дискретных стандартных управлений к стандартному непрерывному управлению является результат, касающийся так называемого процесса диффузионного типа bang-bang. Рассматриваются процессы, похожие на процессы наблюдения в дискретной схеме в исследуемой задаче

Х^пщ ~ Ti(t) + где процесс управления Tgit)) - стандартный.

В третьем разделе показано, что разность этих процессов S^ — —

Утп^)> гДе Д = l/n > сходится к некоторому процессу St. Более точно, доказана Теорема 6. Процессы Sв дискретной схеме равномерно в среднеквадра-тическом сходятся к процессу St:

Е ( sup (Sf - St) ) 0, n -> оо,

0<i<T / где процесс St является решением следующего стохастического дифференциального уравнения dSt = -^sgn Stdt + dBt, z где Bt - некоторое броуновское движение.

Основные результаты работы опубликованы в [52],[53],[55].

Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК

Заключение диссертации по теме «Теоретические основы информатики», Кузнецов, Юрий Александрович

Заключение

В диссертации была в строгой формулировке поставлена задача о различении гипотез в непрерывной схеме с альтернативными наблюдениями. Получены новые результаты об оптимальной стратегии в рассматриваемой задаче, найдена функция риска и границы областей продолжения наблюдений. Были получены стохастические дифференциальные уравнения и системы алгебраических уравнений, которым должны удовлетворять границы областей продолжения наблюдений. Все эти системы уравнений могут быть решены численно и в дальнейшем использоваться на практике.

В дискретном времени так же были получены результаты относительно оптимальной стратегии, структуры областей продолжения наблюдений и характеристик функции риска (как эксцессивной миноранты функции риска от мгновенной остановки).

При исследовании связи между дискретной и непрерывной постановками, была доказана равномерная по времени (на каждом конечном временном интервале) сходимость по вероятности стандартных управлений в дискретных схемах к стандартному управлению в непрерывной схеме. Полученные результаты означают, что можно аппроксимировать непрерывное управление дискретным. Кроме того, важно отметить одно применение используемых методов при исследовании задачи существования решения стохастического дифференциального уравнения. А именно, было показано, что процессы управления в дискретной схеме сходятся к процессу, являющемуся решением некоторого стохастического дифференциального уравнения с сингулярными коэффициентами. Само существование сильного решения данного уравнения требует отдельного доказательства. Однако, в диссертации это решение построено в явном виде, как предел дискретных процессов (стандартных управлений в дискретной схеме).

Работа выполнена на механико-математическом факультете МГУ им. М.В. Ломоносова. Автор выражает глубокую признательность своему научному руководителю - профессору А.Н. Ширяеву за постановку задачи и постоянный интерес к работе.

Список литературы диссертационного исследования кандидат физико-математических наук Кузнецов, Юрий Александрович, 2009 год

1. Гирсанов И. В. О преобразовании одного класса случайных процессов с помощью абсолютно непрерывной замены меры // Теория вероятностей и ее применения. - 1960. - Т.5. - Вып.З. - С.314-330.

2. Гихман И.И., Скороход A.B. Стохастические дифференциальные уравнения. Киев: Наукова думка, 1968.

3. Григелионис Б.И., Ширяев А.И. О задаче Стефана и оптимальных правилах остановки марковских процессов // Теория вероятностей и ее применения. 1966. - Т.П. - Вып.4. - С.612-631.

4. Дуб Дж.Л. Вероятностные процессы. М.: ИЛ, 1956.

5. Дынкин Е.Б. Марковские поцессы. М.: Физматгиз, 1963.

6. Звонкин А.К. Преобразование фазового пространства диффузионного процесса, уничтожащее снос// Математический сборник. 1974. - Т.93(135). -№1. - С.129-149.

7. Ито К., Маккин Г. Диффузионные процессы и их траектории. М.: Мир, 1968.

8. Кельберт М.Я. О сходимости дискретных схем к непрерывным в некоторых задачах последовательного анализа.//Теория вероятностей и ее применения. 1976. - Т.21 - Вып.З. - С.620-628.

9. Колмогоров А.Н. Теория вероятностей и математическая статистика. Избранные труды. Т.2. - М.: Наука, 1986.

10. Колмогоров А.H., Прохоров Ю.В., Ширяев А.Н. Вероятностно-статистические методы обнаружения спонтанно возникающих эффектов// Труды МИАН СССР. 1988. - Т. 182. - С.4-23.

11. Крылов Н.В. Управляемые процессы диффузионного типа. М.: Наука, 1977.

12. Липцер Р.Ш., Ширяев А.Н. Статистика случайных процессов. М.: Наука, 1974.

13. Липцер Р.Ш., Ширяев А.Н. Теория мартингалов. М.: Наука, 1986.

14. Михалевич B.C. Байесовский выбор из двух гипотез о среднем значении нормального процесса// Вестник Киевского университета. 1958. - Т.1. -№1. - С.101-104.

15. Шепп Л.А., Ширяев А.Н. Новый взгляд на расчеты "Русского опциона"// Теория вероятностей и ее применения. 1994. - Т.39. - Вып.1. - С.130-149.

16. Ширяев А.Н. Статистический последовательный анализ. 2-е изд., пере-раб. - М.:Наука, 1976.

17. Ширяев А.Н. Стохастические проблемы финансовой математики // Обозрение прикладной и промышленной математики. 1994. - Т.1. - Вып.5. -С.780-820.

18. Ширяев А.Н., Кабанов Ю.М., Крамков Д.О., Мельников А.В. К теории расчетов опционов Евпропейского и Американского типов. ГДискретное время // Теория вероятностей и ее применения. 1994. - Т. 39. - Вып.1. -С.21-79.

19. Ширяев А.Н., Кабанов Ю.М., Крамков Д. О., Мельников А. В. К теории расчетов опционов Евпропейского и Американского типов.1.. Непрерывное время // Теория вероятностей и ее применения. 1994. -Т.39. - Вып.1. - С.80-129.

20. Arrow K.J., Blackwell D., Girshick M.A. Bayes and minimax solutions of sequential decision problems// Econometrica. 1949. - Vol.17. - №3-4. - P.213-244.

21. Blackwell D., Girshick M.A. Theory of Games and Statistical Decisions. -N.Y.: Wiley, 1954.

22. Cairoli R., Dalang Robert C. Sequential Stochastic Optimization. N.Y.:Wiley, 1996.

23. Chernoff H. Sequential tests for the mean of a normal distribution// Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability. Berkeley:Univ.of California Press. - 1961. -Vol.1. - P.79-91.

24. Chernoff H. Sequential Analysis and Optimal Design. Philadelphia, PA: SI AM, 1972.

25. Cherny A.S., Shiryaev A.N., Yor M. Limit behaviour of the "horizontal-vertical" random walk and some extensions of the Donsker-Prokhorov invariance principle// Теория вероятностей и ее применения. 2002. - Т.47. - Вып.З. -С.498-517.

26. Chow Y.S., Robbins Н., Siegmund D. Great Expectations: The Theory of Optimal Stopping. Boston: Houghton Mifflin Сотр., 1971.

27. Dvoretzky A., Kiefer J., Wolfowitz J. Sequential decision problems for processes with continuous time parameter, testing hypotheses// Ann. Math. Stat. 1953. - Vol.24. - №2. - P.254-264.

28. Ghomrasni R., Peskir G. Local time-space calculus and extensions of Ito's formula//Proc. High dimensional probability III (Sandbjerg,2002), Progr.Probab. Vol.55. - Basel:Birkhauser,2003. - P. 177-192.

29. Ikeda N., Watanabe S. Stochastic Differential Equations and Diffusion Processes. 2nd ed. - Amsterdam: North-Holland, 1989.

30. Ito K. Stochastic integral// Proc. Imp. Acad. Tokyo. 1944. - Vol.20. - №8. -P.519-524.

31. Ito K. On a stochastic integral equation // Proc. Imp. Acad. Tokyo. 1946. -Vol.22. - №2. - P.32-35.

32. Ito K. On stochastic differential equations // Memoirs of the American Mathematical Society. 1951. - Vol.4. - P.l-89.

33. Jacod J. Calcul stochastique et problèmes de martingales // Lecture Notes in Mathematics. Vol.714. - P.l-539. - Berlin:Springer-Verlag, 1979.

34. Karatzas I. On the pricing of American options// Applied Mathematics and Optimization. 1988. - Vol.17. - №1. - P.37-60.

35. Lehmann E. L. Testing Statistical Hypotheses. N.Y.: Wiley, 1959.

36. Mandelbaum A. Continuous multi-armed bandits and multiparameter processes//Ann.Probab. 1987. - Vol.15. - №4. - P.1527-1556.

37. Mandelbaum A., Shepp L. A. and Vanderbei R. J. Optimal switching between a pair of Brownian motions// Ann. Probab. 1990. - Vol.18. - №3. - P. 1010-1033.

38. Neyman J., Pearson E.S. On the problem of the most efficient tests of statistical hypotheses// Phil. Trans. Roy. Soc. London. Ser. A. 1933. - Vol.231.- P.289-337.

39. Peskir G. A change-of-variable formula with local time on curves //J. Theoret. Probab. 2005. - Vol.18. - №3. - P.499-535.

40. Peskir G. On the American option problem// Math. Finance. 2005. - Vol.15.- №1. -P.169-181.

41. Peskir G., Shiryaev A. N. Optimal stopping and free-boundary problems. Lectures in Mathematics, ETH Zurich: Birkhauser, 2006.

42. Peskir G. Principle of smooth fit and diffusions with angles. Research Report No. 7 (2006), Probab. Statist. Group Manchester//Sto-chastics. 2007. - Vol.79. - №3-4. - P.293-302.44

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.