Прогнозирование и идентификация динамических систем методами усеченного оценивания тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Догадова Татьяна Валерьевна
- Специальность ВАК РФ05.13.01
- Количество страниц 140
Оглавление диссертации кандидат наук Догадова Татьяна Валерьевна
Введение
1 Модели с дискретным временем. Усеченное последовательное
оценивание параметров динамических систем
1.1 Введение к главе
1.2 Постановка задачи. Модель общей регрессии
1.3 Оптимальное оценивание параметра динамики процесса А11(1)
1.3.1 Адаптивное усеченное последовательное оценивание параметра процесса АИ (1) с неизвестной дисперсией шума
1.3.2 Эффективность усеченной последовательной оценки
1.3.3 Имитационное моделирование усеченных последовательных оценок неизвестного параметра процесса АЯ(1)
1.3.4 Моделирование адаптивных прогнозов стоимости ценных бумаг
1.4 Оценивание авторегрессионного параметра динамики
процесса А1Ш1СН(1,1)
1.4.1 Имитационное моделирование оценок неизвестного
авторегрессионного параметра процесса АПА11СН(1,1)
1.5 Оценивание параметров двумерного процесса авторегрессии АЯ(2) специального вида
1.6 Оценивание авторегрессионных параметров процесса А11А11СН(2,2)
1.7 Оценивание авторегрессионного параметра процесса
А11А11СН(1л)
1.8 Оценивание среднего случайного авторегрессионного параметра процесса АПА11СН(1,1)
1.8.1 Случай известной дисперсии шумов
1.8.2 Случай неизвестной дисперсии шумов
1.8.3 Имитационное моделирование оценок среднего случайного авторегрессионного параметра процесса А1Ш1СН(1,1)
1.9 Выводы по главе
2 Модели с непрерывным временем
2.1 Введение к главе
2.2 Метод усеченного оценивания. Общий результат
2.3 Прогнозирование процесса Орнштейна-Уленбека
2.3.1 Усеченное оценивание параметра процесса Орнштейна-Уленбека
2.3.2 Адаптивное оптимальное прогнозирование процесса Орнштейна-Уленбека
2.3.3 Имитационное моделирование
2.4 Адаптивное прогнозирование негауссовского процесса Орнштейна-Уленбека
2.5 Прогнозирование негауссовского процесса Орнштейна-Уленбека по дискретным наблюдениям
2.6 Гарантированное оценивание параметра процесса Орнштейна-Уленбека по наблюдениям с аддитивным зависимым шумом
2.7 Прогнозирование многомерных диффузионных процессов
2.7.1 Оценивание параметров многомерных диффузионных процессов
2.7.2 Адаптивное оптимальное прогнозирование многомерных диффузионных процессов
2.8 Однопараметрическое дифференциальное уравнение с запаздыванием
2.8.1 Усеченное оценивание параметра однопараметрического дифференциального уравнения
с запаздыванием
2.8.2 Адаптивное прогнозирование процесса, удовлетворяющего однопараметрическому дифференциальному уравнению с запаздыванием
2.9 Выводы по главе
Заключение
Список литературы
Приложение А Акт о внедрении результатов диссертации в учебный
процесс НИ ТГУ
Введение
Важной задачей современной прикладной математики является развитие алгоритмов статистической обработки временных рядов, включая алгоритмы идентификации и прогнозирования с гарантированным качеством для стохастических динамических систем с дискретным и непрерывным временем. Подобные системы широко применяются для описания элементов баз данных, для поиска и обработки информации, а также для построения математических моделей объектов случайной природы - в таких отраслях науки, как экономика, физика, социология, биология, медицина и др.
Наиболее используемыми для данных целей моделями являются модели авторегрессионного типа, в числе которых часто рассматриваются такие модели с дискретным временем как модель авторегрессии (АЯ), модель авторегрессии с условной гетероскедастичностью (А11А11СН), и модели с непрерывным временем - диффузионные процессы и процессы, удовлетворяющие стохастическим дифференциальным уравнениям с запаздыванием, и с шумами типа Леви. Структура вышеупомянутых моделей подразумевает зависимость наблюдений между собой, что является естественным требованием для реальных динамических систем.
Чтобы оценить качество математической модели, используются различные методы. Одним из них является подход, предложенный Л. Льюнгом в работах [96], [97]. Согласно концепции Льюнга, модель считается качественной, если позволяет строить достаточно точные прогнозы.
В качестве примера рассмотрим следующую параметрическую модель
= А(в,п - 1,Уп-1)+ £„,
рые согласованы с некоторой фильтрацией {Тп, п > 1} и, возможно, зависят от значений (хп)п>1, А - Тп—1-измеримая функция. Обозначим х = {хп(п — 1)}п>1 _ последовательность одношаговых прогнозов процесса (хп). Согласно [96, 97], качество построенной модели процесса (хп) может определяться в смысле различных критериев. Таким образом, в задаче построения математической модели ключевым фактором является способность модели прогнозировать будущие значения процесса.
В качестве одного из критериев Льюнг предложил критерий на основе функции потерь вида
1 N
(0) = jyE LMß)),
п=1
где L(z)-некоторая положительная скалярная функция z, еп(в) - ошибки прогнозов. Такой методологический подход положил начало развитию ряда подходов теории идентификации систем. Минимизируя V^ по параметру в во множестве его возможных значений Dq , можно получить его оценку
ÖN = arg min Vn (0).
OeDe
В качестве примера такой оценки может выступать оценка по классическому методу наименьших квадратов (МНК), для которой L(z) = z2.
Для примера можно рассмотреть скалярный процесс авторегрессии первого порядка
хп = \хп—1 + ^п, п > 1, (0.1)
гДе Сп - это независимые одинаково распределенные величины с нулевым средним. Как известно из работ [35], [96] , оптимальным в среднеквадра-тическом смысле одношаговым прогнозом является условное математическое ожидание хп относительно его прошлых значений, то есть величина E\(xn|^*n—i) = \хп—1, где E\x - математическое ожидание случайного вектора ж по распределению P\, которое соответствует истинному значению
параметра Л. На практике параметр Л неизвестен, поэтому его заменяют некоторой оценкой Ап-1, строя затем одношаговые адаптивные прогнозы вида хп = Лп-1хп-1, п > 1. Очевидно, что качество прогноза существенно зависит от точности оценки Лп.
Для оценивания параметров стохастических динамических систем существует множество методов, одним из которых является МНК. Если предполагается, что шумы £п имеют гауссовское распределение, то оценки, построенные по МНК, совпадают с оценками по методу максимального правдоподобия (ММП). В задачах идентификации эти методы применялись, например, в работе [101], где оценки параметра динамики устойчивого процесса АИ были построены с помощью ММП, а также была показана их состоятельность и асимптотическая нормальность для случая гауссовых шумов. Позднее была решена аналогичная задача, но с негауссовскими шумами, имеющими конечные моменты любого порядка. В работе [112] было также показано, что оценки ММП обладают свойством асимптотической эффективности, то есть в неравенстве Крамера-Рао их среднеквадратическое отклонение достигает нижней границы. К примеру, в [119] показана оптимальность оценок МНК параметра динамики процесса АЯ(1).
В дальнейшем рассматривались также и более сложные модели: в работе [38] для матричного параметра динамики векторного процесса авторегрессии была доказана сильная состоятельность его оценок по МНК при ограничениях на его собственные числа и изучены асимптотические свойства выборочной информационной матрицы Фишера. В случае, когда шумы не являются н.о.р.с. величинами, а представляют собой мартингал-разность было также установлено свойство сильной состоятельности оценок МНК. Задачи идентификации для линейных моделей авторегрессионного типа решались в работах [33], [34], [42], [103], [104] и др.
Процесс АН со случайными параметрами динамики - модель с параметром динамики, подверженным случайным флуктуациям. Вследствие
этого, значения параметра дрейфуют, однако его среднее может оставаться постоянным. Исследованию такой модели, в частности, посвящены работы [16], [30], [67], [81], [99], [105], [106]. В них оценивались характеристики шума, которому подвержены парметры процесса, а также их математическое ожидание; кроме того, были найдены условия стационарности и эргодичности процесса.
В работах [31], [108] для случая гауссовских шумов была установлена эквивалентность модели AR со случайными параметрами и модели AR-GARCH того же порядка. Модели ARCH и GARCH учитывают эффект условной гетероскедастичности, характерный для рынка ценных бумаг -для этих моделей условная дисперсия является функцией квадратов прошлых наблюдений.
Модели ARCH и GARCH широко используются для моделирования финансовых временных рядов, поскольку они фиксируют тенденцию к кластеризации волатильности в финансовых данных и тот факт, что безусловное распределение цены и прибыли обычно имеет тяжелые хвосты. Класс авторегрессионных (AR) моделей с ошибками ARCH, введенный в [129], сочетает в себе преимущества модели AR, ориентированной при прогнозировании на использование условных математических ожиданий процесса (при известном прошлом), и модели ARCH - условных дисперсий (при известном прошлом), см., например, [99]
Кроме упомянутых выше методов оценивания параметров динамических систем - МНК [35], [38], [109] и ММП [32], [35], [37], можно также выделить методы стохастической аппроксимации [115], корреляционные методы типа Юла-Уокера [36], [41], [72], [74], алгоритмы линейной и нелинейной фильтрации [7], [37], [47], [76], см. также [43]. Выбор метода зависит от уровня априорной информации о модели. Например, если неизвестно распределение шумов и значения его параметров, то ММП, который во многих случаях является асимптотически эффективным, не позволяет получить рекуррент-
ные, легко реализуемые оценки. В таком случае предпочтительно использование корреляционных методов или методов стохастической аппроксимации.
Однако стоит отметить, что изучение свойств оценок, полученных с помощью перечисленных методов, возможно лишь в предположении о неограниченном росте числа наблюдений. Практически более применимыми являются методы обработки данных,которые представлены зависимыми наблюдениями и имеют конечные объемы выборок. В то же время, использование и развитие классических методов в задачах с неасимптотической постановкой вызывает большие технические трудности. Подходы, позволяющие учесть ограничение на размер выборки, показаны, например, в работах [46], [130] - в них построены доверительные эллипсоиды для оценок МНК параметров некоторых линейных систем. Другие результаты в неасимптотических параметрических и непараметрических задачах, к примеру, представлены в работах [4], [5], [102], [116], [117], [119] и др.
Альтернативным к асимптотическому подходом к проблеме оценивания параметров динамических систем является метод последовательного анализа. Его идея была предложена Вальдом в работах [3], [127] и заключается в том, что длительность процедуры регулируется выбором специального момента остановки - это также обеспечивает и гарантированное качество оценивания. Как только значение некоторого функционала от наблюдений превосходит заданную величину, наблюдения прекращаются. Позднее метод последовательного анализа применялся для оценивания параметров в моделях с зависимыми наблюдениями для динамических систем с дискретным и непрерывным временем [2], [6], [7],[9]-[13], [15], [18], [19]-[22], [25], [29], [47], [71], [77], [87], [92], [118] и др. Последовательные оценки на выборках конечного объема обладают, как правило, заданным в среднеквадратическом смысле качеством. Для последовательных планов оценивания параметров динамических систем были доказаны также свойства сильной состоятельности и асимптотической нормальности. Кроме того, в некоторых работах
были получены несмещенные оценки параметров, что при использовании классических асимптотических методов в принципе невозможно. Также последовательный подход применялся для непараметрического оценивания регрессии, авторегрессии и функции плотности по зависимым наблюдениям [7], [39], [66], [110], [111] и др.
Несмотря на то, что метод последовательного оценивания обладает рядом очевидных достоинств, в применении к практическим задачам он имеет один существенный недостаток. Как правило, объем выборки на практике является не только конечным, но и фиксированным, а для получения оценок произвольно высокой точности методом последовательного оценивания необходимо использовать выборку случайного и неограниченного размера [19], [79].
Для решения этой проблемы В. В. Конев и С. М. Пергаменгциков предложили метод усеченного последовательного оценивания, являющийся модификацией метода последовательного оценивания. Этот подход использовался работах [57], [69], [80], [81] и др. для построения оценок параметров динамических систем с гарантированным качеством по выборке фиксированного объема. Суть метода состоит в том, что если построенный момент остановки г превосходит максимальное число наблюдений Ж, то оценка по методу последовательного оценивания А(т) отвергается, в противном случае усеченная последовательная оценка Л^ (т) с ней совпадает, т. е.
Лж(г) = А(т)х(т < N).
Отметим, что такая оценка обладает заданным среднеквадратическим качеством, при этом выборка имеет случайный, но ограниченный объем. Кроме того, установлена равномерная асимптотическая нормальность, как для оценки параметра, так и для момента остановки.
и
оценивания применяется к линейным и нелинейным моделям с дискретным временем.
В работах [110], [111] решалась задача непараметрического усеченного оценивания функции регрессии по зависимым наблюдениям. Оценки, которые были получены, основываются на оценке Надарая-Ватсона и обладают известным среднеквадратическим отклонением.
Позднее в работах [123, 124] В. А. Васильевым был предложен метод усеченного оценивания, являющийся модификацией метода усеченного последовательного оценивания. Продемонстрируем реализацию этой процедуры оценивания, используя в качестве примера устойчивый процесс AR(1), задаваемый уравнением (0.1). Оценка МНК неизвестного параметра Л имеет вид
п
Е Хк-\Хк
Хп = кк=п-, 1. (0.2)
Е
к=1
Тогда усеченная оценка Л строится как
(s 5 >") •
^п = Ап • x(i>>k-i > Н], п > 1, (0.3)
где Н > 0 - специальным образом выбранный параметр. Данный метод позволяет сохранить заданное качество оценок на конечных выборках, не используя при этом идеи последовательного анализа.
При некоторых дополнительных условиях на шумы £п в [124] было установлено следующее свойство усеченной оценки (0.3)
Ел(Ап - X?" < С^, т = 1,2,..., (0.4)
тическая нормальность и асимптотическая оптимальность оценки параметра авторегрессии в минимаксном смысле.
С помощью свойства (0.4) производится контроль качества оценки, это позволяет успешно использовать ее в различных задачах адаптации. Широко востребованной на данный момент является задача адаптивного прогнозирования, решенная, к примеру, в работах [40], [44], [70], [93], [107], [128] для процессов с дискретным временем. Меняя размер выборки, можно контролировать моменты уклонения усеченной оценки. Поэтому имеет смысл рассмотреть такую функцию потерь для адаптивных прогнозов, построенных с помощью этой оценки, которая отражала бы одновременно качество прогнозирования и стоимость длительности наблюдений, требуемую для достижения этого качества.
Одной из первых работ, где для исследования качества адаптивных прогнозов предлагался критерий с использованием такой функции риска, была монография Г. Чернова [45]. Изначально им была рассмотрена задача нахождения оптимального размера выборки при оценивании среднего в по наблюдениям X = в + и, где и - ненаблюдаемый шум, имеющий нулевое среднее и дисперсию а2. Если дано п независимых наблюдений процесса X, то в качестве оценки в можно использовать выборочное среднее
п п
Х = - V = в + -V щ.
п п
1=1 1=1
Чтобы выбрать оптимальный размер выборки п, вводится понятие стоимости. Пусть Ь(9,1) - функция потерь, отражающая стоимость оценивания неизвестного в по наблюдениям £ = Л и пусть С(п) - цена использования выборки размера п. В особом случае, когда Ь(в,1) = к(Ъ — в)2 ж С(п) = сп, ожидаемая стоимость (риск) использования Л, рассчитанного по выборке
размера п, равна
что минимизируется (если пренебречь тем, что п— целое число) значением
Во многих задачах разумно использовать линейную функцию издержек
в качестве стоимости проведения п наблюдений. Константу с0 можно отбросить, так как она не оказывает влияния на решение задачи. Квадрати-ческая функция потерь L = k(t — О)2— классическая и является разумной аппроксимацией более общей функции потерь L(9,t), если при t = в функция L равна нулю и минимальна, и является гладкой в момент t. Тогда
д2L(0 9)
L(6,t) ~ k(6)(t — в)2 для ¿близкого к 0 при -—2— > 0. Предположе-
ot2
ние, что к(9) не сильно изменяется по в и что наша оценка будет близка к в, приводит к тому, что квадратическая функция потерь может быть взята в качестве приближения. В некоторых задачах лучше использовать L другого вида, например, L(6,t) = k\t — в\, но квадратичная ошибка применяется чаще, поскольку она имеет дополнительное преимущество, позволяющее использовать соответствующую дисперсию.
тогда минимальное значение функции риска есть
Я(в,по) = 2(ска2)
С (п) = Со + сп
щью дисперсии, в данной задаче? Ответ дает теория полезности [98]. При довольно слабых априорных предположениях может быть показано, что любая оптимизационная задача может быть сформулирована с помощью некоторой функции полезности, имеющей следующие параметры. При выборе из двух альтернатив, та, что является более предпочтительной, имеет большую полезность. Например, лотерея, имеющая два исхода с полезностями щ и и2 и вероятностями этих исходов р и 1 — р соответственно, обладает полезностью
и = рщ + (1 — р)и2.
В двух словах, полезность случайного исхода - это математическое ожидание результирующей полезности. Если имеем дело с относительно маленькими потерями, полезность (денежная) приближена к линейной и при добавлении потерь или издержек таких, как Ь(6,Х) и С(п), искажение будет небольшим.
Почему для оценки в необходимо использовать X? Получение точной оценки неизвестного параметра зависит от нашего знания распределения вероятностей случайной ошибки. В задачах, где известно распределение вероятностей для шумов модели, можно значительно улучшить структуру и свойства оценки. Если, например, ошибки нормально распределены, то X является оценкой по методу максимального правдоподобия.
И в завершение следует отметить, что оптимальный объем п0 зависит от того, известна ли дисперсия а2. Если она неизвестна, то существует несколько подходов. Один из них - просто предположить, каково значение а2 и действовать соответственно. Поскольку функция риска ЩО, п) малочувствительна к изменениям п в окрестности щ, ее отклонение от отимального значения может быть невелико. Можно также действовать последовательно: по п наблюдениям оценить а2 с помощью наблюдаемого выборочного
среднеквадратического отклонения
,2 =
ь2 \2
п —
1=1
и следует продолжать наблюдения, пока п <
Даппый подход, предложенный Роббннсом в работах [114, 122], предполагает потери, которые являются довольно точной оценкой оптимального значения Я(в, щ), когда а2 неизвестна. В самом деле, результаты, полученные для нормально распределенных шумов, показывают действительно маленькую стоимость при игнорировании незнания истинного значения а2 для конечного числа наблюдений (независимо от к, а2 и с). Данный результат обеспечивает более высокий порядок эффективности, чем было принято ожидать от статистических процедур.
Далее Г. Чернов решал задачу последовательного оценивания среднего нормального распределения. Полагаем, что если а неизвестно, то можно после каждого нового наблюдения использовать в определении п0 текущую оценку а2, чтобы определить, в какой момент достигается близкий к оптимальному размер выборки. Ожидается, что при использовании такой простой схемы, потери будут небольшими. Однако, поскольку оценка дисперсии чувствительна к размеру выборки, следует отметить, что выборка должна состоять из достаточно большого числа наблюдений. При этом находится цена потерь от незнания а2, ее свойства были исследованы в работах [114, 122].
Позднее Т. Н. Шрирам в работе [120] также использовал подобную функцию риска при решении задачи прогнозирования для дискретных процессов с зависимыми наблюдениями. Для скалярного устойчивого процесса авторегрессии первого порядка (хп), заданного уравнением (0.1), рассмат-
ривалась функция потерь вида
А п 2 А п
Ьп = — ^(хг — Х0^) + п = — У^ ж2_! • (Ап — А)2 + п, (0.5)
г=1 г=1
где х°р1 = Ел(хг1Тг—\) = \х{—1 - оптимальный одношаговый прогноз,
хГ1 = XпХг—1, г = 1, п - адаптивный одношаговый прогноз, Ап - оценка МНК, определенная в (0.2), А - параметр процедуры, который имеет смысл цепы ошибки прогноза.
Согласно [120], для соответствующей функции риска выполняется
Аа
Яп = Ела Ьп =--+ п + о(п-1), п —У ж.
п
Оптимальный размер выборки п°А = А1/2а может быть получен при минимизации главной части функции, однако при отсутствии априорной информации о параметре а2 его использование не представляется возможным. Заменив его некоторой оценкой а2п, определим момент остановки
ТА = \п > А1/2дп\ ,
п>па I у
где па - «задержка» процедуры. Асимптотическая эквивалентность Та и
п°а при А — ж в смысле сходимости в среднем и почти наверное, а также
н,
асимптотическая «риск-эффективность» Та в смысле сходимости —
п°А
при А — ж доказана в работе [120]. Более того, установлена асимптотическая нормальность и равномерная интегрируемость центрированного нор-
та — п°А
мированного момента остановки -- с помощью методов нелинейной
\/ПА
теории восстановления.
Отметим, что Xi в (0.5) формально не является адаптивным прогнозом, поскольку для получения оценки параметра динамики Ап в момент времени (г — 1) используются будущие значения процесса хг,...,хп. То
есть в данном случае можно говорить скорее об интерполяции в интервале г = 1,п. Однако полученные результаты могут быть использованы при построении моделей динамических систем по реальным данным.
В работах [78], [121] вышеописанные результаты Шрирама были дополнены и уточнены; подобная постановка рассматривалась в [68]. В работах [23, 24], [89]—[91] использовались оценки неизвестных параметров динамических систем с дискретным временем по методу усеченного оценивания (0.3), что позволило решить подобную задачу для построения прогнозов ^ = Х—1х—1 в реальном времени.
В диссертационной работе метод усеченного оценивания впервые применен для решения задачи оптимального адаптивного прогнозирования динамических систем с непрерывным временем.
Стоит отметить, что метод усеченного оценивания параметров динамических систем с дискретным и непрерывным временем может быть также успешно применен, к примеру, в адаптивных процедурах интерполяции, управления и фильтрации.
Актуальность проблемы
Развитие методов статистической обработки временных рядов таких, как идентификация и прогнозирование стохастических динамических систем дискретным и непрерывным временем, является важной задачей современной прикладной математики. При этом необходимо, чтобы применение таких алгоритмов в практических приложениях обеспечивало гарантированное качество решения поставленных задач. Области науки, в которых подобные результаты имеют большое прикладное значение, включают в себя экономику, физику, финансовую математику, социологию, биологию и др.
Для решения задач идентификации динамических систем существует ряд классических асимптотических методов. В то же время для практического применения результатов статистической обработки актуальными являются методы, позволяющие делать статистические выводы по выбор-
кам фиксированного объема. Одними из таких методов являются метод усеченного последовательного оценивания, предложенный В.В.Коневым и С.М.Пергаменгцпковым, а также метод усеченного оценивания функционалов типа отношений В.А.Васильева, который при фиксированном объеме наблюдений позволяюет получать оценки с гарантированным качеством.
Необходимость развития теории адаптивного оптимального прогнозирования и применения ее при построении математических моделей стохастических динамических систем с дискретным и непрерывным временем, а также необходимость решения других статистических задач при неполной априорной информации обуславливает актуальность построения и исследования свойств адаптивных прогнозов динамических систем в реальном времени. Задача адаптивного оптимального прогнозирования также важна в различных практических задачах.
В многочисленных работах, связанных с задачей адаптивного прогнозирования, по большей части изучались асимптотические свойства прогнозов, полученных с помощью классических асимптотических методов и метода последовательного анализа оценивания неизвестных параметров системы. Использование усеченных оценок в адаптивных процедурах, в том числе в процедурах адаптивного прогнозирования, позволяет исследовать качество прогнозов при применении практически значимых критериев для динамических систем с дискретным и непрерывным временем. Получаемые процедуры при этом отличаются достаточной простой реализацией на практике.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Адаптивное оптимальное прогнозирование многомерных процессов авторегрессионного типа с дискретным временем2015 год, кандидат наук Кусаинов Марат Ислямбекович
Одноэтапные последовательные процедуры оценивания параметров динамических систем2016 год, кандидат наук Емельянова Татьяна Вениаминовна
Оценивание параметров нелинейных стохастических динамических систем с дискретным временем2010 год, кандидат физико-математических наук Маляренко, Анна Александровна
Улучшенное оценивание параметров регрессии с импульсными помехами2012 год, кандидат физико-математических наук Пчелинцев, Евгений Анатольевич
Последовательное обнаружение моментов разладки случайных процессов2000 год, доктор физико-математических наук Воробейчиков, Сергей Эрикович
Введение диссертации (часть автореферата) на тему «Прогнозирование и идентификация динамических систем методами усеченного оценивания»
Цель работы
Цель диссертационного исследования состоит в построении процедур оценивания параметров с гарантированным качеством для процессов с дискретным и непрерывным временем, а также процедур адаптивного асимптотически оптимального прогнозирования процессов авторегрессионного типа с непрерывным временем и неизвестными параметрами. Кроме того, целью является подтверждение работоспособности полученных алгоритмов и их
свойств с помощью численного моделирования.
Для достижения этих целей были сформулированы и решены следующие задачи:
• построение усеченных последовательных оценок неизвестных параметров процесса регрессии общего вида, а также процессов АЯ(1), АЯ(2), А1Ш1СН(1,1), АЕА11СН(2,2), А1Ш1СН(2,Ч), А1Ш1СН(1,1) с дрейфующим параметром и исследование их статистических свойств; численное моделирование процедур оценивания с целью проверки результатов, сформулированных в ходе решения этих задач
•
непрерывным временем, построенных на основе усеченных оценок неизвестных параметров динамики для: классического процесса Орнштейна-Уленбека и процесса Орнштейна-Уленбека с негауссовским шумом; многомерных процессов диффузионного типа; уравнений с запаздыванием по времени; а также оптимизация процедуры прогнозирования в смысле заданной функции потерь; численное моделирование процедур прогнозирования с целью подтверждения их работоспособности.
Методы исследования
Результаты получены с использованием методов теории вероятностей, анализа временных рядов, обработки информации, линейной алгебры, теории случайных процессов, математического анализа и имитационного моделирования.
Научная новизна и результаты, выносимые на защиту
Впервые вариант метода усеченного последовательного оценивания был применен для оценивания параметров нелинейных и многомерных моделей авторегрессионного типа с дискретным временем, исследованы неасимптотические свойства построенных оценок. При решении задач адаптивного оптимального прогнозирования в моделях стохастических динамических си-
стем с непрерывным временем впервые использовались оценки неизвестных матричных параметров динамики моделей, полученные по методу усеченного оценивания. Данные оценки имеют гарантированную точность на выборках фиксированного объема и обладают свойством сильной состоятельности, что позволило построить и исследовать свойства прогнозов для процессов, удовлетворяющих дифференциальным уравнениям с запаздыванием по времени, многомерных устойчивых диффузионных процессов, а также процессов с шумами типа Леви.
Основные результаты диссертационного исследования обладают научной новизной. Эти результаты можно сформулировать в виде следующих положений, выносимых на защиту:
I. Метод усеченного последовательного оценивания применен для оценивания параметров процессов АЯ(1), А11А11СН(1,1), А11А11СН(2,2), А11А11СН(2,д), А11А11СН(1,1) с дрейфующим параметром и двумерного процесса АЯ(2) специального вида; исследованы статистические свойства оценок.
II. Предложены процедуры адаптивного прогнозирования, оптимальные в смысле заданной функции потерь, для перечисленных ниже устойчивых процессов
• Процесса Орнштейна-Уленбека
• Процесса Орнштейна-Уленбека с негауссовским шумом
•
му уравнению с запаздыванием по времени
Степень разработанности темы
В данной работе развивается метод, предложенный известным шведским математиком Леннартом Льюнгом, по построению математических моделей на основе использования качественных прогнозов стохастических ди-
намических систем. При этом используется новый метод усеченного оценивания неизвестных параметров случайных процессов, который позволяет исследовать качество прогнозов в смысле известного критерия, предложенного американским математиком Г. Черновым. Все результаты, полученные в диссертационной работе, являются новыми и могут служить основой для дальнейшей разработки адаптивных методов обработки стохастических динамических систем в задачах управления, фильтрации и т.д.
Достоверность
Полученные результаты сформулированы в виде теорем и лемм, которые имеют строгое математическое доказательство. Произведено имитационное моделирование, результаты которого подтверждают теоретические выводы.
Теоретическая и практическая ценность работы
Теоретическая значимость работы заключается в развитии методов усеченного и усеченного последовательного оценивания в задачах идентификации динамических систем с дискретным и непрерывным временем. Показаны неасимптотические и асимптотические свойства полученных с помощью этих методов оценок неизвестных параметров динамики. Построены адаптивные прогнозы для моделей с непрерывным временем, являющиеся оптимальными в смысле классического критерия качества прогнозирования.
Построенные процедуры прогнозирования могут применяться в прикладных задачах, в которых в качестве математических моделей используются стохастические динамические системы в условиях, когда увеличение числа наблюдений состояний системы невозможно или затратно. Отрасли науки и техники, допускающие применение результатов данной диссертации включают: генетику, биомедицину, социологию, финансовую математику и др. Теоретические результаты могут быть использованы в курсах лекций для студентов математических факультетов.
Апробация работы
Основные положения и результаты диссертации докладывались и обсуждались на следующих конференциях:
1. Международная научная конференция «Робастная статистика и финансовая математика-2018», Томск, 9-11 июля 2018 г.
2. Двенадцатая конференция с международным участием «Новые информационные технологии в исследовании сложных структур», пос. Катунь, Алтайский край , 4-8 июня 2018 г.
3. Вторая международная конференция по стохастическим методам, Новороссийск, 25—31 мая 2017 г.
4. Международная научная конференция «Робастная статистика и финансовая математика-2017», Томск, 3-5 июля 2017 г.
5. X Всероссийская научно-техническая конференция «Актуальные вопросы архитектуры и строительства», Новосибирск, 11-13 апреля 2017 г.
6. Международная научная конференция «Робастная статистика и финансовая математика», Томск, 1-2 июля 2016 г.
7. XIII Международная конференция студентов и молодых ученых «Перспективы развития фундаментальных наук», Томск, 26-29 апреля 2016 г.
8. 54 международная научная студенческая конференция МНСК-2016, Новосибирск, 16-20 апреля 2016 г.
9. II международная летняя школа молодых ученых «Information Technologies for Complex System Analysis and Synthesis (IT CoSAS'2015)», Анапа, 8-12 июня 2015 г.
10. Международная научная конференция «Робастная статистика и финансовая математика», Томск, 1-2 июля 2015 г.
11. II Всероссийская молодежная научная конференция с международным участием «Математическое и программное обеспечение информационных, технических и экономических систем», Томск, 16-17 мая 2014 г.
12. XI Международная конференция студентов и молодых ученых «Перспективы развития фундаментальных наук», Томск, 22-25 апреля 2014 г.
13. 52 Международная научная студенческая конференция (МНСК-2014), Новосибирск, 11-18 апреля 2014 г.
14. I Всероссийская молодежная научная конференция «Математическое и программное обеспечение информационных, технических и экономических систем», Томск, 16-17 мая 2013 г.
15. X Международная конференция студентов и молодых ученых «Перспективы развития фундаментальных наук», Томск. 23-26 апреля 2013 г.
Публикации
Основные результаты диссертации представлены в публикациях автора, перечисленных в списке использованной литературы: [8], [50]—[65]. Среди них 3 статьи опубликовано в журналах Перечня ВАК [57, 59, 62], в том числе 2 - в изданиях, индексируемых Web of Science [59, 62].
Структура и объем диссертации
Работа состоит из введения, двух глав основного текста, заключения, списка использованной литературы и приложения. Полный объем диссертации составляет 140 страниц, 15 рисунков, 8 таблиц. Список литературы включает 130 наименований.
Содержание работы
В главе 1 построены оценки неизвестных параметров линейных и нелинейных процессов авторегрессионного типа с дискретным временем методами усеченного последовательного и усеченного оценивания. Исследованы асимптотические и неасимптотические свойства построенных оценок.
В главе 2 построены адаптивные оптимальные прогнозы процессов с непрерывным временем, удовлетворяющих стохастическим дифференциальным уравнениям, на основе оценок неизвестных параметров процессов по
методу усеченного оценивания.
1 Модели с дискретным временем. Усеченное последовательное оценивание параметров динамических систем
1.1 Введение к главе 1
Современная эволюция математической статистики направлена на развитие методов обработки данных по зависимой выборке фиксированного размера. Одну из таких возможностей дает известный метод последовательного оценивания, который успешно применялся для решения параметрических и непараметрических задач. Этот подход для системы независимых наблюдений был впервые представлен в [127]. Позже эта идея применялась при оценке параметров динамических систем во многих статьях и книгах ([2, 13, 17, 47, 48, 49, 71, 87, 94, 119] среди прочих). В частности, последовательные оценки параметра А11(1) с неизвестной дисперсией шума были рассмотрены в [49].
Для получения последовательных оценок с произвольной точностью необходима выборка неограниченного размера. Вместе с тем, на практике время наблюдения за системой часто не только конечно, но и фиксировано. Одну из возможностей для нахождения оценок с гарантированной точностью вывода по выборке фиксированного размера дает метод усеченного последовательного оценивания. Данный метод впервые был предложен в [80, 81] и получил далнейшее развитие для задач оценивания параметров динамических систем с дискретным временем в ряде работ [57, 69] и др. В этих статьях были построены оценки параметров динамических систем, имеющих известную верхнюю границу для среднеквадратического отклонения оценок, полученных по выборке фиксированного размера. Данный метод также применялся для решения задач непараметрической статистики [47, 110, 111].
Нелинейные стохастические системы, как известно, широко используются для описания реальных процессов в биологии,экономике, медицине и
пр. Для простых моделей, таких, как, например скалярная авторегрессия первого порядка с дискретным и непрерывным временем, может быть построена одноэтапная процедура последовательного оценивания. В подобных случаях одноэтапные последовательные оценки являются оценками МНК или максимального правдоподобия, вычисляемыми в специальный момент остановки. Данные оценки достаточно просты для исследования. В более сложных моделях, к примеру, в процессах авторегрессии высокого порядка и многомерных регрессионных процессах, применяется двухэтапная последовательная процедура оценивания параметров (см. [17, 47, 71, 87] и т.д.). Кроме того, существует ряд многомерных моделей, для которых возможно построение одноэтапной процедуры оценивания неизвестных параметров (см. [13, 47, 94]) и применение их в задачах адаптивного оптимального прогнозирования [11, 89, 90]. В данной работе рассматриваются модели такого типа, строится процедура усеченного последовательного оценивания для модели общей регрессии и в качестве примеров решаются задачи оценивания параметров скалярных процессов А11А11СН(1,1), АЯ(1), А11А11СН(1^), А11А11СН(2,2), двумерной авторегрессии специального типа и модели АКАИСН с дрейфующим параметром. Также для оценки неизвестного параметра динамики процесса АЯ(1) была установлена асимптотическая эффективность в случае неизвестной дисперсии шума модели.
В данной главе метод усеченного последовательного оценивания применяется для построения оценок неизвестных параметров процессов авторегрессионного типа. Результаты главы опубликованы в работах [50]-[54], [57, 58].
1.2 Постановка задачи. Модель общей регрессии
странство с фильтрацией Т* = {Тп}п>0.
Пусть наблюдаемый р-мерный процесс (х(п)) удовлетворяет уравнению:
где А(п), В(п) - Тп - измеримые наблюдаемые матрицы размера р х д,р х т соответственно. Элементы этих матриц могут зависеть от реализаций
Шумы £ (п) образуют иоследовательность Тп - согласованных н.о.р. случайных векторов с Е^ (п) = 0, Е^ (п) ^' (п) = I; где А = (Х\,..., Хд)' -вектор неизвестных параметров. Здесь и ниже штрих означает транспонирование.
Нашей целью является построение усеченной последовательной оценки скалярного параметра в = а'А, где а - заданный постоянный вектор. Этот метод позволяет получать оценки с гарантированным качеством по выборке фиксированного объема.
При построении процедуры оценивания векторного параметра А в модели регрессии (1.1), будем учитывать ситуацию, когда матрица А(п) может быть вырожденной. В этом случае будут использоваться псевдообратные матрицы (см., например, [1, 94]) А+(п) = [А'(п)А(п)]-1А'(п) (предполагается, что все обратные матрицы [А'(п)А(п)]-1 определены почти наверное (п.п.)). Более того, Тп— согласованные матрицы ^ (п) := В (п) В' (п) полагаются известными или ограниченными известными матрицами 2(п) в смысле квадратичных форм для всех п > 0:
х(п) = А(п - 1)Х + В(п - (п), п > 1,
(1.1)
(х(п)).
2 (п) < 2(п) п.н.
(1.2)
ной оценки наименьших квадратов:
N
^ с(п)а'А+(п — 1)х(п)
=
п=1
N
Ес(п)
п=1
(1.3)
где с (п) = (п) • с (п — 1), с(п) = {а'А+ (п)2+ (п)(А+ (п))'а} , 2+ (п) = 2 (п), если 2 (п) известна и 2(п) в противном случае; и п) (п) - некоторая неотрицательная весовая функция, удовлетворяющая неравенствам п)(п) < 1, п > 1. Согласно (1-2) и (1-3), отклонение оценки 9^ имеет вид:
N
^с(п)а'А+(п — 1)С (п)
9^ — 9 =
п=1
N
Т,с(п)
п=1
(1.4)
где ((п) = В(п — 1)£ (п). Определим усеченную последовательную оценку для параметра 9 то выборке размера N, как
тн,ы
= я Е Рп(Н )°(п)а'А+(п — 1)х(п) • X
п=1
N
Ес (п) > н
п=1
(1.5)
где момент остановки
= <
к N
[П{к е [1,М]: Е с(п) > Н}, £ с(п) > Н,
п=1 п=1
N
М, £ с(п) < Н
п=1
(1.6)
и веса
1, П < тн,м, Рп = { N
ан, ^ с (п) > н,
ан =
тн,м — 1
Н — Е с(п)
п=1
С (тн,м) '
п=1
/К \
Обозначим 5н,м = Р\ I с (п) < Н ) ■ Здесь и далее Е\ будем ио-
\п=1 /
нимать как математическое ожидание по распределению Р\ с заданным параметром Л.
В следующей теореме приведено свойство построенной оценки параметра в, доказательство которого подобно доказательству аналогичных теорем в работах [2, 80, 81].
Теорема 1.1. Пусть задан процесс регрессионного типа (1.1), где матричные функции, А(п) и В(п) такие, что для них выполняется условие (1.2) и Е\с(п) < ж, п € [1, Щ ■ Тогда для любых N > 1 и Н > 0 оценка 0н,к, определенная в (1.5), обладает свойством
Е\(0н,ы — О)2 < 1 + • ■
Доказательство Теоремы 1.1. Для доказательства теоремы, с помощью (1.4) найдем уклонение усеченной последовательной оценки (1.5)
1
@н,м — в = - Е Рпс(п)а'А+(п — 1)С(п) • X
п=1
N
Ес (п) ^ н
п=1
—0 • х
' N
Ес (п) <н
п=1
Оценим среднеквадратическое уклонение для 9н,ы ■ Второй момент первого слагаемого может быть оценен так же, как, например, в [2], используя определение тн,к, с (п) и свойство рп < 1
1
тн,ы
Ехфн,м — О)2 < ^ • Ех^ &с2(п)э!А+(п — 1)((п)С(п)(А+(п — 1))'.
(п- 1))'а
п=1
2 тн,м
+02 • 6н,м < • Ех Е Ас2(п)а'А+(п — 1)^+(п — 1)(А+(п — 1))'.
(п- 1))'а
п=1
2 тн,м 2
+02 • < ^2 • ЕА Ё Рпс(п) + в2 • = ^ + О2 • .
п=1
Теорема 1.1 доказана.
Результаты раздела опубликованы в [57].
Применим общий алгоритм оценивания в следующих задачах.
1.3 Оптимальное оценивание параметра динамики процесса
АЩ1)
Пусть {хп}п>0 - скалярный авторегрессионный процесс:
хп = \ • хп—1 + а • £п, п > 1, (1.7)
имеющий начальное значение х0 с нулевым средним и восьмой момент; {^п}
3 2
- последовательность н.о.р. случайных величин с = Е^ = 0, Е^п = 1 и Е^8 < ж; кроме того, х0 и {^п} одинаково распределены. Процесс (1.7) предполагается устойчивым, т.е. |А| < 1, а параметр а неизвестным.
Задача состоит в построении оценки параметра Л с гарантированной в среднеквадратическом смысле точностью.
В этом разделе мы рассмотрим два вида оценок - с известной главной частью среднеквадратической ошибки (имеющую более простую структуру) и оптимальную в асимптотическом минимаксном смысле оценку. Первая оценка будет использована в разделе 1.3.2 в качестве пилотной оценки при построении оптимальной. В обоих случаях мы строим усеченную последовательную оценку на основе оценки МНК:
N / N
X N = Е Хп • Хп—1 / Е
п=1 / п=1
/ п=1
ма специального вида. В разделе 1.3.2 доказана асимптотическая эффективность некоторой модификации построенной оценки. В разделе 1.3.3 проведено численное моделирование, подтверждающее теоретические свойства оценки.
1.3.1 Адаптивное усеченное последовательное оценивание параметра процесса AR (1) с неизвестной дисперсией
шума
Определим в (1.5), (1.6) пороговое значение Н^ = h • • N, где т = т (N) - последовательность целых чисел, удовлетворяющая следующим условиям:
Предположение 1.
а) т (N) = о (N), т (N) ^ ж при N ^ ж;
л ч logrn (N) / 1 \
b -ттг^— = о ^^ при N —> ж;
У т (N) \VNj
т (N)
с) Для некоторых 5 £ (0,1) выполняется —-^у < 5 и число
h £ (о, (V2 - if • (1 + s)-1^.
Определим пилотную адаптивную оценку дисперсии а2 по методу наименьших квадратов следующим образом
1 т
^ = - KXn~l] ,
n=i
где
Кг =РГ Oj-i^X^
Хт Хт • X
т
ЕX2n-i > т(\0%т)~1
n=i
Аналогично [124] может быть доказано свойство
\2
Р (J2 а2ЛА С • (iogmy
Мат -а) < -~2-, ^
где д = (Л, а2^ .
Определим в общей процедуре оценивания (1.5), (1.6) весовые функции
w (п) =
0,1 < п < т,
X
а2т > (logт) 1 ,т <п < N;
(1.9)
усеченный момент остановки
TN = {
inf |
к е [1,N]: Е 1 > д
IN
п=т+1
N
N
Е х1~ i > hn ■
п=т+1
N,
Е xl-1 < hn
п=т+1
(1.10)
и весовые функции
1, 1 < п < rN,
N
Рп = <
1, п = TN, Е Х1-1 < HN,
п=т+1 N
ан, п = rN, Е х1-1 > HN ,
п=т+1
(1.11)
где
TN - 11
ан = ( HN - Е хп-1
п=т+1
X
tn-1 •
Тогда усеченная последовательная оценка (1.5) примет вид
TN
Xn =
Н
N
Ей
п=1
пхпхп—1 • х
N
Е хп-1 > HN, а2т > (log т) 1
п=т+1
(1.12)
Обозначим для каждого N такого, что log т (N) > а , функцию
SN =
2С22 • (log т)2 , 2С21 , С1/4 • (log т)
+ +
3/2
+
2С • (log т)
2
1
где С21 —
8(1 + 5)2ВАЕ-а2)
а2
1 - & (1 + «)
С22 —
8к4 • С(1 + ¿)6 В
-т'&Вл- коэф-
[а2 ( Со - к (1 + ^))]4'
фициент из неравенства Буркхольдера. Согласно Предположению 1 £м — о при N — ж. Следующая теорема является одним из основных ре-
С
цательную константу, значение которой не является решающим (и не всегда одинаково).
Теорема 1.2. Рассмотрим модель (1.7) с параметром |А| < 1. Тогда, последовательная усеченная, оценка (1.12) параметра А обладает следующим свойством:
\ 2 1 1)Е^Ам -А) < — + ем;
если к тому же и х0 для некоторого положительного целого з имеют
моменты порядка 8 й 7 тог да при, N -— ж
2* С ( 1
2)ЕААМ-А) <
N4
+
(мО.
Доказательство Теоремы 1.2. Доказательство первого утверждения теоремы основано на следующем представлении отклонения оценки параметра:
Ая - А —
а
тм
н
N
^ ^ Рпхп-1 ^п • X
п=т+1
N
Е Хп-1 ^ НN1 ат > (^т) 1
п=т+1
-А •х
' N
Е
п=т+1
X
п—1
<Н!
N
-А •х а2т < (\ogrn)-1 — Ь + 12 + к- (1.13)
1
Согласно этой формуле получим:
Е,(АМ - А)' < ЕиТ + 2ЕиТ> + 2ЕиТ.
< ^и11
V12
'V13'
(1.14)
4
2
49, 69, 80], найдем оценку сверху
Е< а2ЕЕи
1
тм
п=т+1
I • X я2т > т)
,-1
1
ты
= а
-ГГ2 Е Рп Х™—1^ Х > П1) 1
м нгм,
" \п=т+1
)
= мЕ* 4 •х К > (1°ё т)—1
1 , ^I 2 21
Еп, \о,т — о I
< +
НИ кЫ т
1 1°g т
< м + « — +
1/4 1 С1/4 • (^ т)
3/2
кЫ кЫл/т
(1.15)
По определению 12 имеем:
Е„и< Р„
( М
\п=т+1
^ 2 < 1 М I / ^ Хп—1 <
Определим число С0 [Л] = [л/1 + X2 — |А|] . Согласно Лемме 2 в [80 для каждого к > т справедливо:
Е > (д) Е £
п=т+1
п=т+1
(1.16)
Отметим, что в устойчивом случае |А| < 1
Со (X) > (у2 — 1) .
Отсюда и по неравенству Чебышева, получим:
Р,
Е х1—1 < < (X) Е Й < Я^
\п=т+1 / \ п=т+1 /
= Рп
< Ри
-
(
1
N
N - т 1
Е te
— а
22 ) > а -
Н
N
п=т+1 N
N — т
Е (й -
п=т+1
> а2 -
< Р,
<
(
1
N
Е а
N - т ^ 1 v>n
п=т+1
22 - ° )
+
hN(d - а2)
Со • (N - т)
Со • (N - т)
ha2m N Со • (N - т)
>а2(1 -
) )
hN
Со • (N - т)
))
8В4Е,,{$ - а2)4
(
а2 1-
hN
Co(N-т)
+
8h4N4Е„(а1 - а2)4
(N - т)
(
а2 1-
hN
C0(N-т)
4
< 8(1 + 5)2В4ЕД^ - у2)4 + 8h4 • С(1 + 5))
С4 • (N - т) (log т)2
}2 i1 - h (1 + V
,N2 [а2 (С0 - h (1 + ¿))]4 N2 • т2
С21 + С22 • (log т)
(1.17)
N2 N2 • т2 ' В последнем неравенстве мы использовали (1.8). Оценим третье слагаемое в (1.14)
ЗД < Р,U « <
(v2m < (log rn) ^ .
Используя (1.8) и неравенство Чебышева для достаточно больших N, полу-
чим
Р, < (logтГ1) = Р, (а2 - а2т > а2 - (logrn)-1)
<
(J • (log m
m2( a2 - (log m)
1
= о —
(1.18)
Первое утверждение Теоремы 1.2 следует из (1.14), (1.15), (1.17), (1.18). Второе утверждение может быть доказано аналогично первому. Теорема 1.2 доказана.
Подобный результат для последовательной оценки Л представлен в
4
6
2
4
1.3.2 Эффективность усеченной последовательной оценки
В этом разделе рассмотрим немного более сложную модификацию оценки (1.12) и докажем ее оптимальность в смысле некоторой функции риска, определенной ниже. Подставим в формулу (1.12) пороговое значение
г2
т
Hn = hN • —^ • (N _ т) ,hN = 1 _ (log N) 1 и т = т (N) - иоследова-1 — X2
— т
тельность целых чисел, удовлетворяющих следующим условиям: Предположение 2.
а) т (N) = о (N), т (N) ^ ж при N ^ ж;
, ч login (N) ( 1 \
b -ттт^— = о ^-~— при N -л ж;
У т (N) \VN • log2N J
т ( N)
с) Для некоторого 5 £ (0,1) выполняется неравенство —-^у < 6.
Здесь пилотные оценки дисперсии а2 и X определяются следующим обра-
зом
т
-2 1 L \ , .
^т'п—1
п
и для некоторого г £ (0,1)
ат ' I 'п X т'п—1
т т 1
п=1
Хт Р1" г, г]Хт,1
где оценка Хт, моменты остано вкп т^ и вес а п)(п], (Зп определены в (1.9)-(1.12).
Докажем эффективность оценки Х^ в смысле критерия, использующего функцию риска вида
2
Rt,n (Xn) = sup sup I (X, f ) N • E^(Xn — X) .
V |A|<1_r
Здесь Xn - произвольная оценка параметра X, V - класс всех плотностей
f(:) шумов {<^п} , имеющих конечные вторые моменты и информацию Фи-
а'2 _
шера I (X, f) = -г-21 (f)(= (1 _ X2) для случая гауссовских илотно-
1 X2
2
стей f(.)), I(f) =
'f W
f (x) dx.
\ f(x)
Наша цель - доказать, что предел
lim R
N^oo
N (Xn^
Для доказательства оптимальности оценки Xn, получим следующее нера-
венство
N^oo
- л)
lim N ■ E,, Xn - X) < 1-Х2.
(1.19)
Используя представление (1.13) для уклонения оценки Xn , оценим вторые моменты слагаемых в правой части равенства (1.13). Аналогично (1.15) имеем
if < а2Еи
nN
1
-Е„
/ tn \п=т+1
рпх2п_ 1\Fm \ •х v2m > (logm)
1
= h-2 __1
= hN AT
1 N — m
-E„
(1 - Al)
7 2
• X
7m > (logm)
1
< h-2 . _1_
< hN N-m
(1 - A2)
+h~N2 • ^- E, 1 N — m
22 К 2 I
7 2
m
(1 •X > (logm) 1
+ hN at
1 N — m
1
- X2
< h-2 . _1_
< hN N-m
(1 - A2)
-2 logm
N • N (ЕЛат V2)) + hN N -my
< h-2 * (1 - Л2) + hj! 01/4 ^^m)3/2
N — m 4 7 J
1/4
+Ь- •::^(Ejai -a2)4) + hN2^
N (N - m) л/т
En I Am — X
)
< ,0N
+ h J ■
1
■N
N — m \ m • h
{¿¡Ъь + £m) =° Ш .
(1.20)
2
Оценим ЕиI%
Е,122 < Р,
I М
\п=т+1
%п-1 < Нм
)
Заметим, что когда Нм определяется, как в разделе 1.3.2, метод оценивания данной вероятности, использованный в разделе 1.3.2, не может быть применен. Поэтому мы будем использовать формулу Ито для следующего функционала от процесса {х2п} :
1
N — т
1
{
2 2 ■т ■М
+
2 X
N
Е
п=т+1 N
а
■ п 1 -
1-Х2
1
N
1 - X2 I N -т N -т
Е 1 ^ + ^—тИ (6
п=т+1
N -т
п=т+1
2
-а )
}
С помощью этой формулы и неравенства Чебышева, получим:
1
N — т
1
{
2 2 ■т ■М
+
2 X
N
Е
п=т+1 N
2 а
■ __
п-1 1-Х2
1
N
<Ри
1 - XI N -т N -т
2 X
Е ■п-1 ^п + -^—тТ, (£
1 2 2 ■м 2 ■ 2
-X2 N - т
п=т+1 N
N -т ^
п=т+1
2 „Л -а )
}
1
N
Е хп-1 ь - (й -а2)
<
8
а
а
п=т+1 2
п=т+1
1-Х2 1 -X2
• Е„
> (1 - Ьм )
а
)
(а2)4 (1 - Нм)4 ^ - т)
4
4 и
■м + хт + 2 1X1
N
■ п- 1 п
п=т+1
+
N
п-1
п=т+1
+
8
{а2)4 (1 - г2)8 (1 - НмУ
4Еи[\ат
-2 '21
— а
+ 2(1 - г) а2
Am — А
<
2 • 44
(а2)4(1 - hN)4(N -т)
4 [Е,х% + Е1
х8
^ т
N 4
+2 + Е
п=т+1
N
£ (Я -1)
+
64
(а2)4 (1 - г2)8 (1 - hN)
44
п=т+1
E,\7l -v 2\4 + 2а2Еи
\т — А
= О
(logN )4 + (logN)4 (logm)2 + (logN)
т2
т2
(1.21)
( N -т)2
Последнее неравенство верно, вследствие (1.8), второго утверждения Теоремы 1.2, второго свойства в Предположении 2 и очевидного неравенства sup Еих8п < ж , которое выполняется для устойчивых процессов (1.7). Тогда
п>0
неравенство (1.19) следует из (1.13), (1.18), (1.20) и (1.21). Из (1.19) следует, что усеченная оценка |Aw| является оптимальной (см. [119, 124]) в асимптотическом минимаксном смысле
lim Rr,N (XN) > lim inf R^n (XN) = lim Rr,N (/W) = 1
и пнфпмум берется по классу всех оценок А^ параметра А. Отсюда и из (1.19) получаем свойство эффективности. Результаты подразделов 1.3.1, 1.3.2 опубликованы в [57].
1.3.3 Имитационное моделирование усеченных последовательных оценок неизвестного параметра
процесса А11(1)
Для подтверждения теоретических свойств полученных оценок А^ параметра А выполнено моделирование при п)(п) = 1 ж Н^ = Н • N в случае
4
4
4
известной дисперсии а2 = 1 :
тм
=
Н
N
Ей
п=1
пхпхп-1• х
N
Е ХП-1 > НN
п=т+1
(1.22)
Для этой цели использовался пакет прикладных программ МАТЬАВ. В таблицах 1)и 2) дано среднее
1
100
^ ) = т Е^ (к)
к=1
оценок (1.22) для к-ой реализации х(к = (^хПк^ , к = 1..100 процесса (1.7) и их качественные характеристики (выборочное среднеквадратическое отклонение)
1
100
^) = йю ' £(к) - Х)2
к=1
для разных N.
Таблица 1 - Оценивание параметра А для модели АЯ(1) с И = 0, 2
1
А N = 100 N = 200 N = 500
) ят) ) ят) АШ) )
0,2 -0,2031 0,0395 -0,2111 0,0240 0,2041 0,0090
-0,2 -0,1755 0,0521 -0,1831 0,0257 -0,1973 0,0092
0,9 0,8836 0,0426 0,8678 0,0252 0,8967 0,0066
-0,9 -0,8874 0,0407 -0,9082 0,0222 -0,8943 0,0114
1 0,9841 0,0514 0,9722 0,0164 1,0013 0,0091
-1 -0,9730 0,0395 -0,9942 0,0162 -0,9993 0,0104
4 4,0107 0,0166 4,0183 0,0074 4,0087 0,0026
_4 -4,0060 0,0228 -3,9987 0,0071 -4,0008 0,0050
Таблица 2 - Оценивание параметра Л для модели AR(1) с h = 0, 6
Л N = 100 N = 200 N = 500
KN) Sl(N) \(N) Sl(N) \(N) Sl(N)
0,2 0,2253 0,0149 0,1991 0,0090 0,2001 0,0029
-0,2 -0,2126 0,0141 -0,1945 0,0090 -0,2004 0,0029
0,9 0,8874 0,0145 0,8872 0,0067 0,8945 0,0027
-0,9 -0,8997 0,0127 -0,9015 0,0054 -0,9012 0,0037
1 1,0085 0,0123 0,9898 0,0077 0,9967 0,0038
-1 -0,9732 0,0171 -1,0044 0,0051 -0,9893 0,0033
4 3,9996 0,0047 3,9986 0,0027 4,0057 0,0014
_4 -3,9947 0,0068 -4,0038 0,0034 -4,0040 0,0015
1.3.4 Моделирование адаптивных прогнозов стоимости ценных
бумаг
В целях проверки эффективности предложенной процедуры оценивания было произведено ее тестирование на реальных данных. С сайта www.finam.ru были взяты цены акций четырех крупных компаний - «Мегафон», «Сбербанк», «Газпром» и «Роснефть» за годичный период (с 05.05.2014 по 05.05.2015). В качестве модели изменения цен акций была использована модель AR(1) и для ее построения использовалась усеченная последовательная оценка неизвестного параметра динамики вида
TN,H
) = --х(У>?_i > N • log-1 N
tn,h
r^i
-1
E i
(E > N • log-1 ^
i=1
и вычислялась ее выборочная дисперсия. Результатом стали следующие значения, приведенные в таблице 1
Таблица 3 - Оценивание параметра Л по реальным данным
Компания Л(Ж) )
«Сбербанк» 0,9999 0,0277
«Роснефть» 1,0004 0,0441
«Мегафон» 0,9995 0,3200
«Газпром» 1,0006 0,0252
На графиках (Рисунок 1-4) ниже синим цветом показано истинное значение цены акции, красным прогнозируемое (одношаговый прогноз), вычисленный по формуле
•п Л%п— 1 .
Рисунок 1 Сбербанк
Рисунок 4 Газпром
На предложенных выше графиках (Рисунок 1-4) видно, что значение одношагового прогноза для цен акций в каждый момент времени очень близко к их истинному значению, из чего можно сделать вывод о высокой точности полученной оценки.
Также мы наблюдали динамику изменения получаемой оценки с ростом выборки
п
Х(п) = =-, п = 1..М,
Х>?-1
¡=1
и изменения значения выборочной дисперсии
1 П 2 / л^г Х'п^г—1) .
П
1=1
Рисунок 5 Изменение оценки параметра с увеличением выборки.
Сбербанк. ЕХ(М) « 0,993.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Непараметрическое оценивание функционалов от распределений случайных последовательностей2000 год, доктор физико-математических наук Кошкин, Геннадий Михайлович
Гарантированные выводы для процессов авторегрессии-скользящего среднего2002 год, кандидат физико-математических наук Шаповалов, Дмитрий Васильевич
Последовательные процедуры обнаружения момента разладки случайных процессов авторегрессионного типа с условной неоднородностью2012 год, кандидат физико-математических наук Сергеева, Екатерина Евгеньевна
Непараметрическое оценивание сигналов с неизвестным распределением2003 год, доктор физико-математических наук Добровидов, Александр Викторович
Идентификация стохастических систем авторегрессионного типа с нелинейностями и бесконечной дисперсией шума2009 год, кандидат физико-математических наук Марков, Александр Сергеевич
Список литературы диссертационного исследования кандидат наук Догадова Татьяна Валерьевна, 2019 год
— + -
аг а
1
Х[<к < - + ^ •х[оч > - *] + Щ\Лг-Л| = Ь + /2 + /э
Рассмотрим каждое слагаемое в отдельности
i л| =
а - а^ а^ а
Х[аг <- ^ 1 г] < \а — аь\;
\а\
Откуда по свойству (2.24)
ЕI? <С 1og2^ • Е\а -аг\2р <С
По неравенству Чебышева получим
ЕI¡р < С • Р (оъ > - 1og_1 г) <С • Р (оъ -а> - Ь -а) <
1
1
< С Р(\аг -а\> \а\ - ¿) <С
(И - 1)2р
е(аг -а)2р <С •
1og2pt
гр
Для оценивания ЕI2 достаточно применить свойство (2.32). Полученные
1, 2, э
1
Лемма 2.1 доказана.
Аналогично работам [91], [120] и [121], нашей целью является доказать асимптотическую эквивалентность та и в смысле почти наверное и в среднем, а также оптимальность представленной адаптивной процедуры прогнозирования в смысле эквивалентности ВА и очевидным образом модифицированного риска
Яа = А • Ее2(ТА) + ета. (2.34)
¿А
Теорема 2.2. Рассмотрим модель (2.3) и момент Ьа, определенный в (2.29). Тогда, для прогнозов (2.23), моменты ТА, та и функции, риска В^0, яа, определенные соответственно по формулам (2.28), (2.29) и (2.28), (2.34), для любого а < 0 обладают свойствами
г) ^ —о 1 п.н- (2.35)
±А А—то
и) -> 1; (2.36)
; та а—— ' 1 ;
»> ва _-_-1. (2-37)
Доказательство Теоремы 2.2 Докажем утверждение (1). По определению Та и ТА имеем
Щ = Ак 'Х[ТА = (А]+ v 'Х[ТА > (а]
= аА^ • Х^А > А1/'2а<А] + О" • х[А1/2агЛ > (а] 1 п.н.
Свойство (2.35) доказано.
Докажем утверждение (11). Используем следующее представление
та = 1 + = 1 +
А1/2 • а
Перепишем sa в виде
tA - А1/2 • а Та - А1/2 • а
SA = А1/2 • а • *[ТА = tA] + А1/2 • а • Х[ТА > tA]
= *А-1/Г/ • ^А > А1/2.(л] + ^ • х{А1/2а,.л > tA].
Тогда, согласно третьему свойству в Лемме 2.1
IEsa| < Р[tA > A1/2atA] + а-1ЕК - а|
< РК < log-1 А] + a-2JE« -а2)2 —^ 0. Свойство (2.36) доказано.
Докажем утверждение (iii). Будем использовать представление
| = 2 {а^Ф2(ТД) + А^
Тогда из (2.35) следует, что для доказательства утверждения (2.37) достаточно показать сходимость
А1/2Е-1- е2(ТА)-> 1. (2.38)
Тда А^то
Аналогично [91, 120], для некоторого £ £ (0, а) обозначим
Т = (а — е) • А1/2, Т' = ( а + ) А1/2.
Далее используем следующие свойства
р (та <т') р (та >т ) <С (2.39)
которые выполняются для любого т > 1. Действительно,
Р(та < Т') = Р(A1/2 • atA < (a - s)A1/2) < P(К - a| > г)) < 1 Е(a2 a2)2^ Сlog2w(A1/2 log-1 A) • logmA rlog3-A
<7—гт^—Е(a, -a ) < С--—jr,-< С—-—jtz-
( a)2 w A Aw/2 Aw/2
Аналогичным образом получим
Р(та > Т'') = Р(Т'' < A1/2atA) = Р(a + г < au)
< Р (| at a - a| > с) < (е a )-2w • Е « - a2)2w < С i^gW^.
Проведем доказательство утверждения (2.39) в 3 этапа:
1) А1/2 • Е-1-е2(ТА) • Х[Та <Т'] ^ 0 (2.40)
ТAa
2
2) А1/2 • Е-1-62(Та) • Х[Та > Т'] ^ 0 (2.41)
ТAa 2
3) А1/2 • Е-1-е2(ТА) • Х[Т' < ТА < Т"] ^ 1 (2.42)
та-
при А ^ ж.
По определению е2 (t) имеем
1 1 гТа 1 ГТа
А1/2 • ^62(Та) = А1/2 • -1- = А1/2 • -L- (\-и - X)2^
Т А- 1 А- Ju 1 А- Ju
1 fTA 1 fTA
+2А1/2 (Xt-u - X)xt-u • 6,t-u^ + А1/2 et,t-udt
Т А- Ju 1А-Ju
=: /1 + h + /3. (2.43)
Докажем (2.40). По неравенству Коши-Буняковского, (2.4) и Лемме 2.1 справедливо
А1/2
"Т
Еh • Х[Та < Т] < ^ I Е(Xt-u - Xfxfdt
tА- Ju
А1/2
т
< 2
2А а и
Е(Лí_u - Л)4 • Ех\(И < С
А1/2 [т' а А1/2 ^А
2
А и
— <с
2А а
0.
По неравенству Кошн-Буняковского и Лемме 2.1 получим
Е\ 12\^х[та < Т] <
2А1/2 1*Аа
-Е
-та
х[та < т]
2 А1/2
< 2
2А а и
Е(Л- - Л)2хЦ_иЕ&_и(а
2 А1/2
т
(Е(Л-и -Л)4 •Ех1и)1/4а
< 12 а I (Лг-и Л) •-^^-и,
А а и
Г * < с^ТТ^ < сЧА - 0.
2 /2 А и
2 А
А /4
Используя (2.37) с т = 2 при А ^ то, получим
А /2
т
Е 1э • Х[ТА <Т] < ^ I Е^-и • х[Та < Т ]&
А и
А1/2
< 2 2
А и
Е&-иЛ • Р2 (та < Т)
<c^.Аl/?-■ ^ = с 0.
2
1А
А А
т = 2
1 рТл
Е¡1 • х[Та >Т"]=А1/2Е 1 1 " "2-2
ТА2 а и
( Л- - ЛУх^иМ • х[та > Т ]
< — •Р1/2 {Та >Т ')^Е вир-
а
т 4 и
(Л- - Л)2х^_и(Ь
)
<С ^эА.Е 8ир^/ (Лг-и -Л)4х4_иа.
V *>т" зЧи
Т
С 1с^3 А
\
1
Е вир —I (А- - А)4х^-уШ
г>Т'
п<в<п+15
< С ^3А
\
Е^Г' % <С 1сg3 А
п>Т
п3 1и ¿2
И «/и
\
Е
п Т
п3
1
1сg3 А
< С А— < С^йТ — 0.
Т
А1/2
Аналогично получим:
2А1/2 I 1 / г3
Е112\ • х[Та > Т''] < —— М/Е вир - (Аг-и - А)хг-и&-и№
V 8>Т" 5 ЧЛ
а
)
< С А • . Е вир -1 [(Аг-и - А)^2^^ < С
V В>Т" 5 3 Л '
1сg7/2 А А1/2
0,
так же, как п
Е13 • х[Та > Т''] < —Р1/2(Та > Т") • ,1Е вир -1 ( I
\1е ^
<С ^ 0
Наконец, для доказательства утверждения (111) Теоремы 2.2 разложим (2.42) следующим образом
ЕЬ • Х[Т' < Та < Т'] = 71 + 72 + 73 + 74,
где
1 СТа
71 = А1/2 • Е-,- I (Аг-и - А)2х2_и(И • х[Т' < Та < Т''],
Т\а}и
1
72 = 2А1/2 • Е-^ (а,-и - А)хь-и№ • х[т < та < Т']:
ТАа ¿и,
1
1 ?Та
3э = А1/2 • Е 1 1 <
Т2 (&-и - а2)а • х[Т < Та <Т ],
1/2
34 = ЕА-^ • х[Т < Та < Т''].
Та
Начнем с оценки 31
А1/2 т
31 < (Туа] Е(Л- - Л)2х^-и(
гА1/2(а+е) ,-
< СА-1/2 • / у/Е(Лг-и - Л)4 • Е4_( < С
к^ А
А2
0.
2 А1/2 I ( гта \2
\М < ^^\1е(] (Лг-и - Л)^-ий) • Х[Та < Т']
2 А1/"2-^ Т Гг' log1/2А
< (Г г-ау [ Е(Л-и - Л^-и* < с 1оА^ ^ 0.
Обозначим МА = [и-1 • А1/2(а + е)]1 + 1, где [Ь]1 означает целую часть .
\3э\ < СА/Г2^Е в^р {.[(^-и - а2)*)
< С
А1/2 ^ \
Е вир
( 1 Г' (§1
1<мА \п=1
(&-и - а2)М
<
С
А1/2
\
МА
п=1
(п—1)и
03,-и - а2)а
с с
< • л/мД < ^ 0.
А1/2
А1/4
Теперь покажем сходимость 34 ^ 1 при А ^ то. 34 можно записать
в виде
34 = Р[Т <Та < Т"] + ЬА,
2
1
2
п и
где
Ьа = Е-^[А1/2а - Та] • х[Т' < Та < Т'']. Та
По определениям Та,Т ,Т' и согласно Лемме 2.1 вероятность
Р[Т' < ТА < Т''] — 1 при А — то.
Отметим, что при А ^ 1 справедливо неравенство Т > 1а, тогда Та = А1/2О,а и
La < уЕ\ТА - Л1/2а| • Х[Та >Т] = С •ЕК -а\<С • yjЕ« - а2)2 - 0. Теорема 2.2 доказана.
2.3.3 Имитационное моделирование
Для подтверждения сходимости усеченных оценок (2.6) и свойств прогнозов (2.23), построенных на основе этих оценок, было произведено моделирование. Для этой цели был использован пакет MATLAB. В таблицах 7), 8 приведено среднее значение
1 100
ат = 100 • ^ ат (к) к=1
оценок ат(&), построенных по формуле (2.6) по k-й реализации ж(к) = (ж(к)), к = 1... 100 процесса (2.3), и их качественные характеристики в виде выборочного среднеквадратического отклонения
1 100
Sl(T) = — • £(от(к) -а)2 100 к=1
для разной длины наблюдений Т. Определим шаг дискретизации h и количество дискретных наблюдений N = h-1T при вычислении оценок ат (к)
Тх(к) \х{к)~х{к) "1 N ат (к) = — n-х( £(^i)h)2 > Т log-1T), Т> 0.
U4-r)h)
i=1
Таблица 7 - Оценивание параметра а при h = 0,1
а N = 1000, Т = 100 N = 2000, Т = 200 N = 5000, Т = 500
ат S2(T) ат ^(Т) ат ^(Т)
-0,3 -0,3135 0,0065 -0,3051 0,0030 -0,3070 0,0011
-0,5 -0,5113 0,0082 -0,5180 0,0059 -0,4969 0,0017
-0,8 -0,8283 0,0154 -0,8034 0,0074 -0,7949 0,0033
-1 -1,0126 0,0186 -0,9979 0,0111 -1,0017 0,0051
Таблица 8 - Оценивание параметра а при h = 0,15
а N = 1000, Т = 150 N = 2000, Т = 300 N = 5000, Т = 750
ат ^(Т) ат ^(Т) ат ^(Т)
-0,3 -0,3054 0,0050 -0,3098 0,0019 -0,3042 0,0001
-0,5 -0,5107 0,0053 -0,5081 0,0036 -0,5050 0,0014
-0,8 -0,8263 0,0124 -0,8114 0,0042 -0,8041 0,0020
-1 -1,0146 0,0111 -1,0165 0,0061 -1,0122 0,0028
Как видно из результатов моделирования, среднеквадратическая ошибка ^(Т) оценок ат уменьшается с ростом выборки - см. также (Рисунок 13). Это подтверждает сходимость полученных оценок.
Рисунок 13 Эмпирическая среднеквадратическая ошибка ^(Т);а = -0, 5; Т = 100
Кроме того, с помощью полученных оценок были построены прогнозы
а = - 0, 5 и = 1
формуле
х(к)(1 - 1) = 1> 1
Результаты представлены на графиках (Рисунок 14), 15) ниже. Голубым цветом показаны реальные значения наблюдаемого процесса, зеленым - значения прогнозов.
Рисунок 14 - Процесс хг и адаптивный прогноз ^(Ъ — 1)
Также была построена ошибка прогнозирования
100
= ш ' Е— ^ — 1°)^)2' 1 = 1, ■*
100
к=1
с Т = 100, N = 1000, ^ = 0,1 (см. Рис.15). Видно, что ошибка прогнози-
рования сходится к а2 = 1 — е 1 ~ 0,6321, что соответствует полученным
теоретическим результатам.
1.4-1-1-1-1-1-1-1-1-г
1.2 -
п.2 ■
Q LI_I_I_I_I_I_I_I_I_I_
О 100 200 300 400 500 600 700 800 900 1000
n
Рисунок 15 - Эмпирическая среднеквадратическая ошибка ¿^(Z)
2.4 Адаптивное прогнозирование негауссовского процесса
Орнштейна-Уленбека
В настоящее время одной из самых популярных моделей с непрерывным временем, широко используемой в финансовой математике, является негауссовый процесс Орнштейна-Уленбека с шумом в виде с процесса типа Леви. Рассмотрим следующий авторегрессионный процесс
dxt = axtdt + d£t, t > 0 (2.44)
с нулевым средним и начальным значением х0, а также известными моментами. Здесь £t = p1Wt + р2Zt, pi = 0 и р2 - некоторые константы;
(Wt, t > 0) стандартный винеровский процесс, заданный на вероятностном
Nt
пространстве (Ü,F, {Ft}t>0,P) с фильтрацией {Ft}t>o; Zt = ^ Yk - со-
к=1
ставной пуассоновский процесс, где Yk, к > 0— н.о.р. случайные величины с нулевым средним, имеющие все моменты; (Nt) - пуассоновский процесс с
параметром интенсивности Л > 0, т. е.
j
^ = Е х № < t} и т, = y, ъ.
3>1 1=1
Здесь (Tj)j>1- скачки пуассоповского процесса (Nt)t>0 и (т.,-)^>1- н.о.р. случайные величины, экспоненциально распределенные с параметром Л.
Следует отметить, что для р2 = 0 процесс (2.44) является стандартным процессом Орнштейна-Уленбека.
Полагаем процесс (2.44) устойчивым, т. е. параметр а < 0. Заметим, что в этом случае для любого m > 1
sup Ex2m < то. i>0
Цель состоит в том, чтобы построить прогноз для Xt по наблюдениям Xt-U = (^s)0<s<i-M, который является оптимальным в смысле функции риска, представленной ниже. Здесь и > 0 - фиксированная временная задержка. Решение для процесса Xt, полученное по формуле Ито, имеет вид
t
Xt = eatxo + У ea{t—z)d^z, t > 0 0
и при заданном и > 0, получим представление
Xt = bxt-u + m,t-u, t > и,
где
t
b = еам, = J ea(t-a)d£a, E^t,t-u = 0,
t—u
я2 := Dm,t—u = ^ (Pi + ^PIEY2) [b2 — 1].
Оптимальным в среднеквадратнческом смысле прогнозом является условное математическое ожидание
х0 = Ьхг_и, Ь > и.
Поскольку на практике параметр а и, как следствие, Ь неизвестны, то для реальных процессов невозможно построить оптимальный прогноз. Чтобы решить проблему прогнозирования, мы определяем адаптивный прогноз, который строится при использовании оценки аг неизвестного параметра а. Определим адаптивный прогноз как
Хг (Ъ _ и) = Ьг-иХг-и, г>и, (2.45)
где Ьг_и = еа*-ии, £ > и; а = рто](_то,0]аг, аг- усеченная оценка параметра, построенного аналогично случаю с дискретным временем [91] на основе оценки наименьших квадратов
г
/ ху Ах V
аг = --х I > I . (2.46)
Обозначим ошибки прогнозирования ж- и хг (£ _ и) как
6-0 :— Хг Хо —
ег (£ _ и) := хь _ хг (£ _ и) = (ь _ Ьг-и^ Хг-и + Ш,г-и, t > и. Определим функцию потерь
Ьг = —е2(£) + г, г > и,
где
г
е2(£) = 1 J е2(й —
и
и параметр А > 0 - стоимость ошибки прогнозирования. Также определим функцию риска, которая имеет вид
л
в* = -Ее2 (г) + г
и рассмотрим задачу оптимизации
Rt —у min.
t
Для оптимальных прогнозов можно непосредственно оптимизировать соответствующую функцию риска
R0 = e^j(e°(t))2 + ^ = ^ + t - min, (2.47)
где
t
(e'W = |/ (eS)2ds.
и
В данном случае оптимальная длительность наблюдений T¿ и соответствующее значение Rl0 соответственно равны
1А
т\ = А1/2а, ЛЦо = 2А1/2а, (2.48)
где а:=л/~<т2. Однако, поскольку а и, соответственно, а, неизвестны, a ТА
и R10 зависят от а, оптимальный прогноз не может быть использован.
1 А
Поэтому определим оценку Та оптимального времени ТА как
ТА = inf{t > tA : t > A1/2atA}, (2.49)
где tA := А1/2\о^> 1А = о (А1/2). Здесь аг := \[Щ ~ оценка неизвестного а,
1 (* 2
Оценка определяется таким образом, поскольку
= Е^и = Е(хь _ Ьхг-и)2.
Оценки аг, Ьг и аг, которые используются при построении адаптивных прогнозов, имеют свойства, приведенные ниже в лемме, которые можно доказать аналогично разделу 2.3.2. По сравнению с разделом 2.3.2, данный способ оценивания дисперсии а2 не требует знания структуры оцениваемого параметра и не зависит от истинных значений параметров р1, р2, ЕУ2, X и их оценок. Более того, верхняя граница для моментов уклонения оценки о"! точнее, чем у определенной в (2.30).
Лемма 2.2. Рассмотрим модель (2.44)- Тогда для £ _ и > в0 := ехр (2 |а|) и всех р > 1 оценки аг и Ьг обладают свойствами
Е(оъ _ а)2 < ^, (2.50)
\ 2Р С
Е(1н _ Ь) < -, (2.51)
д к2 _ -2)2р < ^Р.
Доказательство Леммы 2.2 Докажем свойство (2.50) аналогично разделу 2.3.2. По определению (2.46) оценки аг и используя (2.44), найдем
г
представление для уклонения оценки
at — а =
J xv
о_
t
f хЦ dv
-x
.. _1
xvdv > ¿log- t
a • X
.. _1
x.2dv < ¿log- t
Определим
gt = - I x2dv, g = — — (pi + p2EY?\) > ° ft = - I xvdС
Тогда
E (at — a)2p = E
ft 9t
2p
x [gt > log ]
+ a2p • P[gt < log-11] =: h + h.
(2.52)
Используя неравенство Коши-Буняковского для первого слагаемого,
получим
L = Е
ft , ,9 - 9t
--Г Jt-
. 9 99t
2р
X [9t > log 11]
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.