Робастные GM-тесты и оценки в авторегрессионных схемах с выбросами тема диссертации и автореферата по ВАК РФ 01.01.05, кандидат наук Есаулов Даниил Михайлович

  • Есаулов Даниил Михайлович
  • кандидат науккандидат наук
  • 2015, ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова»
  • Специальность ВАК РФ01.01.05
  • Количество страниц 116
Есаулов Даниил Михайлович. Робастные GM-тесты и оценки в авторегрессионных схемах с выбросами: дис. кандидат наук: 01.01.05 - Теория вероятностей и математическая статистика. ФГБОУ ВО «Московский государственный университет имени М.В. Ломоносова». 2015. 116 с.

Оглавление диссертации кандидат наук Есаулов Даниил Михайлович

2.5 Доказательства теорем

3 Робаетные GM-процедуры в AR(p) модели

3.1 Проверка гипотезы размерности в AR(p) модели в схеме без засорений

3.2 Построение качественно робастного GM-теета в AR(p) модели в схеме

с засорениями

3.3 Асимптотическая нормальность GM-оценок в схеме с засорениями, Робастность GM-теетов, основанных на GM-оценках

4 Оптимальность GM-тестов

4.1 Асимптотически оптимальные тесты в AR(1)

4.2 Алгоритм построения асимптотически оптимального взвешенного теста наименьших модулей в А Н (1). Результаты численного эксперимента

4.3 Доказательства

Заключение

Список обозначений

Список литературы

Гл яв ^^

Рекомендованный список диссертаций по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Введение диссертации (часть автореферата) на тему «Робастные GM-тесты и оценки в авторегрессионных схемах с выбросами»

Введение

В диссертации рассматриваются линейные авторегрессионные модели. Эти классические объекты исследуются статистиками на протяжении уже более 85 лет. Одними из важнейших статистических задач для таких моделей являются задачи оценивания неизвестных параметров и проверки гипотез об этих параметрах, в частности, гипотез о размерности модели. Среди процедур, используемых для их решения, выделим обобщенные М-процедуры (СМ-процедуры), процедуры минимального расстояния (МБ-процедуры) и знаково-ранговые процедуры. Все они могут быть исследованы в рамках единого подхода — с использованием так называемых остаточных эмпирических процессов (о.э.п.). А именно, интересующие нас статистики являются функционалами от о.э.п. Поэтому изучение асимптотических свойств этих статистик может быть сведено к изучению асимптотических свойств соответствующих о.э.п.: равномерных линейных разложений, слабой сходимости в подходящих метрических пространствах и т.д.

Упомянутые выше процедуры детально исследованы в случае, когда авторегрессионный процесс наблюдается непосредственно.

В данной работе мы рассматриваем модель авторегрессии в ситуации, когда наблюдения содержат независимые аддитивные выбросы (засорения) с неизвестным и произвольным распределением. Интенсив-

ность выбросов неизвестна и имеет порядок 0(п-1/2), п — объем данных.

Наша основная цель — построить ОМ-процедуры в схеме с засорениями и исследовать достаточные условия качественной робастно-сти таких процедур против выбросов. Особое внимание будет уделено робастности ОМ-тестов, так как для них, в отличие от оценок, это свойство изучалось мало. Помимо известных ОМ-процедур будут рассмотрены новые ОМ-тесты для проверки гипотез о размерности АЯ(р) модели без использования ОМ-оценок неизвестных параметров. Кроме того, будут описаны асимптотически оптимальные ОМ-тесты и предложен численный алгоритм их построения в семипараметрической ситуации. Поставленные задачи будут решаться с использованием остаточных эмпирических процессов. В частности, мы получим асимптотические равномерные разложения остаточных эмпирических процессов в нашей локальной схеме засорения данных. Этот результат представляет самостоятельный интерес, т.к. может быть использован не только для исследования ОМ-процедур в схеме с засорениями, но также и для ранговых, знаковых и процедур минимального расстояния.

Перечисленные задачи являются новыми. Они содержательны в теоретическом плане, их значение для приложений очевидно.

Далее введение устроено следующим образом: сначала мы кратко опишем свойства ОМ-процедур в модели линейной авторегрессии без засорений. Затем перейдем к формальному описанию схемы засорений и понятия качественной робастности, рассматриваемых в диссертации. При этом будет рассказано о некоторых других характеризациях робастности, используемых в статистической литературе. Далее, т.к. задачи, рассматриваемые в работе, являются частью общей проблемы исследования робастности статистических процедур, при построении которых применяются о.э.п., мы расскажем об известных результатах

для знаково-ранговых и MD-процедур в схемах без засорений. Для них можно поставить те же задачи об исследовании качественной робаст-ности, что и для ОМ-тестов. В конце введения будут кратко описаны полученные в работе результаты.

GM-процедуры в авторегрессионных схемах без засорений.

Итак, авторегрессионная модель порядка p (А11(р)-модель) определяется стохастическим разностным уравнением

Ut = ßlUt-1 +-----h ßpUt-p + £t, t G Z, (1.1)

где ß = (ßi,... , ßp)T — вектор неизвестных неслучайных коэффициентов, a {et} — независимые одинаково распределенные случайные величины (н.о.р.с.в.) с неизвестными функцией распределения G и Лебеговой плотностью g, Eei = 0, E^i < œ. Будем рассматривать слу-

{ Ut } ,

циопарпым. Для существования и п.н. единственности строго стационарного решения (1.1) достаточно, чтобы корни характеристического уравнения xp = ßixp-i + ... + ßp были по модулю меньше единицы. В этом случае п.н. единственное решение уравнения (1.1) представляется в виде ut = ^öj£t-j, где последовательность {öj} определяется рекуррентным соотношением

öj = ßiöj-i +-----+ ßpöj-p, j G Z+,

öi-p = ••• = ö-i = 0, öo = 1.

Подробности приведены в Brockwell, Davis, [26], гл.З.

GM-оценки для авторегрессионных моделей были предложены в работах Денби и Мартина (Denby, Martin, [29]) и Мартина (Martin, [60], [61]). Опишем, как строятся такие оценки для модели (1.1). Пусть наблюдения ui-p,... ,un — выборка из стационарного решения (1.1). Для априори выбранных функций ф и параметра a G Rp введем вектор

Ln(a) := (Lni(a),Ln2(a),..., Lnp(a)) , (1.2)

где

n

Lnj(a) := n-1/2^2 фЫ-з)Ф(и — aiut-i-----арЩ—р).

t=1

GM-оценка определяется как подходящее (т.е. n1/2-состоятельное) решение уравнения

Ln(a) = 0. (1.3)

Бустос (Bustos, [27]) показал, что при некоторых условиях па ф и ф такая оценка является асимптотически нормальной. Обозначим ее вn gm. Стоит отметить, что при ф(х) = х,ф(x) = — уравнение (1.3) совпадает с уравнением максимального правдоподобия. Оценка наименьших квадратов входит в класс GM-оценок при ф(х) = ф(х) = х.

Рассмотрим векторы Ut—1 := (ut—1,ut—2,... ,ut—p)T, t = 1,...,n, и векторную функцию

ip(Ut—1) := (ф(Щ—1), ф(щ—2),..., ф(Щ—р ))T. Введем матрицы размерности p х p

д(х)<1ф(х) E^(Uo)(Uq)t, К(в) := Еф2(^) E^(Uq)^t(Uq):

М(в) := C—1(в)К(в)(С—1(в))Т. (1-4)

Доказательство существования и асимптотической гауссовости в n gm может быть основано на асимптотической равномерной

линейности (AUL, Asymptotic Uniform Linearity) статистики Ln(a).

ф

можно показать, что

sup ||Ln(0 + n-1/20) - Ln(ß) + C(0)0|| = Op(1), (1.5)

||0||<е«ж

Где Ii . Ii _ евклидова норма вектора. Соотношение вида (1.5) и описывает свойство AUL. С помощью (1.5) доказывается, что с вероятностью, стремящейся к 1 при n ^ ж, существует n1/2-состоятельная

последовательность вп,см такая, что Ьп(впо0м) = 0. К тому же, для Ьп(0ом) из (1.5) следует разложение

ЪифП1ом) = -Мв) - С(в)п1/2(вп,ом - в) + Ор(1).

Теперь в силу ЦПТ для Ьп(в)

п1/2(вп,ом - в) Л N(0, М(в)) , п л ю. (1.6)

Отметим, однако, что случай негладкой ф, например, ф(х) = sign(ж), не менее важен. Технически он гораздо сложнее. В этом случае формула Тейлора неприменима, и для исследования процесса Ьп(а) и асимптотических свойств вп ом используется техника, основанная на случайно взвешенных остаточных эмпирических процессах. Введем их. Остатками в модели (1.1) называются величины

£г(а) := щ — ата е , I = 1,..., п.

Соответствующие взвешенные о.э.п. имеют вид

п

:= п—1/2

г=1

vn(a, x) := n 1/2 ^ ^(Ut-i)I(st(a) < x) =

= n-1/2Y, v(Ut-i)l{et < x + (а - (3)TUt-i),

t=i

n

:= n-V2

Un(0, x) := n-1/2Y, <P(Ut-i) I(et < x + n-1/2dTU-)

t=i

- G(x + n-1/2GTUt-i)

Слагаемые в последней сумме образуют мартингал-разность относительно последовательности а-алгебр Ff := с{ei, i < t}, t = 0,1,..., n.

Такие процессы в линейных авторегрессионных моделях исследовал, в частности, Коул (Koul, [48], гл. 7). При некоторых условиях на f и распределение ошибок {et} от показал, что для любого 0 < О < ж верно асимптотическое разложение

sup ||un(0,x) - un(0,x)|| = op(1). (1.7)

xe RJI 011<©

Из (1.7) следует AUL процесса vn(e + n-1/20, x):

sup ||vn(0 + n—1/20, x) - vn(e, x) - g(x)E^(Uc)(Uo)T0|| = op(1). x€M,||0||<0

(1.8)

Предположим, что '(x) имеет ограниченную вариацию, и E'(^) = 0. Тогдa Ln(a) представляют в виде интегрального функционала от о.э.п.:

/то рТО

'(x)dvn(a, x) = — / vn(a,x)d' (x).

-то J —то

Соотношение (1.8) теперь влечет (1.5), и, таким образом, снова верны утверждения о существовании и асимптотической гауссовости GM-оценки. Помимо [48] такой подход применялся в статье Коула (Koul, [49]) для исследования GM-оценок в модели нелинейной регрессии с аддитивно входящими ошибками. Аналогичные результаты для ARCH модели были получены Болдиным (Boldin, [22], [23]) и распространены на GARCH модель Вязиловым ([13]).

На основе GM-оценок, используя их асимптотическую нормальность, можно стандартным образом строить тесты для проверки линейных гипотез, в частности, гипотез о размерности модели. А именно, пусть ß разбит па подвекторы ßT = (e(1)T, e(2)T), где в(1) е Rm, в(2) е Rp—m, m < p.

Рассмотрим гипотезу Ho: в(2) = 0, альтернативой возьмем H1: в(2) = 0. Таким образ ом, в(1) является мешающим параметром. Если H0 верпа, то размерность авторегрессии не превышает т. Введем локальные альтернативы Н1п(т): ß = ßn := в0 + n—1/2т, где вТ = (в(1)Т, 0T), тт = (т(1)T, т(2)T) е Rp — постоянный вектор с

т p — т

Если верна Н1п(т), то при некоторых условиях на функции ф и ф GM-оценка ßщси, так же как и ПРИ гипотезе, существует и является

асимптотически нормальной, но появляется сдвиг. А именно, >1/2(Р „,в0) — ^ , м(МОу

n1/2(Pn,GM - во) - N (г, М(во)), n - ж. (1.9)

Заметим, что в монографии Коула (Koul, [48]) случай локальных

i (x) = x

ется следствием результатов Крайса (Kreiss, [53]) и несложным образом

i

М).

Пусть J (в), Q(e), B (в) — такие матрицы размерности (p - m) х

(p - m), m х mum х (p - m) соответственно, что

М (W) B<e>\. 10)

(в) \bt(в) J(e^

В качестве тестовой статистики для проверки H0 обычно берут статистику

р (2)T р _1 р (2)

Vn := n fin,GM (Jn) fin,GM, (1.11)

где Jn — произвольная состоятельпая при Н1п(т) оценка матрицы

р T р (1)T р (2)T р (1) m р (2) _m

JW, а Р n,GM = (Р n,GM, Pn,GM), Р n,GM ^ Rm, Р n,GM ^ RP m

Обозначим нецентральное распределение хи-квадрат с p - m степенями свободы и параметром нецентральности Л2 гак x2(p - m, Л2). Из (1.9) следует, что при альтернативе Н1п(т)

Vn - X2(p - m, Л0), n -ж, (1.12)

где Л2 = и-1/2(в0)т(2)||2.

Решать нелинейное уравнение (1.3) и выбирать из всех его решений подходящее — непростая задача. Существует подход, позволяющий строить GM-тесты, эквивалентные тестам со статистикой Vn, не находя Рn gm . Эти тесты основываются непосредственно на специальным образом преобразованной статистике Ln(Pn), где Рп — любая предварительная n1/2 -состоятельная оценка параметра в. В качестве Рп

можно взять, например, обычную оценку наименьших квадратов. Соответствующую конструкцию, т.н. „general score tests", изучал Крайс (Kreiss, [53]) в случае ф(х) = х и гладкой ф(х). Опишем его результаты подробнее.

Переобозначим для случая ф(х) = х статистику Ln(a) через

Ф„(а) := n-1/2 ^ Ut-Met(a)).

t=i

Функции ф(х) = х соответствуют матрицы 2

К(в) = E^2(ei) E(Uo)(Uo)T, С(в) = J д(х)#(х) E(Uo)(Uq)T,

М(в) = „ E^2(£1)-2 [E(Uq)(UQ)t1-1

д(х)#(х)]

Введем матрицу W(e) такую, что

W(e)WT (в)= [E(Uq)(UQ)t 1-1

Обозначим Wn состоятельную при Н1п(т) оценку W(в0).

Пусть (3п0 := (вПО , 0Т), где (3ПО — п1/2-состоятельная оценка параметра в(1). Обозначим п о а ортогональную проекцию вектора а па последние (р — т) компонент. Рассмотрим тестовую статистику

п 2

[п—1 £ ^2(£^(Зпо))]—1 ||п о WTФп(Зпо)| . (1.13) ¿=1

В работе [53] было доказано, что для функций ^ С, дважды непрерывно дифференцируемых с ограниченными производными, и ошибок с Ее4 < то при Н1п(т) статистика (1.13) слабо сходится к х2(р — т, А2). Здесь параметр нецентральности АО такой же, что и в (1.12) при ф(х) = х. Отметим также, что при ф(х) = х, ф(х) = — ^(Ху, как показано в [53], получается асимптотически оптимальный в максиминном смысле тест.

К сожалению, преобразование статистики Ьп((3п) из [53] в случае произвольной ф(х) = х неприменимо. В Главе 3 данной работы мы,

используя другое преобразование, предлагаем новый способ построения GM-тестов в AR(p) модели, в частности, для ограниченных f. При этом, в отличие от [53], мы рассматриваем случай, вообще говоря, негладкой ф. В частном случае f (x) = x наша тестовая статистика совпадает со статистикой (1.13).

Отметим также, что стандартный подход для исследования предельных распределений тестовых статистик при контигуальных альтернативах использует третью лемму Ле Кама (Hajek et al [34], стр. 257). При этом должно быть выполнено условие локальной асимптотической нормальности модели. Мы используем другой подход, основанный на AUL статистики Ln(a).

Описание схемы засорения. Качественная робастность и другие характеризации робастности.

Перейдем к описанию схемы засорения данных, рассматриваемой в диссертации.

В работе рассматривается ситуация, когда наблюдения содержат грубые выбросы и имеют вид

yt = ut + zt7n Ct, t = 1 - p, 2 - p,...,n. (1.14)

Здесь {ut} — выборка из стационарного решения уравнения (1.1); {z/n} — н.о.р.с.в. с распределением Бернулли Br(Yn), Yn = min(1,n-1/2y), параметр y > 0 неизвестен; {Ct} — н.о.р.с.в. с неизвестным распределением д; последовательности {ut}, {z/n}, {Ct} независимы между собой. Последовательность {Ct} интерпретируется как последователь-

Yn

Y=0

является локальным вариантом общеупотребительной схемы засорения данных во временных рядах, предложенной в [62].

Мы построим стандартные GM-процедуры и новый ОМ-тест по на-{ yt }

^Y

В схеме засорений (1.14) GM-оценка ¡3n,GM определяется как n1/2-состоятельное решение нелинейной системы

Li (а) = 0,

где статистика L^(а) строится по засоренным наблюдениям } так же, как Ln(a) строилась по {ut}. Построение тестовых статистик осуществляется по тому же принципу.

Для построенных в схеме засорений (1.14) GM-тестов мы установим достаточные условия качественной робастности к выбросам. Мы используем две характеризации робастности тестов, предложенные Бол-диным ([7], Boldin, [24]). Первая из них — локальная качественная робастность (LQ-робастность). Пусть Tn,Y — статистика теста для проверки H0: в(2) = 0. Мощность теста в схеме (1.14) на локальной альтернативе Н1п(т) обозпачим Wn(T, 7, д). Тест со статистикой Tn,Y называется LQ-робастным, если семейство {Wn(T, 7,д)} равностепенно непрерывно по 7 в точке 7 = 0. То есть, верна сходимость

sup |W„(t,7,д) - Wn(T,0,д)| ^ 0, 7 ^ 0. (1.15)

Супремум в (1.15) берется по произвольным д, ||т|| < T < то и n > n0(T). Соотношение (1.15) означает, что для малых 7 равномерно по Д, ||т|| < T и n > n0 близки уровни значимости и мощности тестов в схемах с засорениями и без засорений, т.е. при 7 = 0.

Предположим, что существует W(т, 7,д) := Wn(т, 7,д) —

предельная мощность теста, основанного на Tn,Y. Второй тип робастности, который мы будем использовать, характеризуется равностепенной непрерывностью семейства {W(т, 7,д)} по 7 в точке 7 = 0. Будем называть тест предельно качественно робастным, если

sup |W(т,7,д) - W(т,0,д)|^ 0,7 ^ 0. (1.16)

М,||т ||<T

Болдин ([7], Boldin, [24]) использовал описанные выше определения при построении качественно робастных знаковых тестов в авторегрессии. В частности, в [7] были предложены предельно качественно робаст-ные знаковые тесты для проверки гипотезы о порядке многопараметрической AR(p) модели в схеме (1.14). В [24] был построен LQ-робастный знаковый тест для проверки гипотез в модели AR(1). Опишем результаты из [24] более подробно. Пусть

ut = fiut-1 + £t, t e Z, (1.17)

где {et} — п.о.р.с.в. с неизвестными функцией pаспределения G и плотностью g; Ee1 = 0, E|e1| < ж, а в ~ неизвестный параметр такой, что |в| < 1.

В схеме (1.17) без засорений локально наиболее мощный знаковый тест для проверки гипотезы Н0: в = в0 против правосторонней альтернативы Н+: в > в0 может быть построен следующим образом ([9], Гл. 6). Пусть u0,u1,... ,un — выборка из стационарного решения (1.17). Введем

St(a) := sign(£t(a)) = sign(ut - aut-1), t = 1,... ,n,

n- 1 n

(a) := ^ at-1 ^ Sk-t(a)Sk(a).

t=i k=t+i

Тестовой статистикой для проверки Н0 берется величина

TS(в0) := n-1/2(1 - в2)1/2lSn(в0).

Введем последовательность локальных альтернатив Н1п (т): в = вп = в0+п-1/2т, т > 0. При Н1п(т), а также условиях G(0) = 1/2, g(0) > 0, ограниченности g(x) и ее непрерывности в точке 0

TS(в0) -- N(2g(0)E|ei|(1 - в2)-1/2т, 1), n - ж.

Питменовская асимптотическая относительная эффективность (АОЭ) теста со статистикой Tjf (во) относительно теста наименьших квадратов равна eS,LS = (2g(0)E|£i|) . Для G (x) с тяжелыми хвостами eS,LS может быть сколь угодно большой.

Отметим, что в схемах без засорений знаковые тесты исследовались в монографии Болдина и др. ([9]) для линейных регрессии и авторегрессии, в работе Болдина и Штутте ([10]) для ARMA моделей.

В [24] рассматривается ситуация, когда наблюдения авторегрессии (1.17) содержат грубые выбросы и имеют вид (1.14) с p =1.

В схеме засорений (1.14) статистика T*y (во) знакового теста строится по {yt} так же, как T,f (во) строилась по {ut}. Мощность соответствующего Tfy(во) теста при альтернативе Н1п(т) обозначим WS (т,7,м).

В [24] было установлено линейное по т и y стохастическое разложение T^fy (в0) при n ^ то, равномерное по 0 < т < T < то, 0 < Y < Г < той произвольн ым д. Это разложение влечет существование равномерного слабого предела Tfy (в0), а значит, равномерного предела WS(т, 7,д) для мощности W^(т, 7,д). Отсюда следует соотношение типа (1.15), означающее LQ-робастность. Отметим, что общеупотребительные тесты наименьших квадратов и М-тесты из [53] LQ-робастными не являются.

Предложенное Болдиным определение качественной робастности тестов родственно определению Р и дери (Rieder, [67]) качественной робастности тестов для случая независимых данных. В [67] исследовалась робастность ранговых тестов. Отметим, что определение Ридера дано в нелокальной схеме и основано на равностепенной непрерывности распределения ошибок относительно метрик Прохорова или Колмогорова.

Напомним его точную формулировку. Пусть (Œ, B) — измеримое пространство, M — множество вероятностных мер на B. Для под-

множества P С M обозначим P(n) := {^n=1Gi, Gi e P,i = 1,... ,n} прямое произведение вероятностных мер Gi. Последовательность тестов {фп} есть последовательность измеримых отображений фп: Qn — [0,1], n > n0. В метрике Прохорова шар радиуса 6 e [0,1] и центром в F e M обозначим PP(F,6).

Последовательность тестов {фп} является качественно робастной в F, если для любого £ > 0 существует 6 > 0 такое, что для Wn e PP(F,6)(n\n > n0, выполнено соотношение |/ фndWn - f фndFn| < £.

Данное определение родственно определению качественной робаст-

Tn =

Tn(x1,... , xn) — последовательность оценок, построенных по независимым наблюдениям {xi} с одинаковым распределением F. Обозначим распределение статистики Tn в этом случае как Ср (Tn). По Хампелю

Tn F,

для любого £ > 0 существует 6 > 0 такое, что при всех n и распределениях G e PP(F,6) распределения CG(Tn) e PP(Ср(Tn),£). Это определение было обобщено на временные ряды в работе Боенте и др. (Boente et al., [20]).

Стоит отметить, что Хампелевская характеризация качественной робастности оценок получила гораздо меньшее распространение, чем его инфинитезимальный подход к робастности, основанный на понятии функции влияния (Influence Function). Этот подход был подробно описан в монографии Хампеля и др. (Hampel et al., [41]) для оценок в случае независимых данных и оказал большое влияние на развитие теории робастных статистик в целом. Функция влияния IFh(x,T,F) оценки Tn(x1,... , xn), построенной по н.о.р. данным с распределением F, описывает тот асимптотический эффект, который оказывает на статистику Tn x.

ления IFh предполагается, что оценка Tn имеет в ид Tn = T (Fn), где

Fn — эмпирическая функция распределения.

В [40] Хампелем были построены В-робастные (т.е. с чувствительностью supx |/F#(ж,ск, F)| < то) М-оценки, оптимальные в смысле минимизации асимптотической дисперсии. Обобщения такого подхода в многопараметрическом случае приведены в [41]. Хьюбер (Huber, [45]), Краскер и Уэлш (Krasker and Welsh, [52]) распространили хампелевский подход на модель линейной регрессии. Отметим, что поиск оптимальных В-робастных М-оценок в случае нормальной модели с неизвестным параметром сдвига приводит к тому же классу оценок, что и известный минимаксный подход Хьюбера (Huber, [43], [44]).

Предложенный Хампелем подход к робастности был распространен также и на статистические тесты. В [41], к примеру, даны функции влияния для ранговых тестов, построенных по н.о.р. данным. Мир-киту и Хеттманспергер (Markatou, Hettmansperger, [58]) построили В-робастные обобщенные М-тесты для поверки линейных гипотез в модели линейной регрессии. Их результат был обобщен Херитьером и Рон-четти (Héritier, Ronchetti, [42]), а также Силвапулле (Silvapulle, [70]) для нелинейных регрессионных моделей.

Кунш (Kunsch, [55]) обобщил понятие Хампелевской функции влияния на модель авторегрессии. В его работе были построены В-робастные GM-оценки параметров модели, оптимальные в смысле минимизации следа асимптотической ковариационной матрицы. Отметим, однако, что в отличие от случая н.о.р. данных, функционал, определяющий оценку, во временных рядах зависит не только от одномерного распределения, но от всех конечномерных распределений сразу. Поэтому в этом случае более приемлемым является использование вместо функций влияния т.н. функционалов влияния (Influence Functional). Такую характеризацию робастности для временных рядов предложили Мартин и Йохай (Martin, Yohai, [62]).

Опишем подробнее их подход.

В [62] рассматривается схема засорения данных вида (1.14), но с постоянным (не зависящим от п) уровнем засорений Пусть для про-

стоты p = 1. Обозначим ß^ оценку параметра ß, построенную по засоренным данным. Пусть распределение засорений ц G M^, где M^ — некоторый фиксированный класс распределений.

Предположим, что для любого достаточно малого y > 0 при n ^ ж выполняется сходимость по вероятности

Ж, ^ в7, в0 = ß,

для некоторого неслучайного ß1. Тогда функционалом влияния (IF) оценки ß- называется величина

ßY - в0

IF(ßY,ц) := lim в-в

V ' Y ^0+ Y

в том случае, когда предел существует. IF(ßY, ц) характеризует величину главного члена в разложении асимптотического смещения

ßY - ß0 = IF(ßY,ц)7 + o(y).

Согласно [62], оценка в- является В-робастной, если величина

GES(Me,ßT) := sup |IF(ßY,ц)|,

называемая чувствительностью к грубым выбросам, конечна. В этом случае главный член асимптотического смещения (ßY — ß0) равномерно мал при всех возможных засорениях и малых y.

В [62] были найдены функционалы влияния и установлены условия конечной чувствительности GM-оценок для моделей авторегрессии, скользящего среднего и ARMA моделей при гауссовских инновациях. Позднее были вычислены функционалы влияния многих других оценок в линейных и нелинейных моделях временных рядов. Например,

функционалы влияния MD-оценок и знаковых оценок в авторегрессионных моделях можно найти в работе Дхара (Dhar, [30]) и монографии Болдина и др. ([9]) соответственно. В моделях типа ARCH и GARCH функционалы влияния GM-оценок были найдены в работах Болдина (Boldin, [22]), Сорокина (Sorokin, [69]) и Вязилова (Vyazilov, [72]), MD-оценок — в работе Сорокина (Sorokin,[68]). Синха и др. (Sinhaet al., [71]) исследовали функционалы влияния GM-оценок в нелинейных моделях с авторегрессионными ошибками.

Разумеется, существуют и другие характеризации робастности статистических процедур. Различные подходы приведены, например, в монографии Маронны и др. (Maronna et al., [59]).

Как уже было сказано выше, исследование качественной робастности GM-процедур в данной диссертации использует асимптотические разложения остаточных процессов в схемах с засорениями. Понятно, что используя эти разложения можно найти достаточные условия качественной робастности и для других процедур, при построении которых применяют о.э.п. В следующем разделе мы приведем примеры таких процедур и опишем известные результаты для них в схемах без засорений. Таким образом, будет видно, что рассматриваемые в работе задачи являются частью общей проблемы исследования качественной робастности статистических процедур во временных рядах, основанных на о.э.п.

Некоторые результаты о ранговых и MD-процедурах в авторегрессионных моделях. Эмпирические функции распределения.

Эмпирические процессы могут быть использованы, например, при построении процедур минимального расстояния (MD-процедур). Метод минимального расстояния был предложен в работах Вольфовица (Wolfowitz, [73]—[75]). Коулом (Koul, [47]) для определения MD-оценки

в AR(1) модели (1.17) был использован взвешенный о.э.п.

n

wn(a, x) := n-1/2 ^ ip(ut-i)

t=i

функция распределения G(x) предполагается известной. MD-оцепка определяется как точка минимума функционала

/+œ

w2n(a, x)dG(x) (1.18)

на R. AUL процесса wn(a,x) (одномерный вариант соотношения (1.8)) влечет равномерное по в разложение процесса Kn(fi+п-1/2в) и, следовательно, асимптотическую нормальность оценки f3vjimd пРи условии ее n1/2-состоятельности. Для установления последней используется монотонность wn(a,x) по a (Koul, [48], Теорема 7.4.4.).

G(x)

неизвестна и симметрична. Сорокин (Sorokin, [68]) предложил подход, при котором можно отказаться от условия симметричности функции распределения (ф.р.). В его определении о.э.п. для ARCH моделей неиз-G(x)

n

Gn(x,a) := n-1 ^I(st(a) < x). (1.19)

t=i

Позднее родственный метод применялся Эрлихом ([18]) для построения так называемых двухшаговых MD-оценок в ARMA моделях.

Ранговые оценки — еще один тип оценок, для исследования которых можно использовать свойства эмпирических процессов. Очевидно, если R1(a),..., Rn(a) — ранги остатков £1(a),..., en(a), то

Rt(a) = nGn(st(a),a).

Тогда равномерное линейное разложение для остаточного эмпирического процесса позволит находить разложение для ранговых статистик.

I{e(a) < x) - G(x) ,

Ранговые оценки в модели авторегрессии исследовались в работах Болдина (Boldin, [21]), Коула и Оссиандера (Koul, Ossiander, [51]), Му-хердже и Баи (Mukherjee и Bai, [64]). Коул (Koul, [49]) строил ранговые оценки параметров нелинейных моделей с аддитивными шумами.

Основные результаты в ранговом анализе связаны с задачами проверки гипотез. Детально ранговые тесты в ARMA моделях были исследованы в работах Халлина и др. (Hallin et al., [36], [37], [38]). В работе Крайса (Kreiss, [53]) ранговые тестовые статистики используются для проверки линейных гипотез в AR(p) модели.

Используя разложения эмпирических ф.р. вида (1.19) можно также строить критерии для проверки гипотез о виде распределения ошибок модели. Отметим, например, работу Муганцевой ([16]), в которой строился тест для проверки гипотезы о нормальности ошибок в линейной регрессии. Позднее в работе Болдина ([3]) исследовалось асимптотическое поведение статистики Колмогорова для проверки простой гипотезы H0 : G = G0 в модели (1.17). Пусть j3n — произвольная n1/2-состоятельная оценка в. Тестовая статистика, определенная в [3], имеет вид

sup

хе r

n1/2[Gn(x,3n) - Go(x)] . (1.20)

В силу соотношения

sup

xgr,|0|<©

n1/2[Gn(x, вп + n"1/2tf) - Gn(x)] = Op(1), n —у то,

имеем

sup

х€ r

n1/2[Gn(x,3n) - Gn(x)] = Op(1), n — то. (1.21)

Следовательно, тестовые статистики типа Колмогорова-Смирнова и ¡х>2, основанные на Сп(ж,/Зп) (такие, как (1.20)), имеют то же асимптотическое распределение, что и соответствующие статистики, основанные па Сп(ж). А именно, они сходятся по распределению к

supte[0,i] |ш0(£)| и JQ1[wo(i)]2dt соответственно. Здесь w0(t) — броуновский мост. Таким образом, в стационарных авторегрессионных моделях с нулевым средним критерии согласия, основанные на остаточных эмпирических процессах, являются асимптотически непараметрическими (асимптотические распределения их статистик не зависят от гипотетического распределения ошибок и параметров авторегрессионной схемы).

Похожие диссертационные работы по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК

Список литературы диссертационного исследования кандидат наук Есаулов Даниил Михайлович, 2015 год

Литература

[1] Андерсон Т., Статистический анализ временных рядов, М.:Мир, 1976.

[2] Биллингсли П., Сходимость вероятностных мер, М.: Наука, 1977.

[3] Болднн М.В., Оценка распределения возмущений в схеме авторегрессии, Теория вероятн. и ее примен., Т. 27, №4, с. 905-910, 1982.

[4] Болдин М.В., Проверка гипотез в схемах авторегрессии критериями Колмогорова и омега-квадрат, ДАН СССР, Т. 273, №1, с. 19-22, 1983.

[5] Болдин М.В., О проверке гипотез в схеме скользящего среднего критериями Колмогорова-Смирнова и омега-квадрат, Теория вероятн. и ее примен., Т. 34, №4, с. 758-764, 1989.

[6] Болдин М.В., О последовательных остаточных эмпирических процессах в ARCH-модели, Успехи мат.наук, Т. 57, №2 , с. 185-186, 2002.

[7] Болдин М.В., Робастность знаковых тестов для гипотез о порядке авторегрессии, Теория вероятн. и ее примен., Т. 57, №4, с. 1-10, 2012.

[8] Болдин М.В., Есаулов Д.М., Остаточные эмпирические процессы и качественно робастные GM-тесты в авторегрессии, Вестн. МГУ, сер. Матем. мех., №1, с. 46-50, 2014.

[9] Болдин М.В., Симонова Г.П., Тюрин Ю.Н., Знаковый статистический анализ линейных моделей, М.: ФИЗМАТЛИТ, 1997

[10] Болдин М.В., Штуте В., О знаковых тестах в ARMA модели с возможно бесконечной дисперсией ошибок, Теория вероятн. и ее примеч., Т. 49, №3, с. 436-460, 2004.

[11] Боровков А.А., Математическая статистика, Н.:Наука, 472 е., 1984.

[12] Вязилов А.Е., Остаточная эмпирическая функция распределения в GARCH(1,1) и ее применение при проверке гипотез, Успехи мат. паук, Т. 54, с. 163-164, 1999.

[13] Вязилов А.Е., Эмпирические процессы в СА11СН(1,1)-модели и ро-бастное оценивание параметров, Успехи мат.наук, Т 56, №5, с. 179180, 2001.

[14] Есаулов Д.М., Робастность GM-тестов в авторегрессии против выбросов, Вестн. МГУ, сер. Матем. мех., №5, с. 5-9, 2011.

[15] Кендалл М., Стьюарт А., Статистические выводы и связи, М.: Наука., 899 е., 1973.

[16] Муганцева Л.А., Проверка нормальности в схемах одномерной и многомерной регрессии, Теория вероятн. и ее примем., Т. 22, №3, с. 603-614, 1977.

[17] Смирнов Н.В., О распределении w2-критерия Мизеса, Мат,ем,, сб., Т.2(44), №5, с. 973-993, 1937.

[18] Эрлих И.Г., Двухшаговые оценки типа минимального расстояния для параметров модели ARM А (1,1), В ест,п. МГУ, сер. Матем. мех., №6, с. 52-54, 2010.

[19] Bai J., Weak convergence of the sequential empirical processes of residuals in ARMA models, Ann. Statist., Vol. 22, p. 2051-2061, 1994.

[20] Boente G., Fraiman R., Yohai V.J., Qualitive Robustness for Stochastic Processes, Ann. Statist., Vol. 15, p.1293-1312, 1987.

[21] Boldin M.V., On residual empirical distribution function and rank estimators in autoregression, Math. Methods of Statist., Vol. 6, No. 1, p. 70-91, 1997.

[22] Boldin M.V., On empirical processes in heteroscedastic time series and their use for hypothesis testing and estimation, Math. Methods of Statist., Vol. 9, p. 65-89, 2000.

[23] Boldin M.V., On sequential residual empirical processes in heteroscedastic time series, Math. Methods of Statist., Vol. 11, No. 4, p. 453-464, 2002.

[24] Boldin M.V., Local robustness of sign tests in AR(1) against outliers, Math. Methods of Statist., Vol. 20, No. 1, p. 1-13, 2011.

[25] Boldin M.V., Erlikh I.G., Testing hypotheses on the "drift"of parameters in ARMA and ARCH models, Math. Methods of Statist., Vol. 18, No. 1, p.1-19, 2009.

[26] Brockwell P.J., Davis R.A., Time series analysis: Theory and methods, New York: Springer-Verlag, 1991.

[27] Bustos O.H., General M-estimates for contaminated pth-order autoregressive processes: Consistency and asymptotic normality. Robustness in autoregressive processes, Zeitschrift far Wahrscheinlichkeitstheorie und verwandte Gebiete, No. 59, p. 491504, 1982.

[28] Chow S. N., Mallet-Paret J., Yorke J. A., Finding zeroes of maps: Homotopy methods that are constructive with probability one, Math, of Comp., Vol. 32, p. 887-899, 1978.

[29] Denby L., Martin R.D., Robust estimation of the first-order autoregressive parameter, J. Amer. Statist. Assoc., Vol. 74, p. 140146, 1979.

[30] Dhar S.K., Minimum distance estimation in an additive effects outliers model, Ann. Statist., Vol. 19, No. 1, p. 205-228, 1991.

[31] Durbin J., Weak convergence of the sample distribution function when parameters are estimate, Ann. Statist., Vol. 1, No. 2, p. 279-290, 1973.

[32] Esaulov D.M., Application of residual empirical processes to robust linear hypotheses testing in autoregression, Proceedings of 10th International Conference CDAM: Theoretical and applied stochastics, Vol. 5, No. 1, p. 153-156, 2013.

[33] Esaulov D.M., Residual Empirical Processes and Their Application to GM-Testing for the Autoregression Order, Math. Methods of Statist., Vol. 22, No. 4, p. 333-349, 2013.

[34] Hajek J., Sidak Z., Sen P.K., Theory of Rank tests, 2nd ed., Academic Press, San Diego, 1999.

[35] Hall P., Heyde C. C., Martingale Limit Theory and Its Applications, Academic Press, New York, 1980.

[36] Hallin M., Ingenbleek J.-F., Puri M.L., Linear serial rank tests for randomness against ARM A alternatives, Ann. Statist., Vol. 13, No. 3, p. 1156-1181, 1985.

[37] Hallin M., Ingenbleek J.-F., Puri M.L., Linear and quadratic rank tests for randomness against serial dependence, J. Time Ser. Anal., Vol. 8, No. 4, p. 409-424, 1987.

[38] Hallin M., Puri M.L., Aligned Rank Tests for Linear Models with Autocorrelated Error Terms, J. Multivar. Anal., Vol. 50, No. 2, p. 175237, 1994.

[39] Hampel F.R., A general qualitive definition of robustness, Ann. Statist., Vol. 42, No. 6, p. 1887-1896, 1971.

[40] Hampel F.R., The influence curve and its role in robust estimation, Ann. Statist., Vol. 69, p. 383-393, 1974.

[41] Hampel F.R., Ronchetti E.M., Rousseeuw J., Stahel W.A., Robust statistics. The approach based on influence functions, N.Y.: Wiley, 1985.

[42] Heritier S., Ronchetti E., Robust bounded-influence tests in general paramteric models, J. Amer. Statist. Assoc., Vol. 89, p. 897-904, 1994.

[43] Huber P.J., Robust estimation of a location parameter, Ann. Statist., Vol. 35, p. 73-101, 1964.

[44] Huber P.J., Robust statistics, N.Y.: Wiley, 1981.

[45] Huber P.J., Minimax aspects of bounded influence regression, J. Amer. Statist. Assoc., Vol. 78, p. 66-72, 1983.

[46] Jaeckel L.A., Robust estimates of location: Symmetry and asymmetric contamination, Ann. Math. Stat., Vol. 42, p. 1020-1034, 1981.

[47] Koul H.L., Minimum distance estimation and goodness-of-fit tests in first order autoregression, Ann. Statist., Vol. 14, p. 1194-1213, 1986.

[48] Koul H.L., Weighted empiricals and linear models, IMS Lecture Notes — Monograph Series, Hayward, CA, Vol. 21, 1992.

[49] Koul H.L., Asymptotics of some estimators and sequential residual empiricals in nonlinear time series, Ann. Statist., Vol. 24, p. 380-404, 1996.

[50] Koul H.L., Levental S., Weak convergence of residual empirical process in explosive autoregression, Ann. Statist., Vol. 17, p. 1784-1794, 1989.

[51] Koul H.L., Ossiander M., Weak convergence of randomly weighted dependent residual empiricals with applications to autoregression, Ann. Statist., Vol. 22, p. 540-562, 1994.

[52] Krasker W.S., Welsch R.E., Efficient bounded influence regression estimation, J. Amer. Statist. Assoc., Vol. 77, p. 595-604, 1992.

[53] Kreiss J.-P., Testing linear hypotheses in autoregressions, Ann. Statist., Vol. 18, No. 3, p. 1470-1482, 1990.

[54] Kreiss J.-P., Estimation of the distribution function of noise in stationary processes, Metrica, Vol. 38, p. 285-297, 1991.

[55] Kunsch H., Infinitesimal Robustness For Autoregressive Processes, Ann. Statist., Vol. 12, No. 3, p. 843-863, 1984.

[56] Li B., Zamar R.H., Min-max asymptotic variance when scale is unknown, Statistics and Probability Letters, Vol. 11, p.139-145, 1991.

[57] Ling S., Weak convergence of the sequential empirical processes of residuals in nonstationary autoregressive models, Ann. Statist., Vol. 26, p. 741-754, 1998.

[58] Markatou M., Hettmansperger T.P., Robust bounded-influence tests in linear models, J. Amer. Statist. Assoc., Vol. 85, p. 180-190, 1990.

[59] Maronna R.A., Martin R.D., Yohai V.J., Robust Statistics: Theory and Methods, John Wiley and Sons, 2006

[60] Martin R.D., Robust estimation of autoregressive models, Direct. Time Ser., Haywood, CA: Institute of Mathematical Statistics, p.228-254, 1980.

[61] Martin R.D., Robust methods for time series, Applied Time Series Analysis II, New York: Academic Press, p.683-759, 1981.

[62] Martin R.D., Yohai V.J., Influence Functionals for Time Series, Ann. Statist., Vol. 14., p.781-818, 1986.

[63] Mokkadem A., Propriétés de mélange des processus autorégressifs polynomiaux Ann. Inst, H, Poincaré Probab. Statist., Vol. 26, p. 219— 260, 1990.

[64] Mukherjee K., Bai Z.D., R-estimation in Autoregression with Square-Integrable Score Function J. Multivar. Anal, Vol. 81, 167-186, 2002.

[65] Pollard D., Asymptotics for least absolute deviation regression estimators Econometric Theory, Vol. 7, 186-199, 1991.

[66] Reider H., A Robust Asymptotic Testing Model, Ann. Statist., Vol. 6, p.1080-1094, 1978.

[67] Reider H., Qualitive Robustness of Rank Tests, Ann. Statist., Vol. 10, p.205-211, 1982.

[68] Sorokin A.A., On the minimum distance estimates in ARCH model Math. Methods of Stat., Vol 13, No 3, p. 329-355, 2004.

[69] Sorokin A.A., On parameter estimation and testing hypotheses on dimension in ARCH(p) model, Math. Methods of Stat., Vol. 15, No 3, p. 327-348, 2006.

[70] Silvapulle M.J., Robust bounded influence tests against one-sided hypotheses in general parametric models, Statist, and Probab. Letters., Vol. 31, p. 45-50, 1996.

[71] Sinha S.K, Field C., Smith B., Robust estimation of nonlinear regression with autoregressive errors, Statist, and Probab. Letters., Vol. 63, p.49-59, 2002.

[72] Vyazilov A.E., Empirical processes and robust estimation of parameters of the GARCH model, Math. Methods of Stat., Vol. 12, No 2, p.231-245, 2003.

[73] Wolfowitz J., Estimation by minimum distance method, Ann. Inst. Stat. Math., Vol. 5, p.9-23, 1953.

[74] Wolfowitz J., Estimation by the minimum distance method in nonparametric stochastic difference equations, Ann. Math. Stat., Vol. 25, No 2, p.203-217, 1954.

[75] Wolfowitz J., Minimum distance estimation method, Ann. Math. Stat., Vol. 28, p.75-88, 1957.

[76] Wolfowitz J., Estimation by minimum distance method, Ann. Inst. Stat. Math., Vol. 5, p.9-23, 1953.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.