Робастные GM-тесты и оценки в авторегрессионных схемах с выбросами тема диссертации и автореферата по ВАК РФ 01.01.05, кандидат наук Есаулов Даниил Михайлович
- Специальность ВАК РФ01.01.05
- Количество страниц 116
Оглавление диссертации кандидат наук Есаулов Даниил Михайлович
2.5 Доказательства теорем
3 Робаетные GM-процедуры в AR(p) модели
3.1 Проверка гипотезы размерности в AR(p) модели в схеме без засорений
3.2 Построение качественно робастного GM-теета в AR(p) модели в схеме
с засорениями
3.3 Асимптотическая нормальность GM-оценок в схеме с засорениями, Робастность GM-теетов, основанных на GM-оценках
4 Оптимальность GM-тестов
4.1 Асимптотически оптимальные тесты в AR(1)
4.2 Алгоритм построения асимптотически оптимального взвешенного теста наименьших модулей в А Н (1). Результаты численного эксперимента
4.3 Доказательства
Заключение
Список обозначений
Список литературы
Гл яв ^^
Рекомендованный список диссертаций по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК
Эмпирические и последовательные эмпирические процессы в статистическом анализе ARMA модели2010 год, кандидат физико-математических наук Эрлих, Иван Генрихович
Робастное и непараметрическое оценивание характеристик случайных последовательностей2009 год, доктор физико-математических наук Китаева, Анна Владимировна
Адаптивное оптимальное прогнозирование многомерных процессов авторегрессионного типа с дискретным временем2015 год, кандидат наук Кусаинов Марат Ислямбекович
Робастные методы и алгоритмы оценивания корреляционных характеристик данных на основе новых высокоэффективных и быстрых робастных оценок масштаба2013 год, кандидат наук Смирнов, Павел Олегович
Прогнозирование и идентификация динамических систем методами усеченного оценивания2019 год, кандидат наук Догадова Татьяна Валерьевна
Введение диссертации (часть автореферата) на тему «Робастные GM-тесты и оценки в авторегрессионных схемах с выбросами»
Введение
В диссертации рассматриваются линейные авторегрессионные модели. Эти классические объекты исследуются статистиками на протяжении уже более 85 лет. Одними из важнейших статистических задач для таких моделей являются задачи оценивания неизвестных параметров и проверки гипотез об этих параметрах, в частности, гипотез о размерности модели. Среди процедур, используемых для их решения, выделим обобщенные М-процедуры (СМ-процедуры), процедуры минимального расстояния (МБ-процедуры) и знаково-ранговые процедуры. Все они могут быть исследованы в рамках единого подхода — с использованием так называемых остаточных эмпирических процессов (о.э.п.). А именно, интересующие нас статистики являются функционалами от о.э.п. Поэтому изучение асимптотических свойств этих статистик может быть сведено к изучению асимптотических свойств соответствующих о.э.п.: равномерных линейных разложений, слабой сходимости в подходящих метрических пространствах и т.д.
Упомянутые выше процедуры детально исследованы в случае, когда авторегрессионный процесс наблюдается непосредственно.
В данной работе мы рассматриваем модель авторегрессии в ситуации, когда наблюдения содержат независимые аддитивные выбросы (засорения) с неизвестным и произвольным распределением. Интенсив-
ность выбросов неизвестна и имеет порядок 0(п-1/2), п — объем данных.
Наша основная цель — построить ОМ-процедуры в схеме с засорениями и исследовать достаточные условия качественной робастно-сти таких процедур против выбросов. Особое внимание будет уделено робастности ОМ-тестов, так как для них, в отличие от оценок, это свойство изучалось мало. Помимо известных ОМ-процедур будут рассмотрены новые ОМ-тесты для проверки гипотез о размерности АЯ(р) модели без использования ОМ-оценок неизвестных параметров. Кроме того, будут описаны асимптотически оптимальные ОМ-тесты и предложен численный алгоритм их построения в семипараметрической ситуации. Поставленные задачи будут решаться с использованием остаточных эмпирических процессов. В частности, мы получим асимптотические равномерные разложения остаточных эмпирических процессов в нашей локальной схеме засорения данных. Этот результат представляет самостоятельный интерес, т.к. может быть использован не только для исследования ОМ-процедур в схеме с засорениями, но также и для ранговых, знаковых и процедур минимального расстояния.
Перечисленные задачи являются новыми. Они содержательны в теоретическом плане, их значение для приложений очевидно.
Далее введение устроено следующим образом: сначала мы кратко опишем свойства ОМ-процедур в модели линейной авторегрессии без засорений. Затем перейдем к формальному описанию схемы засорений и понятия качественной робастности, рассматриваемых в диссертации. При этом будет рассказано о некоторых других характеризациях робастности, используемых в статистической литературе. Далее, т.к. задачи, рассматриваемые в работе, являются частью общей проблемы исследования робастности статистических процедур, при построении которых применяются о.э.п., мы расскажем об известных результатах
для знаково-ранговых и MD-процедур в схемах без засорений. Для них можно поставить те же задачи об исследовании качественной робаст-ности, что и для ОМ-тестов. В конце введения будут кратко описаны полученные в работе результаты.
GM-процедуры в авторегрессионных схемах без засорений.
Итак, авторегрессионная модель порядка p (А11(р)-модель) определяется стохастическим разностным уравнением
Ut = ßlUt-1 +-----h ßpUt-p + £t, t G Z, (1.1)
где ß = (ßi,... , ßp)T — вектор неизвестных неслучайных коэффициентов, a {et} — независимые одинаково распределенные случайные величины (н.о.р.с.в.) с неизвестными функцией распределения G и Лебеговой плотностью g, Eei = 0, E^i < œ. Будем рассматривать слу-
{ Ut } ,
циопарпым. Для существования и п.н. единственности строго стационарного решения (1.1) достаточно, чтобы корни характеристического уравнения xp = ßixp-i + ... + ßp были по модулю меньше единицы. В этом случае п.н. единственное решение уравнения (1.1) представляется в виде ut = ^öj£t-j, где последовательность {öj} определяется рекуррентным соотношением
öj = ßiöj-i +-----+ ßpöj-p, j G Z+,
öi-p = ••• = ö-i = 0, öo = 1.
Подробности приведены в Brockwell, Davis, [26], гл.З.
GM-оценки для авторегрессионных моделей были предложены в работах Денби и Мартина (Denby, Martin, [29]) и Мартина (Martin, [60], [61]). Опишем, как строятся такие оценки для модели (1.1). Пусть наблюдения ui-p,... ,un — выборка из стационарного решения (1.1). Для априори выбранных функций ф и параметра a G Rp введем вектор
Ln(a) := (Lni(a),Ln2(a),..., Lnp(a)) , (1.2)
где
n
Lnj(a) := n-1/2^2 фЫ-з)Ф(и — aiut-i-----арЩ—р).
t=1
GM-оценка определяется как подходящее (т.е. n1/2-состоятельное) решение уравнения
Ln(a) = 0. (1.3)
Бустос (Bustos, [27]) показал, что при некоторых условиях па ф и ф такая оценка является асимптотически нормальной. Обозначим ее вn gm. Стоит отметить, что при ф(х) = х,ф(x) = — уравнение (1.3) совпадает с уравнением максимального правдоподобия. Оценка наименьших квадратов входит в класс GM-оценок при ф(х) = ф(х) = х.
Рассмотрим векторы Ut—1 := (ut—1,ut—2,... ,ut—p)T, t = 1,...,n, и векторную функцию
ip(Ut—1) := (ф(Щ—1), ф(щ—2),..., ф(Щ—р ))T. Введем матрицы размерности p х p
/ж
д(х)<1ф(х) E^(Uo)(Uq)t, К(в) := Еф2(^) E^(Uq)^t(Uq):
-ж
М(в) := C—1(в)К(в)(С—1(в))Т. (1-4)
Доказательство существования и асимптотической гауссовости в n gm может быть основано на асимптотической равномерной
линейности (AUL, Asymptotic Uniform Linearity) статистики Ln(a).
ф
можно показать, что
sup ||Ln(0 + n-1/20) - Ln(ß) + C(0)0|| = Op(1), (1.5)
||0||<е«ж
Где Ii . Ii _ евклидова норма вектора. Соотношение вида (1.5) и описывает свойство AUL. С помощью (1.5) доказывается, что с вероятностью, стремящейся к 1 при n ^ ж, существует n1/2-состоятельная
последовательность вп,см такая, что Ьп(впо0м) = 0. К тому же, для Ьп(0ом) из (1.5) следует разложение
ЪифП1ом) = -Мв) - С(в)п1/2(вп,ом - в) + Ор(1).
Теперь в силу ЦПТ для Ьп(в)
п1/2(вп,ом - в) Л N(0, М(в)) , п л ю. (1.6)
Отметим, однако, что случай негладкой ф, например, ф(х) = sign(ж), не менее важен. Технически он гораздо сложнее. В этом случае формула Тейлора неприменима, и для исследования процесса Ьп(а) и асимптотических свойств вп ом используется техника, основанная на случайно взвешенных остаточных эмпирических процессах. Введем их. Остатками в модели (1.1) называются величины
£г(а) := щ — ата е , I = 1,..., п.
Соответствующие взвешенные о.э.п. имеют вид
п
:= п—1/2
г=1
vn(a, x) := n 1/2 ^ ^(Ut-i)I(st(a) < x) =
= n-1/2Y, v(Ut-i)l{et < x + (а - (3)TUt-i),
t=i
n
:= n-V2
Un(0, x) := n-1/2Y, <P(Ut-i) I(et < x + n-1/2dTU-)
t=i
- G(x + n-1/2GTUt-i)
Слагаемые в последней сумме образуют мартингал-разность относительно последовательности а-алгебр Ff := с{ei, i < t}, t = 0,1,..., n.
Такие процессы в линейных авторегрессионных моделях исследовал, в частности, Коул (Koul, [48], гл. 7). При некоторых условиях на f и распределение ошибок {et} от показал, что для любого 0 < О < ж верно асимптотическое разложение
sup ||un(0,x) - un(0,x)|| = op(1). (1.7)
xe RJI 011<©
Из (1.7) следует AUL процесса vn(e + n-1/20, x):
sup ||vn(0 + n—1/20, x) - vn(e, x) - g(x)E^(Uc)(Uo)T0|| = op(1). x€M,||0||<0
(1.8)
Предположим, что '(x) имеет ограниченную вариацию, и E'(^) = 0. Тогдa Ln(a) представляют в виде интегрального функционала от о.э.п.:
/то рТО
'(x)dvn(a, x) = — / vn(a,x)d' (x).
-то J —то
Соотношение (1.8) теперь влечет (1.5), и, таким образом, снова верны утверждения о существовании и асимптотической гауссовости GM-оценки. Помимо [48] такой подход применялся в статье Коула (Koul, [49]) для исследования GM-оценок в модели нелинейной регрессии с аддитивно входящими ошибками. Аналогичные результаты для ARCH модели были получены Болдиным (Boldin, [22], [23]) и распространены на GARCH модель Вязиловым ([13]).
На основе GM-оценок, используя их асимптотическую нормальность, можно стандартным образом строить тесты для проверки линейных гипотез, в частности, гипотез о размерности модели. А именно, пусть ß разбит па подвекторы ßT = (e(1)T, e(2)T), где в(1) е Rm, в(2) е Rp—m, m < p.
Рассмотрим гипотезу Ho: в(2) = 0, альтернативой возьмем H1: в(2) = 0. Таким образ ом, в(1) является мешающим параметром. Если H0 верпа, то размерность авторегрессии не превышает т. Введем локальные альтернативы Н1п(т): ß = ßn := в0 + n—1/2т, где вТ = (в(1)Т, 0T), тт = (т(1)T, т(2)T) е Rp — постоянный вектор с
т p — т
Если верна Н1п(т), то при некоторых условиях на функции ф и ф GM-оценка ßщси, так же как и ПРИ гипотезе, существует и является
асимптотически нормальной, но появляется сдвиг. А именно, >1/2(Р „,в0) — ^ , м(МОу
n1/2(Pn,GM - во) - N (г, М(во)), n - ж. (1.9)
Заметим, что в монографии Коула (Koul, [48]) случай локальных
i (x) = x
ется следствием результатов Крайса (Kreiss, [53]) и несложным образом
i
М).
Пусть J (в), Q(e), B (в) — такие матрицы размерности (p - m) х
(p - m), m х mum х (p - m) соответственно, что
М (W) B<e>\. 10)
(в) \bt(в) J(e^
В качестве тестовой статистики для проверки H0 обычно берут статистику
р (2)T р _1 р (2)
Vn := n fin,GM (Jn) fin,GM, (1.11)
где Jn — произвольная состоятельпая при Н1п(т) оценка матрицы
р T р (1)T р (2)T р (1) m р (2) _m
JW, а Р n,GM = (Р n,GM, Pn,GM), Р n,GM ^ Rm, Р n,GM ^ RP m
Обозначим нецентральное распределение хи-квадрат с p - m степенями свободы и параметром нецентральности Л2 гак x2(p - m, Л2). Из (1.9) следует, что при альтернативе Н1п(т)
Vn - X2(p - m, Л0), n -ж, (1.12)
где Л2 = и-1/2(в0)т(2)||2.
Решать нелинейное уравнение (1.3) и выбирать из всех его решений подходящее — непростая задача. Существует подход, позволяющий строить GM-тесты, эквивалентные тестам со статистикой Vn, не находя Рn gm . Эти тесты основываются непосредственно на специальным образом преобразованной статистике Ln(Pn), где Рп — любая предварительная n1/2 -состоятельная оценка параметра в. В качестве Рп
можно взять, например, обычную оценку наименьших квадратов. Соответствующую конструкцию, т.н. „general score tests", изучал Крайс (Kreiss, [53]) в случае ф(х) = х и гладкой ф(х). Опишем его результаты подробнее.
Переобозначим для случая ф(х) = х статистику Ln(a) через
Ф„(а) := n-1/2 ^ Ut-Met(a)).
t=i
Функции ф(х) = х соответствуют матрицы 2
К(в) = E^2(ei) E(Uo)(Uo)T, С(в) = J д(х)#(х) E(Uo)(Uq)T,
М(в) = „ E^2(£1)-2 [E(Uq)(UQ)t1-1
д(х)#(х)]
Введем матрицу W(e) такую, что
W(e)WT (в)= [E(Uq)(UQ)t 1-1
Обозначим Wn состоятельную при Н1п(т) оценку W(в0).
Пусть (3п0 := (вПО , 0Т), где (3ПО — п1/2-состоятельная оценка параметра в(1). Обозначим п о а ортогональную проекцию вектора а па последние (р — т) компонент. Рассмотрим тестовую статистику
п 2
[п—1 £ ^2(£^(Зпо))]—1 ||п о WTФп(Зпо)| . (1.13) ¿=1
В работе [53] было доказано, что для функций ^ С, дважды непрерывно дифференцируемых с ограниченными производными, и ошибок с Ее4 < то при Н1п(т) статистика (1.13) слабо сходится к х2(р — т, А2). Здесь параметр нецентральности АО такой же, что и в (1.12) при ф(х) = х. Отметим также, что при ф(х) = х, ф(х) = — ^(Ху, как показано в [53], получается асимптотически оптимальный в максиминном смысле тест.
К сожалению, преобразование статистики Ьп((3п) из [53] в случае произвольной ф(х) = х неприменимо. В Главе 3 данной работы мы,
используя другое преобразование, предлагаем новый способ построения GM-тестов в AR(p) модели, в частности, для ограниченных f. При этом, в отличие от [53], мы рассматриваем случай, вообще говоря, негладкой ф. В частном случае f (x) = x наша тестовая статистика совпадает со статистикой (1.13).
Отметим также, что стандартный подход для исследования предельных распределений тестовых статистик при контигуальных альтернативах использует третью лемму Ле Кама (Hajek et al [34], стр. 257). При этом должно быть выполнено условие локальной асимптотической нормальности модели. Мы используем другой подход, основанный на AUL статистики Ln(a).
Описание схемы засорения. Качественная робастность и другие характеризации робастности.
Перейдем к описанию схемы засорения данных, рассматриваемой в диссертации.
В работе рассматривается ситуация, когда наблюдения содержат грубые выбросы и имеют вид
yt = ut + zt7n Ct, t = 1 - p, 2 - p,...,n. (1.14)
Здесь {ut} — выборка из стационарного решения уравнения (1.1); {z/n} — н.о.р.с.в. с распределением Бернулли Br(Yn), Yn = min(1,n-1/2y), параметр y > 0 неизвестен; {Ct} — н.о.р.с.в. с неизвестным распределением д; последовательности {ut}, {z/n}, {Ct} независимы между собой. Последовательность {Ct} интерпретируется как последователь-
Yn
Y=0
является локальным вариантом общеупотребительной схемы засорения данных во временных рядах, предложенной в [62].
Мы построим стандартные GM-процедуры и новый ОМ-тест по на-{ yt }
^Y
В схеме засорений (1.14) GM-оценка ¡3n,GM определяется как n1/2-состоятельное решение нелинейной системы
Li (а) = 0,
где статистика L^(а) строится по засоренным наблюдениям } так же, как Ln(a) строилась по {ut}. Построение тестовых статистик осуществляется по тому же принципу.
Для построенных в схеме засорений (1.14) GM-тестов мы установим достаточные условия качественной робастности к выбросам. Мы используем две характеризации робастности тестов, предложенные Бол-диным ([7], Boldin, [24]). Первая из них — локальная качественная робастность (LQ-робастность). Пусть Tn,Y — статистика теста для проверки H0: в(2) = 0. Мощность теста в схеме (1.14) на локальной альтернативе Н1п(т) обозпачим Wn(T, 7, д). Тест со статистикой Tn,Y называется LQ-робастным, если семейство {Wn(T, 7,д)} равностепенно непрерывно по 7 в точке 7 = 0. То есть, верна сходимость
sup |W„(t,7,д) - Wn(T,0,д)| ^ 0, 7 ^ 0. (1.15)
Супремум в (1.15) берется по произвольным д, ||т|| < T < то и n > n0(T). Соотношение (1.15) означает, что для малых 7 равномерно по Д, ||т|| < T и n > n0 близки уровни значимости и мощности тестов в схемах с засорениями и без засорений, т.е. при 7 = 0.
Предположим, что существует W(т, 7,д) := Wn(т, 7,д) —
предельная мощность теста, основанного на Tn,Y. Второй тип робастности, который мы будем использовать, характеризуется равностепенной непрерывностью семейства {W(т, 7,д)} по 7 в точке 7 = 0. Будем называть тест предельно качественно робастным, если
sup |W(т,7,д) - W(т,0,д)|^ 0,7 ^ 0. (1.16)
М,||т ||<T
Болдин ([7], Boldin, [24]) использовал описанные выше определения при построении качественно робастных знаковых тестов в авторегрессии. В частности, в [7] были предложены предельно качественно робаст-ные знаковые тесты для проверки гипотезы о порядке многопараметрической AR(p) модели в схеме (1.14). В [24] был построен LQ-робастный знаковый тест для проверки гипотез в модели AR(1). Опишем результаты из [24] более подробно. Пусть
ut = fiut-1 + £t, t e Z, (1.17)
где {et} — п.о.р.с.в. с неизвестными функцией pаспределения G и плотностью g; Ee1 = 0, E|e1| < ж, а в ~ неизвестный параметр такой, что |в| < 1.
В схеме (1.17) без засорений локально наиболее мощный знаковый тест для проверки гипотезы Н0: в = в0 против правосторонней альтернативы Н+: в > в0 может быть построен следующим образом ([9], Гл. 6). Пусть u0,u1,... ,un — выборка из стационарного решения (1.17). Введем
St(a) := sign(£t(a)) = sign(ut - aut-1), t = 1,... ,n,
n- 1 n
(a) := ^ at-1 ^ Sk-t(a)Sk(a).
t=i k=t+i
Тестовой статистикой для проверки Н0 берется величина
TS(в0) := n-1/2(1 - в2)1/2lSn(в0).
Введем последовательность локальных альтернатив Н1п (т): в = вп = в0+п-1/2т, т > 0. При Н1п(т), а также условиях G(0) = 1/2, g(0) > 0, ограниченности g(x) и ее непрерывности в точке 0
TS(в0) -- N(2g(0)E|ei|(1 - в2)-1/2т, 1), n - ж.
Питменовская асимптотическая относительная эффективность (АОЭ) теста со статистикой Tjf (во) относительно теста наименьших квадратов равна eS,LS = (2g(0)E|£i|) . Для G (x) с тяжелыми хвостами eS,LS может быть сколь угодно большой.
Отметим, что в схемах без засорений знаковые тесты исследовались в монографии Болдина и др. ([9]) для линейных регрессии и авторегрессии, в работе Болдина и Штутте ([10]) для ARMA моделей.
В [24] рассматривается ситуация, когда наблюдения авторегрессии (1.17) содержат грубые выбросы и имеют вид (1.14) с p =1.
В схеме засорений (1.14) статистика T*y (во) знакового теста строится по {yt} так же, как T,f (во) строилась по {ut}. Мощность соответствующего Tfy(во) теста при альтернативе Н1п(т) обозначим WS (т,7,м).
В [24] было установлено линейное по т и y стохастическое разложение T^fy (в0) при n ^ то, равномерное по 0 < т < T < то, 0 < Y < Г < той произвольн ым д. Это разложение влечет существование равномерного слабого предела Tfy (в0), а значит, равномерного предела WS(т, 7,д) для мощности W^(т, 7,д). Отсюда следует соотношение типа (1.15), означающее LQ-робастность. Отметим, что общеупотребительные тесты наименьших квадратов и М-тесты из [53] LQ-робастными не являются.
Предложенное Болдиным определение качественной робастности тестов родственно определению Р и дери (Rieder, [67]) качественной робастности тестов для случая независимых данных. В [67] исследовалась робастность ранговых тестов. Отметим, что определение Ридера дано в нелокальной схеме и основано на равностепенной непрерывности распределения ошибок относительно метрик Прохорова или Колмогорова.
Напомним его точную формулировку. Пусть (Œ, B) — измеримое пространство, M — множество вероятностных мер на B. Для под-
множества P С M обозначим P(n) := {^n=1Gi, Gi e P,i = 1,... ,n} прямое произведение вероятностных мер Gi. Последовательность тестов {фп} есть последовательность измеримых отображений фп: Qn — [0,1], n > n0. В метрике Прохорова шар радиуса 6 e [0,1] и центром в F e M обозначим PP(F,6).
Последовательность тестов {фп} является качественно робастной в F, если для любого £ > 0 существует 6 > 0 такое, что для Wn e PP(F,6)(n\n > n0, выполнено соотношение |/ фndWn - f фndFn| < £.
Данное определение родственно определению качественной робаст-
Tn =
Tn(x1,... , xn) — последовательность оценок, построенных по независимым наблюдениям {xi} с одинаковым распределением F. Обозначим распределение статистики Tn в этом случае как Ср (Tn). По Хампелю
Tn F,
для любого £ > 0 существует 6 > 0 такое, что при всех n и распределениях G e PP(F,6) распределения CG(Tn) e PP(Ср(Tn),£). Это определение было обобщено на временные ряды в работе Боенте и др. (Boente et al., [20]).
Стоит отметить, что Хампелевская характеризация качественной робастности оценок получила гораздо меньшее распространение, чем его инфинитезимальный подход к робастности, основанный на понятии функции влияния (Influence Function). Этот подход был подробно описан в монографии Хампеля и др. (Hampel et al., [41]) для оценок в случае независимых данных и оказал большое влияние на развитие теории робастных статистик в целом. Функция влияния IFh(x,T,F) оценки Tn(x1,... , xn), построенной по н.о.р. данным с распределением F, описывает тот асимптотический эффект, который оказывает на статистику Tn x.
ления IFh предполагается, что оценка Tn имеет в ид Tn = T (Fn), где
Fn — эмпирическая функция распределения.
В [40] Хампелем были построены В-робастные (т.е. с чувствительностью supx |/F#(ж,ск, F)| < то) М-оценки, оптимальные в смысле минимизации асимптотической дисперсии. Обобщения такого подхода в многопараметрическом случае приведены в [41]. Хьюбер (Huber, [45]), Краскер и Уэлш (Krasker and Welsh, [52]) распространили хампелевский подход на модель линейной регрессии. Отметим, что поиск оптимальных В-робастных М-оценок в случае нормальной модели с неизвестным параметром сдвига приводит к тому же классу оценок, что и известный минимаксный подход Хьюбера (Huber, [43], [44]).
Предложенный Хампелем подход к робастности был распространен также и на статистические тесты. В [41], к примеру, даны функции влияния для ранговых тестов, построенных по н.о.р. данным. Мир-киту и Хеттманспергер (Markatou, Hettmansperger, [58]) построили В-робастные обобщенные М-тесты для поверки линейных гипотез в модели линейной регрессии. Их результат был обобщен Херитьером и Рон-четти (Héritier, Ronchetti, [42]), а также Силвапулле (Silvapulle, [70]) для нелинейных регрессионных моделей.
Кунш (Kunsch, [55]) обобщил понятие Хампелевской функции влияния на модель авторегрессии. В его работе были построены В-робастные GM-оценки параметров модели, оптимальные в смысле минимизации следа асимптотической ковариационной матрицы. Отметим, однако, что в отличие от случая н.о.р. данных, функционал, определяющий оценку, во временных рядах зависит не только от одномерного распределения, но от всех конечномерных распределений сразу. Поэтому в этом случае более приемлемым является использование вместо функций влияния т.н. функционалов влияния (Influence Functional). Такую характеризацию робастности для временных рядов предложили Мартин и Йохай (Martin, Yohai, [62]).
Опишем подробнее их подход.
В [62] рассматривается схема засорения данных вида (1.14), но с постоянным (не зависящим от п) уровнем засорений Пусть для про-
стоты p = 1. Обозначим ß^ оценку параметра ß, построенную по засоренным данным. Пусть распределение засорений ц G M^, где M^ — некоторый фиксированный класс распределений.
Предположим, что для любого достаточно малого y > 0 при n ^ ж выполняется сходимость по вероятности
Ж, ^ в7, в0 = ß,
для некоторого неслучайного ß1. Тогда функционалом влияния (IF) оценки ß- называется величина
ßY - в0
IF(ßY,ц) := lim в-в
V ' Y ^0+ Y
в том случае, когда предел существует. IF(ßY, ц) характеризует величину главного члена в разложении асимптотического смещения
ßY - ß0 = IF(ßY,ц)7 + o(y).
Согласно [62], оценка в- является В-робастной, если величина
GES(Me,ßT) := sup |IF(ßY,ц)|,
называемая чувствительностью к грубым выбросам, конечна. В этом случае главный член асимптотического смещения (ßY — ß0) равномерно мал при всех возможных засорениях и малых y.
В [62] были найдены функционалы влияния и установлены условия конечной чувствительности GM-оценок для моделей авторегрессии, скользящего среднего и ARMA моделей при гауссовских инновациях. Позднее были вычислены функционалы влияния многих других оценок в линейных и нелинейных моделях временных рядов. Например,
функционалы влияния MD-оценок и знаковых оценок в авторегрессионных моделях можно найти в работе Дхара (Dhar, [30]) и монографии Болдина и др. ([9]) соответственно. В моделях типа ARCH и GARCH функционалы влияния GM-оценок были найдены в работах Болдина (Boldin, [22]), Сорокина (Sorokin, [69]) и Вязилова (Vyazilov, [72]), MD-оценок — в работе Сорокина (Sorokin,[68]). Синха и др. (Sinhaet al., [71]) исследовали функционалы влияния GM-оценок в нелинейных моделях с авторегрессионными ошибками.
Разумеется, существуют и другие характеризации робастности статистических процедур. Различные подходы приведены, например, в монографии Маронны и др. (Maronna et al., [59]).
Как уже было сказано выше, исследование качественной робастности GM-процедур в данной диссертации использует асимптотические разложения остаточных процессов в схемах с засорениями. Понятно, что используя эти разложения можно найти достаточные условия качественной робастности и для других процедур, при построении которых применяют о.э.п. В следующем разделе мы приведем примеры таких процедур и опишем известные результаты для них в схемах без засорений. Таким образом, будет видно, что рассматриваемые в работе задачи являются частью общей проблемы исследования качественной робастности статистических процедур во временных рядах, основанных на о.э.п.
Некоторые результаты о ранговых и MD-процедурах в авторегрессионных моделях. Эмпирические функции распределения.
Эмпирические процессы могут быть использованы, например, при построении процедур минимального расстояния (MD-процедур). Метод минимального расстояния был предложен в работах Вольфовица (Wolfowitz, [73]—[75]). Коулом (Koul, [47]) для определения MD-оценки
в AR(1) модели (1.17) был использован взвешенный о.э.п.
n
wn(a, x) := n-1/2 ^ ip(ut-i)
t=i
функция распределения G(x) предполагается известной. MD-оцепка определяется как точка минимума функционала
/+œ
w2n(a, x)dG(x) (1.18)
-œ
на R. AUL процесса wn(a,x) (одномерный вариант соотношения (1.8)) влечет равномерное по в разложение процесса Kn(fi+п-1/2в) и, следовательно, асимптотическую нормальность оценки f3vjimd пРи условии ее n1/2-состоятельности. Для установления последней используется монотонность wn(a,x) по a (Koul, [48], Теорема 7.4.4.).
G(x)
неизвестна и симметрична. Сорокин (Sorokin, [68]) предложил подход, при котором можно отказаться от условия симметричности функции распределения (ф.р.). В его определении о.э.п. для ARCH моделей неиз-G(x)
n
Gn(x,a) := n-1 ^I(st(a) < x). (1.19)
t=i
Позднее родственный метод применялся Эрлихом ([18]) для построения так называемых двухшаговых MD-оценок в ARMA моделях.
Ранговые оценки — еще один тип оценок, для исследования которых можно использовать свойства эмпирических процессов. Очевидно, если R1(a),..., Rn(a) — ранги остатков £1(a),..., en(a), то
Rt(a) = nGn(st(a),a).
Тогда равномерное линейное разложение для остаточного эмпирического процесса позволит находить разложение для ранговых статистик.
I{e(a) < x) - G(x) ,
Ранговые оценки в модели авторегрессии исследовались в работах Болдина (Boldin, [21]), Коула и Оссиандера (Koul, Ossiander, [51]), Му-хердже и Баи (Mukherjee и Bai, [64]). Коул (Koul, [49]) строил ранговые оценки параметров нелинейных моделей с аддитивными шумами.
Основные результаты в ранговом анализе связаны с задачами проверки гипотез. Детально ранговые тесты в ARMA моделях были исследованы в работах Халлина и др. (Hallin et al., [36], [37], [38]). В работе Крайса (Kreiss, [53]) ранговые тестовые статистики используются для проверки линейных гипотез в AR(p) модели.
Используя разложения эмпирических ф.р. вида (1.19) можно также строить критерии для проверки гипотез о виде распределения ошибок модели. Отметим, например, работу Муганцевой ([16]), в которой строился тест для проверки гипотезы о нормальности ошибок в линейной регрессии. Позднее в работе Болдина ([3]) исследовалось асимптотическое поведение статистики Колмогорова для проверки простой гипотезы H0 : G = G0 в модели (1.17). Пусть j3n — произвольная n1/2-состоятельная оценка в. Тестовая статистика, определенная в [3], имеет вид
sup
хе r
n1/2[Gn(x,3n) - Go(x)] . (1.20)
В силу соотношения
sup
xgr,|0|<©
n1/2[Gn(x, вп + n"1/2tf) - Gn(x)] = Op(1), n —у то,
имеем
sup
х€ r
n1/2[Gn(x,3n) - Gn(x)] = Op(1), n — то. (1.21)
Следовательно, тестовые статистики типа Колмогорова-Смирнова и ¡х>2, основанные на Сп(ж,/Зп) (такие, как (1.20)), имеют то же асимптотическое распределение, что и соответствующие статистики, основанные па Сп(ж). А именно, они сходятся по распределению к
supte[0,i] |ш0(£)| и JQ1[wo(i)]2dt соответственно. Здесь w0(t) — броуновский мост. Таким образом, в стационарных авторегрессионных моделях с нулевым средним критерии согласия, основанные на остаточных эмпирических процессах, являются асимптотически непараметрическими (асимптотические распределения их статистик не зависят от гипотетического распределения ошибок и параметров авторегрессионной схемы).
Похожие диссертационные работы по специальности «Теория вероятностей и математическая статистика», 01.01.05 шифр ВАК
Одноэтапные последовательные процедуры оценивания параметров динамических систем2016 год, кандидат наук Емельянова Татьяна Вениаминовна
Робастное и непараметрическое оценивание параметров авторегрессионного поля2013 год, доктор физико-математических наук Горяинов, Владимир Борисович
Оценивание параметров нелинейных стохастических динамических систем с дискретным временем2010 год, кандидат физико-математических наук Маляренко, Анна Александровна
Многомерный непараметрический линейный регрессионный анализ2006 год, кандидат физико-математических наук Бусарова, Дарья Алексеевна
Непараметрическое оценивание сигналов с неизвестным распределением2003 год, доктор физико-математических наук Добровидов, Александр Викторович
Список литературы диссертационного исследования кандидат наук Есаулов Даниил Михайлович, 2015 год
Литература
[1] Андерсон Т., Статистический анализ временных рядов, М.:Мир, 1976.
[2] Биллингсли П., Сходимость вероятностных мер, М.: Наука, 1977.
[3] Болднн М.В., Оценка распределения возмущений в схеме авторегрессии, Теория вероятн. и ее примен., Т. 27, №4, с. 905-910, 1982.
[4] Болдин М.В., Проверка гипотез в схемах авторегрессии критериями Колмогорова и омега-квадрат, ДАН СССР, Т. 273, №1, с. 19-22, 1983.
[5] Болдин М.В., О проверке гипотез в схеме скользящего среднего критериями Колмогорова-Смирнова и омега-квадрат, Теория вероятн. и ее примен., Т. 34, №4, с. 758-764, 1989.
[6] Болдин М.В., О последовательных остаточных эмпирических процессах в ARCH-модели, Успехи мат.наук, Т. 57, №2 , с. 185-186, 2002.
[7] Болдин М.В., Робастность знаковых тестов для гипотез о порядке авторегрессии, Теория вероятн. и ее примен., Т. 57, №4, с. 1-10, 2012.
[8] Болдин М.В., Есаулов Д.М., Остаточные эмпирические процессы и качественно робастные GM-тесты в авторегрессии, Вестн. МГУ, сер. Матем. мех., №1, с. 46-50, 2014.
[9] Болдин М.В., Симонова Г.П., Тюрин Ю.Н., Знаковый статистический анализ линейных моделей, М.: ФИЗМАТЛИТ, 1997
[10] Болдин М.В., Штуте В., О знаковых тестах в ARMA модели с возможно бесконечной дисперсией ошибок, Теория вероятн. и ее примеч., Т. 49, №3, с. 436-460, 2004.
[11] Боровков А.А., Математическая статистика, Н.:Наука, 472 е., 1984.
[12] Вязилов А.Е., Остаточная эмпирическая функция распределения в GARCH(1,1) и ее применение при проверке гипотез, Успехи мат. паук, Т. 54, с. 163-164, 1999.
[13] Вязилов А.Е., Эмпирические процессы в СА11СН(1,1)-модели и ро-бастное оценивание параметров, Успехи мат.наук, Т 56, №5, с. 179180, 2001.
[14] Есаулов Д.М., Робастность GM-тестов в авторегрессии против выбросов, Вестн. МГУ, сер. Матем. мех., №5, с. 5-9, 2011.
[15] Кендалл М., Стьюарт А., Статистические выводы и связи, М.: Наука., 899 е., 1973.
[16] Муганцева Л.А., Проверка нормальности в схемах одномерной и многомерной регрессии, Теория вероятн. и ее примем., Т. 22, №3, с. 603-614, 1977.
[17] Смирнов Н.В., О распределении w2-критерия Мизеса, Мат,ем,, сб., Т.2(44), №5, с. 973-993, 1937.
[18] Эрлих И.Г., Двухшаговые оценки типа минимального расстояния для параметров модели ARM А (1,1), В ест,п. МГУ, сер. Матем. мех., №6, с. 52-54, 2010.
[19] Bai J., Weak convergence of the sequential empirical processes of residuals in ARMA models, Ann. Statist., Vol. 22, p. 2051-2061, 1994.
[20] Boente G., Fraiman R., Yohai V.J., Qualitive Robustness for Stochastic Processes, Ann. Statist., Vol. 15, p.1293-1312, 1987.
[21] Boldin M.V., On residual empirical distribution function and rank estimators in autoregression, Math. Methods of Statist., Vol. 6, No. 1, p. 70-91, 1997.
[22] Boldin M.V., On empirical processes in heteroscedastic time series and their use for hypothesis testing and estimation, Math. Methods of Statist., Vol. 9, p. 65-89, 2000.
[23] Boldin M.V., On sequential residual empirical processes in heteroscedastic time series, Math. Methods of Statist., Vol. 11, No. 4, p. 453-464, 2002.
[24] Boldin M.V., Local robustness of sign tests in AR(1) against outliers, Math. Methods of Statist., Vol. 20, No. 1, p. 1-13, 2011.
[25] Boldin M.V., Erlikh I.G., Testing hypotheses on the "drift"of parameters in ARMA and ARCH models, Math. Methods of Statist., Vol. 18, No. 1, p.1-19, 2009.
[26] Brockwell P.J., Davis R.A., Time series analysis: Theory and methods, New York: Springer-Verlag, 1991.
[27] Bustos O.H., General M-estimates for contaminated pth-order autoregressive processes: Consistency and asymptotic normality. Robustness in autoregressive processes, Zeitschrift far Wahrscheinlichkeitstheorie und verwandte Gebiete, No. 59, p. 491504, 1982.
[28] Chow S. N., Mallet-Paret J., Yorke J. A., Finding zeroes of maps: Homotopy methods that are constructive with probability one, Math, of Comp., Vol. 32, p. 887-899, 1978.
[29] Denby L., Martin R.D., Robust estimation of the first-order autoregressive parameter, J. Amer. Statist. Assoc., Vol. 74, p. 140146, 1979.
[30] Dhar S.K., Minimum distance estimation in an additive effects outliers model, Ann. Statist., Vol. 19, No. 1, p. 205-228, 1991.
[31] Durbin J., Weak convergence of the sample distribution function when parameters are estimate, Ann. Statist., Vol. 1, No. 2, p. 279-290, 1973.
[32] Esaulov D.M., Application of residual empirical processes to robust linear hypotheses testing in autoregression, Proceedings of 10th International Conference CDAM: Theoretical and applied stochastics, Vol. 5, No. 1, p. 153-156, 2013.
[33] Esaulov D.M., Residual Empirical Processes and Their Application to GM-Testing for the Autoregression Order, Math. Methods of Statist., Vol. 22, No. 4, p. 333-349, 2013.
[34] Hajek J., Sidak Z., Sen P.K., Theory of Rank tests, 2nd ed., Academic Press, San Diego, 1999.
[35] Hall P., Heyde C. C., Martingale Limit Theory and Its Applications, Academic Press, New York, 1980.
[36] Hallin M., Ingenbleek J.-F., Puri M.L., Linear serial rank tests for randomness against ARM A alternatives, Ann. Statist., Vol. 13, No. 3, p. 1156-1181, 1985.
[37] Hallin M., Ingenbleek J.-F., Puri M.L., Linear and quadratic rank tests for randomness against serial dependence, J. Time Ser. Anal., Vol. 8, No. 4, p. 409-424, 1987.
[38] Hallin M., Puri M.L., Aligned Rank Tests for Linear Models with Autocorrelated Error Terms, J. Multivar. Anal., Vol. 50, No. 2, p. 175237, 1994.
[39] Hampel F.R., A general qualitive definition of robustness, Ann. Statist., Vol. 42, No. 6, p. 1887-1896, 1971.
[40] Hampel F.R., The influence curve and its role in robust estimation, Ann. Statist., Vol. 69, p. 383-393, 1974.
[41] Hampel F.R., Ronchetti E.M., Rousseeuw J., Stahel W.A., Robust statistics. The approach based on influence functions, N.Y.: Wiley, 1985.
[42] Heritier S., Ronchetti E., Robust bounded-influence tests in general paramteric models, J. Amer. Statist. Assoc., Vol. 89, p. 897-904, 1994.
[43] Huber P.J., Robust estimation of a location parameter, Ann. Statist., Vol. 35, p. 73-101, 1964.
[44] Huber P.J., Robust statistics, N.Y.: Wiley, 1981.
[45] Huber P.J., Minimax aspects of bounded influence regression, J. Amer. Statist. Assoc., Vol. 78, p. 66-72, 1983.
[46] Jaeckel L.A., Robust estimates of location: Symmetry and asymmetric contamination, Ann. Math. Stat., Vol. 42, p. 1020-1034, 1981.
[47] Koul H.L., Minimum distance estimation and goodness-of-fit tests in first order autoregression, Ann. Statist., Vol. 14, p. 1194-1213, 1986.
[48] Koul H.L., Weighted empiricals and linear models, IMS Lecture Notes — Monograph Series, Hayward, CA, Vol. 21, 1992.
[49] Koul H.L., Asymptotics of some estimators and sequential residual empiricals in nonlinear time series, Ann. Statist., Vol. 24, p. 380-404, 1996.
[50] Koul H.L., Levental S., Weak convergence of residual empirical process in explosive autoregression, Ann. Statist., Vol. 17, p. 1784-1794, 1989.
[51] Koul H.L., Ossiander M., Weak convergence of randomly weighted dependent residual empiricals with applications to autoregression, Ann. Statist., Vol. 22, p. 540-562, 1994.
[52] Krasker W.S., Welsch R.E., Efficient bounded influence regression estimation, J. Amer. Statist. Assoc., Vol. 77, p. 595-604, 1992.
[53] Kreiss J.-P., Testing linear hypotheses in autoregressions, Ann. Statist., Vol. 18, No. 3, p. 1470-1482, 1990.
[54] Kreiss J.-P., Estimation of the distribution function of noise in stationary processes, Metrica, Vol. 38, p. 285-297, 1991.
[55] Kunsch H., Infinitesimal Robustness For Autoregressive Processes, Ann. Statist., Vol. 12, No. 3, p. 843-863, 1984.
[56] Li B., Zamar R.H., Min-max asymptotic variance when scale is unknown, Statistics and Probability Letters, Vol. 11, p.139-145, 1991.
[57] Ling S., Weak convergence of the sequential empirical processes of residuals in nonstationary autoregressive models, Ann. Statist., Vol. 26, p. 741-754, 1998.
[58] Markatou M., Hettmansperger T.P., Robust bounded-influence tests in linear models, J. Amer. Statist. Assoc., Vol. 85, p. 180-190, 1990.
[59] Maronna R.A., Martin R.D., Yohai V.J., Robust Statistics: Theory and Methods, John Wiley and Sons, 2006
[60] Martin R.D., Robust estimation of autoregressive models, Direct. Time Ser., Haywood, CA: Institute of Mathematical Statistics, p.228-254, 1980.
[61] Martin R.D., Robust methods for time series, Applied Time Series Analysis II, New York: Academic Press, p.683-759, 1981.
[62] Martin R.D., Yohai V.J., Influence Functionals for Time Series, Ann. Statist., Vol. 14., p.781-818, 1986.
[63] Mokkadem A., Propriétés de mélange des processus autorégressifs polynomiaux Ann. Inst, H, Poincaré Probab. Statist., Vol. 26, p. 219— 260, 1990.
[64] Mukherjee K., Bai Z.D., R-estimation in Autoregression with Square-Integrable Score Function J. Multivar. Anal, Vol. 81, 167-186, 2002.
[65] Pollard D., Asymptotics for least absolute deviation regression estimators Econometric Theory, Vol. 7, 186-199, 1991.
[66] Reider H., A Robust Asymptotic Testing Model, Ann. Statist., Vol. 6, p.1080-1094, 1978.
[67] Reider H., Qualitive Robustness of Rank Tests, Ann. Statist., Vol. 10, p.205-211, 1982.
[68] Sorokin A.A., On the minimum distance estimates in ARCH model Math. Methods of Stat., Vol 13, No 3, p. 329-355, 2004.
[69] Sorokin A.A., On parameter estimation and testing hypotheses on dimension in ARCH(p) model, Math. Methods of Stat., Vol. 15, No 3, p. 327-348, 2006.
[70] Silvapulle M.J., Robust bounded influence tests against one-sided hypotheses in general parametric models, Statist, and Probab. Letters., Vol. 31, p. 45-50, 1996.
[71] Sinha S.K, Field C., Smith B., Robust estimation of nonlinear regression with autoregressive errors, Statist, and Probab. Letters., Vol. 63, p.49-59, 2002.
[72] Vyazilov A.E., Empirical processes and robust estimation of parameters of the GARCH model, Math. Methods of Stat., Vol. 12, No 2, p.231-245, 2003.
[73] Wolfowitz J., Estimation by minimum distance method, Ann. Inst. Stat. Math., Vol. 5, p.9-23, 1953.
[74] Wolfowitz J., Estimation by the minimum distance method in nonparametric stochastic difference equations, Ann. Math. Stat., Vol. 25, No 2, p.203-217, 1954.
[75] Wolfowitz J., Minimum distance estimation method, Ann. Math. Stat., Vol. 28, p.75-88, 1957.
[76] Wolfowitz J., Estimation by minimum distance method, Ann. Inst. Stat. Math., Vol. 5, p.9-23, 1953.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.