Исследование поведения остатков линейной по параметрам полиномиальной регрессионной модели тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат физико-математических наук Пономарчук, Юлия Викторовна

  • Пономарчук, Юлия Викторовна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2005, Комсомольск-на-Амуре
  • Специальность ВАК РФ05.13.18
  • Количество страниц 102
Пономарчук, Юлия Викторовна. Исследование поведения остатков линейной по параметрам полиномиальной регрессионной модели: дис. кандидат физико-математических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Комсомольск-на-Амуре. 2005. 102 с.

Оглавление диссертации кандидат физико-математических наук Пономарчук, Юлия Викторовна

Введение.

1 Анализ литературных данных.

• 1.1 Задачи, в решении которых используются графики остатков.

1.1.1 Проверка адекватности модели данным.

1.1.2 Проверка предположений об ошибках.

1.1.3 Выявление промахов.

1.2 Виды графиков остатков.

2 Коэффициент корреляции между остатками несмещенной, линейной по параметрам регрессионной модели.

2.1 Общие сведения о коэффициенте корреляции.

2.2 Вычисление коэффициента корреляции между остатками.

2.3 Влияние корреляции на поведение остатков.

3 Исследование интервала для серии остатков, полученных по одной серии измерений. ф 3.1 Формула интервала для серии остатков.

3.2 Сравнение точного интервала с t-интервалом для остатков.

4 Проблема обнаружения промахов.

5 Плотность распределения стьюдентизированных остатков регрессионной модели, полученных по одной серии измерений.

5.1 Вывод общей формулы функции плотности распределения стьюдентизированных остатков регрессионной модели, полученных по одной серии измерений. 5.2 Частные случаи функции плотности распределения стьюдентизированных остатков.

6 Описание алгоритмов программ.

6.1 Сравнение возможностей предлагаемых программ и существующих пакетов обработки данных.

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование поведения остатков линейной по параметрам полиномиальной регрессионной модели»

Актуальность темы. Задача обработки данных технического или естественнонаучного эксперимента очень часто заключается в подборе функциональной зависимости между двумя группами переменных, принимающих числовые значения х-,, х2, ., хп и y1t у2, ., ут, которые можно объединить в векторы х, у. Одна из переменных, х - независима и неслучайна, известна точно и влияет на значения второй, у. В литературе, например, в [1], значения xh i = 1,n независимой переменной (аргумента), в которых проводятся измерения, называют узлами, а значения зависимой (отклика) значения ук, к = 1,т - опытными значениями, зависящими от Xj.

Таким образом, исходными данными являются пары значений (xj, уj), i = 1,п, которые являются результатами измерений. В общем случае число узлов может отличаться от числа откликов, так как измерения могут проводиться несколько раз в одном и том же узле, т.е. n < т.

Будем предполагать, что наблюдаемые (опытные) значения отклика являются суммой значения какой-либо функции в узле и значения некоторой случайной величины s:

У( =f(xj)+Si, i = 1,п. (1)

При этом, согласно [1], случайное слагаемое в, отражает либо присущую отклику изменчивость, либо влияние на него одного или нескольких неучтенных факторов, либо то и другое вместе. Случайную величину s называют ошибкой эксперимента, подразумевая несовершенство метода измерения у, что может включать в себя недостаточную точность измерительных устройств, сбой аппаратуры, ошибки оператора и подобные этим причины.

В классическом регрессионном анализе предполагается, что: а) все опыты проводятся независимо друг от друга, т.е. случайное слагаемое в одном опыте не влияет на результат другого опыта; б) случайные составляющие принадлежат к одному распределению с конечной дисперсией.

Далее мы должны определить семейство моделей f(х,в), предполагая, что оно является параметрическим, где 0 е 0 - вектор-параметр семейства, и функция f(x,§) линейно зависит от параметра 0. Тогда соотношение (1) можно представить в следующем виде:

У( =f(Xj, 0)+ 8j, i = 1, n.

Отсюда типичная задача линейного регрессионного анализа - восстановление зависимости у от х при сделанных выше предположениях, эквивалентна поиску оценки параметра 0 (0) по исходным данным х|, у,), i = 1,n. Знание 0 позволяет предсказывать значение отклика по заданному значению фактора.

Решение такой задачи не будет полным без использования методов математической и прикладной статистики, которые широко применяются в современной инженерной практике. При этом инженерам нужны по возможности простые и наглядные, но достаточно строгие и правильные решения и рекомендации. Можно сказать, что наибольшей популярностью в анализе данных пользуется графический метод.

Во многих случаях построение различного рода графиков и диаграмм оказывается весьма эффективным средством исследования [2-5]. Известный статистик Дж.Тьюки посвятил построению различных графиков и диаграмм книгу объемом около 700 страниц [2]! Уместно также привести высказывание другого крупного статистика Дж.Себера: «Представляется., что графики являются более информативными, чем соответствующие им критерии, так что построение критериев после построения графиков может оказаться и не нужным. С другой стороны, требуется достаточное мастерство в интерпретации графиков» [3, с. 168].

Графические методы важны как в предварительном анализе данных, так и в представлении окончательных выводов. Графический анализ помогает также и при интерпретации [4, 6].

Когда графические методы используются на стадии предварительного анализа, точная форма выбираемого расположения решающего значения не имеет. Например, в качестве минимального предварительного анализа данных можно рассматривать график точек (xh У|) [6]. Как правило, такой анализ указывает, например, целесообразно ли какое-нибудь преобразование переменных до анализа в терминах модели или существуют ли изолированные резко выделяющиеся наблюдения, для включения или исключения которых необходимы специальные исследования. После анализа данных в предположении справедливости модели необходимо вычислить остаточные разности, то есть разности между наблюденными значениями и значениями, оцененными на основе модели. Далее, численный или графический анализ этих остатков может дать возможность предложить другое семейство моделей. Исходное семейство может оказаться слишком сложным, и, возможно, есть надежда перейти к более простому семейству, содержащему, например, значительно меньше неизвестных параметров.

С другой стороны, при заключительном представлении выводов желательно тщательное соблюдение формата графиков. При этом в [4] предлагается придерживаться следующих рекомендаций: на осях должны быть четко обозначены названия переменных и единиц измерения; должны использоваться разрывы осей для обозначения «искусственного» начала координат; сравнение сходных программ нужно облегчить, используя, например, идентичные шкалы для их представления и располагая сходные диаграммы на одной и той же странице или развороте страниц; ф — шкалы нужно выбирать так, чтобы точные и приближенно линейные

Ч' зависимости рисовались бы приблизительно под углом 45° к координатным осям; надписи должны, насколько это возможно, превращать диаграммы в почти не требующий дополнительных разъяснений материал анализа, то есть, независимый от текста; на интерпретацию не должна влиять техника представления результатов; на один график не следует помещать слишком много информации: нанесением ли слишком большого числа точек или сопровождением чрезмерно обширной дополнительной информацией.

В задачах обработки экспериментальных данных наряду с графическими методами широко используются и методы, основанные на количественных характеристиках величин. Поэтому работа посвящена не только анализу графиков и диаграмм, но и исследованию существующих и разработке новых критериев, которые можно применить в исследовании поведения остатков.

Регрессионный анализ считается неполным без анализа остатков ej построенной регрессионной модели (эмпирической зависимости), т.е. раз

• ностей значений отклика у, и значений эмпирической зависимости у(х}) здесь и далее у(х) = f(x, в)) в каждом узле xji ei = У\~ y(xi )• (2)

В литературе (например, в [7], [8] (ссылка по [7])) также рассматриваются так называемые «стьюдентизированные» (dj) и «шкалированные» (Cj) в- в- в- -остатки: dj = , ' Cj = ' -= '-, где D(ej) - оценка диспер

VD(ei) рср(е) о2П-р

V р п сии обычного остатка a Dcp(e) - средняя по всем узлам оценка дисперсии остатков, Sp - оценка дисперсии опытных данных (остаточная дисперсия), р - число параметров модели.

С помощью анализа остатков решаются следующие задачи: адекватна ли модель опытным данным; верны ли предположения об ошибках (например, независимы ли они, распределены ли нормально и т.д.); есть ли среди обрабатываемых данных промахи (измерения, содержащие грубую ошибку).

Здесь же необходимо отметить, что остатки представляют своего рода «оценку» случайных ошибок.

Хотя классический регрессионный анализ считается завершенной конструкцией и исследованию остатков посвящено множество работ известных статистиков Дж. Тьюки, Дж. Анскомба, Н. Дрейпера, Г. Смита, Дж. Се-бера, Дж. Элленберга и других, в базовых положениях о поведении остатков нет четкости и математической строгости, встречаются такие слова, как «вероятно», «с большой долей вероятности», «по-видимому».

Так, известно, что остатки распределены нормально в каждом узле, но в совокупности не являются выборкой (совокупностью независимых, одинаково распределенных случайных величин), т.к. они коррелированны между собой, и дисперсии в каждом отдельном узле неодинаковы. Однако поскольку считается, что при большом числе узлов корреляция между остатками слаба, и дисперсии остатков «практически» равны, то к ним можно относиться, как к выборке, и, следовательно, к совокупности остатков можно применять выборочные методы исследования. Таким образом, учитывать ли особенности поведения остатков должен решать сам исследователь, что при отсутствии соответствующего опыта, скорее всего, приведет к ошибочным выводам.

Автором проанализировано влияние корреляции между остатками на их поведение, с целью дать практически реализуемые рекомендации для решения вышеупомянутых задач.

Постановка задачи. Оставаясь в рамках классического регрессионного анализа, уточним статистическую задачу, которая будет рассматриваться в работе. Пусть задан массив пар значений (х,,у,), i = 1, 2,., п. Значения аргумента xf известны точно, а значения отклика yj содержат только случайные ошибки: =У|-Уо(х|). (3) т.е. У| = y0(xj)+ 6j, где y0(xj) - истинное значение в узле х,.

Относительно ошибок Sj предположим, что они подчиняются схеме Гаусса-Маркова: а) центрированы, т.е. их математическое ожидание равно нулю, М(е,) = 0; б) гомоскедастичны, т.е. данные yj равноточны, их дисперсии в разных узлах одинаковы, D(y,) = D(sj) = а2; в) ошибки в разных узлах некоррелированы, т.е. cov(sj,8k) = 0, i^k и распределены нормально.

Относительно неизвестной истинной зависимости у0(х) сделаем общепринятые предположения: а) истинная зависимость существует в виде непрерывной дифференцируемой функции во всем диапазоне изменения аргумента, т.е. у0(х)еС1[х1, хп]; б)она представима в виде

Уо(х) - Zajfj(x)> (4) j=i где aj - неизвестные истинные параметры, число которых р0 полагается известным, a fj(х) - известные функции (базисные функции).

Иными словами, истинная зависимость представима в виде линейной комбинации базисных функций. В случае метода наименьших квадратов чаще всего применяют модель полиномиального вида у0(х) = Р(х) = а0 + а-|Х + . + amxm, где коэффициенты а0, а-,,. ат подлежат оценке методом наименьших квадратов [9]. Обычно говорится, что если на самом деле верна другая модель у0(х) = д(х), где непрерывная на отрезке функция д(х) отлична от многочлена, то можно воспользоваться теоремой Вейерштрасса (например, [10]), в силу которой функцию д(х) можно приблизить многочленом Р(х) с любой точностью. Но ссылка на теорему Вейерштрасса здесь не совсем уместна, потому что любая непрерывная функция согласно этой теореме может быть приближена многочленом достаточно высокой степени. На практике, однако, степень m многочлена Р(х) стараются выбирать не высокой, а низкой. Действительно, если п - число экспериментальных точек, то многочлен степени (п -1) пройдет через все точки (хь y-J (х2> у2), ••• ,(хт уп). включив тем самым случайные ошибки s-,, s2,., еп. Авторы [11] отмечают, что «при ограниченных объемах выборки . с увеличением сложности модели . точность оценивания падает». Таким образом, многочлен более высокой степени оказывается дальше от истины, чем многочлен более низкой степени.

В рамках сделанных выше предположений регрессионную модель истинной зависимости (4) естественно записать в виде

9(x) = iajfj(x)J (5) j=i где неизвестные коэффициенты находят по массиву данных (х|, у|) , i = 1, 2,., п методом наименьших квадратов, а число р определяют с помощью статистических критериев.

В работе в качестве базисных функций fj(x) использовались ортонормированные на системе узлов базисные функции \|/j(x), такие, что

V Л, W \ [0 при j ^ I l4'j(XiVi(Xi)= , . (6)

М J [1 при J = I

В качестве \|/j(x) в работе были использованы ортонормированные полиномы Чебышева дискретного переменного. Этот выбор был сделан по рекомендации авторов [10 - 14]. Был реализован следующий метод: сначала были построены ортогональные полиномы Чебышева h(x) = 1, ф2 = х-х. Далее полиномы строились по следующей рекуррентной формуле: h(x) = x'-1-Zi=L--фк(х), к=1 1Фк2М i=l

1 п где х = -£х, - среднее значение по узлам, j = 3, р. Затем проводилась П их нормировка:

VjW = т==' J =РhfM i=1

Таким образом, мы вместо модели (5) будем рассматривать модель р y(x)=y>j\|/j(x), (7) j=i где ©j =Zyill/j(xi) " МНК-оценки некоторых преобразованных к ортонорi=1 мированному базису истинных параметров со,.

Использование ортонормированных полиномов дает существенные преимущества: резко упрощаются вычисления; результаты приобретают наглядность; МНК-оценки параметров coj в (7) оказываются статистически независимыми и распределенными (при сделанных выше предположениях об ошибках) по закону N(c0j,a2) и т.д. [15-17].

Такое преобразование модели всегда возможно, если выполняется первое предположение об истинной зависимости у0(х). Если исходная модель является полиномом (а это наиболее распространенный на практике случай), то и число р в моделях (5) и (7) совпадает. Более подробно проблема выбора числа параметров модели будет затронута ниже.

Итак, задача будет состоять в анализе поведения остатков при разном числе параметров р, построении и исследовании интервала для остатков, полученных по одной серии измерений, выводе формулы коэффициента корреляции между остатками в произвольных узлах, выводе выражений для плотности распределения остатков при разных числах степеней свободы, написании программ для вычисления коэффициента корреляции, остатков и интервалов для них.

Таким образом, работа посвящена стохастическому моделированию [18], где неизвестные факторы - ошибки Sj, являются случайными величинами, для которых известны вид функции распределения и математическое ожидание.

Цель работы. Целью диссертационной работы является исследование существующих и разработка новых методов анализа остатков, изучение интервала для остатков, полученных по одной серии измерений, вывод формулы коэффициента корреляции между остатками в произвольных узлах, вывод выражений для плотности распределения стьюдентизирован-ных остатков при разных числах степеней свободы, написание программ для вычисления коэффициента корреляции между остатками, остатков и

12 интервалов для них, а также исследование возможности применения полученных результатов в процессе обработки данных методом регрессионного анализа.

Объектом исследования являются проблемы, распространенные в практике регрессионного анализа, а именно в анализе остатков, связанные с тем, что совокупность остатков - это система коррелированных случайных величин.

Предмет исследования - поведение остатков полиномиальной регрессионной модели, полученных по одной серии измерений, с изменением числа степеней свободы остаточной дисперсии регрессионной модели (число степеней свободы равно n-р, где п - число узлов, р - число параметров).

Методика исследования. При решении поставленных задач были использованы методы математической статистики, а также математический эксперимент. Теоретические выкладки были проиллюстрированы методом математического эксперимента: сгенерированные непосредственно компьютером данные для обработки затем были исследованы согласно положениям регрессионного анализа и анализа остатков. В процессе реализации метода регрессионного анализа данных был применен метод наименьших квадратов (МНК) с использованием ортогональных и ортонорми-рованных полиномов Чебышева. Графический метод был использован непосредственно в анализе остатков.

Автор выносит на защиту следующие положения и результаты: выведенная формула для вычисления коэффициента корреляции остатков несмещенной линейной по параметрам полиномиальной регрессионной модели, использующая ортонормированные полиномы Чебышева; исследование интервалов для остатков регрессионной модели, полученных по одной серии измерений, сравнение их с широко известными t-интервалами; рекомендации для решения проблемы выявления промахов по графикам остатков с учетом их коррелированности; выведенная общая формула для функции плотности распределения стьюдентизированных остатков, полученных по одной серии измерений, зависящая от числа степеней свободы остаточной дисперсии, а также иллюстрация ее частных случаев для малых чисел степеней свободы; варианты программной реализации теоретических результатов в задаче регрессионного анализа экспериментальных данных, зарегистрированные во Всероссийском научно-техническом информационном центре [19-20], а также их сравнение с уже существующими алгоритмами, реализованными в программных пакетах обработки данных SPSS и StatSoft Statistica.

Структура и объем диссертации. Диссертации состоит из введения, шести глав, заключения и двух приложений, иллюстрированных рисунками, таблицами и графиками. Библиографический список включает 56 наименований.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Пономарчук, Юлия Викторовна

ЗАКЛЮЧЕНИЕ

В результате выполненной работы был сделан аналитический обзор литературы по заданной теме, позволивший сформулировать задачи исследования, получены и проанализированы новые данные, относящиеся к исследованию остатков. В работе остатки рассматриваются как система коррелированных случайных величин, распределенных нормально с математическим ожиданием 0 и различной дисперсией в разных узлах, в отличие от широко распространенного подхода к ним как к выборке. Исходя из этого, автору удалось получить результаты, уточняющие некоторые положения теории регрессионного анализа, помогающие понять поведение остатков, а следовательно, и применять полученные знания в инженерной практике, анализе технических и естественнонаучных экспериментов, а также в математической статистике при уточнении известных и разработке новых статистических методов анализа.

Подведем итоги выполненных исследований.

1. Предложенная формула для вычисления коэффициента корреляции между остатками несмещенной линейной по параметрам полиномиальной регрессионной модели позволяет исследователю оценить зависимость остатков до проведения эксперимента. Следовательно, экспериментатор может планировать опыт с целью уменьшения корреляции остатков, что в свою очередь, даст возможность сделать более правильные выводы об адекватности модели данным, существовании промахов среди измерений, истинности предположений об ошибках.

Важным следствием из этой формулы является вывод о том, что для выборки (р = 1, v|/-|(Xj) = -p=) коэффициент корреляции для выборочных л/П остатков равен--, где п - объем выборки. Это ставит под сомнение п-1 принятое в метрологической практике правило считать многократные измерения при п > 4, т.к. р(в|, ек) = -0.33(3).

2. В работе исследованы точные выражения для интервалов для остатков регрессионной модели. Отмечено, что остатки (в одной серии измерений) не имеют t-распределения, как считалось до сих пор. Причем распределение стьюдентизированных остатков, полученных в одной серии измерений, зависит от числа степеней свободы остаточной дисперсии. Подтверждено, что с ростом v распределение стьюдентизированных остатков стремится к стандартному нормальному распределению.

3. Разработанная процедура выявления промахов в совокупности остатков при малых числах степеней свободы остаточной дисперсии, учитывающая их корреляцию между собой и различные дисперсии в разных узлах, использует не только точные интервалы для остатков, но и значения коэффициента корреляции, предлагает цензурирование выборки наблюдений и последующую обработку данных без наблюдения, соответствующего подозрительному остатку.

4. Выведенная функция плотности вероятности стьюдентизированных остатков, полученных по единственной серии измерений, позволяет узнать их распределение даже до проведения эксперимента (если можно предположить число параметров модели). Следовательно, исследователь, зная закон распределения, сможет более точно анализировать их поведение.

5. Разработана и зарегистрирована во ВНТИЦ [19] программа вычисления коэффициента корреляции остатков несмещенной полиномиальной регрессионной модели, линейной по параметрам.

6. Разработана и зарегистрирована во ВНТИЦ [20] программа обработки опытных данных методом регрессионного анализа с построением эмпирической зависимости полиномиального вида, линейной по параметрам, вычислением остатков и построением интервалов для них, вычислением коэффициента корреляции между остатками и построением совместных доверительных интервалов Бонферрони для истинной зависимости.

Результаты проведенных исследований позволяют более точно анализировать экспериментальные данные, а также дают направления дальнейшего изучения этого раздела регрессионного анализа. Наиболее важными из них являются: более точное оценивание погрешности эмпирической зависимости, ограничение степени полинома сверху и разработка более строгой процедуры проверки на промахи, разработка методов анализа остатков для случая, когда ошибки не имеют нормального распределения.

Научная новизна исследования. Новым результатом является формула для коэффициента корреляции между остатками для несмещенной линейной по параметрам регрессионной модели с использованием ортонорми-рованных полиномов для дискретного переменного. Показано, что модуль коэффициента корреляции принимает наибольшие значения между остатками, находящимися в крайних узлах диапазона изменения аргумента.

Важным результатом представляется зависимость коэффициента корреляции от числа степеней свободы остаточной дисперсии (чем больше число степеней свободы, тем меньше коэффициент корреляции между остатками). На основе данных работы Г.А. Иванова и И.А. Кривошеева [41] в диссертации развернуто показано и проиллюстрировано методом математического эксперимента преимущество точных интервалов для остатков перед широко распространенными t-интервалами.

Впервые получена общая формула для функции плотности распределения стьюдентизированных остатков, вычисленных по одной серии измерений, а особенно важным результатом представляется зависимость данной функции от числа степеней свободы остаточной дисперсии. При этом под одной серией измерений понимается совокупность данных, обрабатываемых совместно.

Предложенная процедура выявления промахов в совокупности остатков, позволяет обнаруживать их ниже уровня шумов на графике остатков.

Теоретическая значимость. В отличие от общепринятого подхода к остаткам как к выборке, подход к остаткам как к системе коррелированных случайных величин представляется новым. Кроме того, использование ор-тонормированных полиномов Чебышева позволяет значительно упростить и сократить теоретические выкладки, что, безусловно, удобно для использования на практике, а также для дальнейших исследований. В работе приведена формула коэффициента корреляции между остатками, что позволяет оценить зависимость этих величин. Математически доказано, что точный интервал для серии остатков уже, чем t-интервал, особенно при относительно малых числах степеней свободы. С математической точностью показано, что распределение стьюдетизированных остатков стремится к нормальному с увеличением числа степеней свободы остаточной дисперсии. Также теоретически значимой представляется общая формула плотности распределения стьюдентизированных остатков, полученных по одной серии измерений.

Практическая значимость. Несмотря на то, что использование орто-нормированных полиномов для дискретного переменного известно в регрессионном анализе, общепринятыми являются вычисления с помощью методов матричной алгебры. Однако применение ортонормированных полиномов позволило значительно упростить и сократить теоретические выкладки. Полученная формула коэффициента корреляции между остатками дает возможность исследователю оценить меру зависимости этих величин до проведения эксперимента, следовательно, данный результат может быть применен на стадии планирования опыта с целью уменьшить корреляцию остатков. Важным следствием из формулы коэффициента корреляции является вывод о том, что для выборки (число параметров модели равно 1) коэффициент корреляции для выборочных остатков равен 1

--, где п - объем выборки. Это ставит под сомнение принятое в метп-1 рологической практике правило считать многократными измерения при п > 4, т.к. р(е,, ек) =-0.33(3).

Поскольку рассмотренный точный интервал для серии остатков уже, чем широко известный t-интервал, он позволяет эффективнее выявлять промахи среди остатков даже при достаточно сильной корреляции. Автором разработана приемлемая процедура выявления промахов в совокупности остатков, учитывающая их коррелированность между собой.

Все полученные результаты сопровождаются программными реализациями в математическом пакете прикладных программ Maple 8.0 (вычисление коэффициента корреляции между остатками линейной по параметрам, несмещенной полиномиальной регрессионной модели, построение линейной по параметрам полиномиальной регрессионной модели, вычисление остатков и построение интервалов для них, построение совместных доверительных интервалов Бонферрони для истинной зависимости).

Полученные результаты публиковались в журналах, сборниках трудов, сборниках тезисов докладов региональных и международных конференций [19-20, 52-56], внедрены в научную и инженерную практику ФГУП ВНИИФТИ «Дальстандарт» и используются при обработке результатов совместных измерений и решении других метрологических задач.

Список литературы диссертационного исследования кандидат физико-математических наук Пономарчук, Юлия Викторовна, 2005 год

1. Тюрин Ю.Н. Анализ данных на компьютере / Ю.Н. Тюрин,

2. А.А. Макаров; Под ред. В.Э. Фигурнова. М.: ИНФРА-М, 2003. - 544 с.

3. Тьюки Дж. Анализ результатов наблюдений / Дж. Тьюки. М.: Мир, 1981.-693 с.

4. Себер Дж. Линейный регрессионный анализ / Дж. Себер. М.: Мир, 1980.-456 с.

5. Кокс Д.Р. Прикладная статистика: Принципы и примеры / Д.Р. Кокс, Э.Дж. Снелл; Перевод с англ. Е.В. Чепурина; Под ред. Ю.К. Беляева. М.: Мир, 1984.-200 с.

6. Мелник М. Основы прикладной статистики / М. Мелник; Перевод с англ. Л.А. Клименко, В.В. Манахина; Под ред. Г.Г. Пирогова. М.: Энерго-атомиздат, 1983. -414 с.

7. Кокс Д.Р. Теоретическая статистика / Д.Р. Кокс, Д.В. Хинкли; Перевод с англ. Е.В. Чепурина; Под ред. Ю.К. Беляева. М.: Мир, 1978. - 560 с.

8. Дрейпер Н. Прикладной регрессионный анализ. Кн. 1 / Н. Дрейпер, Г. Смит; Перевод с англ. М.: Финансы и статистика, 1986. - 366 с.

9. Behnken D.W. Residuals and Their Variance Patterns / D.W. Behnken, N.R. Draper//Technometrics. 1972. - 14. - P. 101-111.

10. Тутубалин B.H. Статистическая обработка результатов наблюдений. / B.H. Тутубалин. М.: Знание, 1973. - 64 с.

11. Демидович Б.П. Численные методы анализа. Приближение функций, дифференциальные и интегральные уравнения / Б.П. Демидович, И.А. Марон, Э.З. Шувалова. М.: Наука, 1967. - 368 с.

12. Айвазян С.А. Прикладная статистика: Исследование зависимостей: Справ, изд. / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин; Под ред. С.А. Айвазяна. М.: Финансы и статистика, 1985. - 487 с.

13. Лебедев В.И. Функциональный анализ и вычислительная математика.: Учебное пособие / В.И. Лебедев. М.: ФИЗМАТЛИТ, 2000. - 296 с.

14. Гмурман В.Е. Теория вероятностей и математическая статистика / В.Е. Гмурман. М.: Высшая школа, 1997.

15. Хазанова Л.Э. Математическое моделирование в экономике / Л.Э. Хазанова. М.: Издательство БЕК, 1998. - 141 с.

16. Инвентарный номер ВНТИЦ 50200501154. Программа расчета коэффициента корреляции между остатками несмещенной линейной по параметрам полиномиальной регрессионной модели / Ю.В. Пономарчук. -2005.

17. Инвентарный номер ВНТИЦ 50200501153. Программа обработки ф данных методом регрессионного анализа / Ю.В. Пономарчук. 2005.

18. Levine J.H. Introduction to Data Analysis: The Rules of Evidence / J.H. Levine, T.B. Roos. Dartmouth: Dartmouth College, http://www.dartmouth.edu/ ~mss/data analysis/index.html - 1997.

19. NIST/SEMATECH e-Handbook of Statistical Methods. National1.stitute of Standards and Technology, Technology Administration, US Department of Commerce, http://www.itl.nist.gov/div898/handbook/ 2003.

20. Новицкий П.В. Оценка погрешностей результатов измерений / П.В. Новицкий, И.А. Зограф. П.: Энергоатомиздат, Ленингр. отд-ние, 1985.-248 с.

21. Джонсон Н. Статистика и планирование эксперимента в технике и науке: Методы планирования и эксперимента / Н. Джонсон, Ф. Лион; Перевод с англ.; Под ред. Э.К. Лецкого, Е.В. Марковой. М.: Мир, 1981. - 516 с.

22. Бикел П.Дж. Математическая статистика / П.Дж. Бикел, К. Доксам; Перевод с англ. Ю.А. Данилова. М.: Финансы и статистика, 1983. - 278 с.

23. Р 50.2.004 2000. Определение характеристик математических моделей зависимостей между физическими величинами при решении измерительных задач. Государственная система обеспечения единства измерений. - М.: Госстандарт России, 2000. - 12 с.

24. Справочник по прикладной статистике. Т.1 / Перевод с англ.; Под ред. Э.Ллойда, У.Ледермана, Ю.Н.Тюрина. М.: Финансы и статистика, 1989.-508 с.

25. Вучков И. Прикладной линейный регрессионный анализ / И. Вучков, Л. Бояджиева, Е. Солаков; Перевод с болг. и предисл. Ю.П. Адлера. М.: Финансы и статистика, 1987. - 238 с.

26. Anscombe F.J. The Examination and Analysis of Residuals / F.J. Anscombe, J.W. Tukey. //Technometrics. 1963. - 5. - P. 141-160.

27. Шеффе Г. Дисперсионный анализ / Г. Шеффе; Перевод с англ. Б.А. Севастьянова и В.П. Чистякова. М: Наука, 1980. - 512 с.

28. Иванов Г.А.[ Робастный критерий проверки однородности двух негауссовых выборок относительно дисперсий /|Г.А. Иванов), Ю.В. Пономарчук, Ю.Р. Чашкин // Измерительная техника. 2005. - № 2. - С. 9-12.

29. Иванов Г.А.| Статистические процедуры применения приближенного критерия равенства дисперсий при неизвестных эксцессах распределений

30. Г.А. Иванов!, Ю.В. Пономарчук, Ю.Р. Чашкин // Измерительная техника. -2005. -№ 4. -С. 7-10.

31. Anscombe F.J. Rejection of Outliers / F.J. Anscombe. // Technometrics. 1960.-2.-P. 123-147.

32. Osborne J.W. The power of outliers (and why researchers should always ф check for them) / J.W. Osborne, A. Overbay // Practical Assessment, ResearchV

33. Evaluation. 2004. - v. 9. - № 6.

34. Stefansky W. Rejecting Outliers in Factorial Designs / W. Stefansky // Technometrics. 1972. - 14. - P. 469-479.

35. Пустыльник Е.И. Статистические методы анализа и обработки наблюдений / Е.И. Пустыльник. М.: Наука, 1968. - 288 с.

36. Боровков А.А. Теория вероятностей / А.А. Боровков. М.: «Наука», 1976.-352 с.

37. Крамер Г. Математические методы статистики / Г. Крамер. М.:• Мир, 1975.-648 с.

38. Кендалл М. Статистические выводы и связи / М. Кендалл, А. Стьюарт. М.: Наука, 1973. - 890 с.

39. Иванов Г.А. Статистические методы обработки экспериментальных данных при восстановлении зависимости. / Г.А. Иванов, И.А. Кривошеев.ф Владивосток: Дальнаука, 1998. 133 с.

40. Уилкс С. Математическая статистика / С. Уилкс. М.: Мир, 1967. -632 с.

41. Худсон Д. Статистика для физиков / Д. Худсон. М.: Мир, 1970.v. 296 с.

42. Hawkins D.M. Identification of outliers / D.M. Hawkins. London: Chapman and Hall. - 1980.

43. Dixon W. J. Analysis of extreme values / W.J. Dixon // Annals of Mathematical Statistics. 1950. - 21. - P. 488-506.

44. Wainer H. Robust statistics: A survey and some prescriptions /ф H. Wainer // Journal of Educational Statistics. 1976. - 1 (4). - P.285-312.v .

45. Большев Л.Н. Таблицы математической статистики / Л.Н. Большев, Н.В. Смирнов. М.: Наука, 1983.-416 с.

46. Максимей И.В. Математическое моделирование больших систем / И.В. Максимей. Мн.: Высшая школа, 1985. - 119 с.

47. Клепиков Н.П. Анализ и планирование экспериментов методом мак-Y симума правдоподобия / Н.П. Клепиков, С.Н. Соколов. М.: Наука, 1964.184 с.

48. Пономарчук Ю.В. Восстановление зависимостей методом наименьших квадратов (регрессионный анализ) / Ю.В. Пономарчук // Материалы региональной научной конференции «Молодежь и научно-технический прогресс». Владивосток: Изд-во ДВГТУ, 2000. - С. 73-75.

49. Ponomarchuk Yu.V. On the behavior of remainders of linear regression ~r. model with increase of number of it's parameters / Yu.V. Ponomarchuk,

50. Yu.R. Chashkin // Proceedings and Abstracts of 2001 Far-Eastern School

51. Seminar on Mathematical Modeling and Numerical Analysis (FESS-MMNA'01). -Хабаровск: Изд-во ДВГУПС, 2001.-С. 129-130.

52. Пономарчук Ю.В. О проблеме обнаружения промахов по графикам остатков / Ю.В. Пономарчук, Ю.Р. Чашкин // Труды 60-ой региональной научно-практической конф. творческой молодежи 10-11 апреля 2002 г. Хабаровск: изд-во ДВГУПС, 2002. - Т. 2. - С. 209-211.

53. Иванов Г.А. Плотность распределения стьюдентизированных остатков регрессионной модели, полученных по одной серии измерений / Г.А. Иванов, Ю.В. Пономарчук, Ю.Р. Чашкин // Метрология. 2002. - № 11. -С. 3-10.т

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.