Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Гетманская, Ирина Васильевна

  • Гетманская, Ирина Васильевна
  • кандидат технических науккандидат технических наук
  • 2009, Красноярск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 121
Гетманская, Ирина Васильевна. Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Красноярск. 2009. 121 с.

Оглавление диссертации кандидат технических наук Гетманская, Ирина Васильевна

ВВЕДЕНИЕ.

ГЛАВА 1. ИТЕРАЦИОННОЕ МИНИМАЛЬНО КОНТРАСТНОЕ ОЦЕНИВАНИЕ РЕГРЕССИОННОГО КОЭФФИЦИЕНТА.

1.1. Постановка задачи.

1.2. Весовая функция регрессии.

1.3. Наблюдаемые значения регрессионного коэффициента.

1.4. Рекуррентная формула оценивания регрессионного коэффициента.

Выводы.

ГЛАВА 2. ОПТИМИЗАЦИЯ МИНИМАЛЬНО КОНТРАСТНОГО ОЦЕНИВАНИЯ РЕГРЕССИОННОГО КОЭФФИЦИЕНТА.

2.1. Начальное приближение.

2.2. Условие окончания итерационного процесса.

2.3. Погрешность оценки.

2.4. Условия оптимальности оценивания.

Выводы.

ГЛАВА 3. АЛГОРИТМ ИТЕРАЦИОННОГО МИНИМАЛЬНО КОНТРАСТНОГО ОЦЕНИВАНИЯ НЕЛИНЕЙНОЙ ОДНОПАРАМЕТРИЧЕСКОЙ ПАРНОЙ РЕГРЕССИИ.

3.1. Алгоритм оптимизации минимально контрастного оценивания регрессионного коэффициента нелинейной парной регрессии.

3.2. итерационный процесс минимально контрастного оценивания регрессионного коэффициента.

3.3. отыскание прогнозируемой погрешности минимально контрастной оценки регрессионного коэффициента.

3.4. моделирование исходных данных численного эксперимента оценивания.

Выводы.

ГЛАВА 4. СРАВНЕНИЕ РЕЗУЛЬТАТОВ ИТЕРАЦИОННОГО МИНИМАЛЬНО КОНТРАСТНОГО И КЛАССИЧЕСКИХ МЕТОДОВ ОЦЕНИВАНИЯ НЕЛИНЕЙНЫХ ОДНОПАРАМЕТРИЧЕСКИХ ПАРНЫХ РЕГРЕССИЙ.

Гаусса.

4.3. Сравненрш с результатами оценивания методом Марквардта

4.4. Итерационное минимально контрастное оценивание параметров полупроводников и сравнение его результатов с оценками метода конфлюентного анализа.

Выводы.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Оптимизация минимально контрастного оценивания нелинейной однопараметрической парной регрессии»

Актуальность работы. Научно — технический прогресс в его современном состоянии всеобщей компьютеризации характеризуется проникновением во все сферы деятельности человека наукоёмких технологий, что обусловливает для их создания и совершенствования широкое применение математических методов. Многие технологии связаны с обработкой и интерпретацией исходных данных, что, как правило, осуществляется решением обратных задач, в частности, восстановлением неизвестных параметров состояния объекта исследования по данным о его состоянии. Для решения обратной задачи необходима математическая модель состояния объекта исследования, являющаяся лишь некоторым приближением её к реальности.

Например, в технологиях локальной диагностики материалов промышленной опто и микроэлектроники используются модели жёсткого электромагнитного излучения, возникшего в результате взаимодействия заряженных частиц с объектами исследования. На их основе строятся методы микроанализа: определение локальных параметров материала по регистрируемым сигналам интенсивности электромагнитного излучения образца. Так, в работах [1, 2] совершенствуются модели катодолюминес-центного излучения полупроводников.

В технологиях спутникового зондирования для прогнозирования глобальных и региональных изменений природной среды, применяются сложные модели геофизических, биохимических, климатических процессов. Например, объём биомассы растительности на поверхности суши или содержание хлорофилла в водоёмах по их спектральным образам предназначены сложные модели состояния природных экосистем [3].

Для прогнозирования социальных и социально-экономических явлений применяются сложные модели их состояний [4]. Так, количественные закономерности строения и функционирования социума и социально -экономических систем позволяют определить параметры его равновесия, дестабилизации и развития.

В геофизических исследованиях, несмотря на большую сложность, моделей интенсивности магнитного и гравиметрического полей в зависимости от параметров местоположения руды [5], они применяются для оценки параметров местоположения руды по данным аэрофотосъёмки [6].

В ядерной физике используются модели, описывающие ядерную структуру или межъядерные силы с помощью уравнений квантовой механики [7].

В рамках данной работы нет необходимости в освещении всего многообразия существующих моделей.

Надо иметь в виду, что математическая модель является лишь некоторым приближением её к реальности. Простая модель может не отражать важные особенности объекта. Ещё с работ Николая Кузанского (XV век) в гносеологии считается, что реальность сложнее сколь угодно сложной модели [8].

Результат решения обратной задачи в первую очередь зависит от степени приближения к реальности описывающей её модели. Чем модель точнее, тем от большего числа параметров она зависит, вследствие чего её аналитическое представление становится сложным, что влечёт за собой проблемы её использования.

Наблюдаемые параметры состояния объектов исследования, как правило, отягощены ошибками измерений. Для их обработки и интерпретации не менее важным, чем подбор адекватной модели, является корректное применение методов регрессионного анализа, которые базируются на основные понятия и методы теории вероятностей и математической статистики [9 - 15].

Развитие регрессионного анализа, как элемента математической статистики, в первой половине 20-го столетия строилось в основном исходя из параметрического подхода вследствие его вычислительной простоты, соответствия предположениям рассматриваемых моделей, а также математического удобства такого описания.

Пусть известна природа совокупности данных xt, yt, i — l,n, и найдена с точностью до неизвестного параметра 9 математическая модель в виде зависимости Y — г(Х,в). По результатам п независимых наблюдений значений фактора Xj и отклика у{ таких, что

У1 =Yt + st, Xj = Xi + 8i, где i = \,n - номер наблюдений, 8/, sz- - погреппюсти, возникающие из — за неучтенных факторов, и (или) ошибок измерений значений независимой Xj и зависимой Yj переменных. Оценить параметр в можно одним из методов параметрического сглаживания.

В регрессионном анализе функцию Y — г[Х,в^ называют параметрической регрессией, а оцениваемый параметр в - регрессионным коэффициентом. В общем случае параметрическая регрессия Y = r[X,e) - нелинейная относительно параметра 0 функция.

Оценивание регрессионного коэффициента обычно проводится с помощью некоторого критерия, строящегося с использованием функционала п

F = £p(S/), который является неотрицательной, неубывающей, выпуклой /=1 функцией, зависящей от величины В/ = у j-r(Xj,9). Оценка 9 параметра 0 должна обеспечивать минимум функционала F, хотя бы приближённо. Если функция г(х,в) дифференцируема по параметру в, то оценка в находится в результате решения оценочного уравнения

IM Xj,yj,0) = O,

0.1) полученного на основании необходимого признака существования локального минимума функционала F, в котором

V(xi>yb0) = Рв (*/) = P'(*i)' гв (xi>0)■

Метод оценивания параметра Э минимизацией по нему функционала F, у которого p(s/) = [>,z-r(Xi-,9)] , называется методом наименьших квадратов (МНК) [16].

Обобщением МНК является метод наименьших расстояний [17], мип нимизируемый функционал которого F = ) зависит от функции 1

При условии, когда x-t - измеренные значения Xt без погрешностей 5,-, то есть xi и X/ совпадают, этот метод совпадает с МНК.

Статистическая база наименьших квадратов была подведена в 1809 году немецким учёным Гауссом, исходя из введённого им принципа максимального правдоподобия. Он сформулирован [18] так: наилучшее описание является то, которое даёт наибольшую вероятность получить в результате измерений именно те значения, которые были фактически получены.

Если закон распределения погрешностей известен и он нормальный, то минимизируемый функционал, полученный методом максимального правдоподобия, совпадает с функционалом, соответствующим взвешенному МНК с весами, определяемыми среднеквадратичными отклонениями погрешностей. Данное обстоятельство является веским теоретическим обоснованием (с вероятностной точки зрения) того, что при нормально распределенной погрешности исходных данных оптимальной оценкой регрессии является оценка МНК.

Оценка параметра в минимизацией итерациями функционала, полученного по принципу максимального правдоподобия с учётом погрешности не только отклика, но и предиктора, является оценкой метода конфлю-энтного анализа (КА) [19, 20].

Вычислительные алгоритмы оценивания параметрической регрессии - алгоритмы поиска глобального (если нет уверенности в том, что локальный минимум один) или локального минимума [21, 22] функционала F. С появлением компьютеров стали широко применяться специальные методы, такие как Ньютона - Гаусса, Марквардта, локальной минимизации, учитывающие специфику минимизируемого функционала [23 - 27]. Алгоритмы итерационного типа имеют «недостаток, присущий большинству методов локального поиска, заключающегося в том, что для их сходимости требуется хорошее начальное приближение» [24].

В диссертационной работе в качестве начального приближения предлагается оценка, полученная на основании формирующих итерационную формулу оценивания данных. Доказанная в рамках определённой точности состоятельность начального приближения, в рамках той же точности снимает остроту проблемы «плохого начального приближения», что оптимизирует сглаживание итерациями.

Классические методы математической статистики базируются на представлении о нормальном распределении погрешности исходных данных, в то время как современный подход статистики состоит в использовании непараметрических [28-33] и устойчивых [34-37] (робастных) методов, в меньшей степени опирающихся на предположения о законе распределения погрешности.

Предназначением методов непараметрического сглаживания является решение прямых задач для эмпирического построения модели зависимости между наблюдаемыми параметрами состояния изучаемого объекта. Непараметрический подход был открыт в 1857 году саксонским экономистом Энгелем. Этими методами долгое время пренебрегали. Нынешний интерес к ним обусловлен осознание того, что непараметрические методы обладают гибкостью и используют лишь минимальную априорную информацию, например, о непрерывности или симметричности функции распределения случайных погрешностей.

Разработанный в диссертационной работе метод, в результате нелинейной аппроксимации модельной регрессии в точках с координатами, соответствующими исходным данным оценивания, приобретает свойство гибкости непараметрического подхода, что позволило найти критерий оптимальности оценивания, согласующейся с реальными результатами оценивания.

С 60-х годов 20-го столетия в связи с появлением компьютеров появились методы прикладной статистики, в которых отказ от некоторых классических рекомендаций математической статистически компенсировался расширением круга решаемых задач. Методы анализа данных в них, в отличие от классических, меньше опираются на представление о законах распределения исходных величин.

Причины ограниченной прикладной ценности классической статистики указывались ещё А.Н.Колмогоровым [38] и Дж. Тьюки [39]. В [39] на простом примере оценки центра нормального распределения показана неустойчивость оценки максимума правдоподобия к слабому отклонению плотности распределения от модельной.

Оптимизацию решения предложил П. Хьюбер [40]: он нашёл наилучшую оценку центра нормального распределения при наихудшем симметричном загрязнении и назвал её робастной (гоЬиз^здравая). Л.Д. Ме-шалкин [41] предложил семейство устойчивых оценок всех параметров многомерного нормального распределения. Объёмное статистическое моделирование в Принстонском университете [42] показало, что оценка Хьюбера неустойчива при нарушении симметрии загрязнения. Там же были опробованы и рекомендованы десятки других оценок центра, более устойчивые, чем простое среднее. Эти способы перенесены на задачу регрессии, решения которой называются робастной регрессией.

Количество робастных регрессий больше, чем количество оценок, предложенных в Принстонском эксперименте. Так, Юречкова [43] предложила аналогичную выборочной медиане функцию p{e) = \s\, соответствующую методу наименьших модулей Форсайд и др. [44] p{s)-\s^, 1<и<2, соответствующую обобщённому методу наименьших модулей а Мешалкин [45] — экспоненциальную функцию p{s)- -ехр(—Ле-2/^), соответствующую методу семейства оценок Мешалкина. Харин и Сталевская [46] избавились от необоснованности оценок, предусмотрев в исходной модели погрешности в определении, как отклика, так и предикторов. Предложенные Шурыгиным [47] регрессии, учитывающие ошибки отклика и предиктора, удобны для создания устойчивых решений.

Робастные методы основаны на более общих, чем в классических методах предположениях относительно случайных ошибок. Так, считают, что в методе минимакса [36] эти ошибки независимы и имеют симметричный закон распределения, в ранговых методах [48] распределены непрерывно и одинаково, а в методе наименьших модулей [43, 49] и знаковом методе [50] с равными вероятностями принимают положительные и отрицательные значения.

В данной работе найден критерий выбора оптимальной регрессии на основе данных оценивания апостериори в отличие от выше описанных методов с условиями оптимальности априори, что позволяет считать его более обоснованным для реального эксперимента, в условиях неопределённости относительно законов распределения погрешностей. Это актуально для прикладных методов регрессионного анализа.

Для практических задач оценивания характерна неполнота информации относительно законов распределения погрешностей наблюдаемых параметров. Поэтому без проверки гипотез для каждого нового эксперимента оценивания о предполагаемом (нормальном) распределении погрешности применение классических методов необоснованно.

Поэтому весьма актуальна разработка методики, позволяющей осуществлять робастное оценивание достаточно сложных моделей в характерных для реального эксперимента условиях.

Так, в предположении о нормальности погрешности исходных данных оценивания параметров полупроводникового материала (диффузионной длины ННЗ и скорости поверхностной рекомбинации) в работах [51 -57] исследованы возможности МНК и КА. Результат оценивания МНК и КА диффузионной длины ННЗ равен 0,3+0,1 мкм, из которого видно, что для субмикронного разрешения точность данного оценивания не достаточна. Объяснить не достаточную точность результата оценивания можно не только необоснованностью применения МНК и КА в реальных условиях эксперимента, но и тем, что, например, в работах [51, 52] используются методы линеаризации регрессионной зависимости интенсивности KJI излучения от энергии первичных электронов.

Для класса линейных и линейных по параметру регрессионных моделей методы регрессионного анализа подробно изучены и хорошо разработаны. Они обсуждаются в подавляющем большинстве работ. Связано это с тем, что: 1) нелинейные методы сложнее для практического применения, чем линейные, 2) для сложных моделей возникают проблемы применения нелинейных методов, 3) для класса нелинейных регрессионных зависимостей можно применять линейные методы, предварительно линеаризовав нелинейную регрессионную модель. Известно [58], что преобладание в прикладном регрессионном анализе линейных по параметрам моделей отражает тот факт, что при решении конкретных задач неизвестный отклик изучаемой системы заменяется его полиномиальной аппроксимацией. Между тем, нелинейные модели регрессии обладают важными преимуществами перед линейными. Основное из них состоит в большей адекватности нелинейных моделей с существенно меньшим числом неизвестных параметров.

Несмотря на то, что задача параметрического оценивания нелинейных регрессионных моделей значительно сложнее, чем аналогичной задачи для линейных моделей, задачи нелинейного сглаживания на практике встречаются часто. Это происходит по следующим причинам [23]: а) нелинейность исходит из сущности явления, для описания которого предназначена модель; б) дополнительная информация об истинном характере зависимости позволяет выбрать достаточно точную нелинейную модель с значительно меньшим числом параметров, чем аналогичной линейной модели; с) линеаризация модели часто приносит значительно больше потерь, чем выгод.

Примерами нелинейных моделей могут служить:

1) широко применяемая в исследованиях кинетических задач модель т г (х, #) = ]>] ег ехР (~ei+m х) > /=1 которая возникает при решении систем линейных дифференциальных уравнений;

2) модели т ( 2\ г(х,в) = ехР(-0/+/я (* - ei+2m ) ) «J™ i=l т п

-%-, г=l(x-0i+m) +0i+2m описывающие резонансные явления и использующиеся при обработке спектрального анализа;

3) модель г(х,0) = arctgYj(xj -6j), /=1 использующаяся в задачах слежения за движущимися объектами.

В нелинейных методах для достаточно больших объёмов исходных данных п может возникнуть проблема результативности решения оценочного уравнения (0.1). С ростом объёма исходных данных оценивания п сложность уравнения (0.1) 2п кратно увеличивается. Чем сложнее вид модели и чем больше погрешность исходных данных, тем ниже порог числа п, при котором уравнение (0.1) не имеет решения, что согласуется с классическими рекомендациями статистиков, согласно которым дисперсия регрессионного предсказания минимальна при полном наборе признаков.

Из вышесказанного следует то, что осуществление на практике базового закона математической статистки, закона больших чисел, применительно к регрессионному анализу (асимптотической сходимости оценки к истинному значению оцениваемого параметра) невозможно.

Так как для современных технологий характерно создание и совершенствование описывающих состояния объектов исследования моделей, имеющих достаточно сложное представление, то решение этой проблемы актуально.

Так, она возникает при исследовании возможности достижения субмикронного разрешения в локальной диагностике полупроводников с использованием, отвечающей современному представлению физики полупроводников модели явления, лежащего в основе катодолюминесцентного (KJI) метода оценивания параметров полупроводников. Надо заметить, что эта модель является не самой сложной из предложенных [2] моделей. Описание формирования её аналитического представления в виде функциональной зависимости интенсивности KJI излучения от параметров полупроводниковой мишени и электронного зонда, выраженной через элементарные и специальные функции, приведено в приложении 3 данной работы.

При KJI исследованиях немало важной является задача уменьшения радиационной нагрузки на исследуемый объект. Связанные с этим вопросы оптимизации измерений и обработки данных в KJI микроскопии задач рассматривались в работе [59].

В диссертационной работе эти вопросы не ставятся, но они решаются в силу качества полученных разработанным методом оценок. Возможность достижения субмикронной точности при оценивании необходимых параметров полупроводников с малыми объёмами исходных данных (и<8) является аспектом актуальности диссертационной работы.

Подавляющее большинство всех формул, используемых в естественно — научных и технических дисциплинах относятся к парным регрессиям, когда модель г(является однооткликовой и однофакторной [60]. Так, по вопросам парной регрессии в одном из научных журналов только за два года опубликовано шесть статей [61 - 67], что свидетельствует об актуальности исследований в диссертационной работе по совершенствованию метода оценивания парных регрессий.

Объём знаний по прикладной статистики давно превысил индивидуальные возможности восприятия [68]. Так как публикации по статистике необозримы, поэтому полный обзор литературы, касающейся вопросов регрессионного анализа и оптимизации решений задач с его помощью, в рамках диссертационной работы невозможен.

Создание программного обеспечения статистических методов — самостоятельная область деятельности, идущая вслед за разработкой алгоритмического обеспечения. Первую программу общего назначения для решения задач оценивания нелинейным методом наименьших квадратов создали Бут и Петерсон [69] совместно с Боксом. Впоследствии были созданы программы, предназначенные для конкретных групп пользователей и решающих некоторые частные задачи нелинейного оценивания. Так, программы [70 - 77] реализуют имеющие более общий характер, чем МНК, алгоритмы с применением конечно — разностных аппроксимаций или аналитически заданных производных или без них. Программное обеспечение различается, не только алгоритмом, но и используемым алгоритмическим языком, типом ЭВМ и системному обеспечению, в которых оно создано. В одной из современных систем компьютерной математики, символьных математических вычислений Maple для Windows на компьютерах класса IBM, регрессионный анализ обеспечен программой fit статистического пакета stats [78]. Она реализует алгоритм МНК для частного случая нелинейных регрессий, линейных по параметрам.

В данной работе программа, обеспечивающая разработанный метод оценивания парных однопараметрических регрессий не ограничивает класс нелинейных регрессий линейными по параметру функциями.

Выполненное в системе Maple, необходимое аналитическое задание производной обеспечено встроенной функцией этой системы. Для сложных моделей задание производных без привлечения ЭВМ невозможно. Размер их выражений, найденных встроенными функциями системы Maple, исчисляется десятками, а для производных второго порядка даже сотнями страниц печатного текста. Это обстоятельство решает выбор системы для реализации разработанного алгоритма оценивания сложной нелинейной регрессии в пользу системы символьной математики Maple.

Программный комплекс, обеспечивающий разработанную в работе методику оценивания РК, несмотря на ограничения в ней класса оцениваемых нелинейных регрессий однопараметрическими и парными, имеет немаловажное преимущество перед существующими программами. Она просто модифицируется для получения любых оценок из класса минимально контрастных, в том числе и робастных, что является актуальным в свете современного понимания обоснованности прикладных статистических методов.

Цель работы— оптимизация нелинейного параметрического сглаживания по качеству оценок, таких, как несмещённость, и по чувствительности к виду распределения переменных состояния.

Для достижения поставленной цели решались следующие задачи:

1) разработка итерационных формул нелинейного параметрического сглаживания, позволяющих получать любую из робастных оценок необходимого параметра модели;

2) определение условий сходимости оценки, вычисленной по разработанной формуле, к истинному значению оцениваемого параметра и выбор оптимальной оценки;

3) создание программного комплекса для реализации на ЭВМ разработанного метода оценивания;

4) проведение вычислительного эксперимента для сравнительного анализа качества оценок, полученных разработанным методом, и оценок, вычисленных традиционными методами прикладной статистики. Методами исследования были: методы теории вероятностей, математической и прикладной статистики, теории приближения, теории дифференциального и интегрального исчисления, оптимизации, а также математического моделирования с использованием компьютерной системы символьной математики Maple и программирования в её среде.

Достоверность положений и выводов диссертационной работы определяется тем, что в ней используются классические и современные математические методы теоретического обоснования результатов, а выводы исследований её возможностей получили подтверждения в численных экспериментах оценивания и согласуются с ранее опубликованными данными.

Научная новизна результатов работы состоит в следующем:

1. Разработан новый итерационный минимально контрастный метод оценивания нелинейной однопараметрической парной регрессии, включающий: точечное оценивание параметров регрессий; выбор лучшей оценки из множества, полученных на основании одного набора исходных данных эксперимента оценивания.

2. Найдены условия оптимальности оценивания разработанным методом: условие окончания итерационной процедуры вычисления оценки, минимизирующее относительную погрешность оценки; аналитическое выражение для минимизации прогнозируемого смещения оценки, как критерия качества оценки.

3. Показано, что оценки регрессионных зависимостей, полученные с помощью предложенного метода, как на тестовых примерах, так и на прикладных задачах оценивания свойств полупроводниковых материалов, имеют значительно более высокую точность, чем зависимости, построенные традиционными методами прикладной статистики.

Практическая ценность работы заключается в следующем.

Разработанная методика оценивания необходимых параметров модели совместно с оптимизацией качества оценки может быть использована для достижения субмикронного разрешения в локальной диагностике полупроводниковых материалов. Методика применима также в любых других технологиях, где необходимо оценивать параметр регрессионного уравнения со сложной моделью состояния объекта исследования при отсутствии достаточных знаний о характере распределения погрешностей исходных данных, что препятствует обоснованному применению классических методов статистики.

Диссертационная работа выполнена в рамках научно-исследовательских работ (НИР) по планам Министерства образования РФ и Российского фонда фундаментальных исследований (РФФИ):

- по программе «Университеты России (технические университеты)»;

- по грантам РФФИ и администрации Калужской области (проекты № 02-02-96017, № 02-01-96023);

- по гранту Министерства образования РФ (проект Т00-2.2-852, номер гос. регистрации 01200110405).

Теоретическая значимость работы заключается в том, что предложенный подход к решению задач практической реализации и оптимизации параметрического сглаживания моделей может быть использован для совершенствования нелинейного регрессионного анализа.

Основные результаты, выносимые на защиту:

1) итерационный метод минимально контрастного оценивания нелинейной однопараметрической парной регрессии;

2) условия оптимальности полученных по разработанному методу оценок;

3) способ выбора лучшей оценки регрессионного коэффициента из множества минимально контрастных оценок, полученных на основании одного набора исходных данных с использованием различных функций минимума контраста;

4) результаты сравнительного анализа итерационных минимально контрастных оценок с оценками, полученными известными классическими статистическими методами;

5) минимально контрастные оценки значений диффузионной длины ННЗ, толщины приповерхностной области, обеднённой основными носителями заряда, а также коэффициента самопоглощения KJI излучения для полупроводниковых материалов GaP0;38As0,62 и СаТе.

Личный вклад автора. Основные научные результаты, полученные лично соискателем, заключаются в следующем:

1. разработан итерационный метод минимально контрастного оценивания нелинейной однопараметрической парной регрессии;

2. найдены условие оптимальности полученных по разработанному методу оценок;

3. найден способ выбора лучшей оценки регрессионного коэффициента из множества минимально контрастных оценок, полученных на основании одного набора исходных данных с использованием различных функций минимума контраста;

4. создано программное обеспечение компьютерной реализации разработанного метода;

5. проведены численные эксперименты оценивания ряда нелинейных относительно оцениваемого параметра регрессий различными методами;

6. проведён сравнительный анализ итерационных минимально контрастных оценок с оценками, полученными традиционными методами прикладной статистики;

7. проведены численные эксперименты итерационного минимально контрастного оценивания диффузионной длины ННЗ, толщины приповерхностной области, обеднённой основными носителями заряда, а также коэффициента самопоглощения KJI излучения для полупроводниковых материалов GaPo,38As0,62 и СаТе.

Апробация работы и публикации. Работы по теме диссертации докладывались и обсуждались на Всероссийских научно - технических конференциях «Прогрессивные технологии, конструкции и системы в при-боро - и машиностроении» (Москва, 2000, 2003); XXXI международной конференции по физике взаимодействия заряженных частиц с кристаллами (Москва, 2001); международной научно - технической конференции «При-боростроение-2002» (Алупка, 2002); XIX Российской конференции по электронной микроскопии (Черноголовка, 2002); Всероссийской научно -технической конференции «Методы и средства измерений физических величин» (Нижний Новгород, 2003); 2-ой Российской научно— технической конференции, посвященной 110-летию со дня рождения А.Я. Хинчина (Калуга, 2004).

По теме диссертации опубликовано 15 работ, в том числе 5 статей в научных журналах и сборниках (из них 3 в научных изданиях Перечня ВАК) и 2 доклада в материалах всероссийских и международных конференций.

Структура и объём работы. Диссертация состоит из введения, четырёх глав, списка литературы и трёх приложений. Общий объём работы составляет 121 страницу, включая 19 рисунков и 8 таблиц. Список литературы содержит 105 наименований.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Гетманская, Ирина Васильевна

Основные результаты данной работы заключаются в следующем.

1. Определена весовая функция парной регрессии в общей схеме минимально контрастного оценивания.

2. Рассмотрены наблюдаемые в эксперименте значения регрессионных коэффициентов и определены числовые характеристики совокупности их значений в эксперименте.

3. Построена формула оценивания регрессионного коэффициента с использованием весовой функции регрессии и наблюдаемых значений регрессионного коэффициента. Она позволяет получить итерационным способом любую оценку из класса минимально контрастных и робастных, в том числе, точечных оценок регрессионного коэффициента.

4. Определены условия асимптотической сходимости оценки к истинному значению оцениваемого параметра, которые согласуются с результатами численных экспериментов оценивания и известными условиями оптимальности отдельных методов.

5. Найден способ нахождения начального приближения для итерационной формулы минимально контрастного оценивания. Доказанная в рамках точности приближения, зависящей от величин погрешностей исходных данных, эффективность оценки начального приближения регрессионного коэффициента позволяет в рамках той же точности оптимизировать итерационное минимально контрастное оценивание.

6. Найдено условие окончания итерационного процесса минимально контрастного оценивания, обеспечивающее в рамках определённой точности оптимальность оценивания.

7. Создан пакет программ в системе Maple, реализующий разработанную в работе методику итерационного минимально контрастного оценивания нелинейной однопараметрической парной регрессии.

8. Проведено сравнение, полученных ИМКО РК нелинейных по оцениваемому параметру регрессий с оценками других известных методов: наименьших квадратов и итерационных Ньютона— Гаусса, Марквардта, конфлюэнтного анализа.

9. В результате сравнения обнаружено, что ИМКО РК существенно -нелинейных регрессий значительно точнее оценок РК линейного МНК, общего нелинейного МНК и метода Ньютона Гаусса. ИМКО РК лучше оценок метода Марквардта. Преимущество в точности оценивания сравниваемых методов для приближенных к линейным функциям регрессии не выявлены.

Ю.Проведены численные эксперименты ИМКО диффузионной длины ННЗ, толщины приповерхностной области, обеднённой основными носителями заряда, и коэффициента самопоглощения KJI излучения для полупроводниковых материалов GaPo.38Aso.62 и СаТе.

11 .Показано, что ИМКО параметров полупроводников точнее, опубликованных результатов оценивания методами МНК и КА.

12.Вывод проведённых в работе исследований заключается в том, что ИМКО позволяет достичь субмикронное разрешение в катодолюми-несцентной диагностике полупроводниковых материалов в результате робастного оценивания достаточно сложной, как более совершенной модели KJI излучения полупроводника. А таюке - решать любую задачу оценивания необходимых параметров в условиях, недостаточных знаний относительно распределения погрешностей исходных данных эксперимента оценивания для обоснованно применения классических методов.

Заключение

Список литературы диссертационного исследования кандидат технических наук Гетманская, Ирина Васильевна, 2009 год

1. Петров, В. И. Катодолюминесцентная микроскопия Текст. // Успехи физических наук. 1996. - Т. 166. - С. 859-871.

2. Степович М. А. Количественная катодолюминесцентная микроскопия прямозонных материалов полупроводниковой оптоэлек-троники: дис. . докт. физ.-мат. наук / М. А. Степович; МГТУ им. Н.Э. Баумана. -М., 2002. 340 с.

3. Козодеров, В. В. Биосфера из космоса: интерпретация радиационных образов природных объектов по их многоспектральным изображениям Текст. // Исследования Земли из космоса. — 2004. -№1. С. 16-29.

4. Игнатьев, М. Б. Устойчивое развитие в зоне адаптационного максимума Текст. // IV Международный семинар: Комплексные исследования перехода России и других стран к устойчивому развитию с использованием математического моделирования: материалы.-М., 1998.

5. Grant F. S. Interpretation Theory in Applied Geophysics / F. S. Grant, G. F. West. New York.: McGraw-Hill, 1965.

6. Eisenpress H. Fitting Ore Deposit Models to Geophysical Survey data / H. Eisenpress, A. Surkan. Personal Communication, 1966.

7. Гольданский В. И. Статистика отчётов при регистрации ядерных частиц / В. И. Гольданский, А. В. Куценко, М. И. Подгорецкий. -М.: Физматлит, 1959.-411 с.

8. Николай Кузанский. Сочинение в двух томах. — М.: Мысль, 1980.-Т. 2.-471 с.

9. Колмогоров А. Н. Основные понятия теории вероятностей / А. Н. Колмогоров. М.: Наука, 1974. - 120 с.

10. Ю.Гнеденко Б. В. Элементарное введение в теорию вероятностей / Б. В. Гнеденко, А. Я. Хинчин. М.: Физматлит, 1982. — 160 с.

11. П.Вентцель Е. С. Теория вероятностей / Е. С. Вентцель. — М.: ГИФМЛ, 1962. 564 с.

12. Кендалл М. Дж. Теория распределений / М. Дж. Кендалл, А. Стьюарт- М.: Наука, 1966. 587 с.

13. Кендалл М. Дж. Статистические выводы и связи / М. Дж. Кендалл, А. Стьюарт. М.: Наука, 1973. - 800 с.

14. М.Боровков А. А. Теория вероятностей / А. А. Боровков. М.: Наука, 1986.-432 с.

15. Боровков А. А. Математическая статистика / А. А. Боровков. М.: Физматлит, 2007. - 703 с.

16. Линник Ю.В. Метод наименьших квадратов и основы математи-ко статистической теории обработки наблюдений / Ю. В. Лин-ник. — М.: Физматлит, 1962. — 333 с.

17. Пытьев Ю. П. Математические методы интерпретации эксперимента / Ю. П. Пытьев. — М.: Высшая школа, 1989. — 351 с.

18. Клепиков Н. П. Анализ и планирование экспериментов методом максимума правдоподобия / Н. П. Клепиков, С. Н. Соколов — М.: Наука, 1964.-183 с.

19. Айвазян, С. А. Методы статистического исследования парных зависимостей в схеме конфлюэнтного анализа и их применение Текст. / С. А. Айвазян, И. М. Богдановский // Заводская лаборатория. 1974. - Т. 40, № 3. - С. 285-295.

20. Магарил-Ильяев Г. Г. Выпуклый анализ и его приложения / Г. Г. Магарил-Ильяев, В. М. Тихомиров. М.: Эдиториал УРСС, 2000. -176 с.

21. Демиденко Е. 3. Линейная и нелинейная регрессия / Е. 3. Деми-денко. М.: Статистика, 1981. — 302 с.

22. Ермаков С.М. Математическая теория оптимального эксперимента / С. М. Ермаков, А. А. Жиглявский. — М.: Наука, 1987. —319 с.

23. Бард Й. Нелинейное оценивание параметров / Й. Бард. — М.: Статистика, 1979. 349 с.

24. Мэйндональд Дж. Вычислительны алгоритмы в прикладной статистике: Пер. с анг. / Дж. Мэйндональд; под ред. Е. 3. Демиден-ко. М.: Финансы и статистика, 1988. - 350 с.

25. Айвазян С. А. Прикладная статистика: исследование зависимостей / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин. М.: Финансы и статистика, 1985. — 487 с.

26. Тюрин Ю. Н. Непараметрические методы статистики / Ю. Н. Тюрин. — М.: Знание, 1978. — 64 с.

27. Холлендер М. Непараметрические методы статистики / М. Хол-лендер, Д. А. Вульф. — М.: Финансы и статистика, 1983. — 518 с.

28. Рунион Р. Справочник по непараметрической статистике. Современный подход / Р. Рунион. -М.: Финансы и статистика, 1982. -198 с.31 .Большев Л. Н. Таблицы математической статистики / Л. Н. Большее, Н. В. Смирное. М.: Наука, 1983. - 416 с.

29. Хардле Вольфганг. Прикладная непараметрическая регрессия / Вольфганг Хардле. М.: Мир, 1993. — 349 с.

30. Смоляк С.А. Устойчивые методы оценивания: Статистическая обработка неоднородных совокупностей / С. А. Смоляк, Б. П. Ти-таренко. М.: Статистика, 1980. — 208 с.

31. Хьюбер П. Робастность в статистике / П. Хьюбер. — М.: Мир, 1984.-304 с.

32. Устойчивые статистические методы оценки данных. — М.: Машиностроение, 1984.-231 с.

33. Колмогоров, А.Н. Несмещённые оценки Текст. //Известия АН СССР, сер. мат. 1950. - Т. 14, - С.303-326.

34. Tukey J. W. A survey of sampling from contaminated distribution. Contribution to Probability and Statistics / J. W. Tukey. Ed. I. Olkin. Stanford: Stanford Univ. Press, 1960. - P. 446-486.

35. Huber, P. J. Robust estimation of location parameter Text. // Ann. Math. Statist, 1964. Vol. 35. - P. 73-101.

36. Meshalkin, L. D. Some mathematical methods for the study of non-communicable diseases Text. // Proc. 6-th Intern. Vetting of Uses of Epidemiol. In Planning Health Services. — Yugoslavia: Primosten, 1971.-Vol. l.-P. 250-256.

37. Andrews D. F. A robust estimation for location: survey and advances / D. F. Andrews, P. J. Bickel, F. R. Hampel, P. J. Huber, W. H. Rodger, J. W.Tukey. Prinston, N. Y.: Princeton Univ. Press., 1972.

38. Jureckova, J. Nonparametric estimates of regression coefficients Text. //Ann. Math. Statist. 1971. - Vol. 42, No. 4. - P. 1328-1338.

39. Forsyth, A. B. A strong rule for variable selection in multiple regression Text. / A. B. Forsyth, L. Engelman, R. Gennrich, F. R. A. May. //J. of Amer. Statist. Assoc. -1973. Vol. 68, No. 341, P. 74-77.

40. Мешалкин, JI. Д. Использование весовых функций при оценке регрессионной зависимости Текст. //Многомерный статистический анализ в социально экономических исследованиях. - М.: Наука, 1974.-С. 25-30.

41. Харин, Ю. С. Об устойчивости многомерного линейного регрессионного прогнозирования Текст. / Ю. С. Харин, С. Н. Сталев-ская. // Весщ АН Беларусь 1997. - №4. - С. 9-13.

42. Шурыгин А. М. Прикладная стохастика: робастность, оценивание, прогноз / A. t М. Шурыгин. М.: Финансы и статистика, 2000.-224 с.

43. Хеттманспергер Т. Статистические выводы, основанные на рангах / Т. Хеттманспергер. М.: Финансы и статистика, 1987. — 334 с.

44. Мудров В. И. Метод наименьших модулей / В. И. Мудров, В. JI. Кушко. М.: Знание, 1971. - 64 с.

45. Болдин М. В. Знаковый статистический анализ линейных моделей / М. В. Болдин, Г. И. Симонова, Ю. Н. Тюрин. — М.: Наука, 1997. -288 с.

46. Михеев, Н. Н. Измерение диффузионной длины неосновных носителей заряда и скорость поверхностной рекомбинации в арсе-ниде галлия катодолюминесцентным методом Текст. / Н. Н. Михеев, Ю. Г. Дорогова // Электронная техника: материалы. — 1988.-Вып. 4.-С. 44.

47. Михеев, Н. Н. Определение параметров полупроводников на основе измерений зависимости интенсивности катодолюминесцен-ции от ускоряющего напряжения электронов зонда РЭМ Текст. // ФТП. 1987. - Т. 21, вып. 2. - С. 370-372.

48. Гетманская, И. В. О влиянии характера описания статистических данных на результаты идентификации диффузионной длины полупроводников Текст. //Труды МГТУ. — 2002.- №583.-С. 93-102.

49. Григорьев, Ю. Д. Асимптотические разложения в нелинейном регрессионном анализе Текст. / Ю. Д. Григорьев, А. В. Иванов // Заводская лаборатория. —1987. №3. - С. 48-54.

50. Степанов С. Е. Разработка оптимального по порядку ёмкости метода измерения и обработки данных: автореф. дис. . канд. физ.-мат. наук. / С. Е. Степанов; Институт атомной энергетики. — Обнинск, 2000. 18 с.

51. Львовский Е. Н. Статистические методы построения эмпирических формул /Е. Н. Львовский.— М.: Высшая школа, 1988.— 239 с.

52. Габов, Е. А. Точность определения параметров прямой у=а+Ьх с учётом ошибок по х и по у Текст. // Заводская лаборатория. -2003.-№ 7, Т. 69.-С. 59-63.

53. Гетманская, И. В. Рекуррентная формула оценивания параметра нелинейной относительно параметра парной регрессии Текст. // Заводская лаборатория — 2005. Т. 71, № 1. - С. 62-68.

54. Гуськова, Е. А. Интервальная линейная парная регрессия (обобщающая статья) Текст. / Е. А. Гуськова, А. И. Орлов // Заводская лаборатория. — 2005. № 3. — С. 57-63.

55. Вощинин, А. П. Критические замечания редакции к статье Зайде-ля Р. М., Кваскова Б. Н. «Метод наименьших квадратов при двумерных погрешностях наблюдений» Текст. // Заводская лаборатория. 2005. - № 11. - С. 63-64.

56. Орлов, А. И. О современных проблемах внедрения прикладной статистики и других статистических методов. (Обобщающая статья) Текст. // Заводская лаборатория. 1992. - №1. - С. 67-74.

57. Booth G. W. And Peterson T.I. Nonlinear Estimation. IBM SHARE Program Pa., 1958. - No. 687 WLNLI.

58. Efroymson M. A. Nonlinear regression with differencial equations, 7090 G2 3146 NLR.- 1961.

59. Marquardt D. W. Least squares estimation of nonlinear parameters, 7040 G2 3094 NLIN. 1965.

60. Eisenpress H. Nonlinear regression equation and systems, estimation and prodiction, 7090 G2 IBM 0035 / H. Eisenpress, A. Bomberault, J. Greenstadt. 1966.

61. Уилкинсон, Дж. Справочник алгоритмов на языке Алгол. Линейная алгебра / Дж. Уилкинсон, К. Райнш. М.: Машиностроение, 1976.-389 с.

62. Программное обеспечение ЭВМ / под ред. М. Л. Петрович. — Минск: Институт математики АН БССР, 1982. вып. 35. - 130 с.

63. Лоусон, Ч. Численное решение задач метода наименьших квадратов / Ч. Лоусон, Р. Хенсон. М.: Наука, 1986. - 230 с.

64. Говорухин, В. Компьютер в математическом исследовании: Учебный курс / В. Говорухин, В. Цибулин. СПб.: Питер, 2001. -624 с.

65. Гетманская, И. В. Формула оценивания регрессионного коэффициента нелинейной парной регрессии с использованием весовойфункции Текст. // Вестник МГТУ им. Н. Э. Баумана. Серия Естественные науки. — 2004. № 4. - С. 11-23.

66. Гетманская, И. В. Несмещенная оценка параметра однопараметрической парной регрессии Текст. // 2-я Российская научно-техническая конференция, посвященная 110-летию со дня рождения А. Я. Хинчина: материалы. Калуга, 2004. - С. 105-112.

67. Гетманская, И. В. Состоятельная оценка параметра однопараметрической парной регрессии Текст. // Вестник МГТУ им. Н.Э. Баумана. Серия Естественные науки. — 2006. № 3. — С. 3-11.

68. Кудрявцев JI. Д. Курс математического анализа: Учеб. для студентов университетов и вузов / JI. Д. Кудрявцев — М.: Высшая школа, 1988.-Т. 1.-712 с.

69. Демидович Б. П. Основы вычислительной математики / Б. П. Де-мидович, И. А. Марон. — СПб.: Лань, 2006. 664 с.

70. Павловский Ю. Н. Опыт имитационного моделирования при анализе социально — экономических явлений / Ю. Н. Павловский, Н. В. Белотелов, Ю. И. Бродский. М.: МЗ Пресс, 2005. -136 с.

71. Прохоров Г. В. Пакет символьных вычислений Maple V / Г. В. Прохоров, М. А. Леденев, В. В. Колбеев. М.: Компания «Петит», 1997.-200 с.

72. Дьяконов В. Maple 6: Учебный курс / В. Дьяконов. СПб.: Питер, 2001.-608 с.

73. Marquardt, D. W. An algorithm for least squares estimation of nonlinear parameters Text. //J. Soc. Industr. and Appl. Math. 1963,-Vol. 11,No. 2.-P. 431.

74. Тихонов A. H. Статистическая обработка результатов экспериментов / А. Н. Тихонов, М. В. Уфимцев. М.: Изд-во Моск. ун-та, 1988.-174 с.

75. Таблицы физических величин. Справочник / Под ред. И. К. Кикоина. М.: Атомиздат, 1976. - 1005 с.

76. КиреевВ. А. Формирование сигнала модуляционной катодолю-минесценции в пространственно неоднородных полупроводниках: дис. . канд. физ.-мат. наук / В. А. Киреев; И1ГГМ РАН. Черноголовка, 1997. -142 с.

77. Local probe techniques for luminescence studies of Ion-dimensional semiconductor structures / A. Gustafsson, M.-E. Pistol, L. Montelius, L. Samuelson Text. //J. Appl. Phys. 1998.- Vol.84, No. 4. -P. 1715-1734.

78. Van Roosbroeck, W. Injected current transport in semi-infinite semiconductor and determination of lifetimes and surface recombination velocities Text. / W. Van Roosbroeck //J. Appl. Phys. 1955. -Vol. 26, No. 1.-P. 380-387.

79. Корн Г. Справочник по математике для научных работников и инженеров: Определения, теоремы, формулы. Издание четвёртое / Г. Корн, Т. Корн. -М.: Наука, 1978. С. 739.

80. Wittry, D. В. Measurements of diffusion lengths in direct — gap semiconductors by electron beam excitation Text. / D. B. Wittry, D. F. Kyser // J. Appl. Phys. 1967. - Vol. 38, No. 1. - P. 375-382.

81. Бонч-Бруевич В. JI. Физика полупроводников: Учебное пособие для вузов / В. Л. Бонч-Бруевич, С. Г. Калашников. — М.: Наука, 1900.-685 с.

82. Смит Р. Полупроводники / Р. Смит. — М.: Мир, 1982. 650 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.