Разработка и исследование метода нормализации клинических данных: Применение к нейроофтальмологии тема диссертации и автореферата по ВАК РФ 05.13.09, кандидат технических наук Клавдиев, Дмитрий Владимирович
- Специальность ВАК РФ05.13.09
- Количество страниц 107
Оглавление диссертации кандидат технических наук Клавдиев, Дмитрий Владимирович
ОГЛАВЛЕНИЕ.
ВВЕДЕНИЕ.
1. ОПИСАНИЕ ОБРАБАТЫВАЕМЫХ ДАННЫХ.
1.1. Структура данных и инструментальные средства их накопления.
1.2. Анализ характера данных.
2. НОРМАЛИЗАЦИЯ СЛУЧАЙНЫХ ВЫБОРОК.
2.1 Введение.
2.2 Нормализация случайной выборки при известной функции распределения.
2.3 Нормализация случайной выборки при отсутствии информации о функции распределёния.
2.4 Характеристики точности аппроксимации.
2.4.1 Дисперсия отклонений.
2.4.2. Интегральная характеристика точности.
2.4.3. Распределение максимального рассогласования.
Выводы.
3. АЛГОРИТМ НОРМАЛИЗАЦИИ ВЫБОРОК И ФАКТОРНЫЙ АНАЛИЗ НЕЙРООФТАЛЬМОЛОГИЧЕСКИХ ДАННЫХ.
3.1. Нормальная модель непрерывных данных.
3.1.1. Определения и обозначения.
3.1.2. Аппроксимация функции восстановления.
3.2. Примеры построения приближенного вида функции преобразования.
3.3. Определение объема выборки, необходимой для построения функции восстановления.
3.4. Нормализация многомерных исходных данных и их
ФАКТОРИЗАЦИЯ.
3.4.1. Нормализация случайных выборок.
3.4.2. Факторизация преобразованных (восстановленных) выборок.
3.5. факторизация данных клинических обследований. выводы.
4. ПРИМЕНЕНИЕ МЕТОДОВ НОРМАЛИЗАЦИИ И РЕШЕНИЕ ЗАДАЧ ДИСКРИМИНАЦИИ НЕЙРОФТОЛЬМОЛОГИЧЕСКИХ ДАННЫХ.
4.1 .Теоретические основы дискриминации.
4.2. Нормализация при проведении дискриминантного анализа
4.2.1. Пример дискриминации нормальных выборок.
4.2.2. Применение нормализации данных для дискриминантного анализа.
4.2.2.1. Нормализация при известной функции распределения.
4.2.2.2. Нормализация при априорной информации о структуре функции распределения.
4.2.2.3. Нормализация при отсутствии предположений о виде функции распределения. выводы.
4.3. Применение дискриминантного анализа для прогноза результата лечения нейроофтальмологических больных.
4.3.1. Предварительная обработка данных.
4.3.2. Применение дискриминантного анализа для определения исходов лечения.
4.3.3. Дискриминация нормализованных данных.
4.3.3. Применение дискриминантного анализа для прогноза результата лечения.
4.3.4. Применение для дискриминации агрегированных данных.
Рекомендованный список диссертаций по специальности «Управление в биологических и медицинских системах (включая применения вычислительной техники)», 05.13.09 шифр ВАК
Модельно-структурные методы дискриминантного анализа в автоматизации задач классификации и прогноза1998 год, доктор технических наук Малиновский, Леонид Глебович
Методы вероятностно-статистического анализа данных в задачах судостроения2000 год, доктор физико-математических наук Золотухина, Лидия Анатольевна
Планирование экспериментов для дискриминации регрессионных моделей2018 год, кандидат наук Гученко Роман Александрович
Вероятностно-статистические методы анализа и обработки сигналов при обращении интегральных преобразований радоновского типа2012 год, доктор физико-математических наук Шестаков, Олег Владимирович
Интервальный метод обработки результатов многоканальных экспериментов2009 год, доктор физико-математических наук Родионова, Оксана Евгеньевна
Введение диссертации (часть автореферата) на тему «Разработка и исследование метода нормализации клинических данных: Применение к нейроофтальмологии»
Настоящая диссертационная работа посвящена разработке и исследованию метода нормализации статистических данных. Проблема создания процедуры такого преобразования возникла в связи с тем, что большинство стандартных статистических методов анализа экспериментальных данных (дисперсионный анализ, факторный анализ, метод наименьших квадратов и т.п.) дают гарантировано правильные ответы при условии, что обрабатываемый экспериментальный материал представляет собой выборку из генеральной совокупности, распределенной по нормальному закону. В то же время конкретные статистические данные, особенно в областях медико-биологических исследований, не позволяют с достаточно большой степенью уверенности принять гипотезу о нормальности их распределения. В результате применение ряда статистических процедур, зачастую, становится лишь эвристическим приемом, не имеющим под собой достаточной теоретической базы.
В работе предлагается в качестве начального этапа обработки статистического материала применять процедуру нормализации, представляющую собой достаточно простое преобразование исходных данных, априорно не являющихся нормальными, в совокупность данных, распределенных по нормальному, или близкому к нормальному, закону.
Побудительным мотивом для выполнения работы были как практические задачи оценки эффективности некоторых методов лечения частичной атрофии зрительных нервов, так и задачи создания инструментария для построения прогноза результата лечения, т.е., по сути дела, решения часто возникающих на практике проблем обработки медицинской статистики.
Теоретические аспекты данной работы близки к результатам, связанным с ранговыми статистиками [12, 21, 24, 42]. Действительно, переход к ранговым статистикам, как будет показано далее, с точностью до нормировки совпадает с преобразованием исходных данных к равномерно распределенным. Авторы всех этих публикаций исследуют вопросы применения ранговых статистик для различных целей статистической обработки. В работах Немана [24], Фрезера [42], Гаека и Шидака [12] дано общее изложение ранговых критериев. Исследования, касающиеся ранговых критериев приведены также в работе Тейла [58]. Проблеме проверки экспериментальных данных на соответствие нормальному закону распределения уделили внимание многие ученые. Так Гири [43] разработал и исследовал критерий эксцесса, основанный на отношении выборочного среднего отклонения к стандартному, табулированному в Biometrical Tables (Таблицы воспроизведены в Таблицах математической статистики [3]). В работе [45] рассматривается распределения Dn и
W2 для проверки нормальности, когда параметры оцениваются по выборке посредством предельные распределения в таком случае свободны от параметров, но не получены в явном виде. Шапиро и Уилком [56] построен критерий для проверки нормальности, основанный на регрессии порядковых статистик на их ожидаемые значения. В этих публикациях, однако, не затрагиваются вопросы, связанные с определением вида преобразований к равномерному закону. Так же не ставится задача преобразования к нормально распределенным данным.
Кендалл и Стюарт в своем фундаментальном труде [20] обсудили различные способы нормализации распределений, но указали на то, что необходимая для построения любого из рассмотренных преобразований функция распределения исходной случайной величины, в эксперименте, как правило, оказывается неизвестной.
Подробное изложение вопросов, касающихся полиномиальной регрессии, приведены в [1, 2, 21, 22, 27, 28, 31]. Тейлу [58] принадлежат некоторые заключения о полиномиальной регрессионной модели.
Общие сведенье о методе наименьших квадратов приведены в [13, 26, 50] и многих других монографиях. В [13, 26], кроме того, описан способ его применения при неравноточных измерениях, необходимый для предложенного в этой работе преобразования.
Проблеме статистической обработки медицинских данных посвятили свое внимание большое количество авторов монографий и научных статей. Так например, в работе [49] рассмотрен вопрос применения дискриминантно-го анализа для распознавания вызванных потенциалов от различных видов раздражителей (общие вопросы дискриминантного анализа - в работах [1, 2, 22, 32, 46]), в статье [53] дискриминантный анализ используется для построения правил автоматической диагностики заболеваний глаз у операторов персональных компьютеров, в работах [36, 51] аппарат дискриминантного анализа используется для построения эффективного диагностического правила для выявления шизофрении по характеру движений глазного яблока. Описание использования дискриминантного анализа для обработки медицинских данных можно найти также в работах [38, 39, 41, 44, 52].
Довольно большое количество научных публикаций последних лет посвящено проведению факторного анализа, вопрос, общую теорию которого можно почерпнуть из [1, 2, 18, 22, 25, 32], медико-биологических данных [39, 41, 47, 55, 57]. В частности, в статье [57] факторный анализ используется для определения ведущих побудительных мотивов для использования презервативов. В статье [37] исследовались факторы, влияющие на отношение к тестированию на ВИЧ. В работах не описано распределение исходных данных, однако, в этом случае, вероятно, можно принять гипотезу об их нормальности, поскольку речь идет в сущности о данных социологических опросов. В статье [47] авторы успешно применяют факторный анализ для определения факторов риска острого инсульта головного мозга. В работе [39] математический аппарат факторного анализа применяется для оценки валидности краткой формы шкалы оценки тяжести остеоартрита (А1М32-5Р).
Однако, ни анализа распределения исходного статистического материала, ни тем более предварительная нормализация его в этих работах не осуществлялось. Подобное несоответствие исходных данных предположению о нормальности распределений может привести к отсутствию гарантий теоретической обоснованности результатов исследований.
Таким образом, анализ литературных материалов за последние годы показывает, что тематика настоящей диссертационной работы исследователями практически не затронута.
Известно, что при построении любого алгоритма очень важную (или -определяющую) [11, 17] роль играет структура обрабатываемых данных, поэтому в первой главе рассматриваются характеристики анализируемого статистического материала и разработанные автором способы накопления и хранения данных клинического обследования пациентов клиники нейрохирургии Военно-медицинской Академии.
Вторая глава работы посвящена описанию способа нормализации данных и оценке погрешности, возникающей при применении такого преобразования.
В третьей главе диссертации рассмотрены вопросы практического применения метода для построения нормальной агрегированной модели данных.
Четвертая глава диссертации содержит результаты тестирования метода нормализации на каноническом примере и обработки реальных данных медицинской статистики. Там же описан разработанный автором инструментарий практикующего специалиста в области нейроофтальмологии, призванный оказать ему помощь в построении прогноза результата лечения.
Похожие диссертационные работы по специальности «Управление в биологических и медицинских системах (включая применения вычислительной техники)», 05.13.09 шифр ВАК
Математическое и алгоритмическое обеспечение статистического анализа данных типа времени жизни2016 год, кандидат наук Чимитова, Екатерина Владимировна
Интервальный подход к анализу больших массивов физико-химических данных2007 год, доктор физико-математических наук Родионова, Оксана Евгеньевна
Некоторые вопросы уточнения предельных распределений статистик критериев нормального типа ω- и χ- для выборок умеренно большой длины2003 год, кандидат физико-математических наук Миронова, Ирина Юрьевна
Методы и программы для построения робастных и редуцированных статистических моделей2019 год, кандидат наук Шестопал Оксана
Математические модели и методы статистического анализа случайных показателей, имеющих распределение, отличное от нормального2010 год, кандидат физико-математических наук Радионова, Марина Владимировна
Заключение диссертации по теме «Управление в биологических и медицинских системах (включая применения вычислительной техники)», Клавдиев, Дмитрий Владимирович
Выводы.
Построен алгоритм преобразования данных для обработки их дис-криминантным анализом. Исследованы на примере несколько ситуаций с различным количеством информации о функции восстановления.
Проведено исследование реальных данных с целью построения формального критерия выздоравливаемости. Получен устойчивый результат, протестированный как на обучающей последовательности, так и на контрольной группе.
Для однородных групп пациентов получены алгоритмы прогнозирования результата лечения по исходным данным - физиологическим показателям и части статических параметров.
Доказана зависимость результата лечения от пола пациента при частичной атрофии зрительного нерва в результате оптохиазмального арахноидита.
Создан программный продукт для рассчета прогноза исхода лечения по статическим, управляемым и динамическим данным до начала лечения
Список литературы диссертационного исследования кандидат технических наук Клавдиев, Дмитрий Владимирович, 2000 год
1. Андерсон Т., Введение в многомерный статистический анализ, (перев. сангл.), М„ ФИЗМАТГИЗ, 1963.-500 с
2. Афифи, Эйзен Статистический анализ. Подход с использованием ЭВМ,1. М., «Мир», 1982.-488 с.
3. Большое Л.Н., Смирнов Н.В., Таблицы математической статистики, М.,1. Наука", 1983,-416 с.
4. Боровиков В.П., Боровиков И.П., STATISTICA® Статистический анализи обработка данных в среде Windows®, М., Инф. Изд. Доп. "Филинъ", 1997,-608 с.
5. Боровков A.A., Математическая статистика. Оценка параметров,проверка гипотез, М., «Наука», 1984, -472 с.6. ван дер Ваден Б.Л., Математическая статистика, М., Иностр. литерат.,1960,-434 с.
6. Вильчевский Н., Гайдар Б., Клавдиев Д., Малахов И., Математическаямодель нейроонкологического пациента, базирующаяся на морфологических изменениях головного мозга. // Матер, международной конф. "Mathtools-97", Санкт-Петербург, Россия, 1997 г. с. 64
7. Вильчевский Н., Долгов Г., Клавдиев В., Клавдиев Д., Обработкамедицинской статистики GUHA-методом. //труды СПбГТУ, т. 461, Санкт-Петербург, Россия, 1997 г. с. 116-119
8. Вильчевский Н., Клавдиев В., Клавдиев Д., Обработка медицинскойстатистики GUHA-методом. // Матер, международной науч.-практ. конференции "METROMED-95", СПбГТУ, Санкт-Петербург, Россия, 1995 г.-с. 177-180
9. Вильчевский Н.О., Шевляков Г.Л., Применение полиномов Бернштейна в задачах адаптивного оценивания, // Матер. V Всесоюзной школы-семинара по непараметрическим и робастным методам статистики. Часть 1, 1985, Томск, с. 44-48
10. Вирт Н., Алгоритмы + структуры данных = программы. М., «Мир», 1984,-360 с.
11. Гаек Я., Шидак 3., Теория ранговых критериев (перев. с англ.), М., "Наука", 1971,-376 с.
12. Гайдаев П.А., Способ наименьших квадратов, М., ВИА, 1959, -269 с.
13. Данилов А., Клавдиев Д., Использование компьютерной базы данных для выделения ведущих лечебных воздействий при поражении хиазмы и зрительных нервов. // матер, международного симпозиума «Ишемия мозга» ВМедА, каф. нейрохирургии. 1997 г. с. 260
14. ДейкстраЭ., Дисциплина программирования. М., «Мир», 1978,-275 с.
15. Дубров A.M., Обработка статистических данных методом главных компонент., М., "Статистика", 1978, 135 с.
16. Кендалл М.Д., Ранговые корреляции, М., "Статистика", 1975, 212 с.
17. Кендалл М.Д., Стюарт А., Многомерный статистический анализ и временные ряды, М., "Наука", 1976, 736 с.
18. Кендалл М.Д., Стюарт А., Статистические выводы и связи, М., "Наука", 1973,-899 с.
19. Кендалл М.Д., Стюарт А., Теория распределений, М., "Наука", 1966, -588 с.
20. Клавдиев Д., Автоматизация процесса принятия решений в медицине. // Матер, международного симпозиума «Ишемия мозга» ВМедА, каф. нейрохирургии. 1997 г., с. 231
21. Леман Э., Проверка статистических гипотез, М., "Наука", 1964,-498 с.25.—Лоули Д., Максвелл А., Факторный анализ как статистический метод, М., "Мир", 1967,-144 с.
22. Лоусон Ч., Хенсон Р., Численное решение задач метода наименьших квадратов, М., «Наука», 1986, 230 с.
23. Лысенков А.Н., Математические методы планирования многофакторных медико-биологических экспериментов, М., «Медицина», 1979, 320 с.
24. Немчинов B.C., Полиномы Чебышева и математическая статистика, М., ТСХА, 1946 г.,-139 с.
25. Ольвер Ф. Асимптотические и специальные функции, М., «Наука», 1971,-528 с.
26. Смирнов Н.В., Теория вероятностей и матеатической статистики. Избранные труды, М., "Наука", 1970 г., 290 с.
27. Смирнов Н.В., Дунин-Барковский И.В., Курс теории вероятностей и математической статистики, М., "Наука", 1965 г., -511 с.
28. Смирнов Н.В., Приближение законов распределения случайных величин по эмпирическим данным, Усп. матем. наук 10, 1944 г., 145 с.
29. Такач. Л., Комбинаторные методы в теории случайных процессов, М., Мир, 1971,-264 с.
30. Тюрин Ю.Н., Макаров А.Т., Анализ данных на компьютере, М., ИНФРА-М Финансы и статистика 1995 г., 384 с.
31. Эрдейи А., Асимптотические разложения, М., ГИФМЛ, 1962 г. , 127 с.
32. Arolt V, Teichert НМ, Steege D, Lencer R, Heide W., Distinguishing schizophrenic patients from healthy controls by quantitative measurement of eye movement parameters. // Biol Psychiatry 1998 Sep 15;44(6):448-58
33. Boshamer CB, Bruce KE., A scale to measure attitudes about HIV-antibody testing: development and psychometric validation. // AIDS Educ Prev 1999 Oct; 11(5):400-13
34. Broadway DC, Drance SM, Parfitt CM, Mikelberg FS., The ability of scanning laser ophthalmoscopy to identify various glaucomatous optic disk appearances. // Am J Ophthalmol 199ft May;1?5(5)^93-B04
35. Fraser D.A.S., Nonparametric Methods in Statistics. // Wiley, New York, 1957
36. Geary R.G., Testing for normality // Biometrica, 1947; 34, 209.
37. Herranz Marin MT, Jimenez-Alonso J, Delgado Rodriguez M, Omar M, Rivera Civico F, Martin Armada M, Siles MJ., Clinical and biological markers of secondary uveitis: results of a discriminant analysis. II Med Clin (Bare) 1997 Dec 6;109(20):786-91
38. Kac M. Kiefer J. and Wolfowitz J., On test of normality and other test of goodness of fit based on distance methods. //Ann. Math. Statist., 1955; 26,189
39. Kendall M.G., Discrimination and classification // Proc. Symp. Multiv. Analysis, Academic Press, New York 1965
40. Kim JS, Choi-Kwon S., Risk factors for stroke in different levels of cerebral arterial disuse. // Eur Neurol 1999;42(3): 150-6
41. Klavdiev V., Klavdiev' D., Koskin S., Shelepin Yu., The code for reliable testing of contrast sensitivity. // materials of International Workshop "NDTCS-97", SPbSTU, St. KMersburg, Russia, 1997:H7
42. Lind JC, Flor-Henry P, Koles ZJ., Discriminant analysis and equivalent source localization of the EEG relatec. cognitive functions. // Brain To-pogr 1999 Summer; 11 (4):265-78
43. Lloyd E.N., Least-squares estimation of location and scale parameters using order statistics. // Biometrica, 1952; 39, 8851.—Matsushima E, Kojima T, Ohta K, Obayashi S, Nakajima K, Kakuma T,
44. Ando H, Ando K, Toru M., Exploratory eye movement dysfunctions in patients with schizophrenia: possibility as a discriminator for schizophrenia. // J Psychiatr Res 1998 Sep-Oct;32(5):289-95
45. Meyers JE, Volbrecht M, Kaster-Bundgaard J., Driving is more than pedal pushing.//Appl Neuropsychol 1999;6(3): 154-64
46. Mocci F, Serra A., Specialist assessments and Law Decree 626/94 on operators employed at VDT/PCs. // Med Lav 1998 Nov-Dec;89(6):524-32
47. Plackett R.L., Linear estimations from cencored data. // Ann. Math. Stat., 1958; 29, 131
48. Ren XS, Kazis L, Meenan RF., Short-form Arthritis Impact Measurement Scales 2: tests of reliability and validity among patients with osteoarthritis. //Arthritis Care Res 1999 Jun;12(3):163-71
49. Theil H., A rank-invariant method of linear and polinomial regression analysis. // Indag. Math, 1950; 12, 86 and 173
50. Vilchevsky N., Klavdiev D., Gauss interpretation of rank tests and its application in neuroophthalmology data processing. // Materials of International Workshop NDTCS-97, St. Petersburg, Russia, 1997:H4
51. Vilchevsky N., Klavdiev V., Klavdiev D., The normalization of samples. Materials of International Workshop NDTCS-99, Alexander I. Melker, Editor, Proceeding of SPIE, vol. 4046, 2000:264-856.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.