Математическое и программное обеспечение прогнозирования выживаемости пациентов на основе нечеткой нейронной сети тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Стрункин, Дмитрий Юрьевич

  • Стрункин, Дмитрий Юрьевич
  • кандидат технических науккандидат технических наук
  • 2012, Казань
  • Специальность ВАК РФ05.13.18
  • Количество страниц 119
Стрункин, Дмитрий Юрьевич. Математическое и программное обеспечение прогнозирования выживаемости пациентов на основе нечеткой нейронной сети: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Казань. 2012. 119 с.

Оглавление диссертации кандидат технических наук Стрункин, Дмитрий Юрьевич

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

ГЛАВА 1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ЗАДАЧИ

1.1. Понятие «выживаемости»

1.2. Особенности медицинских выборок данных

1.2.1. Цензурированность данных

1.2.2. Разнотипность данных

1.2.3. Нечеткость данных

1.3. Математические методы прогнозирования выживаемости пациентов

1.3.1. Методы прогнозирования выживаемости пациента на основе общегрупповой выживаемости

1.3.2. Методы прогнозирования выживаемости пациентов на основе индивидуальных показателей здоровья

1.4. Постановка задачи

Выводы

ГЛАВА 2. ОПРЕДЕЛЕНИЕ ПОКАЗАТЕЛЕЙ ПАЦИЕНТА, ЗНАЧИМО ВЛИЯЮЩИХ НА ВРЕМЯ ВЫЖИВАНИЯ

2.1. Постановка задачи определения значимых показателей пациента

2.2. Методы корреляционного анализа

2.2.1. Корреляция между двумя дихотомическими переменными

2.2.2. Корреляция между дихотомической и порядковой переменными

2.2.3. Корреляция между дихотомической и интервальной переменными

2.2.4. Корреляция между порядковой и интервальной переменными

2.2.5. Корреляция между двумя порядковыми переменными

2.2.6. Корреляция между двумя интервальными переменными

2.2.7. Анализ корреляционных методов

2.3. Методы экспертного оценивания

2.3.1. Методы коллективной работы

2.3.2. Методы получения индивидуального мнения

2.3.3. Анализ методов экспертного оценивания

2.4. Алгоритм отбора значимых показателей пациента

Выводы

ГЛАВА 3. РАЗРАБОТКА АРХИТЕКТУРЫ НЕЧЕТКОЙ НЕЙРОННОЙ СЕТИ И АЛГОРИТМА ЕЕ ОБУЧЕНИЯ

3.1. Разработка модели представления знаний и схемы нечеткого логического вывода

3.1.1. Требования к модели представления знаний и схеме нечеткого логического вывода

3.1.2. Структура модели

3.1.3. Алгоритм нечеткого логического вывода

3.1.4. Выбор вида функций принадлежности

3.2. Разработка структуры нечеткой нейронной сети

3.2.1. Определение параметров и слоев нечеткой нейронной сети

3.2.2. Пример архитектуры нечеткой нейронной сети и схема ее работы

3.3. Разработка алгоритма обучения нечеткой нейронной сети

3.3.1. Анализ существующих подходов к обучению нечеткой нейронной сети

3.3.2. Требования к алгоритму обучения

3.3.3. Разработка вида хромосомы и функции приспособленности

3.3.4. Разработка модифицированных генетических операторов

3.3.5. Общая схема работы генетического алгоритма обучения нечеткой нейронной сети

Выводы

ГЛАВА 4. ОПИСАНИЕ ПРОГРАММНОГО КОМПЛЕКСА

«ВЫЖИВАЕМОСТЬ» И ПРИМЕР ЕГО ИСПОЛЬЗОВАНИЯ

4.1. Описание разработанного программного комплекса

4.1.1. Модуль отбора значимых показателей

4.1.2. Модуль построения и обучения нечеткой нейросетевой модели

выживаемости

4.1.3. Модуль расчета выживаемости пациента на основании

индивидуальных значений показателей здоровья

4.2. Разработка модели прогнозирования выживаемости онкопациентов с диагнозом "Рак почки"

4.2.1. Постановка задачи

4.2.2. Исходная база данных электронных историй болезни

4.2.3. Описание разработанной модели

4.2.4. Проверка адекватности полученной модели

Выводы

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ!

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Математическое и программное обеспечение прогнозирования выживаемости пациентов на основе нечеткой нейронной сети»

ВВЕДЕНИЕ

Одним из наиболее важных факторов при выборе метода лечения пациентов со смертельными заболеваниями имеет определение выживаемости этих пациентов в течение определенных временных интервалов. Под выживаемостью в течение времени t понимают вероятность того, что пациент будет жив после момента времени t: S(t) = Р(Т > t). Прогнозы выживаемости для различных методов лечения позволяют врачам определять наилучший метод лечения пациента.

Существующие математические методы прогнозирования выживаемости можно разделить на две группы по составу используемой информации -методы прогнозирования на основании общегрупповой выживаемости и методы прогнозирования на основе индивидуальных показателей здоровья пациента.

Методы первой группы базируются на статистических методах и позволяют получать «общегрупповой» прогноз, который не позволяет учесть индивидуальные особенности здоровья пациентов. Поэтому в последние годы получили распространение методы второй группы, базирующиеся на использовании регрессионных и нейросетевых моделей, методах нечеткой логики и деревьев решений. Проведенный анализ показывает, что целесообразным подходом является использование нечетких нейронных сетей в силу следующих причин:

1. нечеткости, свойственной медицинским данным;

2. способности к автоматическому обучению и обобщению статистических данных;

3. возможности вероятностной оценки получаемых заключений.

Существующие на сегодняшний день нечеткие нейросетевые модели

имеют существенные ограничения, такие как невозможность работы с

разнотипными данными, отсутствие весовых коэффициентов для ранжирования значимости показателей здоровья пациентов и т.д.

Поэтому актуальной задачей является разработка нечеткого нейросетевого метода прогнозирования выживаемости пациентов со смертельными заболеваниями на основе индивидуальных показателей здоровья и предполагаемого метода лечения

Объект исследования: методы анализа и прогнозирования выживаемости пациентов со смертельными заболеваниями.

Предмет исследования: модели и методы прогнозирования выживаемости пациентов на основе индивидуальных значений показателей здоровья.

Цель работы: разработка нечеткого нейросетевого метода прогнозирования выживаемости пациентов на основании индивидуальных значений показателей состояния здоровья, позволяющего выбирать наилучший с точки зрения выживаемости метод лечения.

Для достижения поставленной цели потребовалось решить следующие задачи:

1. проанализировать структуру и состав медицинских данных, а также существующие методы прогнозирования выживаемости пациентов на их основе;

2. разработать алгоритм отбора показателей, значимых для прогнозирования выживаемости пациентов;

3. разработать модель представления знаний для формализации закономерностей в наборе медицинских данных и алгоритм нечеткого логического вывода на модели, а также соответствующую нечеткую нейронную сеть, реализующую прогнозирование выживаемости пациентов на основе индивидуальных значений показателей здоровья и определенного метода лечения;

4. разработать алгоритм обучения нечеткой нейронной сети с использованием информации базы данных электронных историй болезни;

5. разработать программный комплекс, позволяющий строить модели выживаемости пациентов и прогнозировать выживаемость пациента на заданных временных интервалах.

Методы исследования. Для решения поставленной задачи в работе использовались методы корреляционного анализа, экспертных оценок, прикладной статистики, нечеткой логики, теории нейронных сетей и генетических алгоритмов.

Достоверность полученных результатов обеспечивается математически строгим выполнением расчетов и проведением сравнительных испытаний полученных моделей с известными моделями выживаемости.

Научная новизна работы заключается в следующем:

1. разработан корреляционно-экспертный алгоритм, решающий задачу отбора значимых показателей здоровья пациента и определения тем самым входных параметров нечеткой нейронной сети;

2. разработана модель представления знаний для прогнозирования выживаемости, допускающая работу с различными типами данных;

3. разработана схема нечеткого логического вывода на модели, позволяющая получать решение при частично не определенных входных данных;

4. разработана архитектура нечеткой нейронной сети, соответствующая модели представления знаний и схеме вывода;

5. разработан модифицированный генетический алгоритм обучения нечеткой нейросети с небинарным определением хромосомы и генетическими операторами, не допускающими нарушения логического порядка следования значений нечетких входов сети.

Теоретическая значимость работы заключается в разработке:

1. корреляционно-экспертного алгоритма отбора значимых при прогнозировании выживаемости показателей пациента;

2. новой нечеткой модели представления знаний и схемы логического вывода на ней, а также соответствующей архитектуры нечеткой нейронной сети;

3. модифицированного генетического алгоритма обучения нечеткой нейросети с небинарным определением хромосомы и генетическими операторами, не допускающими нарушения логического порядка следования значений нечетких входов сети.

Практическая ценность диссертационной работы состоит в разработке программного комплекса, позволяющего проводить отбор значимых для прогнозирования выживаемости показателей здоровья пациента, строить нечеткую нейросетевую модель выживаемости на основе статистических данных и проводить расчет выживаемости для пациентов.

По проблеме диссертационной работы опубликовано 11 работ, в том числе 2 статьи в журналах из списка, рекомендованного ВАК РФ, 1 статья и 8 тезисов докладов.

С целью апробации основные результаты диссертационной работы докладывались и обсуждались на следующих конференциях:

1. XV Международная молодежная научная конференция «Туполевские чтения» (Казань, 2007);

2. XVII Международная молодежная научная конференция «Туполевские чтения» (Казань, 2009);

3. Международная аэрокосмическая школа (Крым, 2009);

4. Всероссийская научная конференция студентов, аспирантов и молодых ученых «Наука. Технологии. Инновации» (Новосибирск, 2009);

5. XVIII Международная молодежная научная конференция «Туполевские чтения» (Казань, 2010);

6. IV международный научный конгресс «Нейробиотелеком-2010» (Санкт-Петербург, 2010);

7. Двенадцатая международная научно-техническая конференция «Измерение. Контроль. Информатизация» (Барнаул, 2010);

8. XIX Международная молодежная научная конференция «Туполевские чтения» (Казань, 2011),

9. Всероссийская научно-техническая конференция «Проблемы и перспективы развития информационных технологий» (Казань, 2012).

Реализация результатов работы. Результаты исследования внедрены в работу отделения урологии Республиканского клинического онкологического диспансера Министерства Здравоохранения Республики Татарстан в виде системы прогнозирования выживаемости пациентов с диагнозом «Рак почки».

Личный вклад автора. Цель диссертационной работы была сформулирована научным руководителем профессором Емалетдиновой Л.Ю. Анализ особенностей предметной области, постановка решаемых задач, разработка математических моделей и алгоритмов, их программная реализация в виде программного комплекса, анализ полученных результатов и выводы из них выполнены автором самостоятельно.

На защиту выносятся следующие результаты:

1. корреляционно-экспертный алгоритм отбора значимых для прогнозирования выживаемости показателей здоровья пациента;

2. нечеткая модель представления знаний и схема вывода на модели, а также соответствующая архитектура нечеткой нейронной сети;

3. модифицированный генетический алгоритм обучения нечеткой нейросети с небинарным определением хромосомы и генетическими операторами, не допускающими нарушения логического порядка следования значений нечетких входов сети;

4. программный комплекс отбора значимых при прогнозировании показателей пациента, построения нейронечеткой модели выживаемости и расчета выживаемости пациентов на основе индивидуальных значений показателей здоровья.

Структура и объём диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложения.

В первой главе проводится анализ существующих методов прогнозирования выживаемости и особенностей медицинских данных о пациентах. Доказывается, что для решения задачи прогнозирования выживаемости пациентов на основе индивидуальных значений показателей здоровья целесообразно использовать аппарат нечетких нейронных сетей. На основе приведенного анализа существующих архитектур нечетких нейронных сетей и особенностей медицинских данных, а также поставленной задачи, формулируются задачи, требующие решения для достижения цели диссертационной работы.

Во второй главе рассматривается постановка задачи отбора значимых для прогнозирования выживаемости пациентов показателей, анализируются возможные методы ее решения, и доказывается необходимость построения корреляционно-экспертного алгоритма отбора. Приводятся идея алгоритма и разработанный корреляционно-экспертный алгоритм отбора.

В третьей главе сформулированы необходимые требования к модели представления знаний и разработана модель, допускающая работу со входами различных типов, сформулированы требования к схеме нечеткого логического вывода и разработана схема, позволяющая получать решение при частично не определенных входных данных. Разработана архитектура нечеткой нейронной сети, соответствующая разработанной модели и схеме вывода. Проведен анализ возможных видов функций принадлежности значений нечетких входов и для решения задачи выбраны треугольные функции принадлежности. Проведен анализ возможных подходов к обучению нечеткой нейронной сети и разработан

модифицированный генетический алгоритм с мутацией, не допускающий нарушения логического порядка значений нечетких входов в ходе работы операторов.

В четвёртой главе приводится описание разработанного программного обеспечения, реализующего разработанные модели и алгоритмы, его структура и результаты его использования для построения модели выживаемости больных с диагнозом «Рак почки» на основании базы данных электронных историй болезни Республиканского клинического онкологического диспансера. Проведен анализ адекватности полученной модели выживаемости путем сопоставления со статистически рассчитанными прогнозами выживаемости.

В заключении сформулированы научные результаты, полученные в ходе выполнения диссертационной работы.

Диссертация выполнена на кафедре прикладной математики и информатики (ПМИ) Казанского национального исследовательского технического университета им. А.Н. Туполева - КАИ.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Стрункин, Дмитрий Юрьевич

Выводы

1. Для реализации разработанных математический моделей и алгоритмов был разработан соответствующий программный комплекс.

2. С помощью разработанного программного комплекса был проведен отбор значимых показателей для прогнозирования выживаемости пациентов с диагнозом «Рак почки» и построена нечеткая нейросетевая модель прогнозирования выживаемости.

3. Проведенная проверка адекватности построенной модели показала, что модель адекватна выборочным данным.

ЗАКЛЮЧЕНИЕ

В ходе диссертационного исследования решены следующие задачи:

1. Проведены анализ и классификация математических методов прогнозирования выживаемости пациентов, которые показали, что в силу нечеткости, свойственной медицинским данным, и необходимости вероятностной оценки получаемых заключений целесообразным подходом к решению поставленной задачи является использование нечетких нейронных сетей.

2. Предложен алгоритм экспертного отбора значимых для прогнозирования выживаемости показателей здоровья пациента, основанный на предоставлении экспертам качественной информации о корреляции данных и проверке гипотезы о согласованности экспертных мнений.

3. Разработана модель представления знаний для прогнозирования выживаемости, допускающая работу с показателями различных типов, схема нечеткого логического вывода на модели, позволяющая получать решения при частично не определенных входных данных, а также соответствующая архитектура нечеткой нейронной сети.

4. Для обучения нечеткой нейронной сети разработан модифицированный генетический алгоритм с небинарным определением хромосом и новыми генетическими операторами, не допускающими нарушения логического порядка значений нечетких входов.

5. Разработан программный комплекс, реализующий построение модели представления знаний для прогнозирования выживаемости пациентов и саму процедуру прогнозирования.

6. С помощью разработанного программного комплекса решена задача подготовки принятия решений по выбору целесообразного метода лечения пациентов с диагнозом «Рак почки».

Список литературы диссертационного исследования кандидат технических наук Стрункин, Дмитрий Юрьевич, 2012 год

СПИСОК ЛИТЕРАТУРЫ

1. Аверкин А.Н., Батыршин И.З., Блишун А.Ф. и др. Нечёткие множества в моделях управления и искусственного интеллекта / Под ред. Д.А. Поспелова. М.: Наука, 1986.

2. Аникин И.В. Модели нечётких нейронных сетей // Эволюционное моделирование / Под ред. В.А. Райхлина. Труды Казанского городского семинара «Методы моделирования». Вып. 2. - Казань: Изд-во «Наука», 2004.

3. Архангельский А.Я. Delphi 2006. Справочное пособие: Язык Delphi, классы, функции Win32 и NET. - М.: Бином, 2006.

4. Архангельский А.Я. Программирование в Delphi для Windows. Версии 2006, 2007, Turbo Delphi. - М.: Бином, 2007.

5. Асаи К., Ватада Д., Иваи С. и др. / Под ред. Т. Тэрано, К. Асаи, М. Сугено. Прикладные нечёткие системы. - М.: Мир, 1993.

6. Барлоу Р., Прошан Ф. Статистическая теория надежности и испытаний на безотказность. - М.: Наука, 1984.

7. Батыршин И.З. Параметрические классы нечётких конъюнкций в задачах оптимизации нечётких моделей // Исследования по информатике. Вып. 2. ИПИАН РТ. - Казань: Отечество, 2000.

8. Боженко В.К. , Сотников В.М. Использование многопараметрических методов анализа информации в онкологии. Режим доступа : http ://vestnik.rncrr.ru/vestnik/v6/papers/bozhen_v6 .htm

9. Боровиков В. П. Программа STATISTIC А для студентов и инженеров. -М.: КомпьютерПресс, 2001.

10. Боровиков В.П., Ивченко И.Г. Прогнозирование в системе Statistics в среде Windows.-М: Финансы и статистика, 1999.

11. Гланц С. Медико-биологическая статистика. - М.,Практика, 1999.

12. Глова В.И, Подольская М.А. «Ведифит-1» - экспертная система по диагностике и физиотерапии вертебрального синдрома поясничного остеохондроза, ориентированная на ПЭВМ // Материалы I Международного конгресса вертеброневрологов. - Казань: 1991.

13. Головко В.А. Нейронные сети: обучение, организация и применение. -М.: ИПРЖР, 2002.

14. Гохман О.Г. Экспертное оценивание. Учебное пособие. - Воронеж: Изд-во Воронежского Ун-та, 1991.

15. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник - 4-е изд., перераб. и доп. - М.: Финансы и статистика, 2002.

16. Емалетдинова Л.Ю., Габитов Р.И. Автоматизация экспертного оценивания деятельности специалистов лечебного учреждения // Вестник КГТУ им. А.Н.Туполева. - 1997. - №3.

17. Емельянов В. В., Курейчик В. В., Курейчик В. М. Теория и практика эволюционного моделирования — М: Физматлит, 2003.

18. Ермолаев О.Ю. Математическая статистика для психологов. - М.: МПСИ, 2003.

19. Заде J1.A. Основы нового подхода к анализу сложных систем и процессов принятия решений // Математика сегодня. - М.: Знание, 1974.

20. Заде JI.A. Понятие лингвистической переменной и его применение к принятию приближенных решений. М.: Мир, 1976.

21. Катасёв A.C. Эффективное применение Data Mining в науке и образовании // Профессиональные компетенции в структуре модели современного инженера: Материалы региональной научно-методической конференции. Нижнекамск, 29 апреля 2005 года. Под ред. Гафиятова И.З., Дударевой Л.П., Насейкиной JI.M. Казань: Изд-во Казан, гос. техн. ун-та, 2005.

22. Катасёв A.C., Кривилёв М.А. Интеллектуальный автоматизированный подход к формированию баз знаний в экспертных системах //

Инфокоммуникационные технологии глобального информационного общества: Сборник трудов 3-й ежегодной международной научно-практической конференции. Казань, 8-9 сентября 2005 г. - Казань: Изд-во Казан, гос. ун-та им. В.И. Ленина, 2005.

23. Круглов В.В. Адаптивные системы нечёткого вывода // Нейрокомпьютеры: разработка и применение. - 2003. - №5.

24. Круглов В.В., Дли М.И. Интеллектуальные информационные системы: компьютерная поддержка систем нечёткой логики и нечёткого вывода. -М.: Физматлит, 2002.

25. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. - М.: Горячая Линия - Телеком, 2001.

26. Курейчик В. М., Лебедев Б. К., Лебедев О. К. Поисковая адаптация: теория и практика — М: Физматлит, 2006.

27. Леман Э. Проверка статистических гипотез.-М.Наука,1979.

28. Леоненков A.B. Нечёткое моделирование в среде MathLab и fuzzy TECH. - СПб.: БХВ-Петербург, 2003.

29. Медик В.А., Фишман Б.Б., Токмачев М.С. Руководство по статистике в медицине и биологии. В 2-х томах. - М.: Медицина, 2001.

30. Надежность и эффективность в технике: Справочник в десяти томах. Т.6. Экспериментальная отработка и испытания. - М.: Машиностроение, 1989.

31. Омату С., Халид М., Юсоф Р. Нейроуправление и его приложения. - М.: Радиотехника, 2000.

32. Орлов А.И. Экспертные оценки. Учебное пособие. М.: ИВСТЭ, 2002.

33. Паклин Н.Б. Адаптивные модели нечёткого вывода для идентификации нелинейных зависимостей в сложных системах: Дисс. на соиск. уч. степ, к-та техн. наук. - Ижевск, 2004.

34. Пономарев A.C. Нечеткие множества в задачах автоматизированного управления и принятия решений. - Новосибирск: НТУ "ХПИ", 2005.

35. Розенблат Ф. Принципы нейродинамики: Персептрон и теория механизмов мозга: Пер. с англ. - М.: Мир, 1965.

36. Рутковская Д., Пилиньский М., Рутковский JI. Нейронные сети, генетические алгоритмы и нечеткие системы. - М.: Горячая линия-Телеком, 2006.

37. Северцев Н.А. Надежность сложных систем в эксплуатации и обработке. -М.: Высшая школа, 1989.

38. Скрипник В.М., Назин А.Е. Оценка надежности технических систем по цензурированным выборкам. - Минск: Наука и техника, 1981.

39. Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия., Новосибирск: СО РАН, 2005.

40. Хайкин С. Нейронные сети: полный курс. - М.: Вильяме, 2006.

41. Ходасевич Г. Б. Обработка экспериментальных данных на ЭВМ : в 2 ч. Ч. 2. Обработка одномерных массивов Электронный ресурс: учебник / Г. Б. Ходасевич.

Режим доступа: http://dvo.sut.ru/libr/opds/il30hod2/index.htm

42. Черняховская М.Ю. Представление знаний в экспертных системах медицинской диагностики. - Владивосток: Институт автоматики и процессов управления ДВНЦ АН СССР, 1983.

43. Шмойлова Р.А., «Общая теория статистики: Учебник», 3-е издание, М.: Финансы и Статистика, 2002.

44. Ярушкина Н.Г. Нечёткие нейронные сети (часть 2) // Новости искусственного интеллекта. - 2001. - № 4.

45. Яхъяева Г.Э. Нечеткие множества и нейронные сети. - М.: Бином, 2008.

46. Afifi А.А., Elashoff R.M. Missing observations in multivariate statistic // J.Amer. Statist. Assoc.. - 1966. - №61.

47. Batchelor R., DuaP. Forecaster diversity and the benefits of combining forecasts // Management Science. - 1995. - №41.

48. Berkson J. The Calculation of Survival Rates, in Carcinoma and Other Malignant Lesions of the Stomach. - W.B. Saunders, 1942.

49. Berkson J., Gage R.R. Calculation of Survival Rates for Cancer. -Proceedings of Staff Meetings, Mayo Clinic, 1950.

50. Birnbaum Z.W., Saunders S.C. A Statistical Model for Life-Length of Materials // Journal of the American Statistical Association. - 1958. - №53.

51. Boag J.W. Maximum Likelihood Estimates of Proportion of Patients Cured by Cancer Therapy // Journal of the Royal Statistical Society. - 1949. -№11.

52. Boracchi P., Biganzoli E., Marubini E. Modelling cause-specific hazards with radial basis function artificial neural networks: application to 2233 breast cancer patients // Stat.Med.. - 2001. - №24.

53. Breslow N.E., Crowley J. A Large Sample Study of the Life Table and Product Limit Estimates under Random Censoring // Annals of Statistics. -1974. - №2.

54. Brown G.W., Flood M.M. Tumbler Mortality // Journal of the American Statistical Association. - 1947. - №42.

55. Byers R.H. Jr., Morgan W.M., Darrow W.W., Doll L., Jaffe H.W., Rutherford G., Hessol N., O'Malley P.M. Estimating AIDS Infection Rates in the San Francisco Cohort // AIDS. - 1988. - №2.

56. Cohen A.C. Progressively Censored Sample in Life Testing. - 5th Edition -Technometrics, 1963.

57. Collett D. Modelling Survival Data in Medical Research. - Second Edition -New York: Chapman & Hall, 2004.

58. Cox D.R., Oakes D. Analysis of survival data. - New York: Chapman & Hall, 1984.

59. Das A., Bhattacharya M. Computerized decision support system for mass identification in breast using digital mammogram: a study on GA-based neuro-fuzzy approaches // Adv. Exp. Med. Biol. - 2011.

60. Davis D.J. An Analysis of Some Failure Data // Journal of the American Statistical Association. - 1952. - №47.

61. de Bruijne M.H.J., le Cessie S., Kluine-Nelemas H.C., van Houwelingen H.C. On the use of Cox regression in the presence of an irregularly observed time-dependent covariate // Statistic in medicine. - 2001. - №20.

62. De Laurentiis M., De Placido S., Bianco A.R., Clark G.M., Ravdin P.M. A prognostic model that makes quantitative estimates of probability of relapse for breast cancer patients // Clin. Cancer Res.. - 1999. - №12.

63. Duch W., Adamczak R., Grabczewski K. A new methodology of extraction, optimization and application of crisp and fuzzy logic rules // IEEE Trans, on Neural Networks. - 2000. -№11.

64. Endo A., Shibata T., Tanaka H. Comparison of Seven Algorithms to Predict Breast Cancer Survival // J. of Environmental Informatics. - 2011.

65. Epstein B. The Exponential Distribution and Its Role in Life Testing // Industrial Quality Control. - 1958. - №15.

66. Epstein B., Sobel M. Life Testing // Journal of the American Statistical Association. - 1953. -№48.

67. Gaddum J.H. Log Normal Distributions // London: Nature, 1945.

68. Gehan E.A. Estimating Survival Function from the Life Table // Journal of Chronic Diseases. - 1969. - №21.

69. Hald A. Maximum likelihood estimation of the parameters of a normal distribution which is truncated at a known point. - Skandinavisk Aktuarietidskrift, 1949.

70. Hebb D. The organization of behavior. - New York: Wiley, 1961.

71. Henderson R. Analysis of multivariatate survival data. - New York: Springer, 2000.

72. Henderson R., Jones M., Stare J. Accuracy of point predictions in survival analysis // Statistics in Medicine. - 2001. - №20.

73. Holland J.H. Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control, and Artificial Intelligence. -Michigan: University of Michigan Press, 1975.

74. Hopfield J. Neural Networks and physical systems with emergent collective computational abilities // Proceedings of the National Academy of Science USA. - 1984. - №9.

75. Hornik K., Stinchcombe M., White H. Multilayer feedforward networks are universal approximators //Neural Networks. - 1989. - №2.

76. Huang K.J., Sui L.H. The relevance and role of vascular endothelial growth factor C, matrix metalloproteinase-2 and E-cadherin in epithelial ovarian cancer // Med. Oncol.. - 2011.

77. Huang M.L., Hung Y.H., Lee W.M., Li R.K., Wang T.H. Usage of Case-Based Reasoning, Neural Network and Adaptive Neuro-Fuzzy Inference System Classification Techniques in Breast Cancer Dataset Classification Diagnosis // Medical Systems. - 2010.

78. Hunt E.B., Marin J., Stone P.J. Experiments in induction. - New York: Academic Press, 1966.

79. Ikeda J., Morii E., Liu Y., Qiu Y., Nakamichi N., Jokoji R., Miyoshi Y., Noguchi S., Aozasa K. Prognostic significance of CD55 expression in breast cancer // Clin. Cancer Res. - 2008. - №14.

80. Jang J.R., Sun C.T. ANFIS: Adaptive-Network-based Fuzzy Inference Systems // IEEE Tranc. on Systems, Man and Cybernetics. - 1993. - №23.

81. Jang J.R., Sun C.T., Mizutani E. Neuro-Fuzzy and Soft Computing. A Computational Approach to Learning and Machine Intelligence. - London: Prentice Hall, 1997.

82. Kang J.I., Ham B.K., Oh M.M., Kim J.J., Moon G. Correlation between Serum Total Testosterone and the AMS and IIEF Questionnaires in Patients with Erectile Dysfunction with Testosterone Deficiency Syndrome // Korean J. Urol..-2011.-№52.

83. Kaplan E.L., Meier P. Nonparametric Estimation from Incomplete Observations 11 Journal of the American Statistical Association. - 1958. -№53.

84. Klawonn F., Nauck D., Kruse R. Generation Rules from Data by Fuzzy and Neuro-Fuzzy Methods // Proc. of the Third German Workshop "Fuzzy-Neuro-Systeme' 95". - 1995.

85. Kosko B. Competitive Adaptive Bidirectional Associative Memories // Proceedings pf the IEEE First International Conference on Neural Networks. -1987. - №2.

86. Kovalerchuk B., Triantaphyllou E., Ruiz J.F., Clayton J. Fuzzy logic in computer-aided breast cancer diagnosis: analysis of lobulation // Artif. Intell. Med.. - 1997.-№11.

87. Lee E.T., Wang J.W. Statistical Methods for Survival Data Analysis. 3rd Edition // Wiley Series in probability and Statistics, 2003.

88. Lee S.J., Lee H.J., Moon D.H. Quantitative analysis of thymidine kinase 1 and 5'(3')-deoxyribonucleotidase mRNA expression: the role of fluorothymidine uptake // Anticancer Res.. - 2011. - №31.

89. Lipmann R. An introduction to computing with neural nets // IEEE Acoustic, Speech and Signal Processing Magazine. - 1987. - №2.

90. Lukacic Z., Kern J., Tezak-Bencic M. Detecting predictors of new-born survival by fuzzy sets based machine learning system // Stud. Health Technol. Inform.. - 2000. - №77.

91. Lundin M., Lundin J., Burke H.B., Toikkanen S., Pylkkanen L., Joensuu H. Artificial neural networks applied to survival prediction in breast cancer // Oncology. - 1997. -№57.

92. Mamdani E.H. Application of fuzzy logic to approximate reasoning using linguistic systems // Fuzzy Sets and Systems. - 1977. - №26.

93. Mitra S., Pal S., Mitra P. Data Mining in Soft Computing Framework: A Survey // IEEE Trans, on Neural Networks. - 2002. - №13.

94. Mori M., Kitamura K., Masuda M., Hotta T., Miyazaki T., Miura R., Mizoguti H., Shibata A., Saitoh H., Matuda T., Masaoka T., Harada M., Niho Y., Takaku F. Prognostic Factors in Elderly with Non-Hodgkin's Lymphoma: Development of a Model to Predict Survival // The Japanese Clinical Study Group of THP Lymphomas in the Elderly. - 1999.

95. Nagata T., Ichikawa D., Komatsu S., Inoue K., Shiozaki A., Fujiwara H., Okamoto K., Sakakura C., Otsuji E. Prognostic impact of microscopic positive margin in gastric cancer patients // J. Surg. Oncol.. - 2011.

96. Naguib R.N.G, Robinson M.C., Apakama I., Neal D.E., Hamdy F.C. Neural networks analysis of prognostic markers in prostate cancer // Br. J. Urol.. -1996.-№77.

97. Naguib R.N.G., Hamdy F.C. A general regression neural network analysis of prognostic markers in prostate cancer // Neurocomputing. - 1998. - №19.

98. Naguib R.N.G., Hamdy F.C. Prognostic neuroclassification of prostate cancer patients // Proc. IEEE Internat. Conf. Eng. Med. Biol. Soc.. - Chicago: 1997.

99. Newcombe R.G. Two-Sided Confidence Intervals for the Single Proportion: Comparison of Seven Methods // Statistics in Medicine. - 1998. - №17.

100. Nguyen D.V., Rocke D.M. Tumor classification by partial least squares using microarray gene expression data // Bioinformatics. - 2002. - №18.

101.Raab S.S., Grzybicki D.M. Cytologic-histologic correlation // Cancer Cytopathol.. - 2011.

102. Rechichi G., Galimberti S., Signorelli M., Franzesi C.T., Perego P., Valsecchi M.G., Sironi S. Endometrial cancer: correlation of apparent diffusion coefficient with tumor grade, depth of myometrial invasion, and presence of lymph node metastases // AJR Am J. Roentgenol. - 2011. - №197.

103. Rumelhart D., Hinton G., Williams R. Learning representation by back propagation errors //Nature. - 1986. - №323.

104. Salah B., Alshraideh M., Beidas R., Hayajneh F. Skin cancer recognition by using a neuro-fuzzy system // Cancer Information. - 2011. - №10.

105. Schaefer G., Nakashima T. Hybrid cost-sensitive fuzzy classification for breast cancer diagnosis // Conf. Proc. IEEE Eng. Med. Biol. Soc.. - 2010.

106. Setzkorn C., Taktak A.F., Damato B.E., Grabham J. Evolving Oblique Decision Trees For Survival Analysis // Proc. Industrial Conference on Data Mining - Posters. - 2006.

107. Shia S.M., Xub D.L., Bao L. Improving the accuracy of nonlinear combined forecasting using neural networks // Expert Systems with Applications. -1996. -№16.

108. Stintzing S., Fischer von Weikersthal L., Vehling-Kaiser U., Stauch M., Hass H.G., Dietzfelbinger H., Oruzio D., Klein S., Zellmann K., Decker T., Schulze M., Abenhardt W., Puchtler G., Kappauf H., Mittermuller J., Haberl C., Giessen C., Moosmann N., Heinemann V. Correlation of capecitabine-induced skin toxicity with treatment efficacy in patients with metastatic colorectal cancer: results from the German AIO KRK-0104 trial // Br. J. Cancer.-2011.-№105.

109. Sun R. Beyond Simple Rule Extraction: The Extraction of Planning Knowledge from Reinforcement Learners // Proc. of the IEEE Intern. Joint Conf. on Neural Networks. - 2000.

110. Takagi T., Sugeno M. Fuzzy identification of systems and its application to modeling and control // IEEE Transactions, Systems, Man and Cybernetics. -1985.-№15.

111. Ubeyli E.D. Adaptive neuro-fuzzy inference systems for automatic detection of breast cancer // Medical Systems. - 2009. - №33.

112. Wang L.X. Fuzzy Systems are universal approximators // Proc. of the First Intern. Conf. on Fuzzy Systems. 1992.

113. Weibull W. A Statistical Distribution of Wide Applicability // Journal of Applied Mathematics. - 1951. - №18.

114. Weibull W. A Statistical Theory of the Strength of Materials // Ingenioers vetenskaps akakemien Handlingar. - 1939. - №29.

115. Widrow B., Hoff M. Adaptive switching circuits // In 1960 IRE WESCON Convention Record. - 1960.

116. Zadeh L.A. Fuzzy logic, neural networks and soft computing // Communications of the ACM. - 1994. - №37.

117. Zadeh L.A. Fuzzy Sets // Inform. Contr.. - 1965. - №8.

118. Zhang Y.Q., Fraser M.D., Gagliano R.A., Kandel A. Granular Neural networks for numerical-linguistic data fusion and knowledge discovery // IEEE Trans, on Neural Networks. - 2000. -№11.

119. Zhao X., Huang K., Zhu Z., Chen S., Hu R. Correlation between expression of leptin and clinicopathological features and prognosis in patients with gastric cancer // J. Gastroenterol Hepatol. - 2007.

ПРИЛОЖЕНИЕ 1. ОСНОВНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ, ИСПОЛЬЗУЕМЫЕ ПРИ ПРОГНОЗИРОВАНИИ ВЫЖИВАЕМОСТИ

ПАЦИЕНТОВ.

Модель пропорциональных интенсивностей Кокса.

Модель пропорциональных интенсивностей Кокса - наиболее общая регрессионная модель, поскольку она не связана с какими-либо предположениями относительно распределения времени выживания. Эта модель предполагает, что функция риска имеет

некоторый уровень, являющийся функцией независимых переменных, то есть ковариат. Никаких предположений о виде функции риска не делается. Поэтому модель Кокса может рассматриваться как в некотором смысле непараметрическая. Модель может быть записана в следующем виде: Н^,хх,х2,...,х р) - /г0(О х ехр(аххх + а2х2 + ... + архр),

где /г(/,х1,х2,...,хр) обозначает результирующую функцию риска, при заданных для соответствующего наблюдения значениях р ковариат х1,х2,...,хр и соответствующем времени жизни г. Множитель

называется базовой функцией интенсивности, она равна интенсивности в случае, когда все независимые переменные равны нулю. Можно линеаризовать эту модель, поделив обе части соотношения на /*0(О и взяв натуральный логарифм от обеих частей:

/2 ОС| у ОС2 5 • • • 5 ОС р ),

А„(0

После такого преобразования модель может быть эффективно изучена [58,61].

1п(----) = аххх + а2х2 + ... + архр.

Однако полученная модель подразумевает два предположения. Во-первых, зависимость между функцией риска и логлинейной функцией ковариат является мультипликативной. Это соотношение называется также предположением (гипотезой) пропорциональности. Оно означает, что для двух заданных наблюдений с различными значениями независимых переменных отношение их функций риска не зависит от времени. Второе предположение состоит именно в логарифмической линейности соотношения между функцией риска и независимыми переменными.

Во многих реальных исследованиях предположение пропорциональности может не выполняться. Чтобы ослабить это предположение, используются ковариаты зависящие от времени. Но использование таких ковариат очень усложняет модель и делает возможным ее использование лишь в частных случаях.

Нормальная и логнормалъная модели регрессии.

В этой модели предполагается, что время выживания или логарифм от времени выживания имеет нормальное распределение. Модель, в основном, идентична обычной модели множественной регрессии и может быть описана следующим образом:

( = а0 + аххх + а2х2 +... + а хр,

где время выживания пациента, х1,х2,...,хр- ковариаты, а а1,а2,...,ар -некоторые коэффициенты при ковариатах. Если принимается модель логнормальной регрессии, то £ заменяется 1п ?. Модель нормальной регрессии особенно полезна, поскольку часто данные могут быть преобразованы к нормальному распределению применением нормализующих аппроксимаций. Таким образом, в некотором смысле это наиболее общая параметрическая модель, оценки которой могут быть получены для большого разнообразия исходных распределений времен выживания [6].

Модель экспоненциальной и вейбулловской регрессии.

В своей основе эти модели предполагают, что распределение времени выживания является экспоненциальным или вейбулловским. При этом

параметр ^ в этих распределениях представляется в виде

X = ехр(я0 + аххх + а2х2 + ... + архр),

где время выживания пациента, хх,х2,...,хр- ковариаты, а ах,а2,...,ар -некоторые коэффициенты при ковариатах [53].

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.