Метод главного эксперта в задачах диагностики и прогнозирования тема диссертации и автореферата по ВАК РФ 01.01.09, кандидат физико-математических наук Демьянова, Вероника Владимировна

  • Демьянова, Вероника Владимировна
  • кандидат физико-математических науккандидат физико-математических наук
  • 2008, Санкт-Петербург
  • Специальность ВАК РФ01.01.09
  • Количество страниц 156
Демьянова, Вероника Владимировна. Метод главного эксперта в задачах диагностики и прогнозирования: дис. кандидат физико-математических наук: 01.01.09 - Дискретная математика и математическая кибернетика. Санкт-Петербург. 2008. 156 с.

Оглавление диссертации кандидат физико-математических наук Демьянова, Вероника Владимировна

Список обозначений.

ВВЕДЕНИЕ.

§0.1. Общая характеристика работы.

§0.2. Содержание работы

Глава 1. ОДНОМЕРНАЯ ИДЕНТИФИКАЦИЯ И РАНЖИРОВАНИЕ

§1.1. Постановка задачи идентификации.

§1.2. Задача одномерной идентификации. Идентификация методом разделения

1.2.1. Постановка задачи.

1.2.2. Необходимые и достаточные условия оптимальности.

1.2.3. Численный метод для минимизации т(х).

1.2.4. Квазивыпуклые функции

§1.3. Одномерная идентификация методом изоляции

1.3.1. Идентификация методом изоляции.

1.3.2. Метод покоординатного спуска для минимизации m{z).

1.3.3. Метод сопряженных направлений для минимизации m{z).

§1.4. Ранжирование параметров.

1.4.1. Ранжирование с помощью одномерной идентификации.

Глава 2. МЕТОД ГЛАВНОГО ЭКСПЕРТА

В ЗАДАЧАХ ИДЕНТИФИКАЦИИ.

§2.1. Постановка задачи идентификации

§2.2. Метод главного эксперта.

§2.3. "Выборочные" вероятности правильной и неверной идентификации методом главного эксперта.

§2.4. Параметрическая оптимизация

§2.5. Примеры

Глава 3. ЗАДАЧА ПРОГНОЗИРОВАНИЯ И МЕТОД ГЛАВНОГО ЭКСПЕРТА.

§3.1. Введение.

§3.2. Задача прогнозирования

§3.3. Исследование множеств fii и 0,2 методом главного эксперта.

Глава 4. ПРОГНОЗИРОВАНИЕ ЭФФЕКТИВНОСТИ ХИМИОТЕРАПИИ ПРИ ЛЕЧЕНИИ ОНКОЛОГИЧЕСКИХ ЗАБОЛЕВАНИЙ

§4.1. Введение и постановка задачи.

§4.2. Разделение баз СТ-140 и WCT

4.2.1. Разделяющие гиперплоскости.

4.2.2. Разделение базы СТ

4.2.3. Разделение базы WCT-113.

§4.3. Перекрестное исследование баз WCT-113 и СТ

4.3.1. Исследование базы WCT-113 с помощью плоскости Ь\

4.3.2. Исследование базы СТ-140 с помощью плоскости L

Рекомендованный список диссертаций по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Введение диссертации (часть автореферата) на тему «Метод главного эксперта в задачах диагностики и прогнозирования»

§ 0.1. Общая характеристика работы.

Актуальность темы. "Homo sapiens" , как "человек разумный" , наблюдая явления внешнего мира, старается выявить его закономерности ("законы природы") и действует, учитывая эти законы. Другими словами, человек строит модель внешнего мира (или какого-то процесса). Все современные науки (исключая гуманитарные) представляют собой набор моделей, описывающих те или иные стороны внешнего мира. Математика, как "царица" наук, призвана обслуживать эти модели. Иногда эти модели достаточно адекватно описывают изучаемые объекты или процессы (так называемые "точные" науки), другие процессы пока не поддаются точному описанию (медицина, биология), но и там прогресс стремительно развивается (см., например, [3, 4]). Толчком к этому послужило развитие вычислительной техники и основанных на ней информационных технологий. Многие выдающиеся достижения биологии последних десятилетий были бы невозможны без использования математических методов. Биоматематика стала существенной частью биологии. Необходимость решения задач диагностики в медицине и технике привели к появлению "математической диагностики" , которая включает в себя математический аппарат, используемый для изучения моделей для решения задач идентификации, распознавания образов, обработки экспериментальных данных, технической и медицинской диагностики, прогнозирования. Такие задачи возникают в различных областях пауки. Для их решения строятся различные модели и применяются различные подходы. К сожалению, одного универсального подхода не существует, что приводит к необходимости строить модели, учитывающие специфику конкретного класса задач, и разрабатывать (или использовать существующие) методы их исследования.

Конечной целью изучения баз данных является выявление закономерностей, которым подчиняется изучаемый процесс или явление. Часто эта цель недостижима, поскольку имеющиеся данные могут быть недостаточно достоверными или не отражающими существенные свойства процесса и потому не позволяющими выявить искомые закономерности. Это зависит и от качества имеющейся модели. В данном исследовании эти вопросы не затрагиваются. Нашей целью является оптимальная (в том или ином смысле) обработка уже имеющейся информации (баз данных).

Практические задачи идентификации, диагностики, обработки баз экспериментальных данных, планирования эксперимента привели к развитию теории распознавания образов (см., например, работы В.Н.Вапника, Ю.И.Журавлева и др. [9, 27, 29, 41, 88], а также обзор [82]). Вначале в основном применялись статистические методы обработки баз данных, начало которым положили работы Р.А.Фишера [68] (см. также [2, 4, 5, 42]). Р.Фишер создал лииейный дискриминантный анализ [51]. Появилась математическая теория обучения (см. работы В.Н.Вапника, Ф.Розенблата, В.Н.Фомина, Я.З.Цыпкина, В.А.Якубовича [9, 46, 52, 53, 79, 85, 88]) и соответствующие алгоритмы [17, 32, 40, 46, 87]. В середине прошлого столетия наряду со статистическим подходом стал широко применяться оптимизационный подход. Это связано как с развитием численных методов оптимизации и вычислительной техники, так и с тем, что зачастую статистические характеристики баз данных либо неизвестны, либо их трудно получить. В развитие теории и методов оптимизации внесли существенный вклад как отечественные (советские и российские) ученые, так и зарубежные исследователи (Л.В.Канторович, Ю.И.Журавлев, И.И.Еремин, Б.Н.Пшеничный, В.Н.Тихомиров, Дж.Данциг, Р.Рокафеллар и др.). Методы оптимизации применяются к решению широкого круга вопросов идентификации и обработки данных (см., например, работы А.А.Первозванского, Я.З.Цыпкина, Б.Т.Поляка [11, 13, 44, 46, 63, 70, 75, 76, 78, 89]).

Одним из эффективных методов решения задач обработки данных является кластерный анализ (см. [26, 27, 55, 58, 61, 69, 71, 80, 86]).

В настоящее время существует два подхода к решению задач математической диагностики: статистический и оптимизационный. Первый подход использует вероятностные и статистические методы (это требует изучения статистических характеристик изучаемого процесса, что иногда затруднительно вследствие отсутствия достаточного количества наблюдений), второй - оптимизационный - использует методы математического программирования. Эти подходы взаимно дополняют друг друга и позволяют проводить диагностику и прогнозирование, например, эффективности применения той или иной методики лечения или обучения, с большей надежностью.

Хотя, как отмечено выше, статистический подход к решению задач диагностики начал развиваться еще с начала прошлого века, а оптимизационный - с середины XX столетия, остается немало нерешенных вопросов, актуальность которых не уменьшается. Возникают новые задачи, требующие соответствующего математического и программного обеспечения.

Предлагаемая работа относится ко второму (оптимизационному) направлению.

Одна из задач, которая изучается в данной работе, ставится следующим образом. Имеется две (в действительности может быть и больше) базы экспериментальных данных: А и В. Каждая из них представляет собой набор точек в многомерном пространстве. Предполагается, что каждая из этих баз является генеральной выборкой из некоторого (каждая из своего) случайного процесса. Требуется пайти правило, по которому любую точку из множества С = A U В можно идентифицировать как точку того или иного множества. Математически задача сводится к разделению двух множеств точек. Если выпуклые оболочки множеств А и В не пересекаются, то задача решается с помощью теоремы отделимости: проводится разделяющая гиперплоскость, и точки, находящиеся по одну сторону гиперплоскости, принадлежат одному множеству, а точки, находящиеся по другую ее сторону, принадлежат второму множеству. К сожалению, в реальных задачах указанное условие не выполняется, поэтому приходится проводить разделение неточно. И здесь возникает задача найти такую гиперплоскость (если разделение проводится с помощью гиперплоскости, хотя можно разделять и другими поверхностями и способами), которая обеспечивает наилучшее (в том или ином смысле) разделение. И вот на этом этапе и возникают задачи выбора функционала, способа идентификации (построение идентификатора), построение численного метода.

Вначале для разделения множеств применялись, в основном, методы линейного программирования, которые исторически были разработаны раньше (см. [13, 44]). Наиболее популярным в настоящее время является метод опорных плоскостей (SVM - support vector machines), основанный на линейном программировании или сводящиеся к нему с помощью так называемых методов ядра (kernel methods) (В.Н.Вапник, О.Мапгасарян) ([9, 54, 60, 65, 75, 66, 76, 77, 88]). Использование методов нелинейного и негладкого программирования позволяет значительно улучшить качество идентификации (см. [14, 15, 33, 37, 47, 56, 59, 73]).

Одной из важных проблем при обработке баз данных является ранжирования параметров. Выбор наиболее значимых параметров позволяет ускорить обработку результатов экспериментов и удешевить их проведение (поскольку получение данных является часто дорогостоящей или - в случае медицинских баз данных - болезненной или даже опасной процедурой).

Существуют различные способы ранжирования [26, 34, 35, 57, 62, 72, 83].

Задачи диагностики в медицине являются одновременно и весьма важными, и сложными. Им посвящены многие исследования (см., например, работы [1, 12, 16, 24, 25, 36, 43, 48]).

Актуальность тематики определяется и необходимостью разработки эффективных методов диагностики и прогнозирования, в том числе "экспресс-диагностики" для принятия оперативных решений (первая помощь в медицине, при технологических авариях), когда полная информация недоступна или еще не готова.

Цели и задачи исследования

Целями диссертационной работы являются:

1) исследование задач обработки баз экспериментальных данных и разработка оптимизационных методов идентификации, распознавания, классификации, диагностики и прогнозирования эффективности различных способов обучения и лечения,

2) на основе полученных результатов выявление закономерностей изучаемого процесса.

Указанные цели достигаются: а) решением задач одномерной и "малоразмерной" идентификации; б) решением задачи ранжирования параметров на основе одномерной идентификации; в) разработкой нового метода (метод главного эксперта) для построения правила идентификации (идентификатора, решающего правила или классификатора) при наличии нескольких идентификаторов; г) разработкой методики прогнозирования эффективности различных способов обучения и лечения на основе метода главного эксперта.

Основными методами исследования являются методы математической диагностики, математического программирования, теории вероятностей и математической статистики, математического моделирования. Предлагаемые методы идентификации и прогнозирования построены на основе оптимизационного подхода и не используют статистические характеристики изучаемого процесса или явления (которые обычно заранее не известны).

Эти методы апробированы на конкретных базах данных (в частности, на базе данных больных раком молочной железы СНЕМО-253 Висконсинского университета для прогнозирования эффективности различных схем послеоперационного лечения).

Научная новизна диссертационной работы состоит в разработке оптимизационных методов решения задач одномерной идентификации баз данных, метода главного эксперта (позволяющего построить более эффективный метод идентификации, используя имеющиеся идентификаторы, полученные, например, с помощью одномерных или двумерных идентификаторов), метода прогнозирования эффективности разных способов обучения, лечения и т.п.

Основные положения, выносимые на защиту:

1) новые оптимизационные методы решения задач одномерной идентификации точек двух множеств (метод разделения и метод изоляции);

2) метод ранжирования на основе одномерной идентификации; с его помощью строятся простые идентификаторы (одномерные, двумерные или трехмерные) для наиболее существенных параметров. Эти простые идентификаторы могут использоваться для экспресс-идентификации и распознавания.

3) метод главного эксперта (МГЭ) для построения правила идентификации (идентификатора, решающего правила или классификатора) при наличии нескольких идентификаторов. Каждый из указанных идентификаторов может оказаться не очень точным, но с помощью МГЭ качество идентификации может быть существенно улучшено.

4) методика прогнозирования эффективности различных способов обучения и лечения, разработанная на основе метода главного эксперта.

Практическая ценность. С помощью разработанной методики проведено исследование базы данных СНЕМО-253 больных раком молочной железы и предложена методика прогнозирования эффективности применения или неприменения различных видов терапии для лечения конкретного пациента. База содержит данные о 253 пациентах, которым была сделана хирургическая операция. Будем считать, что комплексное лечение было успешным, если срок жизни пациента после операции составил 5 и более лет. В результате математической обработки были составлены 16 подгрупп - от неблагоприятного до благоприятного прогноза по каждой из четырех схем лечения со своей вероятностью.

Для каждого пациента определено место в одной из подгрупп и рекомендовано именно то лечение, при котором прогноз для него наиболее благоприятен. В действительности более 5 лет прожило 115 человек. При использовании двух параметров удалось прогнозировать благоприятный исход у 141, а при использовании трех параметров - у 155 пациентов. Метод главного эксперта позволяет существенно повысить качество прогнозирования эффективности лечения.

Указанный метод может оказать существенную помощь не только в процессе сопровождения лечебно-диагностического процесса, но и при обработке результатов массовых обследований, проводимых в целях профессионального психофизиологического отбора и психофизиологического сопровождения профессиональной деятельности.

Результаты научных исследований прошли апробацию на Международной конференции "Longevity, Aging and Degradation Models in Reliability, Public Health, Medicine and Biology (LAD'2004)"(Санкт-Петербург, СП6ПТУ, 2004); на 35-й межвузовской научной конференции аспирантов и студентов СПбГУ "Процессы управления и устойчивость"(С.Петербург, 2004г.); на 37-й межвузовской научной конференции аспирантов и студентов СПбГУ "Процессы управления и устойчивость"(С.-Петербург, 2006г.); на Международной конференции "Устойчивость и процессы управления" (С.-Петербург, 29.06.2005-01.07.2005); на Всероссийской конференции "Психофизиология профессионального здоровья человека"(С.Петербург, Военно-медицинская Академия, 16 ноября 2007г.); на научной конференции Военного Института физической культуры (СПб, 1995г.), на Международном семинаре по математической диагностике в Эриче (Сицилия, Италия, 10-20 июля 2006г., Workshop MATHEMATICS AND MEDICAL DIAGNOSIS).

Связь с научными программами. Частично исследования по теме диссертации выполнялись в рамках проекта "Инновационная образовательная среда в классическом университете" Национального проекта "Образование" в 2006 и 2007 годах по темам "Методика составления прогноза эффективности применения различных способов лечения" (2006 г., СПбГУ) и "Разделение баз данных результатов медицинских исследований" (2007 г., СПбГУ).

Публикации. По материалам диссертации опубликованы 12 работ, четыре из которых в изданиях, входящих в перечень ВАК рецензируемых научных журналов. Список работ приведен в конце диссертации.

Структура и объем диссертации. Диссертация изложена на 156 страницах и состоит из Введения, пяти глав, заключения, шести Приложений, списка обозначений и списка литературы, включающего 91 наименование. Работа содержит 10 рисунков и 30 таблиц в основном тексте и 6 рисунков и 36 страниц таблиц в Приложениях.

Похожие диссертационные работы по специальности «Дискретная математика и математическая кибернетика», 01.01.09 шифр ВАК

Заключение диссертации по теме «Дискретная математика и математическая кибернетика», Демьянова, Вероника Владимировна

ЗАКЛЮЧЕНИЕ

В данной работе получены следующие новые результаты:

1) предложены метод разделения и метод изоляции для решения задач одномерной идентификации точек двух множеств на основе оптимизационного подхода;

2) описан метод ранжирования параметров, использующий метод одномерной идентификации; с его помощью строятся простые идентификаторы (одномерные, двумерные или трехмерные) для наиболее существенных параметров. Эти простые идентификаторы могут использоваться для экспресс-идентификации и распознавания.

3) предложен метод главного эксперта (МГЭ) для построения правила идентификации при наличии нескольких идентификаторов. Каждый из указанных идентификаторов может оказаться не очень точным, но с помощью МГЭ качество идентификации может быть существенно улучшено.

Метод главного эксперта имеет ряд преимуществ перед традиционными математико-статистическими процедурами:

- можно работать с выборкой, не подчиняющейся закону нормального распределения;

- использование МГЭ на малых выборках является корректным;

- минимизируется количество показателей, используемых для прогнозирования, и время самой процедуры как получения, так и обработки данных.

Кроме того, получение каждого показателя - это лишние затраты средств, времени, а в случае медицины - и здоровья пациента (например, проведение биопсии - болезненная, дорогостоящая, длительная и не всегда безопасная процедура).

4) на основе метода главного эксперта разработана методика прогнозирования эффективности различных способов обучения и лечения.

5) эта методика использована для прогнозирования эффективности применения химио- и/или гормональной терапии в послеоперационном периоде при лечении онкологических заболеваний. С помощью предложенной методики все пациенты делятся на несколько прогностических групп. Для каждой группы даются вероятности благоприятного исхода как в случае применения химио- и/или гормональной терапии, так и в случае их отсутствия. Для каждого пациента определено место в одной из подгрупп и рекомендовано именно то лечение, при котором прогноз для него наиболее благоприятен. В результате удалось прогнозировать благоприятный исход у существенно большего, чем было в действительности, количества пациентов на 15-30 процентов в зависимости от того, на сколько прогностических групп были разделены пациенты и какие способы лечения применялись).

МГЭ позволяет существенно повысить качество прогнозирования эффективности лечения. Указанный метод может оказать существенную помощь не только в процессе сопровождения лечебно-диагностического процесса, но и при обработке результатов массовых обследований, проводимых в целях профессионального психофизиологического отбора и психофизиологического сопровождения профессиональной деятельности.

Отметим, что МГЭ предлагается использовать не взамен, а наряду с традиционными статистическими методами, это позволит повысить надежность и качество прогнозирования.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в изданиях, входящих в перечень ВАК рецензируемых научных журналов

1. Демьянова В. В. Одномерная идентификация методом разделения // Вестн. С.-Петерб. ун-та; Сер. 10. Прикладная математика, информатика, процессы управления. 2006. Выи. 3. С. 28-31.

2. Демьянов В. Ф., Демьянова В. В., Кокорина А. В., Моисеенко В. М. Прогнозирование эффективности химиотерапии при лечении онкологических заболеваний // Вести. С.-Петерб. ун-та; Сер. 10. Прикладная математика, информатика, процессы управления. 2006. Вып. 4. С. 30-36.

3. Демьянова В.В. Прогнозирование эффективности различных способов лечения // Вести. С.-Петерб. ун-та; Сер. 10. Прикладная математика, информатика, процессы управления. 2007. Вып. 4. С. 3-16.

4. Демьянова В.В. Применение оптимизационного подхода в сопровождении лечебного процесса // Вестник Российской Военно-медицинской академии. 2007. Приложение N 3 (19). (Материалы конференции "Психофизиология профессионального здоровья человека" .) С. 219-220.

Публикации в других изданиях

5. Демьянова В. В. Некоторые особенности работы с социально-травмированными подростками / / Методические материалы по социальной работе. Ассоциация "Врачи мира" (Франция). Институт подростка Санкт-Петербурга. Изд-во Санкт-Петербургского гос. технологического ун-та. СПб, 1995. С. 73-75.

6. Демьянова В. В., Капитонов В.А., Баландин B.C., Королев Ю.Н. Некоторые психологические особенности представителей социально-значимых профессий, работающих с группами риска // Материалы итоговой научной конференции за 1995г. Военный Институт физической культуры. Под ред. проф. Кадырова Р.Н. и доц. Кислого А.Н. Изд-во ВИФК. СПб, 1996. С. 184.

7. Демьянова В. В. Применение математических методов в психодиагностике // Процессы управления и устойчивость: Труды 35-й межвузовской научной конференции аспирантов и студентов. Под ред. Н.В. Смирнова. - СПб.: Изд-во СПбГУ, 2004. С. 297-302.

8. Demyanova V. V. Psychodiagnostics of reliability of competition activity in sports by means of mathematical modelling // Proceedings of the Conference "Longevity, Aging and Degradation Models in Reliability, Public Health, Medicine and Biology (LAD'2004)" . Vol. 2. СПб: Изд-во Санкт-Петербурского Политехнического университета. 2004. Р. 96-100.

9. Demyanova V. V. The principal expert method in data mining // Applied Comput. Math. 2005. Vol. 4, N 1. P. 70-74.

10. Демьянова В. В. Метод главного эксперта в задачах идентификации / / Труды Между нар. конференции "Устойчивость и процессы управления"/ (С.-Петербург, 29.06.2005-01.07.2005). Ред. Д. А. Овсянников, JI. А. Петросян. СПб.: Изд-во С.-Петерб. ун-та, 2005. Т. 2. С. 815-822.

11. Demyanova V. V., Demyanov V.F. The Method of Virtual Experts in Mathematical Diagnostics // Journal of Global Optimization. 2006. Vol. 35 P. 215-234.

12. Демьянова В.В. Задача прогнозирования и метод главного эксперта //Процессы управления и устойчивость: Труды 37-й межвузовской научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова. - СПб.: Изд-во СПбГУ, 2006. С. 198-204.

Список литературы диссертационного исследования кандидат физико-математических наук Демьянова, Вероника Владимировна, 2008 год

1. Амосов Н.М., Зайцев Н.Г., Мельников А.А. и др. Медицинская информационная система. Киев: Наукова думка, 1971.

2. Барабаш Ю.Л., Барский Б.В., Зиновьев В.Т. и др. Вопросы статистической теории распознавания. М.: Советское радио, 1967.

3. Бейли Н. Математика в биологии и медицине. Пер. с англ. М.: Мир, 1970.

4. Бейли Н. Статистические методы в биологии. Пер. с англ.; под ред. В.В. Налимова. М.: Иностранная литература, 1962.

5. Бешелев С.Д., Гурвич Ф.Г. Математико-статистические методы экспертных оценок. М.: Статистика, 1980.

6. Балъд А. Последовательный анализ. Пер. с англ.; под ред. В.А. Севастьянова. М.: Наука, 1960.

7. Бальд А. Статистические решающие функции. Позиционные игры. Под ред. Н.Н. Воробьева и Н.Н Врублевской. М.: Наука, 1967, с. 300-522.

8. Ван дер Варден Б.Л. Математическая статистика. Пер. с немецкого; под ред. Н.В. Смирнова. М.: Иностранная литература, 1960.

9. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения). М.: Наука, 1974.

10. Барис Я. В. Одномерная идентификация двух дискретных множеств с помощью двух отрезков // Труды XXXV научной конференции аспирантов и студентов "Процессы управления и устойчивость". СПб: Издательство СПбГУ, 2004, с. 291-293.

11. Гелъфанд И.М., Пятецкий-Шапиро И.И., Федоров Ю.Г. Отыскание структуры кристаллов с помощью метода нелокального поиска // ДАН СССР, т. 152, № 5, 1963, с. 1045-1048.

12. Генкин А.А. Новая информационная технология анализа медицинских данных (программный комплекс ОМИС). СПб.: Политехника, 1999.

13. Головкин Б.А. Машинное распознавание и линейное программирование. М.: Советское радио, 1972.

14. Григорьева К. В. Аппроксимация критериального функционала в задачах математической диагностики: Диссертация на соискание ученой степени к.ф.-м.н. СПб: С.-Петерб. ун-т, 2006. 191 с.

15. Григорьева К. В. Идентификация множеств с помощью негладкой модели. Процессы управления и устойчивость. Труды XXXV научной конференции аспирантов и студентов. СПб: Изд-во С.-Петерб. Ун-та, 2004, с.294-296.

16. Гублер Е.В. Вычислительные методы анализа и распознавания патологических процессов. JL: Медицина, 1978.

17. Девятериков И. П., Пропой А.И., Цыпкин Я.З. О рекуррентных алгоритмах обучения распознавания образов / / Автоматика и телемеханика, № 1, 1967.

18. Демьянова В.В. Задача прогнозирования и метод главного эксперта //Процессы управления и устойчивость: Труды 37-й межвузовской научной конференции аспирантов и студентов / Под ред. Н.В. Смирнова. СПб.: Изд-во СПбГУ, 2006. С. 198-204.

19. Демьянова В. В. Прогнозирование эффективности различных способов лечения // Вести. С.-Петерб. ун-та; Сер. 10. Прикладная математика, информатика, процессы управления. 2007. Вып. 4. С. 3-16.

20. Дубров A.M. Обработка статистических данных методом главных компонент. М.: Статистика, 1978.

21. Дюк В.А. Методология поиска логических закономерностей в предметной области с нечеткой системологией // Автореферат диссертации на соискание ученой степени д.т.н. СПб, СПбГУ, 2005.

22. Дюк В., Эмануэль В. Информационные технологии в медико-биологических исследованиях. СПб.: Питер, 2003. 528 с.

23. Елисеева И.И., Руковишников В.О. Группировка, корреляция, распознавание образов. М.: Статистика, 1977.

24. Журавлев Ю.И., Дмитриев А.Н., Кренделев Ф.Н. О математических принципах классификации предметов и явлений // Дискретный анализ. Сб. трудов ИМ СО АН СССР. Новосибирск, № 7, 1966.

25. Заботин Я.И., Кораблев Ф.И., Хабибулин Р.Ф. О минимизации квазивыпуклых функционалов // Известия ВУЗов. Математика. 1972. No. 10. С. 27-33.

26. Загоруйко Н.Г. Методы распознавания и их применения. М.: Советское радио, 1972.

27. Карманов В.Г. Математическое программирование. М.: Наука, 1975.

28. Кендалл М.; Стюарт А. Статистические выводы и связи. Пер. с англ.; под ред. А.Н. Колмогорова и Ю.В. Прохорова. М.: Наука, 1973.

29. Козинец Б.Н. Рекуррентный алгоритм разделения двух множеств. В сб. под ред. В.Н. Вапника "Алгоритмы обучения распознавания образов". М.: Советское радио, 1973.

30. Кокорина А.В. Ранжирование дискретных параметров в задачах обработки данных // Труды XXXIV научной конференции аспирантов и студентов "Процессы управления и устойчивость". СПб: Издательство СПбГУ, 2003, с. 276-279.

31. Кокорина А.В. Ранжирование параметров в задачах обработки данных // Труды XXXIII научной конференции студентов и аспирантов "Процессы управления и устойчивость". СПб: ООП НИИ Химии СПбГУ, 2002, с. 277 281.

32. Кокорина А.В. Оптимизационный подход в задачах математической диагностики. Диссертация на соискание ученой степени к.ф.-м.н. СПб, СПбГУ, 2004.

33. Колкот Э. Проверка значимости. Пер. с англ. М.: Статистика, 1978.

34. Кульбак С. Теория информации и статистика. Пер. с англ.; под. ред. А.Н. Колмогорова. М.: Наука, 1967.

35. Литваков Б.М. О сходимости рекуррентных алгоритмов обучения распознаванию образов // Автоматика и телемеханика, № 1, 1968.

36. Логинов В.И., Хургин Я.И. Общий подход к проблеме распознавания образов. Сб. тр. МИНХ и ГП, вып. 62. М.: Недра, 1966.

37. Малета Ю.С., Тарасов В. В. Математические методы статистического анализа в биологии и медицине. Вып. 1, вып. 2. М.: Издательство МГУ, 1982.

38. Неймарк Ю.И., Баталова З.С. и др. Распознавание образов и медицинская диагностика. М.: Наука, 1972.

39. Первозванский А.А. Распознавание абстрактных образов, как задача линейного программирования // Известия АН СССР, Техническая кибернетика, № 4, 1965.

40. Петрова Н.В. Разделение двух дискретных одномерных множеств методом изоляции // Труды XXXV научной конференции аспирантов и студентов "Процессы управления и устойчивость". СПб: Издательство СПбГУ, 2004, с. 328-330.

41. Поляк Б. Т., Цыпкин Я.З. Псевдоградиентпые алгоритмы адаптации и обучения // Автоматика и телемеханика, № 1, 1973.

42. Приставко В.Т., Ярвельян А.В. Методы разделяющей гиперплоскости в медико-биологических задачах // Труды XXXV научной конференции аспирантов и студентов "Процессы управления и устойчивость". СПб: Издательство СПбГУ, 2004, с. 331-333.

43. Славин М.Б. Методы системного анализа в медицинских исследованиях. М.: Медицина, 1989.

44. Тинтнер Г. Введение в эконометрию. Пер. с англ. М.: Статистика, 1965.

45. Уилкс С. Математическая статистика. М.: Наука, 1967.

46. Урбах В.Ю. Дискриминантный анализ: основные идеи и приложения. Сб. Статистические методы классификации, вып. 1. МГУ, 1969.

47. Фомин В.Н. Математическая теория обучаемых опознающих систем. -М.: Издательство ЛГУ, 1976.

48. Якубович В.А. Некоторые общие теоретические принципы построения обучаемых опознающих систем. Сб. Вычислительная техника и вопросы программирования. ЛГУ, 1965.

49. Advances in Kernel Methods. Support Vector Learning (1999). Eds. B.Schoelkopf, C.J.C.Burgcs, A.J.Smola. The MIT Press, Cambridge, Mass.; London, England.

50. Anderberg M.R. Cluster Analysis for Applications. Academic Press, 1973.

51. Astorino A., Gaudioso M. Polyhedral Separability through Succcssive LP. Journal of Optimization Theory and Applications, 112 (4), 265-293. 2002.

52. Bagirov A.M., Rubinov A.M. and Yearwood J. A heuristic algorithm for feature selection based on optimization techniques. In: Sarker R., Abbas H. and Newton C.S. (eds.), Heuristic and Optimization for Knowledge Discovery. Idea Publishing Group. 2000.

53. Bagirov A.M., Rubinov A.M. and Yearwood J. A global optimization approach to classification. Optimization and Engineering 3, 2002, pp. 129 155.

54. Bennett К.P. and Mangasarian O.L. Robust linear programming discrimination of two linearly inseparable sets. Optimization Methods and Software 1, 1992, pp. 23-34.

55. Bhuyan N.J., Raghavan V.V. and Venkatesh K.E. Genetic algorithms for clustering with an ordered representation. Proceedings of the Fourth International Conference on Genetic Algorithms, 1991, pp. 408-415.

56. Bradley P.S. and Mangasarian O.L. Feature selection via concave minimization and support vector machines. Machine Learning Proceedings of the Fifteenth International Conference (ICML'98), San Francisco, California. Morgan Kaufmann, 1998, pp. 82-90.

57. Bradley P.S. and Mangasarian O.L. Massive data discrimination via linear support vector machines. Optimization Methods and Software 13, 2000, pp. 1-10.

58. Chen C. and Mangasarian O.L. Hybrid misclassification minimization. Mathematical Programming Technical Report 95-05, University of Wisconsin, 1995.

59. Cristianini N. and Shawe-Taylor J. An Introduction to Support Vector Machines and other kernel based methods. Cambridge University Press, 2000.

60. DeCoste D. and Schoelkopf B. Training invariant support vector machines. Machine Learning 46, 2002, pp. 161-190.

61. Demyanova V. V. The principal expert method in data mining // Applied Comput. Math. 2005. Vol. 4, N 1. P. 70-74.

62. Fisher R.A. Contributions to Mathematical Statistics. New-York, 1952.

63. Hansen P. and Jaumard B. Cluster analysis and mathematical programming. Mathematical Programming 79, 1997, pp. 191-215.

64. Highleyman W.H. Linear decision functions with applications to pattern recognition. Proc. IRE, № 6, 1962.

65. Jain A.K., Murty M.N. and Flynn P.J. Data clustering: a review. ACM Computing Surveys 31, 1999, pp. 264-323.

66. Kokorina A.V. Ranking the Parameters in Classification Databases. "Longevity, Aging and Degradation Models"(in Reliability, Public Health, Medicine and Biology). Материалы международной конференции LAD'2004

67. Модели Долголетия, Старения и Деградации"). Издательство СПбГПУ, 2004. Vol. 2, pp. 191-193.

68. Kokorina A.V. Unsupervised and supervised Data Classification Via Non-smooth and Global Optimization. Top, Volume 11, Number 1. June 2003. Sociedad de Estadistica e Investigacion Operativa, Madrid, Spain, pp. 86-89.

69. Lee Y.-J., Mangasarian O. L., Wolberg W. H. Survival-time classification of breast cancer patients // Computational Optimization and Applications. 2003. Vol. 25. P. 151-166.

70. Lee Y.-J., Mangasarian O. L. SSVM: A Smooth Support Vector Machine for Classification // Computational Optimization and Applications. 2001. Vol. 20, N 1. P. 5-22.

71. Mangasarian O.L. Linear and nonlinear separation of patterns by linear programming. Operations Research, vol. 13, 1965, pp. 444-452.

72. Mangasarian O.L. Misclassification minimization. Journal of Global Optimization 5, 1994, pp. 309-323.

73. Mangasarian O.L. Mathematical programming in data mining. Data Mining and Knowledge Discovery 1, 1997, pp. 183-201.

74. Michie D., Spiegelhalter D.J. and Taylor C.C. Machine Learning, Neural and Statistical Classification. Ellis Horwood Series in Artificial Intelligence, 1994.

75. Mirkin B. Mathematical Classification and Clustering. Kluwer Academic Publishers, 1996.

76. Murphy P.M. and Aha D. W. UCI repository of machine learning databases. Technical report, Department of Information and Computer science, University of California, Irvine, 1992. www.ics.uci.edu/mlearn/MLRepository.html.

77. Nagy G. State of the art in pattern recognition. Proceedings of the IEEE 56, 1968, pp. 836-862.

78. Nick Street W., Wolberg William H., Mangasarian O.L. Nuclear Feature Extraction For Breast Tumor Diagnosis. IS and SPIE 1993 International Symposium on Electronic Imaging: Science and Technology, Vol. 1905, pp. 861-870, San Jose, California, 1993.

79. Rosen J.B. Pattern separation by convex programming. Journal of Mathematical Analysis and Applications, vol. 10, 1965, pp. 123-134.

80. Rosenblatt F. The perseptron, a probability model for information storage and organization in the brain. Psychol. Rev., 65, 1958.

81. Rubinov A.M., Soukhoroukova N.V. and Yearwood J. Clustering for studying structure and quality of datasets, Research Report 01/24, University of Ballarat, 2001.

82. Schoelkopf B. and Smola A. Learning with Kernels. The MIT Press, 2002.

83. Vapnik V. The Nature of Statistical Learning Theory. Springer-Verlag, New York, N.Y. 2000.

84. Ward J. Hierarchical grouping to optimize and objective function. Journal of the American Statistical Association 58, 1983, pp. 236-244.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.