Комплексная оценка многомерных систем методами иммунокомпьютинга тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Соколова, Людмила Александровна

  • Соколова, Людмила Александровна
  • кандидат технических науккандидат технических наук
  • 2005, Санкт-Петербург
  • Специальность ВАК РФ05.13.01
  • Количество страниц 121
Соколова, Людмила Александровна. Комплексная оценка многомерных систем методами иммунокомпьютинга: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Санкт-Петербург. 2005. 121 с.

Оглавление диссертации кандидат технических наук Соколова, Людмила Александровна

Введение.

Положения, выносимые на защиту.

Глава 1. ИНДЕКСЫ КАК КОМПЛЕКСНАЯ ОЦЕНКА ДЛЯ

РАСПОЗНАВАНИЯ СОСТОЯНИЯ МНОГОМЕРНЫХ

СИСТЕМ.

1.1. Современное состояние проблемы формирования индексов.

1.2. Обзор методов искусственного интеллекта для формирования индексов.

1.3. Распознавание образов.

1.3.1. Математическая формализация задачи.

1.3.2. Искусственные нейронные сети.

1.3.3. Генетические алгоритмы.

1.3.4. Иммунокомпьютинг.

1.4. Постановка задачи исследования.

1.5. Выводы по главе.

Глава 2. МАТЕМАТИЧЕСКИЕ МЕТОДЫ ФОРМИРОВАНИЯ

ИНДЕКСОВ НА ОСНОВЕ ИММУНОКОМПЬЮТИНГА.

2.1. Базовый алгоритм вычисления индекса.

2.2. Определение оптимальных коэффициентов индекса в общем случае.

2.3. Одномерный линейный случай.

2.4. Одномерный нелинейный случай.

2.5. Многомерный линейный случай.

2.6. Выводы по главе.

Глава 3. ИНДЕКСНЫЕ ФОРМАЛЬНЫЕ ИММУННЫЕ СЕТИ.

3.1. Базовая индексная формальная иммунная сеть.

3.2. Блок оптимизации коэффициентов индекса.

3.3. Блок обучения.

3.4. Блок отбора.

3.5. Блок распознавания.

3.6. Селекция наиболее значимых индикаторов с помощью индексной формальной сети.

3.7. Минимальная индексная формальная иммунная сеть.

3.8. Программная реализация.

3.9. Выводы по главе.

Глава 4. ПРАКТИЧЕСКИЕ ПРИМЕНЕНИЯ ИНДЕКСНЫХ ФОРМАЛЬНЫХ ИММУННЫХ СЕТЕЙ ДЛЯ ОЦЕНКИ МНОГОМЕРНЫХ СИСТЕМ.

4.1. Индекс вторжений в компьютерные сети.

4.1.1. Актуальность проблемы.

4.1.2. Исходные данные.

4.1.3. Данные.

4.1.4. Блок обучения.

4.1.5. Блок «Тимус».

4.1.6. Блок «Оптимизации».

4.1.7. Блок «Апоптоз».

4.2. Индекс риска чумы.

4.2.1. Актуальность проблемы.

4.2.2. Исходные данные.

4.2.3. Результаты расчетов.

4.3. Индексы риска подросткового кризиса.

4.3.1. Актуальность поблемы.

4.3.2. Индекс обучаемости.

4.3.3. Индекс темперамента.

4.3.4. Индекс адаптивности.

4.3.5. Индекс успешности.

Щ 4.4. Результаты сравнения с нейронной сетью и генетическим алгоритмом.

4.4.1. Актуальность проблемы.

4.4.2. Описание задачи.

4.4.3. Тестовые данные.

4.4.4. Вычислительный эксперимент.

4.5. Выводы по главе.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Комплексная оценка многомерных систем методами иммунокомпьютинга»

Актуальность темы диссертационного исследования. В настоящее время становится актуальной разработка нового класса интеллектуальных систем мониторинга безопасности. Традиционные методы системного анализа V и поддержки принятия решений оказываются недостаточными для оперативной и интеллектуальной обработки данных мониторинга и формирования на их основе интегральных показателей, позволяющих наглядно отображать и предсказывать опасности и риски. Особую остроту эти задачи приобретают для систем компьютерной, информационно-психологической и эпидемиологической безопасности. Для решения таких задач необходимы методы современного искусственного интеллекта в сочетании с индексами, ^ получившими широкое распространение для комплексной оценки состояния, динамики, активности, а также для прогнозирования рисков и тенденций сложных систем в экономике, здравоохранении, социологии, экологии и т.д. Под индексом сложной многомерной системы понимается число, которое объединяет большое количество компонентов (факторов) или переменных ^ величин, называемых индикаторами. Например, риски деловой активности, такие как Dow-Jones или NASDAQ, широко используются в экономике и финансах. Как правило, такие индексы были введены на основе эмпирических соображений, некоторые из них рассчитываются достаточно легко, как среднее арифметическое последовательностей определенных переменных. Например, The Standard and Poor Index применяет стоимость к среднему представлению 500 акций на Нью-Йоркской фондовой бирже в течение дня. The Retail Price Index, как другой пример, измеряет среднее увеличение цены обычной сети продуктов питания в Великобритании.

Аналогичные индексы являются такими же важными, как в экономике, так и в других областях, например, в медицине - в практике Всемирной Организации Здоровья (ВОЗ). Подобные индексы, как правило, имеют один ^ общий недостаток - они достаточно субъективны.

Все работы, посвященные комплексной оценке состояния многомерных систем, обращают внимание на колоссальный объем требуемой для этого информации.

Несмотря на широкое применение эвристически введенных индексов в различных областях, все более возрастает актуальность строгих математических моделей, которые должны обеспечить разработку индексов, различных по специфичности и агрегированности, вплоть до национального уровня. Существенный вклад в решение этой проблемы внесли работы И. Фишера, Н.В. Хованова и др.

При разработке математических моделей и вычислительных методов для определения значений индексов желательно иметь эффективную интеллектуальную информационную технологию, ориентированную на переработку больших массивов разнородной исходной информации (символьной, числовой непрерывной и дискретной, вероятностной, нечеткой и т.д.).

К наиболее развитым информационным технологиям, пригодным для решения подобного рода задач, можно отнести искусственные нейронные сети и генетические алгоритмы, а к наиболее перспективным - искусственные иммунные системы и иммунокомпьютинг. Существенный вклад в научную разработку указанных технологий внесли работы Д. Е. Румельхарта, А. В. Тимофеева, С. Форрест, Д. Дасгупты и др.

Сравнительный анализ эффективности использования указанных интеллектуальных информационных технологий, выполненный в работах А. О. Тараканова и др. на примере задач экологического мониторинга и лазерной физики, продемонстрировал явные преимущества математических методов иммунокомпьютинга по точности и быстродействию.

Такое состояние в данной области позволяет сделать вывод, что разработанные в данной диссертационной работе математические модели и вычислительные процедуры формирования индекса на основе методов иммунокомпьютинга имеют как научную, так и практическую актуальность.

Цель и задачи диссертационной работы. Цель работы заключается в разработке математических моделей и вычислительных алгоритмов формирования индексов на базе методов иммунокомпьютинга для комплексной оценки состояний, рисков и трендов многомерных систем.

Для достижения этой цели необходимо решить следующие основные задачи:

1. Разработать базовые математические модели формирования индекса.

2. Оптимизировать параметры индекса по обучающей выборке.

3. Разработать метод определения индикаторов, наиболее значимых для вычисления индекса.

4. Разработать структуру индексной формальной иммунной сети для реализации основных вычислительных алгоритмов.

5. Обосновать эффективность разработанных моделей и алгоритмов на основе их сравнения с основными конкурентами в области вычислительного интеллекта.

Методы исследования. Для решения поставленных задач используются методы обработки информации и распознавания образов на базе вычислительного интеллекта, включая искусственые нейронные сети, генетические алгоритмы и иммунокомпьютинг, а также математические методы теории матриц.

Научная новизна:

1. Разработаны математические модели формирования индекса на основе распознавания образов, превосходящие по точности и быстродействию основных конкурентов в области вычислительного интеллекта.

2. Предложены индексные формальные иммунные сети для алгоритмической и программной реализации разработанных моделей.

3. Сформированы индексы, позволяющие оценивать и прогнозировать опасные состояния компьютерных, военно-прикладных и эколандшафтных систем на основе обработки информации по их мониторингу.

Обоснованность и достоверность научных положений, основных выводов и результатов диссертации обеспечиваются корректным анализом состояния исследований в области интеллектуальных информационных технологий, подтверждаются корректностью предложенных математических моделей и вычислительных алгоритмов, а также согласованностью полученных теоретических результатов с результатами их практической реализации. Основные результаты диссертации также прошли апробацию в научных трудах и докладах на международных научных конференциях.

Практическая ценность работы. Полученные теоретические результаты по формированию индекса вторжения в компьютерную сеть, оптимизации параметров индекса и выделению наиболее значимых индикаторов использованы при решении задач информационной безопасности.

Аналогичные результаты по формированию индекса риска чумы использованы для обработки данных мониторинга природных очагов чумы. Эти результаты могут быть использованы для прогнозирования вспышек особо опасных инфекций.

Реализация и внедрение. Основные научные результаты работы внедрены и использовались в следующих организациях:

1. В рамках международного проекта № 2200р Европейского бюро аэрокосмических исследований (EOARD, г. Лондон) через Международный научно-технический центр (МНТЦ, г. Москва) «Разработка математических моделей иммунных сетей для обеспечения безопасности информации».

2. В Санкт-Петербургском государственном университете аэрокосмического приборостроения (ГУАП) в учебном процессе по интеллектуальным информационным технологиям и системам.

3. В Военно-медицинской академии им. С.М. Кирова для прогноза развития дезаптационных нарушений у военнослужащих в рамках отбора к профессиям повышенного риска.

Апробация результатов работы. Основные результаты и выводы диссертации докладывались на: первой международной конференции по Искусственным иммунным системам - (ICARIS - 2002), Университет графства Кент, г. Кентербери, Великобритания, 2002; второй международной конференции по Искусственным иммунным системам - (ICARIS - 2003), Университет г. Эдинбурга, Великобритания, 2003; XIV Всероссийском совещании «Управление качеством образования», Москва-Уфа, 2004; III Санкт-Петербургской межрегиональной конференции «Информационная безопасность регионов России (ИБРР - 2003», Санкт-Петербург, 2003; IX Санкт-Петербургской международной конференции "Региональная информатика (РИ - 2004)", Санкт-Петербург, 2004.

Публикации. Основные результаты и выводы диссертационной работы представлены в 8 научных публикациях.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка использованной литературы и актов внедрения результатов диссертации. Объем основного текста диссертационной работы: 118 страниц, 14 рисунков и 7 таблиц. Список литературы включает 106 наименования.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Соколова, Людмила Александровна

4.5. Выводы

4.1. Предложен новый индекс вторжений в компьютерную сеть и продемонстрированы его возможности на примере фрагмента траффика в типовой локальной сети ВВС США.

4.2. Предложен новый индекс риска чумы, позволяющий прогнозировать вспышки особо опасных инфекций по данным мониторинга эпидемиологической безопасности.

4.3. Предложены новые индексы риска подросткового кризиса для предупреждения и своевременной коррекции возможных нарушений информационно-психологической безопасности личности.

4.4. На основе сравнительного анализа 5 основных алгоритмов, включая нейронную сеть и генетический алгоритм, показаны явные преимущества индексной формальной иммунной сети по быстродействию и безошибочности.

4.5. Полученные результаты показывают явные преимущества индексных формальных иммунных сетей над нейронными сетями и генетическими алгоритмами. При этом базовый алгоритм индексной формальной иммунной сети является наиболее эффективным при наличии эксперта, в то время как МИФИС обладает большими преимуществами, когда предметная область, достаточно сложна и не поддается очевидным интерпретациям.

Заключение

На основе выполненных исследований в диссертации решена актуальная научно-техническая задача, имеющая важное прикладное значение: разработаны математические модели и вычислительные алгоритмы формирования индексов на базе методов иммунокомпьютинга для комплексной оценки состояний, рисков и трендов многомерных систем.

В диссертации получены следующие основные результаты:

1. Разработаны математические модели формирования индекса на основе распознавания образов по иммунокомпьютингу. Данные модели могут также рассматриваться как альтернатива искусственным нейронным сетям, выполняющим задачи интерполяции и экстраполяции значений индекса по обучающим данным.

2. Разработан базовый алгоритм вычисления индексов на основе иммунокомпьютинга. Математической основой алгоритма является сингулярное разложение матриц. На основе базового алгоритма поставлена и решена задача оптимизации коэффициентов индекса в смысле минимума среднеквадратической ошибки, выраженной через компоненты сингулярного разложения с помощью матрицы Вандермонда и лагранжевых интерполяционных многочленов. Рассмотрены линейный и нелинейный, одномерный и многомерный случаи организации формальной иммунной сети. Для наиболее важных частных случаев значения оптимальных коэффициентов индекса получены в аналитическом виде и исследовано их влияние на индекс.

3. Введено новое понятие индексной формальной иммунной сети для алгоритмической и программной реализации разработанных моделей. Разработаны два основных типа таких сетей: базовая и минимальная. Базовая сеть реализует базовый алгоритм вычисления индекса на основе определения оптимальных коэффициентов индекса. Минимальная сеть использует базовый алгоритм распознавания образов методом иммунокомпьютинга для интерполяции и экстраполяции значений индекса по ближайшим точкам в пространстве формальной иммунной сети.

Разработаны основные вычислительные процедуры базовой ИФИС, включающие процедуры обучения («иммунизации») и распознавания, а также отбора и минимизации основных компонентов сети. Разработаны основные вычислительные процедуры минимальной ИФИС, включающие определение значений индекса по ближайшим точкам в пространстве ФИС. Программная реализация ИФИС выполнена в виде программного модуля (пакета) на языке Java средствами разработки программного обеспечения JBuilder-X.

Сформированы индексы вторжений в компьютерную сеть, риска чумы, риска подросткового кризиса, которые позволяют обрабатывать и сжимать исходную разнородную информацию (индикаторы), получаемую с технических систем мониторинга, в одно действительное число (индекс), характеризующее текущее состояние системы, а также позволяющее прогнозировать риски и тренды.

Предложенные новые индексы позволяют повысить быстродействие ФИС по обнаружению вторжений на примере фрагмента трафика в типовой локальной сети ВВС США, прогнозировать вспышки чумы по данным мониторинга эпидемиологической безопасности, предупреждать и своевременно корректировать возможные нарушения информационно-психологической безопасности личности.

Обоснованы преимущества разработанных моделей по точности и быстродействию над основными конкурентами в области вычислительного интеллекта: искусственными нейронными сетями и генетическими алгоритмами. Результаты получены на примере практически важной, но весьма трудоемкой задачи вычислительной физики по определению оптической мощности лазерного диода в зависимости от его внутренней структуры.

Список литературы диссертационного исследования кандидат технических наук Соколова, Людмила Александровна, 2005 год

1. Абдудлина В. 3. Проектирование баз данных для противочумной службы Казахстана. «Менеджмент и новые технологии». Сборник материалов международной конференции. Алматы. - 2001. - С. 25-28.

2. Айкимбаев A.M. и др. Руководство по эпидемиологическому надзору в горных очагах чумы Тянь-Шаня и Алтая. Алма-Ата. - 1991. 125 с.

3. Айкимбаев A.M. и др. Эпидемиологический надзор за чумой в Урало-Эмбенском и Предустюртском автономных очагах. Алматы. -1994. 129 с.

4. Аубакиров С.А. и др. Руководство по ландшафтно-эпизоотологическому районированию природных очагов чумы Средней Азии и Казахстана. -Алма-Ата, 1991.29 с.

5. Беллман Р. Введение в теорию матриц. М.: Наука. - 1976. 352 с.

6. Варнавских Е. А. Критерии творческой активности курсанта военного вуза. //Военная мысль. 2003. №3. - С. 56-58.

7. Власов В. В. Возможен ли индекс здоровья? //Военно-медицинский журнал. 1998. №2. - С.47-50.

8. Головей JI. А., Рыбалко Е. Ф. Практикум по возрастной психологии: Учебное пособие. СПб.: Речь. - 2002.

9. Деммель Дж. Вычислительная линейная алгебра Теория и приложения. - М.: Мир. - 2001. 430 с.

10. Дискуссия о нейрокомпьютерах (информационный материал, ред. В.И. Крюков). Пущино: АН СССР, Научный центр биологических исследований, НИВЦ. -1988.

11. Емельянов С. В., Коровин С. К. Новые типы обратных связей. Управление при неопределенности. -М.: Наука, Физматлит. 1997.

12. Интеллектуальные системы управления с использованием нейронных сетей: Учебн. Пособие /В.И. Васильев, Б.Г. Ильясов, С.В. Валеев, С.Ф. Жернаков. Уфа: УГАТУ. - 1997.

13. Круглое В. В., Дли М. И., Годунов Р. Ю. Нечеткая логика и искусственные нейронные сети. М.: Физматлит. - 2001.

14. Кузнецов В. И., Губанов А. Ф., Кузнецов В. В., Тараканов А. О., Чертов О. Г. Карта комплексной оценки состояния окружающей среды г. Калининграда. Калининград: Экологический атлас. - СПб.: Мониторинг. - 1999. 11 карт.

15. Кузнецов В. И., Кузнецов В. В. Концепция экологического атласа города. Пути реализации. В сб.: Комплексная оценка экологической ситуации. - СПб.: НИИ Атмосфера. - 1998. №3.

16. Кузнецов В. И., Миляев В. Б. Комплекная оценка экологической ситуации и система принятия управленческих решений. В сб.: Комплексная оценка экологической ситуации,-СПб.: НИИ Атмосфера. - 1998. №3.

17. Кузнецов В. И., Миляев В. Б., Тараканов А. О. Математический аппарат комплексной экологической оценки. СПб. - 1998.

18. Кузнецов В. И., Подлесных В. И. Основы менеджмента. СПб.: Олбис.1997.

19. Маркус М., Минк X. Обзор по теории матриц и матричных неравенств. -М.: Наука. 1972.232 с.

20. Нейронная "Иммунная система" побеждает вирусы. //Computer Week 22(180).-М.-1995. 47 с.

21. Непейвода А. Н., КутергинВ. А. Об уровнях знаний и умений в экспертных системах.//Экспертные системы: состояние и перспективы. -М.: Наука. 1989.

22. Острейковский В. А. Теория систем. М.: Высшая школа. - 1997.

23. Полиа Г., Сеге Г. Задачи и теоремы из анализа, ч.2. М.: Наука. - 1978. 432 с.

24. Рао С. Р. Линейные статические методы и их применения. М.: Наука.1968. 548 с.

25. Рутковская Д., Пилиньский М., РутковскийЛ. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая линия-Телеком. - 2004. 384 с.

26. Соколова Л. А. Индекс риска чумы по иммунокомпьютингу. //Труды СПИИРАН.-СПб.: Наука.-2003. Вып. 1,т.З.С. 137-141.

27. Соложенцев Е. Д. Сценарное логико-вероятностное управление риском в бизнесе и технике. СПб: Бизнесс-пресса. - 2004. 416 с.

28. Тараканов А. О. Математические модели информационных процессов на основе биомолекул: формальный пептид вместо формального нейрона. //Проблемы информатики. РАН. - 1998. №1. С. 46-51.

29. Тараканов А. О. Математические модели ключевых молекулярно-биологических механизмов обработки информации.-СПб.: СПИИРАН.- 1998.

30. Тараканов А. О. Формальные иммунные сети: математическая теория и технология искусственного интеллекта. Теоретические основы и прикладные задачи интеллектуальных информационных технологий. //Труды СПИИРАН. СПб.: Наука. - 1998. С. 65-70.

31. Тараканов А. О., Гончарова Л. Б. Иммунокомпьютинг биочип -биокомпьютер. //Труды СПИИРАН. - СПб.: Наука.-2002. Вып.1, т.2. С. 92-104.

32. Тараканов А. О., Туманов М. В. Современные математические методы комплексного оценивания здоровья. СПб. - 1998.

33. Тимофеев А. В. Спектральный синтез диофантовых и нелинейных регуляторов обратимых динамических систем. //Доклады Академии Наук. 1997. 353(2). С. 173-176.

34. Тимофеев А. В., Шибзухов 3. М. Методы синтеза и минимизации сложности диофантовых нейронных сетей над конечным полем. //Автоматика и телемеханика. 1997. №4. С. 204-212.

35. УоссерменФ. Нейрокомпьютерная техника. Теория и практика.-М.: Мир. 1992.

36. Усков А. А., Кузьмин А. В. Интеллектуальные технологии управления. Искусственные нейронные сети и нечеткая логика.-М.: ГЛ-Телеком. -2004.

37. Хехт-Нильсен Р. Нейрокомпьютинг: история, состояние, перспективы. //Открытые системы. 1998. №4.

38. Хованов Н. В. Математические модели риска и неопределенности. -СПб: СПбГУ. 1998. 203 с.

39. Хованов Н. В. Анализ и синтез показателей при информационном дефиците. СПб: СПбГУ. - 1996.196 с.

40. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир. - 1989. 655 с.

41. Artificial Immune Systems and Their Applications (ed. Dasgupta D.). Springer, Berlin, 1999, 306 p.

42. Artificial Neural Networks: Concepts and Control Applications (ed. Rao Vemuri). IEEE Computer Society Press, Los Alamos, CA, 1992.

43. Atreas N. D., Karanikas C. G., Tarakanov A. O. Signal processing by an immune type tree transform. //Lecture Notes in Computer Science 2787, 2003, pp.111-119.

44. Balasubramaniyan J., Garcia-Fernandez J., IsakoffD., SpaffordE., and Zamboni D. An Architecture for Intrusion Detection using Autonomous Agents. //Proceedings of the 14th Annual Computer Security Applications Conference, Phoenix, Arizona, 1998.

45. Bay, S.D. The UCI KDD Archive http://kdd.ics.uci.edu. Irvine, CA: University of California, Dept. of Information and Computer Science (1999).

46. Bogdanov A. A., Timofeev A. V. Neural algorithms of optimal and adaptive control of mechanical systems. //Int. Conf. on Control of Oscillations and Chaos. St. Petersburg, Russia, 1997, 3, pp. 532-537.47.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.