Дистанционная диагностическая система на основе гибридных моделей знаний тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Ле Нгуен Виен

  • Ле Нгуен Виен
  • кандидат науккандидат наук
  • 2015, Волгоград
  • Специальность ВАК РФ05.13.01
  • Количество страниц 123
Ле Нгуен Виен. Дистанционная диагностическая система на основе гибридных моделей знаний: дис. кандидат наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Волгоград. 2015. 123 с.

Оглавление диссертации кандидат наук Ле Нгуен Виен

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

ГЛАВА I АНАЛИЗ СОСТОЯНИЯ ИССЛЕДОВАНИЙ И РАЗРАБОТОК ДИАГНОСТИЧЕСКИХ СИСТЕМ

1.1 Основные понятия области диагностики состояния объекта

1.2 Обзор основных подходов к проектированию диагностических систем

1.2.1 Диагностика с использованием методов математической статистики

1.2.2 Диагностика с использованием методов построения экспертных систем

1.3 Обзор технологий использования экспертных систем диагностики состояния объекта

1.3.1 Способы представления знаний

1.3.2 Средства приобретения знаний

1.3.3 Методы вывода диагностического решения

1.3.4 Средства объяснения решения

1.4 Обзор методологии и методов для интеллектуальной поддержки принятия решения

1.5 Обзор отечественных и зарубежных диагностических систем

1.6 Постановка задачи диагностики состояния объекта

Выводы по первой главе

ГЛАВА II РАЗРАБОТКА МОДЕЛЕЙ И МЕТОДОВ ПОСТРОЕНИЯ ДИСТАНЦИОННОЙ ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЫ

2.1 Информационная модель дистанционной диагностической экспертной системы

2.2 База знаний

2.2.1 Фреймовая база знаний

2.2.2 Нечетко-продукционная база знаний

2.2.3 Построение базы знаний

2.3 Рабочая память

2.4 Приобретение знаний

2.4.1 Формирование базы данных

2.4.2 Проверка базы знаний

2.5 Механизм вывода диагностического решения

2.5.1 Генерация дополнительных вопросов по признакам при обратном выводе

2.5.2 Формирование диагностического заключения при прямом выводе

2.7 Объяснение решения

2.8 Пользовательский интерфейс

Выводы ко второй главе

ГЛАВА III ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ДИСТАНЦИОННОЙ ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЫ

3.1 Основные требования, предъявляемые к дистанционной диагностической экспертной системе

3.2 Выбор инструментальных средств разработки дистанционной диагностической экспертной системе

3.3 Информационные структуры дистанционной диагностической системы

3.3.1 Архитектура дистанционной диагностической системы

3.3.2 Диаграммы классов дистанционной диагностической системы

3.3.3 Базы данных дистанционной диагностической системы

3.4 Основные алгоритмы дистанционной диагностической системы

3.4.1 Алгоритм приобретения знаний

3.4.2 Алгоритм постановки диагноза

Выводы к третьей главе

ГЛАВА IV ИСПЫТАНИЕ И ВНЕДРЕНИЕ ДИСТАНЦИОННОЙ ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЫ

4.1 Разработка системы для решения задачи медицинской предварительной диагностики

4.1.1 Задача медицинской предварительной диагностики в удаленном режиме

4.1.2 Расширение системы для решения задачи медицинской предварительной диагностики

4.2 Описание системы для решения задачи медицинской предварительной диагностики

4.3 Применение системы для решения задачи медицинской предварительной диагностики

Выводы к четвертой главе

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ А - ЭКРАННЫЕ ФОРМЫ СИСТЕМЫ В РЕЖИМЕ ПРИОБРЕТЕНИЯ ЗНАНИЙ

ПРИЛОЖЕНИЕ Б - ЭКРАННЫЕ ФОРМЫ СИСТЕМЫ В РЕЖИМЕ РЕШЕНИЯ ЗАДАЧИ ПРЕДВАРИТЕЛЬНОЙ ДИАГНОСТИКИ

ОСНОВНЫЕ ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ

ДДЭС - Дистанционная диагностическая система;

ЭС - Экспертная система;

БЗ - Базы знаний;

ИС - Инструментальное средство;

ЛП - Лингвистическая переменная;

ЛТ - Лингвистический терм;

ФП - Функция принадлежности;

НПП - Нечетко-продукционное правило;

БД - База данных;

ФБЗ - Фреймовая база знаний;

НПБЗ - Нечетко-продукционная база знаний;

РП - Рабочая память;

ЭПР - Элемент рабочей памяти;

ФБЗ - Формирование базы данных;

ИЗСД - Извлечение знаний из статистических данных;

АП - Ассоциативное правило;

ОНПБЗ - Обучение нечетко-продукционной базы знаний;

ПБЗ - Проверка базы знаний;

ОР - Объяснение решения;

ПИ - Пользовательский интерфейс;

ДДЭС МПД - Дистанционная диагностическая система

для решения задачи медицинской предварительной диагностики.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Дистанционная диагностическая система на основе гибридных моделей знаний»

ВВЕДЕНИЕ

Актуальность темы исследования. Внедрение современных информационных технологий в разные сферы человеческой деятельности (технологической, биотехнической, медицинской, социальной и др.) приводит к появлению новых задач, решение которых связано с автоматизацией диагностических процедур для определения состояния сложных систем. Поддержка принятия решений в диагностических задачах становится необходимым этапом процесса управления в условиях роста объемов разнородной информации в современном обществе и усложнения объектов управления.

Для повышения эффективности диагностических процедур, должны использоваться подходы, объединяющие достижения искусственного интеллекта, нечеткой математики, интеллектуального анализа данных и пр.

Одна из основных задач при создании диагностических экспертных систем заключается в формировании и структурировании системы знаний рассматриваемой предметной области. Для создания базы знаний необходима интеграция различных источников. Тенденции развития современных экспертных систем связаны с внедрением технологий, позволяющих автоматизировать процесс пополнения и оптимизации баз знаний. Для этого необходимо найти пути интеграции различных моделей формирования и представления знаний, разработать алгоритмы, обеспечивающие возможность эффективной настройки баз знаний.

Наиболее актуальными на сегодняшний день являются системы приобретения знаний, основанные на интеграции технологий использующих знания экспертов и методы извлечения знаний из баз данных (KDD - knowledge discovery in databases).

При дистанционной диагностике часто встречается неопределенность информации. Выявленный комплекс признаков не всегда соответствует тому или иному состоянию объекта и может соответствовать разным диагностическим решениям, в том числе с близкими вероятностями для них. Информация,

используемая для постановки диагноза и назначения исследования, в большинстве своем является нечеткой.

Выявление состояния исследуемого объекта в реальном времени играет важную роль при создании дистанционной экспертной системы. Диагностические гипотезы должны быть получены за приемлемое время и использоваться для поддержки лиц, принимающих решения о дальнейшем исследовании.

Создание современных диагностических экспертных систем связано с целым рядом проблем: не учитывается высокий уровень неопределенности получаемой диагностической информации; отсутствуют эффективные методики интеграции знаний, полученных из разнотипных источников; существующие методы приобретения знаний, как правило, обладают низкой адаптивностью и не подразумевают использование механизмов обратной связи для установления новых зависимостей и корректировки правил в базе знаний.

В связи с этим разработка дистанционной диагностической экспертной системы (ДДЭС), базирующейся на знаниях, полученных от экспертов и с использованием технологий извлечения знаний из статистических данных, является актуальной.

Степень разработанности темы исследования.

Использование методов математической статистики для диагностики основано на использовании экспериментальных данных. В работах Д.А. Новикова [2], О.Ю. Ребровой [3], A.B. Дедова [4], Н. Бейли [5], A.B. Гайнера [6] и др. разработаны подходы к решению задачи диагностики на основе анализе использовании экспериментальных данных.

Методы построения интеллектуальных систем на основе знаний экспертов представлены в исследованиях Б.А. Кобринского [7], О.И. Ларичева [8] и др. В их работах, а также в диссертациях Д.Е. Дьяченко [9], Н.С. Безруковой [10], А.Н. Уваровой [11]и др. разработаны модели, алгоритмы и программные средства для поддержки принятия диагностических решений.

К основным результатам по созданию систем принятия решений в условиях неопределенности относятся работы Д.А. Поспелова [50], Н.Г. Ярушкиной [51],

В.В. Круглова [52], Д. Рутковского [53], Н.П. Деменкова [54], Б. Лю [55], Ь.А. гаёеЬ [58],-Е.Н. Машёаш [59] и др.

Вопросам разработки методов автоматизации процессов приобретения знаний посвящены работы Г.С. Осипова [31], Г.В. Рыбиной [32], В.В. Курейчика [33], Б.М. Еа81егЬгоок [34], Я. Dieng [35]и др.

Целью данной диссертационной работы является повышение эффективности процедур дистанционной диагностики объекта за счет создания экспертной системы на основе интеграции различных моделей формирования и представления знаний. Для достижения сформулированной цели в диссертации были поставлены и решены следующие основные задачи:

1. Провести анализ состояния исследований и разработок диагностических систем (существующие системы, модели, методы и алгоритмы), и разработать постановку задачи для автоматизации процедур дистанционной диагностики объекта с использованием методов инженерии знаний.

2. Разработать информационную модель ДДЭС, и ее основные компоненты (база знаний, компонент приобретения знаний, механизм вывода диагностического решения и др.) и соответствующее математическое обеспечение.

3. Разработать структурно-функциональное решение (архитектура, диаграммы программных классов, схема базы данных и основные алгоритмы) ДДЭС.

4. На основе разработанных моделей и алгоритмов реализовать ДДЭС, провести тестирование и апробацию разработанных алгоритмов.

Объектом исследования является процесс диагностики объекта в дистанционном режиме.

Предметом исследования являются методы формирования и представления знаний в диагностической экспертной системе.

Научной новизной обладают следующие полученные результаты:

1. Разработана гибридная модель представления знаний, отличающаяся от известных аналогов комбинацией фреймовой и нечетко-продукционной баз

знаний, для снижения неопределенности при выявлении связей между признаками и диагностическим решением.

2. Разработан алгоритм формирования базы знаний, в котором наряду с экспертными знаниями используются знания, полученные из баз данных, что позволяет организовать процедуру обратной связи для установления новых зависимостей и корректировки правил в базе знаний.

3. Разработан механизм вывода диагностического решения, в котором используется комбинация обратного и прямого вывода, что позволяет уменьшить время получения диагностического решения за счет применения ЫЕТЕ-сети для нечеткого вывода.

Практическая значимость диссертации. На основе предложенного комплекса взаимосвязанных моделей и алгоритмов автоматизации постановки диагноза объекта на базе экспертных знаний и анализа статистической информации разработана диагностическая экспертная система, предназначенная для дистанционной диагностики на основе выявленных признаков; оценки динамики состояния сложных объектов в различных сферах диагностической деятельности.

Реализация и внедрение результатов работы. Результаты работы реализованы в виде программы «Дистанционная экспертная система предварительной диагностики». Система прошла апробацию и использовалась в процессе проведения медицинских консультаций пациентов, находящихся на дому; лиц, нуждающихся в государственной социальной помощи; для организации сбора информации о потребностях пациентов в медицинском обслуживании на дому и формирования графиков посещения врачей с учетом тяжести состояний.

Методы исследования. В диссертационной работе использовались: теория экспертных систем, теория нечетких множеств, методы нечеткой логики, методы интеллектуального анализа данных, объектно-ориентированного программирование.

Основные положения, выносимые на защиту:

1. Модель представления знаний на основе объединения фреймовой и нечетко-продукционной моделей.

2. Алгоритм формирования знаний на основе интеграции технологий, использующих знания экспертов и методы извлечения знаний из статистических данных.

3. Алгоритм поиска и исключения противоречий в базе знаний.

4. Механизм вывода диагностического решения на основе комбинации обратного и прямого вывода.

5. Процедура нечеткого вывода с применением ЯЕТЕ-сети.

6. Дистанционная диагностическая экспертная система для решения задачи медицинской предварительной диагностики.

Достоверность полученных в диссертационной работе теоретических результатов и сформулированных на их основе выводов обеспечивается использованием современных методов проведения научных исследований и корректным применением математического аппарата. Достоверность научных положений и выводов диссертационной работы обоснована: применением современных методов исследования и моделирования сложных систем; согласованностью научных выводов с результатами теоретических обобщений и данными других авторов, представленными в научно-технической литературе.

Апробация результатов исследования. Основные результаты работы докладывались, обсуждались и получили одобрение на 13 международных конференциях, в том числе на 51-ой Внутривузовской научной конференции ВолгГТУ (Волгоград, 2014); на XXVII международной научной конференции «Математические методы в технике и технологиях» (Тамбов, 2014); на XII Всероссийском совещании по проблемам управления (Москва, 2014); на Международной научно-технической конференции «Информационные системы и технологии» (Нижний Новгород, 2014); на XIII Международной молодежной научно-технической конференции «Будущее технической науки» (Нижний Новгород, 2014); на 52-ой Международной научной студенческой конференции «Студент и научно-технический прогресс» (Новосибирск, 2014); на VII

Региональной научно-практической студенческой конференции «России -творческую молодежь» (Камышин, 2014); на Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых «Научная сессия ТУ СУР - 2014» (Томск, 2014); на IX Всероссийской научно-практической конференции проблемы управления в социально-экономических и технических системах (Саратов, 2014); на Международной конференции 11th Joint Conference on Knowledge-Based Software Engineering (Волгоград, 2014); на ежегодной Всероссийской научной школе-семинаре «Методы компьютерной диагностики в биологии и медицине» (Саратов, 2014); на XIX региональной конференции молодых исследователей Волгоградской области (Волгоград, 2014); III Международной научно-практической конференции «Современные технологии и управление» (р.п. Светлый Яр Волгоградской области, 2014).

Публикация результатов исследований. Основные результаты диссертации отражены в 17 опубликованных научных работах, в том числе 4 - в изданиях, рекомендованных ВАК для публикаций основных результатов кандидатских диссертаций.

Соответствие паспорту научной специальности. Указанная область исследования соответствует паспорту специальностей 05.13.01 - «Системный анализ, управление и обработка информации», а именно пункту 5 - «Разработка специального математического и программного обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации», пункту 10 - «Методы и алгоритмы интеллектуальной поддержки при принятии управленческих решений в технических, экономических, биологических, медицинских и социальных системах», пункту 13 - «Методы получения, анализа и обработки экспертной информации».

Объем и структура диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка использованных источников и приложений. Основное содержание диссертации изложено на 119 страницах, включая список литературы из 121 наименований, из которых 26 на иностранных языках.

Соискатель выражает благодарность д.т.н. доценту Садовниковой Наталье Петровне и к.т.н. Панченко Дмитрию Петровичу за вклад в виде практических советов и консультаций по теме диссертации.

ГЛАВА I АНАЛИЗ СОСТОЯНИЯ ИССЛЕДОВАНИЙ И РАЗРАБОТОК ДИАГНОСТИЧЕСКИХ СИСТЕМ

1.1 Основные понятия области диагностики состояния объекта

Диагностика это отрасль знаний, включающая в себя теорию и методы организации процессов установления диагноза, а также принципы создания средств установления диагноза.

Объект, состояние которого определяется, называется диагностируемым объектом. Получение диагностического решения представляется собой процесс исследования объекта. Завершением этого исследования является получение диагностического решения, т.е. заключение о состояние диагностируемого объекта.

Основная цель диагностики состоит в организации эффективных процессов определения состояния различных, особенно сложных, многокомпонентных объектов. Диагноз осуществляется аппаратными или программными средствами, реализующими тот или иной алгоритм получения диагностического решения.

Существует два основных следующих типа задач по определению состояния объектов:

- диагностирование - задача определению состояния, в котором находится объект в настоящий момент времени;

— прогнозирование — задача предсказания состояния, в котором окажется объект в некоторый будущий момент времени.

Диагностические решения необходимы для активных воздействий на исследуемые объекты с целью повышения эффективности их функционирования. По результатам предварительной диагностики принимаются решения по дальнейшему исследованию объектов.

Система, в которой реализуется процесс установления диагноза состояния объекта, можно назвать диагностической системой. Для построения модели объекта диагноза в процессе проектирования и создания диагностической системы необходимо знать свойства и характеристики этого объекта [1]. В

медицине, например, это - состояние человека, а в технике - состояние технического объекта.

1.2 Обзор основных подходов к проектированию диагностических систем

1.2.1 Диагностика с использованием методов математической статистики

Методы математической статистики решают следующие задачи анализа экспериментальных данных: описательная статистика; сравнение двух выборок; снижение размерности пространства признаков; исследование зависимостей между переменными; классификация. К теории классификации относятся классификация с учителем (дискриминантный анализ), классификация без учителя (кластерный анализ и группировка).

Дискриминантный анализ успешно применяется для решения задач диагностики (например, диагностика заболеваний в медицине). Обучающими выборками, для элементов которых известно, каким классам они принадлежат. Задача заключается в том, чтобы вновь появляющийся объект отнести к одному из этих классов. Если в дискриминантном анализе классы заданы, то кластеризация и группировка предназначены для выявления и выделения классов [2, 3]. Для исследования зависимости диагноза от входных факторов (результат анализ) необходимо построить математические модели на основе регрессионного анализа [4].

Другим из методов математической статистики в задачах диагностики является метод на основе байесовской вероятности, которая позволяет вычислить условную вероятность диагностических решений при данном наборе признаков на основании априорной вероятности диагноза и условной вероятности наблюдения признаков [5, 6].

При применении данного подхода можно выделить четыре следующих проблемы:

- организационные трудности возникают при сборе, хранении и обработки больших объемов информации;

- отсутствует возможность включать в модели информацию качественного характера;

- подход не учитывает структурную сложность объектов диагностики и взаимовлияние разных факторов;

- получаемые диагностические результаты напрямую не могут быть объяснены пользователям.

1.2.2 Диагностика с использованием методов построения экспертных систем

Экспертные системы (ЭС) отличаются от традиционных систем обработки информации использованием знаний. Знания - это закономерности предметной области, накопленные в результате практической деятельности человека (или человечества) [12]. В отличие от данных знания обладают пятами следующими свойствами [13, 14]: внутренняя интерпретируемость; структурированность; связанность; семантическая метрика; активность.

ЭС подразделяются на статические и динамические [15]. Статические ЭС не изменяются с течением времени решения задачи, а динамические изменяются, приспосабливаясь к изменениям окружающего мира. Большинство созданных ЭС, в том числе, относятся к первому классу. Как правило, ЭС состоит из следующих базовых компонентов [7, 8, 14, 15, 16]: база знаний; рабочая память; механизм вывода решения; объяснительный компонент; компонент приобретения знаний; пользовательский интерфейс.

ЭС работают в двух следующих режимах: приобретения знаний и решения задач. В режиме приобретения знаний эксперты наполняют базу знаний ЭС экспертными знаниями, которые обеспечивают возможность автоматизировать процесс принятия диагностического решения. В режиме «решения задачи» в процессе общения с ЭС пользователи получают диагностическое решение и его объяснение (если это необходимо) [17].

ЭС является компьютерными программами, способными эмулировать (имитировать, воспроизводить) те области деятельности человека, которые требуют мышления, определенного мастерства и накопленного опыта. При

решении задач диагностики эффективность ЭС заключается в том, что они обладают описанными ниже общими достоинствами [18, 23]:

- эффективность (решение ЭС на уровне компетентности, равной или более высокой по сравнению с экспертами);

- производительность (вывод решения за приемлемое время в режиме реального времени);

- надежность (не подвержено сбоям);

- универсальность представления знаний (отображение декларативных и процедурных знаний);

- возможность приблизительного вывода (определенная степень уверенности в том, что предложенного решение является верным);

- возможность приобретения знаний экспертов (накопление практического опыта решения проблем);

- доступность для понимания (объяснение предложенного решения, и его обоснованность);

- способность вести диалог на естественном языке.

При разработке диагностических ЭС необходимо реализовать следующие этапы [15]:

- идентификация (составление неформального описания цели, задач и выходных данных каждой поставленной задачи);

- концептуализация (содержательный анализ области диагностики);

- формализация (описание способов и моделей представления знаний и функционирования компонентов ЭС);

- реализация (разработка компонентов ЭС и наполнение база знаний

(БЗ));

- тестирование (проверка компетентности компонентов ЭС, и качества базы знаний для выявления недостатков и разработки средств их устранения);

- опытная эксплуатация (проверка пригодности ЭС для пользователей).

В ходе разработки диагностических ЭС приходится неоднократно возвращаться на более ранние этапы и пересматривать принятые там решения.

В разработке диагностических ЭС необходимо учитывать следующие аспекты:

- эксперты (специалисты области диагностики) определяют знания, характеризующие область диагностики, и обеспечивают полноту и непротиворечивость базы знаний;

- инженеры по знаниям (специалисты по разработке ЭС) помогают экспертам: выявить и структурировать знания, необходимые для работы ЭС; осуществить выбор того инструментального средства (ИС), и определить способ представления знаний в этом ИС; определить функционирование компонентов ЭС, которые используют знания, вводимые экспертами;

- программисты (специалисты по разработке ИС) разрабатывают ИС, программируя все основные компоненты ЭС, и осуществляют их сопряжение с окружающей средой.

1.3 Обзор технологий использования экспертных систем диагностики состояния объекта

1.3.1 Способы представления знаний

Знания традиционно делят на декларативные и процедурные знания [24]. Знания также могут быть классифицированы по двум следующим категориям: глубинное представление и поверхностное представление [25].

Формализация описания знаний определяется как представление знаний. Представление знаний является фундаментальным понятием в ЭС. Решение о выборе способов представления знаний оказывает огромное влияние на другие составные части ЭС.

Существуют десятки моделей (или языков) представления знаний для разных предметных областей. Большинство из них может быть сведено к четырем следующим классам: продукционные модели; семантические сети; логические модели; фреймы. При применении логического представления предъявляются очень высокие требования и ограничения к предметной области. А при

использовании сетевого представления велика вероятность возникновения проблемы связанной с невозможностью представления процедурных знаний [12].

Задача диагностики ставится как экспертная классификация объектов, состояние которых описывается некоторым набором диагностических признаков [26]. В общих чертах логическая структура данной задачи может быть представлена в виде графа (см. рисунок 2). На каждом узле графа расположено одно состояние (решения задачи) диагностики, которое определяется как набором диагностических решений с вероятной оценкой постановки.

Процесс экспертной классификации представляется как движение от одного узла графа к другому, в зависимости от ответов на вопросы по выявленным признакам. При появлении новых признаков повторяется процесс установления диагноза. Таким образом, диагностические ЭС определяют граф состояний, в узлах которого расположены состояния диагностики, а дуги задаются способ управляющий сменой состояний [27].

Продукция представляет собой правило, состоящее из двух частей: в первой описывается конкретная ситуация; во второй указывается определенный для этой ситуация набор действия. В качестве состояния области диагностики используют множество утверждений, имеющих вид троек «объект - атрибут - значение». Для более удобного описания сложных предметных областей данный способ оказывается недостаточно. Одним из основных средств борьбы со сложностью является иерархическое представление. Проявлением абстракции является построение иерархии абстрактных понятий предметной области, связанных отношением наследования свойств [27].

Состояние диагностики - Э,

Рисунок 1 - Логическая структура экспертной классификации

Понятие фрейма знаний (или просто фрейма) было введено М. Минским в 1975 г. Фреймы являются абстрактным образом для представления некоего стереотипа восприятия. Структура фрейма достаточно проста, состоит из слотов, описывающих его свойства. Каждый слот может иметь значение по умолчанию. Также со слотом можно связать любое количество процедур (демонов), выполняемых при обращении к его значению (записывание, стирание и запрашивание). В качестве значения слота фрейма может использоваться присоединенная процедура, которая запускается по сообщению, переданному из другого фрейма [28].

Различают фреймы-прототипы (для описания абстрактных понятий предметной области) и фреймы-экземпляры (для отображения реальных понятий при определении конкретных значений слотов). Основными типами значений слотов являются скалярный, который подразделяется следующим образом: числовой (целый или с плавающей точкой); логический; строковый; ссылочный (содержащий ссылку на фрейм или слот); списковый (содержащий произвольное количество элементов любого типа). Поэтому все фреймы взаимосвязаны и образуют единую фреймовую иерархию, в которой фреймы нижнего уровня иерархии наследуют все свойства из фрейма верхнего [26].

В настоящее время все чаще при разработке ЭС используются гибридные модели. Наибольшей эффективностью характеризуются ЭС, основанные на продукционно-фреймовой модели представления знаний. Гибридный способ представления знаний можно описать следующим образом [29]:

- фреймы рассматривается как набор слотов, множество значений которых описывает область диагностики и состояние постановки диагноза в текущий момент решения задачи;

- набор продукционных правил рассматривается как слот фрейма, и являются формой управления сменой состояний постановки диагноза.

Универсальность такого представления знаний заключается о том, что:

- фреймовое представление знаний позволяет использовать фреймовую модель как некий «общий знаменатель» при создании гибридных систем, сочетающих декларативные знания и императивные компоненты;

- фреймы могут эффективно использоваться для доступа к реляционным базам данных, а также к другим типам структурированной информации;

- фреймовое представление знаний предоставляет естественный способ кластеризации знаний, в особенности динамических правил прямого и обратного вывода, вокруг соответствующих фреймов в виде демонов и процедур, что, в свою очередь, обеспечивает естественное распределение знаний между различными узлами.

1.3.2 Средства приобретения знаний

Под приобретением знаний понимаются, во-первых, выявление знаний из источника и, во-вторых, перенос их в ЭС. Существуют следующие способы, методы и стратегии приобретения знаний из различных источников [31]: на основе опроса эксперта (или группы экспертов); на основе анализа текстов; на основе анализа примеров; извлечение знаний из баз данных.

БЗ, построенная на основе экспертного опроса, более качественно описывает область диагностики, и может быть использована для экспертной классификации [36]. Каждый из экспертов может внести в БЗ дополнительные знания на основе имеющегося опыта. Можно разбить пространство диагностических признаков таким образом, чтобы признаки одной группы по их смысловому содержанию отражали какую-то сторону состояния исследуемого объекта.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Список литературы диссертационного исследования кандидат наук Ле Нгуен Виен, 2015 год

SG список строк

Имя фрейма

Признак «Боль в животе»

Имя слота Значение слота

АКО Рго1о1уреБутр1от

LVIS <Боль в животе, >

CVI 0 75

{SF,} {0 9, }

SG Нижн часть живота

Имя фрейма РгокЛуреОюдпоз^вгоир

Имя слота Тип значения

АКО Фрейм-класс

{СЦ} список строк

I

X

3

¡

Имя фрейма Группа диагнозов «Хирург»

Имя слота Значение слота

АКО PrototypeDiagnosisGr oup

—(4)-

Имя фрейма

Диагноз «Аппендицит»

Имя слота Значение слота

'АКО РгоЬ^реЗреаа!^

LVOD <Аппендицит >

CVO 0 65

{<А} {0 8, }

SX Мужской и Женский

АЕ [20, 80]

FIM Хирург

Имя фрейма Признак «Рвота или тошнота»

Имя слота Значение слота

АКО Рго^уреБутрЮт

Имя фрейма Ргок>1уре5утр1отСотр1ех

Имя слота Тип значения

АКО Фрейм-класс

NFID строка

{NFIS¡} список строк

{FRJ набор нечетких правил

{SFIk} список наслед слотов

(3)

(2)

\ Процедуры нечеткого вывода ъ^для вычисления интегральных оценок наличия диагнозов

-(1)-

Наследование свойства Прототип-экземпляр _ "Процедура_~

Имя фрейма Комплекс признаков «Аппендицит»

Имя слота Значение слота

АКО Ргок^уреБутрЮтСо тр1ех

NFID Аппендицит

{NFISi} {Боль в животе, Рвота, }

{FR,} {ЕСЛИ <Боль в животе - высокий» И <Рвота - высокий» ТО <Аппендицит -высокий», }

{SFIk} {Боль в животе ЭР = 0 9, Рвота БР = 0 8, Аппендицит ш = {0 8, }, }

1Р-ЫЕЕ0Е0 Демон для запроса входных оценок силы проявления признаков

Рисунок 4 — Фрагмент фреймовой иерархии БЗ

Универсальным аппроксиматором является нечеткая модель Мамдани при следующих условиях (Кастро, 1995 г.) [81]:

- описание входных и выходных ЛП с использованием симметричной треугольной функции принадлежности;

- агрегирование предпосылки и активизация заключения с использованием операции логического минимума,

- аккумуляция заключений с использованием операции логического максимума,

- дефаззификация выходных ЛП с использованием центроидного метода.

В качестве ФП ЛТ переменных используется симметричная треугольная функция следующего вида:

Mlt(u) =

для _(Ь-с <и <Ъ + с) (11)

с

О для всех остальных и

При создании ФП требуется задание центра ФП «Ь» и второго параметра «с», значения которых затем выясняют и корректируют при необходимости. Графики ФП ЛТ переменной представлены на рисунке 5.

Графики функций принадлежности

Значение переменной

Рисунок 5 - Графики треугольной ФП ЛТ переменной

2.3 Рабочая память

Рабочая память (РП) предназначена для хранения информации об исследуемом объекте, вводимой пользователями, и результирующей информации в текущий момент решения задачи диагностики. Когда факты поступления новой информации актуализированы, создается элементы рабочей памяти (ЭРП) для каждого факта в виде кортежей фиксированной длины.

РП задается следующим образом:

Ш = ({ШЕ1},РЕ) (12)

где: {fvme,} - множество ЭРП; ре - операции (добавление, удаление, модификация и поиск) над ЭРП в РП.

ЭРП задается следующим образом:

WME = (NE, IDE, ATE, ТРЕ, VLE) (13)

где: ne - название ЭРП; ide - идентификатор ЭРП; ate - атрибут ЭРП; тре - тип атрибута ЭРП; vle - значение атрибута ЭРП.

2.4 Приобретение знаний

Автоматизированное приобретение знаний позволяет повысить эффективность работы инженера по знаниям и, следовательно, сократить время формирования базы знаний и повысить ее качество [82, 83].

2.4.1 Формирование базы данных

Формирование базы данных (ФБЗ) может быть представлено следующим образом (см. рисунок 6): заполнение таблиц БЗ; извлечение знаний из статистических данных; генерирование векторов параметров НПБЗ; организация экспертного опроса; обучение НПБЗ.

1 - Диагнозы и их группы, отдельные 4 - Зависимости между ЛТ переменных признаки и их группы, комплексы признаков признаков и диагнозов,

для диагнозов, 5 - Зависимости между ЯП признаков и

2 - Экспертные оценки силы проявления диагнозов; признаков при наличии диагнозов; 6 - Обучающиеся НПБЗ,

3 - Статистические данные; 7 - Обученная НПБЗ.

Рисунок 6 - Схема формирования базы знаний Для заполнения таблиц БЗ эксперт определяет основные понятия, описывающие область диагностики состояния исследуемого объекта и взаимосвязи между ними: диагнозы и их группы; отдельные признаки и их группы; комплексы признаков для диагнозов.

На следующем этапе эксперт определяет основные ЛП: переменные признаков - входные; переменные диагнозов - выходные. Для оценки значений ЛП используется единая качественная шкала: Н - низкий; НС - ниже среднего; С - средний; ВС - выше среднего; В - высокий. Соответствующие ЛТ представляют нечеткое множество, заданное с помощью соответствующих функций принадлежности (ФП). Функции принадлежности ЛП представлены в виде симметричных треугольных функций, которые описываются двумя параметрами (Ъ, с), где Ъ - центр ФП. В таблице 3 приведены числовые интервалы центров ФП в соответствии с оценками значений ЛП по вербально-числовой шкале

Харрингтона [84]. Второй параметр («с») задается в числовом интервале [0.0; 1.0].

Таблица 3 - Числовые интервалы центров ФП в соответствии с ЛТ

№ Наименование ЛТ Числовой интервал центра ФП

1 Низкий [0.0; 0.2]

2 Ниже среднего [0.2; 0.37]

3 Средний [0.37; 0.63]

4 Выше среднего [0.63; 0.8]

5 Высокий [0.8; 1.0]

Причинно-следственные отношения между ЛП формализуются в виде нечетких правил типа «Я: ЕСЛИ А, ТО В (со)», где А - предпосылка, В -заключение, со - весовой коэффициент НПП (берется из числового интервала [0.0; 1.0]).

Для извлечения знаний из статистических данных (ИЗСД) строятся модели, которые описывают близость различных одновременно наблюдаемых категориальных характеристик и могут быть представлены в виде простых правил. В данном случае такими характеристиками являются диагнозы наблюдаемых у исследуемых объектов или их признаки. Для реализации данного подхода используются алгоритмы построения ассоциативных правил (АП), в частности алгоритм Арпоп [85, 86, 87].

В общем случае АП имеет вид «Из множества характеристик «X» следует множество характеристик «У»». Основными характеристиками АП являются «поддержка» и «достоверность» правила. Под «достоверностью» АП понимается доля транзакций из исходного множества, содержащих «X», которые также содержат «У». А под «поддержкой» - доля транзакций из исходного множества, которые содержат пересечение множеств «X» и «У».

Достоверность ассоциативного правила вычисляется по следующей формуле:

где: s(X —»Y) - поддержка ассоциативного правила; s(X) - поддержка множества «X».

Необходимо выполнить двухуровневую обработку данных следующим образом:

- выявление зависимостей между множеством ЛП признаков и ЛП каждого диагноза;

- выявление зависимостей между множеством ЛТ переменных признаков и ЛТ переменной каждого диагноза.

Пусть имеется нормализованный вид множества транзакций для всех ЛП диагнозов, которые после предварительной обработки (см. таблицу 4).

Таблица 4 - Нормализованный вид множества транзакций для всех ЛП диагнозов

Номер транзакции ЛП

Y

1 1 1 1 А

2... 1 1 0 D2

к 1 0 0 Dk

где: к - количество транзакций для всех ЛП диагнозов; п - количество всех ЛП признаков; х ^ = 1..п — входные ЛП признаков; У = Ц,г = 1 ..к — выходная ЛП

диагноза при г'-ой транзакции. На пересечении строки транзакции и столбца ЛП признаков ставится «1», если данная ЛП признака присутствует в транзакции, и «О» - в противном случае.

На первом этапе необходимо вычислить значения уровня поддержки и достоверности АП для х = {х1,..., х„} и у = {д}.

Для каждой ЛП диагнозов необходимо определить одно АП, ранжировав сгенерированные правила в соответствии с их значимостью. Значимость одного правила вычисляется перемножением его значений поддержки и достоверности.

Результаты первичной обработки применяются для дальнейшего этапа выявления зависимостей между ЛТ, переменных признаков и диагнозов, а также для расширения БЗ при появлении новых зависимостей между ЛП.

Пусть имеется нормализованный вид множества транзакций для всех ЛТ переменной г-го диагноза (см. таблицу 5).

Таблица 5 - Нормализованный вид множества транзакций для всех ЛТ переменной г-го диагноза

ЛТ переменных

Номер транзакции X У

< А

1 1 1 1 0 1 0 1 1 1

2... 1 1 0 1 1 1 0 1 1

к 1 0 0 0 1 0 0 0 1

где: к — количество транзакций для ЛП г-го диагноза; й - количество ЛП признаков для ЛП г-го диагноза; ЛТ входной переменной признаках,; а* -ЛТ выходной переменной диагноза У = Д.

На втором этапе необходимо вычислить значения поддержки и достоверности АП для х = \х1 =^11,...,аг9 и 7 = {о, =<//}.

Сгенерированные правила, имеющие достоверность выше, чем у принятого минимального порога (60% и больше), составляют базу нечетких правил. В зависимости от значимости АП можно определить весовой коэффициент нечеткого правила, который характеризует его достоверность.

Обучение нечетко-продукционной базы знаний (ОНПБЗ) осуществляется с применением генетического алгоритма [88, 89, 90, 91].

Для обучения необходимо сформировать базу обучающих выборок и базу обучающихся нечетких правил базы знаний.

НПБЗ однозначно определяет некоторые параметры, которые сводятся в следующий вектор:

где: Ь , ,с .

- параметры функции принадлежности 1 -го ЛТ переменной

7-го признака; й, = - параметры функции принадлежности 1-го ЛТ

переменной г'-го диагноза; - весовой коэффициент к, -го нечеткого правила г-го диагноза.

Для создания начальной базы обучающихся НПБЗ выполняется генерирование определенного количества векторов параметров НПБЗ со случайной инициализацией параметров функций принадлежности ЛТ и весов нечетких правил в соответствующих интервалах.

База обучающих выборок может быть создана лишь путем использования процедуры экспертного опроса, позволяющего получить от экспертов информацию о специфичности и степени выраженности того или иного признака для конкретного диагноза (см. таблицу 6).

Таблица 6 - Описание структуры базы обучающих выборок

Номер выборки Признаки Диагноз

х1 xj хп

1 р\ р1 р"

М р1. р1 рт А»

где: р! - экспертная оценка проявления у'-го признака при наличия г-го диагноза.

На рисунке 7 представлена схема обучения нечеткой базы правил.

1 - Обучающиеся векторы параметров 5 - Обучающие выборки;

нечетких правил; 6 - Хромосомы с приспособленностью;

2-Хромосомы; 7 - Лучшие хромосомы;

3 - Родители-хромосомы; 8 - Векторы параметров нечетких правил

4 - Потомки-хромосомы; после настройки.

Рисунок 7 - Схема обучения НПБЗ При кодировании/декодировании НПБЗ в хромосомы используется код Грея [92]. Каждой хромосоме из популяции ставится в соответствие оценка ее приспособленности в популяции по следующей формуле:

= (16) где: р1 - обучающая выборка; Б - вектор декодированных генов хромосомы; ,5") - реальный выход модели; - желаемый выход модели. Оценка приспособленности хромосомы для всех обучающих выборок вычисляется по следующей формуле:

= (17)

где: Ы- количество обучающих выборок.

Селекция хромосом, основанная на принципе колеса рулетки, заключается в выборе по вычисленным оценкам приспособленности хромосом для генерации очередного поколения. К хромосомам применяются три следующих оператора с определенной вероятностью: скрещивание; мутация и инверсия [93].

Для формирования новой популяции необходимо сокращение популяции до исходного количества хромосом с применением оператора редукции. Процесс

обучения считается законченным, если достигнуто пороговое значение оценки приспособленности хромосомы или достигнуто ограничение на максимальное число эпох функционирования, т.е. не превышен заданный порог для числа эпох.

После обучения выбирается лучшая хромосома с максимальной оценкой приспособленности, которая после декодирования используется для формирования БЗ.

2.4.2 Проверка базы знаний

В предлагаемом способе построения БЗ ошибки в экспертной информации ведут к возникновению противоречий как в составлении комплексов признаков для диагнозов, так и в экспертной оценке проявления признаков при наличия диагнозов. Проверка базы знаний (ПБЗ) предназначена для поиска и исключения противоречий. Для этого необходимо сопоставлять информацию, получаемую от эксперта, с полученной ранее и проверять их на непротиворечивость. В задачу поиска и исключения противоречий входит выявление следующих правил:

- конфликтные правила (два разных диагноза имеют схожие комплексы признаков);

- избыточные правила (одинаковые комплексы признаков присутствуют у сходных диагнозов).

Каждый комплекс признаков для диагноза представляет собой дескриптивное множество, каждому элементу которого поставлено в соответствие путем экспертной оценки силы проявления признака при наличии диагноза. Для количественного определения степени сходства двух комплексов признаков применяется бинарный коэффициент сходства Кульчинского [94], значения которого находятся в диапазоне от «О» (сходство отсутствует) до «1» (полное сходство). Ниже приведен алгоритм поиска и исключения противоречий в БЗ.

Переменные:

- создаваемый комплекс признаков для нового диагноза;

- множество комплексов признаков для всех диагнозов.

Шаг 1. Для каждого у-ого комплекса признаков из уже имеющегося множества «У» для всех диагнозов:

Шаг 1.1. Вычислить коэффициент сходства вновь создаваемого (т.е. комплекса признаков-кандидата на добавление в множество) и у-ого рассматриваемого комплекса признаков из имеющегося множества по следующей формуле:

*=t/z; i/z:^ >]• X!min и (щ

где: а, — экспертная оценка проявления г-го признака в создаваемом комплексе признаков а; в, - экспертная оценка проявления z'-ro признака в рассматриваемом комплексе признаков в; р - количество признаков в комплексе признаков A; q - количество признаков в комплексе признаков в; р — количество признаков, общих в комплексе признаков айв.

Шаг 1.2. Сравнить вычисляемый коэффициент сходства для вновь создаваемого комплекса признаков, который является кандидатом на добавление в множество, с у-ым, рассматриваемым в отношении превышения заданного порогового значения.

а) Если коэффициент сходства превышает заданный порог и диагнозы различны, то правила создаваемого комплекса признаков конфликтны, тогда создаваемый комплекс признаков добавляется в список для модификации. При редактировании комплекса признаков необходимо перейти к началу цикла проверки.

б) Если коэффициент сходства превышает заданный порог и диагнозы сходны, то правила создаваемого комплекса признаков избыточны, тогда комплекс признаков-кандидат в БЗ не добавляется. Перейти к окончанию алгоритма. -

в) Если коэффициент сходства не превышает заданный порог и диагнозы сходны, то рассматриваемый комплекс признаков добавляется в список для модификации. При редактировании комплекса признаков необходимо повторить текущий цикл проверки.

г) Если коэффициент сходства не превышает заданный порог и диагнозы различны, то создаваемый комплекс признаков до сих пор непротиворечив.

Шаг 2. Добавить комплекс признаков-кандидат в БЗ после успешной проверки на непротиворечивость.

На рисунке 8 представлена схема алгоритма поиска и исключения

противоречий в БЗ.

Рисунок 8 - Алгоритм поиска и исключения противоречий в БЗ

2.5 Механизм вывода диагностического решения

Механизм вывода диагностического решения предназначен для получения диагностического заключения на основании входных оценок выявленных признаков [95, 96].

В зависимости от текущей интегральной оценки выводимый диагноз может находиться в одном из трех возможных состояний:

- неактивный кандидат (не рассматривается в качестве диагностической гипотезы);

- потенциальный кандидат (имеет смысл рассмотреть в качестве диагностической гипотезы);

- активный кандидат (помещенный в список диагностических гипотез).

Под диагностической гипотезой понимается диагноз с оценкой его наличия.

Список диагностических гипотез - это, по сути, список пар «активный диагноз -интегральная оценка наличия», упорядоченных в убывающем порядке значений оценок.

Комбинированный механизм вывода решения реализуется следующим образом:

- генерация дополнительных вопросов по ведущим признакам и запрос оценок силы проявления (осуществляется с применением обратного вывода);

- формирование диагностического заключения (осуществляется с применением прямого вывода после каждого обратного вывода).

2.5.1 Генерация дополнительных вопросов по признакам при обратном выводе

Генерация дополнительных вопросов (ГДВ) состоит из четырех этапов (см. рисунок 9): выделение основного диагноза; определение ведущего признака выделенного диагноза; генерация дополнительного вопроса по определенному признаку; запрос оценки силы проявления признака у исследуемого объекта.

1 - Комплексы признаков для диагнозов; 4 - Ведущий признак;

2 - Диагностические гипотезы; 5 - Очередной правильный вопрос;

3 - Основной диагноз; 6 - Оценка силы проявления признака.

Рисунок 9 - Схема генерации дополнительных вопросов

Выделение основного диагноза. Каждый из комплексов признаков для диагнозов включает множество признаков, причем некоторые признаки могут одновременно входить в несколько комплексов признаков [97]. На рисунке 10 представлена иллюстрация расположения эллипсоидов рассеяния диагнозов в пространстве признаков.

Рисунок 10 - Иллюстрация расположения эллипсоидов рассеяния диагнозов Как показано, признак Бт одновременно включается в комплексы признаков для диагнозов о, и и2, что приводит к пересечению эллипсоидов рассеяния. Таким образом, в эллипсоиде рассеяния можно условно выделить область достоверного решения для диагноза £>,, обозначаемую о,, которая вычисляется по следующей формуле:

где - экспертная оценка силы проявления к-го признака при установлении диагноза Д.

Основному диагнозу соответствует минимальная область достоверного решения. В случае, если области достоверного решения для нескольких диагнозов равны, то выбирается диагноз с максимальной суммой экспертных оценок силы проявления признаков в его комплексе признаков.

Для учета ответов на вопросы по имеющимся признакам, необходимо умножить сравнительную оценку и интегральную оценку наличия диагноза. Определение ведущего признака выделенного диагноза. Ведущему признаку соответствует признак, имеющий наиболее максимальную экспертную оценку проявления.

Я =

(19)

На этапе генерации дополнительного вопроса по ведущему признаку задается очередной вопрос для запроса оценки силы проявления признака.

2.5.2 Формирование диагностического заключения при прямом выводе На рисунке 11 представлена схема формирования диагностического заключения (ФДЗ), состоящего из шести основных этапов: создание ЯЕТЕ-сети; сопоставление для получения конфликтного множества; разрешение конфликта по критериям; срабатывание наборов НПП диагнозов; действие (добавление или модификация фактов); обновление ЫЕТЕ-сети.

1 - Присоединенные процедуры; 5 - Потенциальные диагнозы;

2 - Пустая КЕТЕ-сеть; 6 - Активные диагнозы;

3 - Имеющиеся факты; 7 - Интегральные оценки наличия диагнозов;

4 - Заполненная РЕТЕ-сеть; 8 - Заключение о диагнозе.

Рисунок 11 - Схема формирования диагностического заключения При использовании ЯЕТЕ-сети БЗ при трансляции преобразуется в сеть вывода решения [98]. ФДЗ происходит каждый раз при поступлении новых фактов в РП. Факты, приходящие на вход ЯЕТЕ-сети делятся на два следующих класса:

- характеристики исследуемого объекта;

- выявленные признаки с оценкой силы проявления у объекта.

Факты подаются на вход сети вывода решения, задачей которой является определение изменений в конфликтном множестве, которые вызваны поступившими фактами.

На рисунке 12 представлена структура ЯЕТЕ-сети вывода решения.

, Корневой узел Новые факты ,

Шаг 1. Фаззификация f входных переменных

Альфа-память

tf-MA'i)

Альфа-сеть

Бета-сеть

где - степень принадлежности оценки терму переменной ¡-го симптома; о, - весовой коэффициент к-го нечеткого правила; и >>„„ - границы области определения переменной заболевания.

Терминальный узел Диагноз «Гастроэнтерит» {Боль в животе; ...}

Терминальная память

Мгастроэнтерит-Высокий '(У) Ргастроэнгерит-Средний (У) Мгастпоэнтерит-Низкий •(у)

кеселсугрипп Spedficityrp„nn

Терминальный узел Диагноза «Аппендицит» {Рвота; Бопь в животе; ...}

IsFiredi

Шаг 3. Активизация заключения*

Терминальная память

^Критерии разр. конфл.^У Конфликтное множество (потенциальных диагнозов)

!Грипп

J

Нечеткая модель

Мамдани (Кастро, 1995 г.):

• агрегирование предпосылки и активизация заключения с использованием операции логического минимума;

• аккумуляция заключений с использованием операции логического максимума;

• дефаззификация выходных переменных с использованием центроидного метода.

Множество активных диагнозов

Шаг 5. Дефаззификация выходных переменных

/ = Jу*М(у)*Ф ¡Juiyydy

Шаг 4. Аккумуляция заключений

J

Разрешение конфликта: Recency - коэфф. новизны; Specificity - коэфф. специфики; IsFired - знак срабатывания.

Рисунок 12 - Структура RETE-сети вывода решения

57

В сети используются узлы пяти типов:

- корневой узел не имеет входов. Данный единственный узел определяет тип информации, поступающий на вход сети (оценки силы проявления признаков или характеристики), и в зависимости от результата записывает факт в одну из частей сети;

- тип-узел имеет один вход, один выход. В узлах данного типа осуществляется сравнение типа записываемого факта с указанным типом;

- альфа-узел имеет один вход, один и более выходов. Узлы данного типа запоминают попавшие на вход факты. После запоминания факт без проверок и изменений передается потомкам узла;

- бета-узел имеет два входа (правый и левый), и один или более выходов. Узлы данного типа служат для получения всех различных парных объединений всех приходящих в нее фактов. Полученные объединенные факты пропускаются дальше по сети;

- терминальный узел имеет один вход и ни одного выхода. Узлы данного типа являются заключительными узлами фрагментов сети, соответствующих описаниям комплексов признаков диагнозов из БЗ.

Использование КЕТЕ-сети для вывода решения на нечеткой модели типа Мамдани [81] в условиях неопределенности представлено следующим образом.

Каждый комплекс признаков для диагноза соответствует одному фрагмент ЯЕТЕ-сети. При прохождении факта через сеть он сначала попадает в корневой узел, который по типу информации передает его альфа-узлам. Осуществляется фаззификация входных ЛП признаков при присваивании значения исходному слоту. Степень уверенности для ЛТ переменной г'-го признака в условной части к-го НПП, обозначаемая ь*, записывается в альфа-памяти, и передается дальше в бета-узлы.

В корневых узлах происходит объединение поступивших фактов и агрегирование предпосылок. Степень истинности предпосылки для к-то НПП, обозначаемая ск, записывается в бета-памяти. В бета-памяти также хранятся

копии фактов, пришедших на данный вход. Это необходимо для сопоставления с фактами, которые позднее придут на другой вход узла.

Перемещение факта через сеть прекращается, если факт попадет в терминальный узел. Терминальный узел завершает последовательность узлов для некоторого диагноза. Факт, попадающий на его вход, сигнализирует об успешной активации фрагмента сети и подает сигнал для активизации заключения. Значение активизированной ФП и степень истинности JIT переменной диагноза из заключения для к-то НПП, обозначаемые (у) и ^ в соответствующем порядке,

записываются в память терминальных узлов.

Попадание каких-либо объединенных фактов в терминальный узел сети означает, что это потенциальные кандидаты-диагнозы, связанные с данным терминальным узлом. Для разрешения конфликтов (выбора одного или нескольких активных диагнозов из списка потенциальных кандидатов) применяется комбинированный критерий, рассчитанный как сумма коэффициентов новизны и специфики.

- коэффициент новизны. Активному диагнозу соответствуют факты проявления признаков, которые поступают в РП. Для отслеживания времени поступления факты снабжаются специальным атрибутом времени порождения. Коэффициент новизны вычисляется на основании времени порождения всех фактов;

- коэффициент специфики. Активному диагнозу соответствует комплекс признаков с большим количеством фактов проявления поступающих в РП признаков. Коэффициент специфики вычисляется на основании количества фактов.

Коэффициент новизны и коэффициент специфики для каждого диагноза запоминаются в памяти терминального узла и используются в процедурах разрешения конфликтов.

После разрешения конфликта выполняется НПП для каждого активного диагноза. Данная процедура разбивается на два следующих этапа: аккумуляция заключений для вычисления значений функции принадлежности итогового

нечеткого множества ц{у); дефаззификацня выходной лингвистической переменной для вычисления интегральных оценок наличия диагнозов /. Активный диагноз с интегральным значением образует диагностическую гипотезу.

В этом случае в память терминального узла записывается информация, которая запрещает повторно проходить этот фрагмент сети для рассмотренного набора фактов. Далее происходит обновление состояния РП и формирование заключения о диагнозе.

2.7 Объяснение решения

Объяснение решения (ОР) предназначено для отслеживания поведения системы на основе анализа протокола вывода, каждая запись которого соответствует одному диагностическому заключению на основании проявляющихся признаков. Поэтому пользователи могут понять, почему и как решение сформировано системой на каждом этапе.

ОР задается следующим образом:

где: {ш^} - журнал протокола вывода (ЖПВ), включающий набор записей; ре - формирование информации о поведении системы на определенном шаге ее работы.

Запись ЖПВ задается следующим образом:

где: ня - номер записи в ЖПВ; {57?,} - список проявляющихся признаков; \dHRj] - список диагностических гипотез; } - множество предложенных диагнозов.

Ниже приведено формирование почему-объяснения в г'-ой записи из уже имеющегося ЖПВ [13].

Шаг 1. Сформировать вопрос: Почему задан вопрос по /-ому предшествующему признаку из имеющегося списка.

ЕМ ={{Н1{\РЕ)

(20)

(21)

Шаг 2. Выдать утверждение [г\1]: Эта информация необходима, чтобы установить, что «первый диагноз из имеющегося списка диагностических гипотез обнаружено».

Шаг 3. Выдать утверждение [/.1]: Ранее было установлено, что «все предшествующие признаки в 0-1)-ой записи ЖПВ проявлены».

Шаг 4. Выдать утверждение [г.2]: Следовательно, «если г'-ый признак проявлен, то первый диагноз из имеющегося списка диагностическая гипотеза обнаружено».

Шаг 5. Перейти к шагу 1 с номером записи (1-1).

Двойные номера в квадратных скобках имеют следующий смысл: первая цифра номера нумеруется объяснение, а в каждом объяснении нумеруются утверждения, о которых в нем идет речь.

Далее формирование как-объяснение в г'-ой записи ЖПВ приведено ниже.

Шаг 1. Сформировать вопрос: Как получено утверждение [г'.о].

Шаг 2. Выдать ответ: Используется комплекс признаков, обозначаемый [(¿ + 1)1], для первого диагноза из списка диагностических гипотез в (1-1)-ой записи ЖПВ.

Шаг 3. Сформировать вопрос: Как использован комплекс признаков [(г + 1)л].

Шаг '4. Выдать ответ: Ранее установлено, что признаки, пересекающие между рассматриваемым комплексом признаков и списком предшествующих признаков, обозначаемые [(/ + 2)1],...,[(/ + &)л], проявлены. Следовательно, рассматриваемый диагноз обнаружено.

Как получены утверждения [(г' + 2)1],...,[(/ + £)1], объяснительный компонент помнит о том, поскольку отвечены вопросы по признакам относительно этих утверждений.

2.8 Пользовательский интерфейс

Пользовательский интерфейс (ПИ) ведется на ограниченном естественном языке, а также выполняет распределение ролей участников диалога между

пользователями и ДДЭС, и организацию их взаимодействия в процессе постановки диагноза, а также приобретения знаний. ПИ задается следующим образом:

Ш = (соиЯ, СББи, {¡£><7,, Я1/,, {РИ)})}) (22)

где: сииБ - преобразование входной информации пользователей в сообщения ДДЭС; сиБи - преобразование сообщений ДДЭС в выходную информацию пользователей; - диалог между г-го пользователем и ДДЭС;

- роль г-го пользователя;

[щ)

- множество возможных функций /-го

пользователя.

Выводы ко второй главе

1. Разработана информационная модель ДДЭС на основе теории экспертных систем.

2. Разработана база знаний, основанная на объединении фреймовой и нечетко-продукционной модели представления знаний.

3. Разработан метод приобретения знаний, основанный на интеграции технологий использующих знания экспертов и знания, полученные из статистических данных.

4. Разработан механизм вывода решения, основанный на комбинации обратного и прямого вывода с применением ЯЕТЕ-сети для нечеткого вывода.

5. Разработаны другие компоненты ДДЭС (рабочая память, объяснение решения и пользовательский интерфейс).

ГЛАВА III ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ДИСТАНЦИОННОЙ ДИАГНОСТИЧЕСКОЙ ЭКСПЕРТНОЙ СИСТЕМЫ

3.1 Основные требования, предъявляемые к дистанционной диагностической экспертной системе

Реализуемая система должна обеспечить:

- объединение фреймовой иерархии и нечетко-продукционных правил для представления нечетких знаний. ДДЭС позволяет отобразить все многообразие знаний в области диагностики;

- возможность создания, модификации и расширения БЗ (по критериям полноты и непротиворечивости) на основе интеграции технологий, использующих знания экспертов и методы извлечения знаний из баз статистических данных;

- возможность вывода диагностического решения в условиях неопределенности информации о выявленных признаках. ДДЭС не должна останавливаться из-за того, что отсутствует какая-либо часть входной информации;

- работу с диагностической системой в режиме реального времени. ДДЭС должна выполнить диагностику за приемлемое время после того, как пациент ответит очередные вопросы по ведущим признакам;

- возможность объяснения полученного решения. ДДЭС должна объяснить, почему предложено именно такое решение, и показать его обоснованность;

- обеспечение удаленного доступа к диагностической системе, как для пользователей, так и экспертов. ДДЭС, основанная на веб-ориентированных технологиях, должна позволять пользователям и экспертам связываться через Интернет;

- разграничение прав доступа пользователей (эксперты, конечные пользователи). ДДЭС должна выполнить распределение участников диалога пользователей и организовать их взаимодействия.

3.2 Выбор инструментальных средств разработки дистанционной диагностической экспертной системе

Разработка ДДЭС возможна с применением специализированных инструментальных средств, которые входят в три следующей группы: оболочки ЭС (например, EMYCIN, Exsys, ESISP, ЭКСПЕРТ и пр.); языки программирования (например, Prolog, Lisp, С++, LOGO, OPS5 и пр.); инструментальные системы (например, ПИЭС, СПЭИС и пр.) Анализ существующих ИС показал, что все они имеют свои недостатки и достоинства. Отмечен многофункциональный пакет нечеткой логики CubiCalc (фирмы HyperLogic). Пакет содержит интерактивную оболочку для разработки нечетких ЭС и систем управления, и применяется при решении различных задач, в том числе для адаптивного управления сложными социотехническими системами [99].

В настоящее время существует большое количество программных ИС для разработки ДДЭС, но все они обладают недостатками ввиду отсутствия решений указанных выше проблем.

Одним эффективным подходом к программной реализации ДДЭС является создание веб-приложений на основе языка программирования высокого уровня. Веб-приложение - клиент-серверное приложение, в котором клиентом выступает браузер, а сервером - веб-сервер. Все это реализуется следующим образом: протокол передачи данных НТТР; стандарты описания интерфейса HTML/CSS; принцип работы «запрос-ответ».

В настоящее время существует много технологии создания веб-приложений, например ASP.NET; RubyOnRails; JSP и др. Технология ASP.NET является составной частью платформы Microsoft .NET, входящая в состав Microsoft Visual Studio [100].

Для создания и развертывания веб-приложений применяется платформа ASP.NET MVC. Она реализует шаблон «модель-вид-контроллер» и направлена на устранение многих недостатков технологии ASP.NET Web-Forms и имеет следующие преимущества: близость к протоколу; концепция разделения; тестируемость [101].

Данный продукт поддерживает работу с системой управления базами данных (СУБД) Microsoft SQL Server. Microsoft SQL Server, называемый Database Engine, является системой реляционных баз данных. В отличие от ранее существовавших СУБД (иерархическая и сетевая) системы реляционных баз данных основываются на реляционной модели данных, которая базируется на строгой математической теории [102].

Для обеспечения работы веб-приложений на основе веб-форм ASP.NET требуется проприетарный набор серверов для нескольких служб интернета IIS, основным компонентом которой является веб-сервер, предоставляющий пользователю доступ к веб-страницам [103].

Таким образом, в качестве ИС разработки ДДЭС были выбраны язык программирования С# и интегрированная среда разработки Microsoft Visual Studio. Используется сервер баз данных Microsoft SQL Server. Приложения реализованы с помощью технологий платформ .NET Framework и веб-сервера IIS.

3.3 Информационные структуры дистанционной диагностической системы

3.3.1 Архитектура дистанционной диагностической системы

Для организации архитектуры реализуемой системы применяется комбинация из трех следующих архитектурных шаблонов [104, 105]:

- трехуровневая архитектура, предполагающая три компонента (пользовательское приложение, сервер приложений, сервер базы данных) для снижения требований к скорости и стабильности каналов связи между клиентом и серверной частью;

- объектно-ориентированная архитектура, основанная на распределении ответственности системы между отдельными объектами или классами, содержащими данные и поведение;

- компонентная архитектура, обеспечивающая возможность независимого создания и тестирования отдельные компоненты, и затем эти компоненты постепенно объединяются в одну [106].

При реализации ДДЭС такая комбинированная архитектура дает ряд преимуществ: масштабируемость; модифицируемость; безопасность; гибкость; простоту сопровождения.

Схема архитектуры ДДЭС представлена на рисунке 13.

Пользовательское приложение (Веб-браузеры)

о о ^

Зксперты

Пользователи

Сервер приложений (Веб-сервер IIS)

Уровень представления

Пользовательский интерфейс (ASP.NET MVC веб-приложение)

Пользовательский интерфейс (NET WmForms-приложение)

Сервер базы данных (Microsoft SQL Server)

Контур интерфейса с БД

_&азы данных, отправленных анкетГОбучающихеяТЯТЁЗ^ обучающих выборок, щтистических даннь

СОМ-Интерфейс

(добавляемые и редактируемые компоновки)

1 - Данные,

2 - Знания,

3 - Факты проявления признаков,

4 - Факты наличия диагнозов,

5 - Запись журнала вывода решения

6 - Объяснительная информация,

7 - Экспертные знания экспертов,

8 - Статистические данные,

9 - Обучающиеся НПБЗ и обучающие выборки,

10 - База НПП,

11 - Обученная НПБЗ,

12 - Информация о пользователях,

13 - Отправленные анкеты,

14 - Справка, рекомендация по исследованию

Рисунок 13 - Схема архитектуры дистанционной диагностической экспертной системы

67

Веб-браузеры предназначены для сбора информации от пользователя для обработки, а также отображения ему результирующей информации ДДЭС. В качестве терминалов пользователя могут выступать не только компьютеры, но и, например, планшеты, мобильные телефоны и т.п.

При проектировании сервера приложений на основе веб-ориентированных технологий необходимо четко разграничить три следующих уровня [107]: уровень представления; уровень логики; уровень доступа к данным.

Уровень логики предназначен для реализации функций ДДЭС. На сервере приложений ядро реализовано на основе объектно-ориентированной архитектуры.

Ядро реализуемой системы разработано в виде программных модулей на компонентной технологии следующим образом. При создании NET WinForms-приложения реализуются и тестируются функциональности модулей в отдельных библиотеках динамической компоновки. Затем можно использовать их в виде СОМ-объектов как в ASP.NET MVC веб-приложении, так и в других приложениях.

Для этого ядро ДДЭС содержит шесть следующих библиотек динамической компоновки:

- RnowledgeBaseLibrary отвечает за представление знаний, и также преобразование знаний в/из данные;

- BuildingLibrary отвечает за заполнение таблиц БЗ, и также организацию экспертного опроса;

- MiningLibrary отвечает за извлечение знаний из статистических данных;

- LearningLibrary отвечает за обучение НПБЗ для настройки параметров и коэффициентов ее НПП;

- TestingLibrary отвечает за проверку БЗ для поиска и исключения противоречий;

- OnlineAdviceLibrary отвечает за генерацию дополнительных вопросов, формирование диагностического заключения, хранение информации в рабочей памяти, и объяснение вывода решения;

- CatalogLibrary отвечает за электронную справку, и также рекомендации по исследованию;

- AdministrationLibrary отвечает за управление сведениями о пользователях-экспертах.

В ходе реализации функциональности ДДЭС может потребоваться обращение к серверу базы данных, в этом случае используя единственный источник данных на уровне доступа к данным. Источник данных можно рассмотреть также как библиотеку динамической компоновки, называемую DataAccessLayer, обеспечивающую два следующих операции:

- подключение с БД ДДЭС с использованием библиотеки классов провайдера данных ADO.NET;

- управление данными, имеющимися в БД, с использованием набор функциональных блоков Data Access Application Block.

На уровне представления с учетом результирующей информации функциональности ДДЭС осуществляется генерация страницы в ASP.NET MVC веб-приложении, и ее содержимое отправляется клиентскому браузеру. Это основные страницы с графическим интерфейсом, на которых имеются элементы управления.

Для обеспечения пользовательского интерфейса в NET WinForms-приложении, используются экранные формы, которые предоставляют возможность использования стандартных элементов управления.

Место сервера базы данных занимает СУБД Microsoft SQL Server. Данный компонент используется для создания реляционных баз данных ДДЭС (данные, анкеты и т.п.). Здесь возникает несоответствие объектно-ориентированного представления данных в ДДЭС и их представления в виде записей в базах данных. Для решения проблемы используется контур интерфейса с БД, под которым понимается многократно используемый и обычно расширяемый набор классов, обеспечивающий обслуживание постоянно хранимых объектов [108].

3.3.2 Диаграммы классов дистанционной диагностической системы

Для разработки программных модулей необходимо построить набор классов на объектно-ориентированном языке. При этом используются элементы языка моделирования ИМЬ, как объектно-ориентированный подход к анализу, проектированию и программированию.

Для лучшего восприятия диаграмма программных классов ДДЭС представлена двумя следующими уровнями: уровень представления знаний; уровень вывода диагноза.

Диаграмма классов ДДЭС на уровне представления знаний представлена на рисунке 14.

ActivatedFuzzySet

TruthDegree double

GetActivatedValue(do...)

FuzzySet

Name, string B: double C: double

GetValue(double): dou...

Conclusion

RuleWeight. double

Condition

SymptomFactor: double

FuzzyRule

Conditions: List<Cond.. Conclusion: Conclusion

Variable

Name: string

FuzzySets: List<FuzzySet>

IS

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.