Модели, методы и программные средства распределенного приобретения знаний для автоматизированного построения баз знаний интегрированных экспертных систем тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Дейнеко, Александр Олегович
- Специальность ВАК РФ05.13.11
- Количество страниц 128
Оглавление диссертации кандидат технических наук Дейнеко, Александр Олегович
ВВЕДЕНИЕ.
1. АНАЛИЗ СОВРЕМЕННЫХ ПОДХОДОВ И МЕТОДОВ К АВТОМАТИЗИРОВАННОМУ ПОСТРОЕНИЮ ПОЛНЫХ И НЕПРОТИВОРЕЧИВЫХ МОДЕЛЕЙ ПРОБЛЕМНЫХ ОБЛАСТЕЙ
1.1 Особенности построения полных и непротиворечивых моделей проблемных областей.
1.2 Распределенное приобретение знаний.
1.3 заданно-ориентированная методология приобретения знаний и инструментальные программные средства поддержки методологии.
1.3.1 Общая характеристика комбинированного метода приобретения знаний в рачках задачно-ориентированной методологии построения ИЭС.
1.3.2 Технология Data Mining.
1.3.3 Особенности применения алгоритмов Data Mining в рамках комбинированного метода, приобретения знаний.
1.3.4 Типовая проектная процедура «Приобретение знаний из БД».
1.4 представление многопризнаковых объектов.
1.5 Анализ современных методов группировки и кластеризации продукционных правил.
1.5.1 Метрики в пространстве знаний.
1.5.2 Типы измеритаьных шкал и их сравнительный анализ.
1.5.3* Меры близости между у тверждениями для арифметических шкал.
1.5.4 Меры близости между утверждениями дш качественных шкал.
1.6 Цели и задачи диссертационного исследования.
ВЫВОДЫ.
2. ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ РАСПРЕДЕЛЕННОГО ПРИОБРЕТЕНИЯ ЗНАНИЙ.
2.1 Особенносги применения методов экспертной классификации сложных объектов для извлечения знаний.
2.2 Обобщенная модель комбинированного метода приобретения знании.
2.3 Методика группового приобретения знании.
2.4 Разработка алгоритма распределенного приобретения знании из бд.
2.4.1 Выбор стратегии формирования хранилищ данных.
2.4.2 Формальная постановка задачи построения дерева решений
2.4.3 Оптимизация алгоритма распределенного приобретения знаний из БД.
2.5 Разработка метода объединения объектов, полученных из ис i очников знаний различной типологии.
2.5.1 Разработка алгоритма объединения типов атрибутов.
2.5.2 Применение теории мультимножеств для представления многомерных объектов.
2.6 Разработка метода объединения множеств продукционных правил.
2.6.1 Формальная постановка задачи объединения продукционных правил.
2 6.2 Метод автоматизированного объединения продукционных правил, полученных из источников знаний различной типологии.
Выводы.
3. ПРОЕКТИРОВАНИЕ И ПРОГРАММНАЯ РЕАЛИЗАЦИЯ КОМПЛЕКСА
ИНСТРУМЕНТАЛЬНЫХ СРЕДСТВ РАСПРЕДЕЛЕННОГО ПРИОБРЕТЕНИЯ ЗНАНИЙ.
3.1 Особенности реализации средств поддержки типовой проектной процедуры «Приобретение знаний из БД».
3.2 Анализ системных требований на разработку средств поддержки ТПП «Приобретение знании из БД», функционирующих в составе комплекса АТ-ТЕХНОЛОГИЯ.
3.3 Архитектура и реализация программных средств поддержки проектирования хранилищ данных.
3.4 Программная реализация средств распределенного приобретения знании из БД.
3.5 Особенности реализации средств автоматизированного объединения фрагментов полей знаний, полученных из источников знаний различном типологии.
3.6 Интеграция и комплексная отладка программных срсдс ш поддержки гиповой проектной процедуры «Приобретение знаний из БД».
3.7 Пример функционирования средств поддержки проектирования хранилищ данных.
3.8 Пример функционирования средств распределенного приобретения знании из бд и средств объединения наборов правил.
Выводы.
4. ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА МЕТОДОВ И АЛГОРИТМОВ РАСПРЕДЕЛЕННОГО
ПРИОБРЕТЕНИЯ ЗНАНИЙ. ВНЕДРЕНИЕ РАЗРАБОТАННЫХ ИНСТРУМЕНТАЛЬНЫХ ПРОГРАММНЫХ СРЕДСТВ.
4.1 Экспериментальная проверка методов и алгоритмов распределенного приобретения знаний.
4.2 сравнение характеристик реализованных программных средств распре деленного приобретения знаний с существующими средствами.
4.3 применение алгоритма распределенного приобретения знаний из БД в составе проекта «АРМИР-АЭС версия-4». выводы.
ВЫВОДЫ ПО ДИССЕРТАЦИИ.
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Модели, методы и программные средства для построения интегрированных экспертных систем2004 год, доктор технических наук Рыбина, Галина Валентиновна
Программный комплекс для формализации экспертных знаний при нечетком (фаззи) моделировании2002 год, кандидат технических наук Токмаков, Александр Николаевич
Разработка и исследование логического вывода в базах нечетких знаний продукционного типа с целью принятия решений в интеллектуальных системах1998 год, кандидат технических наук Кияшко, Александр Борисович
Нейронечёткая модель и программный комплекс формирования баз знаний экспертных систем2006 год, кандидат технических наук Катасёв, Алексей Сергеевич
Алгоритмы формирования знаний для экспертных систем в слабоструктурированных предметных областях2004 год, кандидат технических наук Муратова, Елена Анатольевна
Введение диссертации (часть автореферата) на тему «Модели, методы и программные средства распределенного приобретения знаний для автоматизированного построения баз знаний интегрированных экспертных систем»
Актуальность темы исследования. Проблема приобретения знании всегда находилась в центре внимания разработчиков современных интеллектуальных систем, в. частности, традиционных экспертных систем и более сложных - интегрированных экспертных систем (ИЭС), обладающих масштабируемой архитектурой и расширяемой функциональностью. Этому важнейшему направлению искусственного интеллекта посвящено значительное число исследований и разработок, тем не менее вопросы практического использования традиционных методов приобретения знаний и создания технологии автоматизированного приобретения знаний по-прежнему являются: актуальной проблемой, что связано как с острым дефицитом экспертов, так и с нехваткой специальных компьютерных систем, имитирующих искусство эксперта/экспертов.
Наиболее остро проблема приобретения знаний возникает при решении сложных практических задач, особенно в таких областях, как медицина, энергетика, космос, экология и др.', где не всегда достаточно мнения одного эксперта, поэтому для построения максимально полных и непротиворечивых моделей проблемных областей и снижения рисков ошибок эксперта необходимо привлекать нескольких экспертов или группу экспертов, что существенно удорожает стоимостные и временные параметры разработки ИЭС. Соответственно возрастает актуальность и роль степени автоматизации труда экспертов и разработки специальных программных средств, различных «оболочек приобретения» и т.д., направленных на компьютерную поддержку процессов получения знаний от эксперта или групп экспертов, являющихся основным источником знаний (источник знаний 1-ого типа).
Значительный вклад в исследование и решение проблем приобретения знаний внесли отечественные учёные О.И.Ларичев, Д.А.Поспелов, Э.В.Попов, Г.С.Осипов, Г.В.Рыбина, А.П.Еремеев, Т.А.Гаврилова, И.Б.Фоминых, В.Ф.Хорошевский, ВЛ.Стефанюк, Н.Г. Загоруйко, В.Б.Тарасов, Б.А. Кобринский, А.С.Нариньяни, О. К. Подлипский, А.Б. Петровский, В.К. Финн и др., а также целый ряд зарубежных учёных S. Easterbrook., J. Quinlan, К. Sreeraman, P. Gregory, R. Dieng, D. Waterman, T. Nguyen, H. Toivonen, F. Coenen, J. Tsai, P. Meseguer, K. Wang и др.
Однако, в настоящее время существует достаточно небольшое число исследований в области группового извлечения знаний из экспертов, которые пока носят только теоретико-методологический характер и предназначены для частичной автоматизации работы инженера по знаниям на этапе группового извлечения знаний.
С другой стороны, в настоящее время типология источников знаний уже не ограничивается только экспертами. Значительные объемы экспертных знаний накоплены в текстах на естественных языках (источник знаний 2-ого типа), а в последние годы — в информации, аккумулирующейся в современных информационных бизнес-системах, представляющих собой сложные организационно-технические системы с такими компонентами управления как сетевые устройства, серверы, приложения, базы данных (СУБД) и т.д. и обладающих большими информационными ресурсами (источник знаний 3-его типа).
Проблема получения (выявления) знаний из источников 2-ого типа связана с бурно прогрессирующей технологией Text Mining, а проблеме автоматизированного извлечения знаний из БД в искусственном интеллекте посвящены такие новые направления как Data Mining и Knowledge Discovery in Databases. Успехи технологии Text Mining связаны с различными аспектами применения текстологических методов получения знаний из естественно-языковых текстов (ЕЯ-текстов), которые получили наибольшее развитие в трёх типах современных веб-ориентированных ЕЯ-систем — поиска информации (Information Retrival), извлечения информации (Information Extraction) и понимания ЕЯ-текста (Text / Message Understanding). С применением различных алгоритмов Data Mining тесно связаны такие проблемные области, как: научные исследования (медицина, биология, биоинформатика и др.); решение задач бизнеса (банковское дело, финансы, страхование. CRM и др.); задачи государственного уровня (борьба с терроризмом, поиск розыскиваемых лиц и т.д.); решение задач анализа веб-ресурсов, где основными направлениями являются Web Content Mining (интеллектуальные поисковые агенты, классификация и фильтрация информации) и Web Usage Mining (подразумевает обнаружение закономерностей в действиях пользователя веб-узла или их группы) и др.
Каждая их этих технологий возникла и развивалась независимо друг от друга и сегодня подобная автономность и распределенность не позволяет осуществлять эффективный мониторинг всех информационных ресурсов (базы знаний, базы данных, а в последние годы и онтологии), которыми обладают интеллектуальные системы, в частности ИЭС. В настоящее время, практически, отсутствуют исследования в области создания инструментальных средств и технологий распределенного приобретения знаний из различных источников различной типологии.
Опыт практического использования целого ряда прикладных ИЭС, разработанных на основе задачно-ориентированной методологии, предложенной Г.В. Рыбиной в середине 90-х годов, и поддерживающего её инструментального комплекса АТ-ТЕХНОЛОГИЯ (в том числе для экспресс-диагностики крови, диагностики сложных технических систем, проектирования уникальных объектов машиностроения, комплексных экологических задач и др.), показал необходимость мониторинга, т.е. проведения регулярных проверок и подтверждений накапливаемых и формализуемых знаний в соответствующих базах знаний, чтобы их качество не отразилось на качестве функционирования ИЭС в целом.
Кроме выявления ошибок (дефектов), дублирования, противоречивости и неполноты информации в базах знании функционирующих систем, эти же вопросы имеют важное значение при моделировании проблемных областей и проектировании собственно баз знаний и баз данных (контроль ограничений целостности, согласованности, соглашений между использованием терминов проблемной области1 и т.д.). Например, чтобы преодолеть проблему неполноты разрабатываемой базы знаний (т.е. эксперт не знает и/илш забыл отметить какой-либо факт, необходимый для решения задачи) можно поступать следующим образом: приглашать конкретного эксперта п-ое количество раз; приглашать других экспертов или группу экспертов; использовать независимый электронный источник знании в виде баз данных Первые два способа могут привести к срыву всего процесса моделирования проблемной области как из-за существенного удорожания стоимости труда эксперта/экспертов, так и в следствие так называемых «шумовых» личностных особенностей экспертов (недопонимание, умолчание, конформизм, когнитивная защита, собственные интересы эксперта, отсутствие семантической унификации используемых терминов проблемной области и др.). Также особо отмечается наличие таких факторов, как «когнитивная защита" личности», «дискретность», неполнота человеческого знания и др.
Наиболее нейтральными и независимыми источниками знаний являются базы данных. Анализ экспериментальных данных, полученных при создании баз знаний целого ряда прикладных ИЭС, показал, что локальное использование баз данных в качестве дополнительного источника знаний способно пополнить объем разрабатываемых баз знаний на 10-20%, в зависимости от специфики проблемной области.
Таким образом, возникает необходимость создания новой автоматизированной технологии приобретения знаний, распределенных по источникам знаний различной типологии.
Цель работы. Целью данной диссертационной работы является автоматизация процессов построения баз знаний ИЭС на основе разработки моделей, методов и программных средств распределенного приобретения знаний
Для достижения поставленной цели в диссертации решены следующие задачи:
1) На основе анализа существующих моделей, методов и средств приобретения знаний выбор базисного метода автоматизированного приобретения знаний, на основе которого предложен новый подход к интеграции информации, полученной из источников знаний различной типологии, предложено и исследовано понятие «распределённого приобретения» знаний с целью автоматизированного построения максимально полных и непротиворечивых моделей проблемных областей.
2) Разработка оригинального алгоритма распределенного приобретения знаний из баз данных, основанного на построении бинарных деревьев решений, существенным отличием которого от базового алгоритма CART является ориентация на приобретение знаний из множества баз данных и оптимизация структуры и количества выведенных продукционных правил.
3) Разработка метода и алгоритмов группового приобретения знаний, основанных на вычислении вероятности принадлежности по мнению группы экспертов каждого рассматриваемого объекта определенному классу.
4) Разработка метода и алгоритмов объединения продукционных правил, полученных из источников знаний различной типологии, основанных на применении теории мультимножеств, расширенных таблиц решений и таблиц мер схожести правил, строящихся путем вычисления мер схожести Хемминга для посылок и заключений правил.
5) Разработка инструментальных программных средств приобретения знаний, распределенных по источникам знаний различной типологии, и средств объединения продукционных правил, полученных из различных источников.
6) Проведение экспериментальной апробации предложенных алгоритмов и разработанных инструментальных программных средств на задачах медицинской диагностики и задачах контроля радиационных дозовых нагрузок персонала атомных электростанций РФ.
Методы исследования. Для решения поставленных задач в диссертации использованы методы искусственного интеллекта (модели и методы представления и обработки знаний, методы инженерии знаний), методы Data Mining (методы классификации, построения деревьев решений), метод эвристической классификации, теория мультимножеств, теория множеств и отношений, технология разработки программного обеспечения.
Научная новизна. В диссертации получены следующие новые результаты.
1. С учетом распределенного варианта приобретения знаний предложен расширенный для источников знаний различной типологии комбинированный метод автоматизированного приобретения знаний.
2. Предложен и исследован алгоритм распределенного приобретения знаний из баз данных, основанный на построении бинарных деревьев решений, существенным отличием которого от базового алгоритма CART является ориентация на приобретение знаний из множества баз данных и оптимизация структуры и количества выведенных правил.
3. Впервые предложен и исследован метод объединения продукционных правил, полученных из источников знаний различной типологии.
4. Впервые разработаны инструментальные программные средства распределенного приобретения знаний из баз данных для автоматизированного построения баз знаний интегрированных экспертных систем и рекомендации по их применению.
Таким образом, в результате выполненных исследований разработаны модели, методы, алгоритмы и инструментальные программные средства, позволяющие снизить трудоемкость и временные затраты на разработку поля знаний и базы знаний в процессе разработки прикладных ИЭС.
Основные научные результаты, выноснмыс на защиту:
1. Расширенный для источников знаний различной типологии комбинированный метод приобретения знаний, построенный на основе выполненного анализа существующих моделей, методов и средств приобретения знаний.
2. Алгоритм распределенного приобретения знаний из баз данных, основанный на построении бинарных деревьев решений, существенным отличием которого от базового алгоритма CART является ориентация на приобретение знаний из множества баз данных и оптимизация структуры и количества выведенных правил.
3. Метод объединения продукционных правил, полученных из источников знаний различной типологии, основанный на применении теории мультимножеств, расширенных таблиц решений и таблиц мер схожести правил, строящихся путем вычисления мер схожести Хемминга для посылок и заключений правил.
4. Комплекс инструментальных программных средств распределенного приобретения знаний из баз данных для автоматизированного построения баз знаний интегрированных экспертных систем.
Практическая ценность н значимость работы заключается в том, что созданные инструментальные программные средства в составе комплекса АТ-ТЕХНОЛОГИЯ используются в учебном процессе ННЯУ «МИФИ» на кафедре Кибернетики, а также в деятельности ОАО «Концерн Росэнергоатом» (акты о внедрении).
Апробация- разработанных моделей,, методов и инструментальных-• программных средств при создании нескольких баз знаний для задач медицинской диагностики и задач контроля: радиационных дозовых нагрузок персонала атомных электростанций РФ-подтвердшщпрактическую значимость результатов диссертации. . . . .
Реализация результатов: диссертации. Результаты диссертации- использовались• в НИР; выполненной при; поддержке РФФИ (проект № 09-01-00638) в учебно-научной? лабораторий "Интеллектуальные системы итехнологии" кафедры Кибернетики МИФИ;
Структура и объём работы. Во введении обоснована актуальность темы диссертации; её научная новизна и практическая значимость, сформулирована,цель работы.
В первом разделе рассматриваются основные понятиям и определения, в;, области приобретения знаний из различных.источников; исследуются; проблемы, характерные;для этой,области, проводится обзор исравнительный; анализ методов ^программных- средств; приобретения знаний из различных источников; На основе анализа существующих моделей, методов и средств- приобретения; знаний выбран базисный5 метод автоматизированного приобретения знаний; предложенный'; и, реализованный? Г.В: Рыбиной в рамках задачно-ориентировапной методологии построения ИЭС. В контексте выбранного метода вводится и исследуется; понятие распределённого приобретения знаний применительно к> интеграции информации; полученной из источников-знаний различной типологии, с целью- автоматизированного построения-максимально полных и непротиворечивых моделей;проблемных областей:
В соответствии с выбранным; подходом источники , знаний; 1-го' и 2-го типа рассматриваются в диссертации как совмещенные,.поскольку в комбинированном методе приобретения знаний существует совокупность хорошо апробированных технологических" процедур, позволяющих дополнять информацию, полученную от эксперта/экспертов, за; счет информации,, выявленной; из проблемно-ориентированных ЕЯ-текстов (в данном: случае — это обработка протоколов интервьюирования экспертов; сбор: лексики инженера, по знаниям / системного аналитика, анализ сигнальных лексем во входных ЕЯ-текстах и
ДР-)- * . . ■
В диссертации; показано, что поскольку не существует универсальных ; методов, позволяющих решать проблему неполноты баз знаний,- то разработка, и применение технологии приобретении знаний, из баз данных как дополнительного источника знаний; является новым приложением концепций Data Mining и Knowledge Discovery in Databases, для решения этой проблемы.
Также в первом разделе диссертации; приводятся результаты анализа отечественных; и зарубежных программных средств поддержки процессов приобретения знаний. Показано, что несмотря на то, что в настоящее время разработано огромное количество» программных средств, реализующих различные подходы к приобретению знаний, функционирующих как в составе многочисленных оболочек экспертных систем, так и-автономно от других компонентов поддержки разработки экспертных систем, несуществует универсальных методов^ и« методологий, позволяющих эффективно решать проблему автоматизированного приобретения знаний, ориентированных на поддержку процессов приобретения знаний на всех этапах жизненного цикла разработки не только ИЭС, но и традиционных экспертных систем.
В связи- с этим в диссертации делается вывод об актуальности темы исследования, направленного на разработку эффективных методов и. инструментальных программных средств распределенного приобретения знаний из баз данных, повышающих степень автоматизации процессов построения поля знаний* и базы знаний для широкого- класса прикладных ИЭС, в том числе проектируемых на основе задачно-ориентированной методологии. Сформулирована цель и поставлены конкретные задачи диссертационного исследования.
Во втором разделе диссертации рассматриваются теоретические аспекты разработки программных средств распределенного приобретения знаний.
Исследованы особенности распределенного варианта приобретения знаний на основе комбинированного метода приобретения' знаний, обеспечивающего с одной* стороны, интеграцию всех типов источников знаний, с другой, стороны — учет их географической распределенности, а также возможность работы с группами удаленных источников знаний. Описана.обобщенная модель комбинированного метода приобретения-знаний с учетом особенностей перехода от локального варианта приобретения знаний- к распределенному приобретению знаний и акцентом на расширение-множества базовых процедур за счет дополнения процедурами группового приобретения знаний; распределенного приобретения знаний из баз данных; объединения фрагментов полей знаний, полученных из источников знаний разной типологии и др.
Описан предложенный алгоритм распределенного приобретения знаний из баз данных, основанный на построении бинарных деревьев решений и дополненный постобработкой сгенерированных правил, направленной- на оптимизацию структуры и количества выведенных правил.
Впервые предложен метод объединения многомерных объектов, для представления которых в диссертации применяется теория мультимножеств, разработанная известным российским ученым А. Б. Петровским. Данный подход является наиболее удобным для представления объектов, характеризующихся многими разнородными признаками, которые могут быть как количественными, так и качественными или смешанными. В рамках предложенного подхода разработаны оригинальные алгоритмы для объединения наборов типов атрибутов и объединения объектов, полученных из источников знаний различной типологии, основанные на применении теории мультимножеств.
Для объединения наборов правил, полученных из источников знаний различной типологии, в диссертации предложен и реализован метод, основанный на анализе расширенных таблиц решений и построении табчиц мер схожести для посылок и заключений сравниваемых правил.
Для реализации группового приобретения знаний из источников 1-ого типа в диссертации разработан и реализован метод группового приобретения знаний, основанный на вычислении вероятности принадлежности по мнению группы экспертов каждого рассматриваемого объекта определенному классу.
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Интеллектуализация диагностики критических состояний больных с сердечной недостаточностью на основе консилиума алгоритмов2005 год, кандидат технических наук Плетнев, Анатолий Владимирович
Исследование и разработка моделей, методов и программных средств темпорального вывода в динамических интегрированных экспертных системах2013 год, кандидат наук Мозгачев, Алексей Васильевич
Извлечение знаний из таблиц данных при помощи обучаемых и упрощаемых искусственных нейронных сетей2000 год, кандидат технических наук Царегородцев, Виктор Геннадьевич
Теория LP-структур для построения и исследования моделей знаний продукционного типа2009 год, доктор физико-математических наук Махортов, Сергей Дмитриевич
Модель МП-процессора, выполняющего преобразование естественно-языкового представления ядра продукции в формулу логики предикатов2005 год, кандидат технических наук Хаптахаева, Наталья Баясхалановна
Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Дейнеко, Александр Олегович
Выводы по диссертации
В диссертации представлены материалы, посвященные решению актуальной задачи, связанной с автоматизацией приобретения знаний из источников различной типологии для построения баз знаний ИЭС. В центре внимания работы находились проблемы, которые до настоящего времени мало исследовались в отечественной и зарубежной практике приобретения знаний из источников различной типологии, поскольку их решение затрагивает целый ряд смежных задач (приобретение знаний из множества источников различной типологии, групповое приобретение знаний, объединение продукционных правил и т.д.).
1) На основе анализа существующих моделей, методов и средств приобретения знаний выбран базисный метод автоматизированного приобретения знаний, на основе которого предложен новый подход к интеграции информации, полученной из источников знаний различной типологии, и введено понятие «распределённого приобретения» знаний с целью автоматизированного построения максимально полных и непротиворечивых моделей проблемных областей.
2) На основе выполненного анализа существующих моделей, методов и средств приобретения знаний построена модель расширенного для источников знаний различной типологии комбинированного метода приобретения знаний.
3) Разработан метод и алгоритм группового приобретения знаний, основанный на вычислении вероятности принадлежности по мнению группы экспертов каждого рассматриваемого объекта определенному классу, позволяющие получать достаточно полные и непротиворечивые фрагменты ПЗ, путем приобретения знаний' из группы экспертов.
4) Разработан оригинальный алгоритм распределенного приобретения» знаний из баз данных, основанный на построении бинарных деревьев решений, существенным отличием которого от базового алгоритма CART является ориентация на приобретение знаний из множества баз данных и оптимизация структуры и количества выведенных продукционных правил.
5) Разработан метод и алгоритмы объединения продукционных правил, полученных из источников знаний различной типологии, основанный на применении теории мультимножеств, расширенных таблиц решений и таблиц мер схожести правил, строящихся путем вычисления мер схожести Хемминга для посылок и заключений правил. Предложенные метод и алгоритмы объединения продукционных правил позволяют существенно сокращать временные затраты при объединении фрагментов ПЗ, полученных из источников знаний различной типологии.
6) Разработаны инструментальные программные средства приобретения знаний, распределенных по источникам знаний различной типологии, и средства объединения продукционных правил, полученных из различных источников, включенные в состав комплекса АТ-ТЕХНОЛОГИЯ третьего поколения.
7) Проведена экспериментальная апробация предложенных алгоритмов и разработанных инструментальных программных средств на задачах медицинской диагностики и задачах контроля радиационных дозовых нагрузок персонала атомных электростанций РФ.
Предложенные и реализованные в диссертации модели, методы и программные средства распределенного приобретения знаний для автоматизированного построения баз знаний ИЭС позволили существенно сократить временные и финансовые затраты на разработку и своевременное пополнение баз знаний ИЭС, а в некоторых случаях автоматизировать процесс создания и поддержания в актуальном состоянии баз знаний ИЭС.
заключения от |0.6 Г от до до с Слить пра
Пропустить правила
Атрибут первого правила
ОБЪЕКТ! .АТРИБУТІ.
Атрибут второго правила 0БЪЕКТ1АТРИБУТ2 ОБЪЕКТ ¿АТРИБУТІ.
Готово
1100] ІНОСТЬ
Ю;100]
0БЪЕКТ2АТРИБУТ1.
0БЪЕКТ2АТРИБУТ1.
РТР
Схожести
Назад | Далее»
Готово
Рис. 38. Задание контрольной зоны Завершающим этапом реализации ТПП «Приобретение знаний из БД» является верификация итогового фрагмента ПЗ (Рис. 39, 40, 41). гВыявитьг
I .V ^ Все нарушения О
V Значение атрибута, на которое нет ссылок. Г" Недопустимое значение атрибута Г Недостижимое заключение Г Замкнутые правила Г* Лишние ії-условия Г" Избыточные правила Г" Конфликтные правила Г" Пересекающиеся правила
Из^ггочньїе цепочкм прави/і 17 Конфликтные цепочки правил Замкнутые цепочки правил Пересекающиеся цепочки правил
-Критерий охвата для цепочек правил
• Охват правил С Охват ветвлений С Охват условий
ОК
Отмена
Рис. 39. Окно средств верификации. Выбор типа аномалий.
Остальные атрибуты:
Атрибуты для начальной маркеровки сета:
Объективные данные 0смотр.Слизистая глотки Все —>
Объективные данные Пальпация. Болезненность к» Объективные данные ПальпацияТолосовое дрожа! Объективные данные. ПальпацияУвеличение пече)-Объективные данные Перкуссия.Высота перкуторе Объективные данные. Перкуссия.Сила перкугорног Пациент № медицинской карты Пациент. Возраст Пациент Домашний адрес Пациент. О смотр Пациенг.Пол Пациенг.ФИО
Предварительный диагноз.Предварительный диагн Предварительный диагноз.Предваригельный диагн Предварительный диагноз.Предваригельный диагн Предварительный диагноз Предварительный диагн Предварительный диагноз Предварительный диагн Предварительный диагноз.Предваригельный диагн Предварительный диагноз.Предваригельный диагн П редваригельный диагноз П редваригельный диагн Предварительный диагноз.Предварительный диагн П редваригельный диагноз. П редваригельный диагн Предварительный диагноз.Предваригельный диагн Предварительный диагноз.Предваригельный диагн П редваригельный диагноз П редваригельный диагн Предварительный диагноз.Предваригельный диагн <— Все Предварительный диагноз Предварительный диагн ^ I
Анамнез. Наследственность Аллергия
Анамнез. Наследственность.Бронхиальная астма
Анамнез. Наследственность.Муковисцидоз
Анамнез. Перенесенные заболевания и наличие хрониче
Анамнез. Перенесенные заболевания и наличие хрониче
Анамнез. Перенесенные заболевания и наличие хрониче
Анамнез. Эпидемиологический и Аллергический анамне
Жалобы пациетаАллергическая сыпь на коже
Жалобы пациетаБоль в горле
Жалобы пациета Боль в грудной клетки
Жалобы пациетаБоль в левой половине грудной клетки
Жалобы пациетаБоль в правой половине грудной клегк!
Жалобы пациета. Бол> в ухе
Жалобы пациета.Влажность кашля
Жалобы пациета Время гроявления кашля
Жалобы пациета Головная боль
Жалобы пациета.Изменение голоса
Жалобы пациета. Кашель
Жалобы пациета.Наличие хрипов
Жалобы пациега.Нарушение сна
Жалобы пациета. Н асморк
Жалобы пациета. Одышка
Жалобы пациета. Одышка в покое
Жалобы пациета. Одышка при незначительной Физическ
Жалобы пациета. Одышка при Физических нагрузках
Жалобы пациета.Озноб
Жалобы пациета. Откашливание мокроты
Жалобы пациета. О тушение в носу сж
Рис. 40. Окно средств верификации. Настройка алгоритмов обнаружения динамических аномалий.
Вдац 1
Найаены оимбки Выжяено
Ошибок мет ^ • Исправлено
Ш в Избыточные цело«* правил V Конфликтные цепочки правил 2 Замкнутые цепо«*м правил 2
Печать Редактор
И стравить
Д пер.
Начало рмнита1 Острый ринит! Анализ ОстрыйРъмиг и Начало ринита1 Острый ринит1 Анализ ОстрыйРиниг и Начало рмнита1 Острый риниг1 Анализ ОстрыйРиниг и Начало рмыта! Острый рюыт! Анализ ОстрыйРмыт и Начало ринита! Острый ригмг! Анализ ОстрыйРиниг и Начало ришта1 Острый ришт! Анализ 0стрыйР»*1иг и Начало рижпа! Острый рижт! Анализ 0стрь*5Риниг и Начало ринита1 Острый рию<т! Анализ ОстрыйРюмг и Начало ринига1 Острый рижт! Анализ ОстрыйРиниг и Начало рим*та2 Острый риниг1 Анализ ОстрыйРьыит и Начало ринит¿2 Острый ринит 1 Анализ ОстрыйРиниг и Начало ришта2 Острый ригыт1 Анализ ОстрыйРиниг и Начало рижта2 Острый рм»«т! Анализ ОстрыйРиниг и Начало ринит«2 Острый ринит1 Анализ ОстрыйРиниг и Начало ринмта2 Острый р**»«г1 Анализ ОстрыйРиниг и Начало ринита2 Острый римет! Анализ ОстрыйРиниг и Начало рим<та2 Острый ринит1 Анализ ОстрыйРинит и Начало рмжта2 Острый риниг1 Анализ ОстрыйРинмт и Начало ринитаЗ Острый риниг1 Анализ ОстрыЗРтит и Начало ринит аЗ Острый ришг! Анализ ОстрыйРиниг и
Начало ринига1 Дополнительные ринита! Дополнительные с.
Начало ринита! Дополнительные сиксгтома» ринига2 Дополнительные с. Начало ринита! Неспецифические симтгомы ринита1 Неспецифические Начало ринита! Неспецифические симптомы ринит а2 Неспецифические Начало ринита1 Н ©специфические симптомы ринитаЗ Неспецифические Начало ринита! Неспецифические симпго»<ш ринита4 Неспецифические Начало ринита! Неспецифические омтгомы ринита5 Неспецифические Начало ринита! Аллергическая этиология! Начало аллергического р«+ыга Начало ринита! Аллергическая зтиология2 Начало аллергтеского ринита Начало ринит а2 Допо/мигельные сикеттомы ринита! Дополнительные с. Начало ринита2 Дополнительные симптомы ринита2 Дополнительные с. Начало ринита2 Неспецифические симптом« риюта! Неспецифические Начало ринита? Неспецифические симптомы ринит а2 Неспецифические. Начало ри«гга2 Неспецифические с*#-«тгомы рикмтаЗ Неспецифические. Начало ринита2 Неспецифические симптомы ринита* Неспецифические Начало ринит а2 Неспецифические симптомы ринита5 Неспецифические Начало ринига2 Аллергическая этиология! Начало аллергического риота Начало ринит а2 Аллергическая зтиология2 Начало аллергического рижта Начало ринигаЗ Дополнительные симптомы рин*чта1 Дополнителым с Начало ринитаЗ Доло/мительные ое-гтгомы ринит а2 Дополнительные с
Рис. 41. Протокол верификации
При верификации итогового фрагмента ПЗ, полученного при объединения знаний, полученных путем интервьюирования экспертов и приобретения знаний из БД, статических и динамических аномалий выявлено не было.
Список литературы диссертационного исследования кандидат технических наук Дейнеко, Александр Олегович, 2011 год
1. Рыбина Г.В. Основы построения интеллектуальных систем. Учебное пособие. М.: Финансы и статистика; ИНФРА-М, 2010.
2. Рыбина Г.В. Теория и технология построения интегрированных экспертных систем. Монография. М.: «Научтехлитиздат», 2008.
3. Люгер Д.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем, 4-е издание.: Пер. с англ. М.: Издательский дом «Вильяме», 2003.—320 с.
4. Попов Э.В. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. М.: Наука, 1987. - 441 с.
5. Попов Э.В., Фоминых И.Б., Шапот М.Д. Статические и динамические экспертные системы: Учеб. Пособие. М.: Финансы и статистика, 1996. — 320 с.
6. Осипов Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии. — М.:Наука. Физматлит, 1997. — 112 с.
7. Осипов Г.С. Лекции по искусственному интеллекту. М.: КРАСАНД, 2009. - 272 с.
8. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. — Питер, 2000.-384 с.
9. Рыбина Г.В., Дейнеко А.О., Нистратов О.В. Автоматизированное построение полных и непротиворечивых баз знаний в интегрированных экспертных системах // Приборы и системы. Управление, контроль, диагностика. 2010. №5. С. 21-24.
10. Рыбина Г.В., Нистратов О.В., Дейнеко А.О. Особенности автоматизации» и интеллектуализации процессов подготовки и переподготовки персонала на промышленных предприятиях // Промышленные АСУ и контроллеры. 2011. № 3. С. 10-14
11. S. М. Easterbrook. Distributed Knowledge Acquisition as a Model for Requirements Elicitation. In Proc. of EKAW-89, pages 530-543, Paris, July 1989.
12. Dieng R., Giboin A., Tourtier P., Corby O., Knowledge Acquisition for Explainable, MultiExpert, Knowledge-Based Design Systems // EKAW. 1992. P. 298-317
13. Кобринский Б.А. Извлечение экспертных знаний: групповой вариант // Новости искусственного интеллекта. 2004. №3. с. 58-66.
14. Подлипский О. К. Построение баз знаний группой экспертов // КОМПЬЮТЕРНЫЕ ИССЛЕДОВАНИЯ И МОДЕЛИРОВАНИЕ 2010 Т. 2 № 1 С. 3-11
15. Рыбина Г.В., Калинина Е.А. Применения технологии Data, Mining для автоматизированного построения баз знаний интегрированных экспертных систем // КИИ-2000. Седьмая нац. конф. с международным участием. Тр. конф.-М.: Физмалит, 2000. Т. 1.С.119-127.
16. Рыбина Г.В., Калинина Е.А., Туровец А.А. Применение методов формирования и обработки хранилища данных для извлечения знаний из данных в комплексе АТ-ТЕХНОЛОГИЯ//Научная сессия МИФИ-2002. Сб.науч. трудов.-М.: МИФИ, 2002. Т.З. С.158-159.
17. Рыбина Г.В. Кочубей Е.А. Рысь Д.И. Интеграция различных источников знаний в инструментальном комплексе АТ-ТЕХНОЛОГИЯ // Научная сессия МИФИ-2005. Сборник научных трудов. М.: МИФИ, 2005. Т. 3. С. 185-186.
18. Quinlan J.R. Induction of Decision Trees //Machine Learning Journal. 1986. №1.
19. Sreerama K.Murthy, Simon Kasif, Steven Salzberg. A System for'Induction of Oblique Decision Trees//Journal of Artificial Intelligence Research. 1994. №8.
20. Норман Дрейпер, Гарри Смит Прикладной регрессионный анализ. Множественная регрессия — 3-е изд. — М.: «Диалектика», 2007. — С. 912.
21. Горбань А. Нейроинформатика и ее приложения. //Открытые системы, 1998. №4-5.
22. Фоминых И.Б. Нейрологические модели в интеллектуальных системах.-//Научная сессия МИФИ-2001. Сб. трудов. Т. 3. с.71-73.
23. Michalski R.S:, Bratko I., Kubat M. Machine Learning and Data Mining: Methods and Applications. Jonh Wiley & Sons Ltd, 1996.
24. Aha D: Case-Based Learning Algoi ithms. 1991.
25. Goldberg D.E. Genetic Algorithms in Search, Optimization and Machine Learning. -Addison-Wisley, 1990.
26. D.B. Fogel Speculation on the evolution of intelligence and its possible realization in machine form. — 1990.
27. Sreerama K.Murthy, Simon Kasif, Steven Salzberg. A System for Induction of Oblique Decision Trees. //Journal of Artificial Intelligence Research, 1994. №8.
28. Quinlan,J.R. Simplifying decision trees. //International Journal of Man-Machine Studies, 1987. №27.
29. Breiman L., Fiedman J., Olshen R. and Stone C.J. Classification and Regression Trees. -Belmont, California, Wadsworth Int.Group, 1984.
30. Mingers J. An Empirical Comparison of Pruning Methods for Decision Tree Induction. -//Machine Learning Journal, 1989. №4.
31. Гаити В;, Герке Й., Рамакришнан Р. Добыча данных в сверхбольших базах данных. -//Открытые системы, 1999. №9-10.
32. Shafer J., Agraval R., Mehta M. SPRINT: A Scalable Parallel Classifier for Data Mining. -//Proc.22nd Int'l Conf. "Very barge Databases". Morgan Kaufinann, San Francisco, 1996.
33. Gehrke J., Ramakrishnan R., Ganti V. Rain-Forest a Framework for Fast Decision Tree Construction of Large Datasets. -//Proc.24nd Int'l Conf. "Very Large Databases", Morgan Kaufmann, San Francisco, 1998.
34. Рыбина Г.В., Левин Д.Е. Особенности применения интеллектуального анализа данных в рамках задачно-ориентированной методологии построения интегрированных экспертных систем//Научная сессия МИФИ-2007. Сб.науч. трудов-М.: МИФИ, 2007. Т.З. С.99-100.
35. Breiman L, Friedman J.H., Olshen R.A., Stone C.T. Classification and Regression Trees.-Wadsworth, Belmont, California, 1984.
36. Рыбина Г.В. Автоматизированное рабочее место для построения интегрированных экспертных систем: комплекс АТ-ТЕХНОЛОГИЯ // Новости искусственного интеллекта. 2005. №3. С 6987.
37. Sreerama K.Murthy, Simon Kasif, Steven Salzberg. A System for Induction of Oblique Decision Trees//Journal of Artificial Intelligence Research. 1994. №8.
38. Загоруйко Н.Г. Прикладные методы анализа данных и знаний.-Новосибирск: Издательство института математики, 1999.-17С.
39. Рыбина Г.В., Степанов Л.С., Тавадзе М.В., Бакина А.С., Петриченко Ю.И. Обучающая интегрированная экспертная система для диагностики заболеваний дыхательных путей//Научная сессия МИФИ-2002. Сб.науч. трудов.-М.: МИФИ, 2002. Т.З. С. 138-139.
40. Рыбина Г.В., Смирнов В.В. Планирование процедур верификации баз знаний в интегрированных экспертных системах // Инженерная физика. 2006. № 3.C.53-65.
41. Вагин В.Н., Федотов А.А., Фомина М.В. Методы извлечения и обобщения информации в больших базах данных. //Изв. РАН. Теория и системы управления, 1999. №5. с. 45-59.
42. Adomavicius G., Tuzhilin A. Expert-Driven Validation of Rule-Based User Models in Personalization Applications. Data Mining and Knowledge Discovery Journal, vol. 5, 2001.
43. Lent В., Swami A., Widom J. Clustering association rules. In Proceedings of the 13th International Conference on Data Engineering, 1997, p. 220-231.
44. Wang K., Tay S., Liu B. Interestingness-based interval merger for numeric association rules. In proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining, 1998.
45. Toivonen H., Klemettinen M., Ronkainen P., Hatonen К., H. Mannila. Pruning and grouping discovered association rules. In ECML-95 Woikshop on Statistics, Machine Learning, and Knowledge Discovery in Databases, 1995.
46. Дюк B.A., Самойленко А.П. Data Mining: учебный курс СПб.: Питер, 2001
47. Jiawei Н., Kamber М. Data Mining: Concepts and Techniques, The Morgan Kaufmann Series in Data Management Systems, Jim Gray, Series Editor Morgan Kaufmann Publishers, August 2000.
48. Kohavi R. «А Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection», 1995.
49. Adomavicius G., Tuzhilin A. Expert-Driven Validation of Rule-Based User Models in Personalization Applications. Data Mining and Knowledge Discoveiy Journal, vol. 5, 2001.
50. Петровский А.Б. Новые классы метрических пространств измеримых множеств и мультимножеств в кластерном анализе. // Методы поддержки принятия решений: Т. 12 М.: Едиториал УРСС, 2001. - С. 54-67.
51. Петровский А.Б. Метрические пространства мультимножеств. // Доклады Академии наук. 1995, Т.344, №2, С.175-177.
52. Петровский А.Б. Пространства множеств и мультимножеств. М.: Едиториал УРСС, 2003.-248 с.
53. Anderberg M.R. Cluster Analysis for Applications. New York, Academic Press, 1973.
54. Рыбина Г.В., Смирнов В.В. Методы и алгоритмы верификации баз знаний в интегрированных экспертных системах // Новости искусственного интеллекта.— 20 05, №3. С.7-19.
55. Подлипский О. К. Об одной гипотезе организации экспертного знания // Современные проблемы фундаментальной и прикладной математики. Сборник научных трудов. — М., 2008. —С. 140-155.
56. Davis, R. 1982. TEIRESIAS: Applications of meta-level knowledge. Knowledge-based systems in artificial intelligence. New York: McGraw-Hill:, 1982.
57. Bennet J.S. ROGET: A Knowledge-Based System for Acquiring the Conceptual Structure of a Diagnostic Expert System Journal of Automated Reasoning // Journal of Automated Reasoning, 1985. p. 49-74.
58. Marcus S. SALT: A knowledge acquisition tool for propose-and-revise systems (Carnegie-Mellon University Department of Computer Science Technical Report). Pittsbuigh, PA, 1987, 170p
59. Eshelman, L MOLE: A knowledge acquisition tool that buries certainty factors: International Journal of Man-Machine Studies Vol 29(5) Nov 1988, p. 563-577.
60. Carlsson M. SICStus Prolog User's Manual. Swedish Institute of Computer Science, September 2010. 1357 p.
61. Моргоев В. К. Метод структуризации и извлечение экспертных знаний: имитация консультаций // Человеко-машинные процедуры принятия решений. Тр. ВНИИСИ. № И. М., 1988. С. 44-56.
62. Андриенко Г.Л. Формирование баз знаний в системе ЭСКИЗ // Прикладные системы искусственного интеллекта (Математические исследования, вып. 123) Кишинев: Штиинца, 1991. с.79-91.
63. Boose О. Expertise transfer and complex problems: using AQUINAS as a knowledge-based system. Int. J. Man- Machine studies, 1987, Vol 26, N1. p. 3-28.
64. Diederich, J , Ruhmann, I., May, M., KRITON: Knowledge Acquisition Tools for Expert Systems, edited by John H. Boose and Brian R. Gaines // Knowledge-Based Systems Series, London: Academic Press, 1998. p. 39-64
65. Осипов Г.С. Инструментарий для экспертных систем. Технология SIMER + MIR // Программные продукты и системы, 1990, N3, с.23-32
66. Reinartz Т. Focusing solutions for data mining: analytical studies and experimental results in real world domains/ Tomas Reinartz Berlin; Hiedelberg; New Yourk; Barcelona; Hong Kong; London; Milan; Paris; Singapore; Tpkyo; springer, 1999, C. 156.
67. Mena, J. Data Mining Your Website. Butterworth-Heinemann, Newton, MA, USA, 1999. 169 p.
68. Alex A. Freitas, Simon H. Mining very large databases with parallel processing Springer, 1998. 55 p.
69. Lindner W., Mesiti M. Current trends in database technology: EDBT 2004 Workshops, PhD, Heraklion, Crete, Greece, March 14-18, 2004: revised selected papers Springer, 2004. 351 P
70. Berson A., Smith S., Thearling K. Building data mining applications for CRM McGraw-Hill, 2000.510 р.
71. Engels R. Component-Based User Guidance in Knowledge Discovery and Data Mining, -IOS Press, 1999. 80 p.
72. Кнут Д. Искусство программирования. В 3-х томах. Т.1 М.: Мир, 1986.1. ИНТЕРНЕТ ИСТОЧНИКИ
73. Machine Learning Repository, http://archive.ics.uci.edu/ml/
74. SPSS Answer Tree Capabilities: http://www.aspiresoftwareintl.com/html/spssanswercap.html
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.