Методы и алгоритмы интеллектуальной поддержки решений по созданию баз знаний в составе информационно-коммуникационных систем тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Самков, Евгений Юрьевич

  • Самков, Евгений Юрьевич
  • кандидат технических науккандидат технических наук
  • 2012, Москва
  • Специальность ВАК РФ05.13.11
  • Количество страниц 122
Самков, Евгений Юрьевич. Методы и алгоритмы интеллектуальной поддержки решений по созданию баз знаний в составе информационно-коммуникационных систем: дис. кандидат технических наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. Москва. 2012. 122 с.

Оглавление диссертации кандидат технических наук Самков, Евгений Юрьевич

ВВЕДЕНИЕ

1. ОБОСНОВАНИЕ СПОСОБОВ ОРГАНИЗАЦИИ ОБЩЕНИЯ МЕЖДУ ПОЛЬЗОВАТЕЛЕМ И БАЗОЙ ЗНАНИЙ. ВЫБОР МОДЕЛИ МАШИННОГО ПОНИМАНИЯ ВХОДНЫХ ТЕКСТОВ

1.1. Уточнение понятия базы знаний

1.2. Обоснование способа организации общения между пользователем и базой знаний

1.3. Выбор модели машинного понимания входных текстов 13 Выводы

2. АНАЛИЗ ЯЗЫКОВЫХ СРЕДСТВ И МЕТОДОВ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ ПРИ ВЫБОРЕ ПРОЕКТНЫХ РЕШЕНИЙ ПО СОЗДАНИЮ БАЗ ЗНАНИЙ

2.1. Обзор языков и методов представления знаний

2.2. Сравнительная характеристика языков и методов представления знаний 44 Выводы

3. РАЗРАБОТКА АЛГОРИТМОВ ИНТЕЛЛЕКТУАЛЬНОЙ ПОДДЕРЖКИ ПРОЕКТНЫХ РЕШЕНИЙ ПО СОЗДАНИЮ БАЗ ЗНАНИЙ

3.1. Алгоритм фреймового представления знаний

3.2. Алгоритм представления знаний на основе концептуальной семантической сети

3.3. Алгоритм представления знаний на основе терминальной семантической сети

3.4. Алгоритм построения процедурной компоненты базы знаний

Выводы

4. ВЫБОР КРИТЕРИЕВ КАЧЕСТВА БАЗ ЗНАНИЙ И РАЗРАБОТКА МЕТОДОВ ИНТЕГРАЛЬНОЙ ОЦЕНКИ ПРОЕКТНЫХ РЕШЕНИЙ

4.1. Критерии оценки качества баз знаний как компоненты информационно-коммуникационных систем

4.2. Сущность интегральной оценки качества проектных решений по созданию баз знаний

4.3. Интегральная оценка на основе аддитивной свертки

4.4. Интегральная оценка на основе мультипликативной свертки

4.5. Интегральная оценка на основе метрического критерия

4.6. Интегральная оценка на основе матрицы потерь

4.7. Интегральная оценка методом иерархической дихотомии

4.8. Интегральная оценка на основе нечетких множеств 83 Выводы

5. РЕАЛИЗАЦИЯ ТЕОРЕТИЧЕСКИХ ПОЛОЖЕНИЙ ПРИМЕНИТЕЛЬНО К ПРОЕКТИРОВАНИЮ БАЗЫ ЗНАНИЙ В СОСТАВЕ ГОСУДАРСТВЕННОЙ АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ РФ «ПРАВОСУДИЕ»

5.1. Назначение, роль и место БЗ в структуре

ГАС РФ «Правосудие»

5.2. Функциональные возможности БЗ

5.3. Комплекс средств автоматизации БЗ

5.4. Состав и структура БЗ

5.5. Взаимодействие БЗ с другими подсистемами ГАС

РФ «Правосудие»

5.6. Иллюстративный пример интерфейса

5.7. Результаты оценки качества проекта 106 ЗАКЛЮЧЕНИЕ 115 СПИСОК ЛИТЕРАТУРЫ

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Методы и алгоритмы интеллектуальной поддержки решений по созданию баз знаний в составе информационно-коммуникационных систем»

Актуальность темы. Текущий период времени характеризуется тотальным внедрением компьютерных технологий управления и обработки информации практически во все сферы человеческой деятельности. Ожидается, что такая тенденция будет прогрессировать. На практике эти технологии реализуются в виде информационно-коммуникационных систем (ИКС), типичным представителем которых является Государственная автоматизированная система Российской Федерации (ГАС РФ) «Правосудие». Неотъемлемой составной частью систем этого типа являются базы знаний (БЗ). В настоящее время, для их построения используются готовые программные продукты типа Oracle, MSSQL, DB2 и другие, дополняемые различными программными модулями, в которые по схеме «естественный язык —> компьютерная программа» закладываются знания о проблемной области. В результате первичной выступает программная среда, а знания пользователя отражаются постольку, поскольку это допускают возможности данного программного продукта. Если исключить из рассмотрения многочисленные подробности «технического» плана, то смысл и сущность традиционной технологии заключается в непосредственном переводе описаний предметной области с естественного языка на математико-программный язык, «понятный» компьютеру. Ограниченность используемых языковых средств обусловливает все те трудности, которые приходится преодолевать разработчикам проектов по созданию баз знаний. В результате на выходе проекта он получает не то, что ему нужно для обеспечения профессиональной деятельности, а то, что могут сделать программисты-разработчики, используя имеющиеся программные платформы.

Таким образом, в настоящее время существует противоречие между потребностью широкого внедрения и использования БЗ и применяемыми технологиями поддержки проектных решений. Главная причина этого противоречия состоит в том, что в рамках традиционной технологии для представления знаний используются два типа языков: естественный язык, которым оперирует конечный пользователь и математико-программный язык, который используют разработчики баз знаний. Именно ограниченность палитры используемых языковых средств и бессистемный взгляд на проектирование БЗ обусловливает трудности, которые приходится преодолевать разработчикам проектов по созданию БЗ. Вместе с тем, в современной теории искусственного интеллекта интенсивно развиваются новые языковые средства, в частности, реляционного и ролевого типов. Их использование открывает новые возможности по описанию фактов и закономерностей предметной области, и позволяет предложить более совершенный алгоритм поддержки проектных решений по созданию БЗ, свободный от указанного выше недостатка.

Исследования, получившие отражение в диссертации, выполнены в соответствии с планами научно-исследовательских и опытно-конструкторских работ ФГУП НИИ «Восход» (г. Москва) в рамках Федеральной целевой программы развития ГАС РФ «Правосудие».

Цель диссертационного исследования заключается в повышении качества разработки и поддержки решений по созданию баз знаний в составе крупномасштабных ИКС систем за счет разработанных алгоритмов и методов интеллектуальной поддержки и их практической реализации применительно к управлению проектом ГАС РФ «Правосудие». Таким образом, объектом исследования является процесс создания базы знании, предметом - методы, обеспечивающие поддержку этого процесса.

Задачи исследования:

1. Исследование принципов организации общения между пользователем и БЗ, выбор модели машинного понимания входных текстов.

2. Анализ существующих и перспективных языков и методов представления знаний при выборе проектных решений по созданию БЗ.

3. Разработка общего и частных алгоритмов интеллектуальной поддержки проектных решений по созданию баз знаний на основе логико-лингвистического подхода.

4. Определение критериев оценки качества баз знаний и выбор методов оценки качества проектных решений по созданию баз знаний.

5. Реализация теоретических положений применительно к поддержке проектных решений при создании базы знаний для подсистемы «Банк судебных решений» (судебной практики) в составе ГАС РФ «Правосудие».

Методологическую базу исследования составляют положения теории системного анализа, искусственного интеллекта, а также методы логико-лингвистического моделирования и экспертных оценок.

Научная новизна. В диссертации получены следующие результаты, обладающие научной новизной:

1) Предложена концептуальная модель машинного понимания входных текстов, направленная на активный поиск в тексте ключевых объектов, стимулирующих базу знаний к реакции, в отличие от традиционной ненаправленной лингвистической обработки текстовых предложений, ориентированной на пассивную регистрацию того, «что есть в предложении».

2) Исследованы языковые средства с учетом особенностей крупномасштабных ИКС. Рекомендован перечень языковых средств для представления знаний о предметной области при реализации баз знаний в составе ИКС.

3) Разработаны алгоритмы интеллектуальной поддержки решений по созданию баз знаний, которые позволяют формализовать знания о предметной области с использованием методов задания единиц знаний.

4) Решена проблема оценки качества проектных решений по созданию баз знаний путем комплексной оценки базы знаний по показателям качества, учитывающим социальную, функциональную, эргономическую, прагматическую, техническую и технологическую составляющие.

Достоверность выводов и положений диссертационной работы определяется комплексным подходом к постановке задач исследования, а также 6 подтверждается положительными результатами практического применения разработанных алгоритмов и методов.

Практическая значимость работы. Разработанные и реализованные алгоритмы и методы поддержки решений при создании БЗ целесообразно использовать при решении проблем для интеллектуальных экспертных систем социально-экономического профиля. Кроме того, материалы диссертации могут быть использованы магистрами ВУЗов в учебном процессе для выполнения курсовых и магистерских диссертаций.

Результаты внедрения. Алгоритмы, методы, выводы и положения, обоснованные в диссертации, использованы во ФГУП НИИ «Восход» при проведении плановых научно-исследовательских и опытно-конструкторских работ по созданию БЗ подсистемы «Банк судебных решений» ГАС РФ «Правосудие». При рассмотрении и оценке технических заданий на развитие ГАС РФ «Правосудие» подход, основанный на использовании методов экспертных оценок, позволил обосновать параметры проекта и наиболее точно оценить затраты на проведение работ в Судебном департаменте при Верховном Суде Российской Федерации, что подтверждено соответствующим актом.

Апробация работы. Материалы диссертации докладывались и обсуждались на: научн.-практ. конф. «Современные информационные алгоритмы в управлении и образовании» (Москва, 2001); выездном заседании совета судей (Астрахань, 2009); первой Всеросс. научн.-техн. конф. «Системы организационного поведения» (Воронеж, 2009); межрегион, научн.-технич. конф. «Модели и алгоритмы интеллектуальной поддержки решений при управлении проектами» (Москва, 2009); межрегион, научн.-технич. конф. «Проблемы управления в социальных и экономических системах» (Москва, 2010); Всеросс. научн.-технич. конф. «Управление в системах организационного поведения» (Москва, 2010); научн.-практ. конф. «Современные информационные технологии в управлении и образовании» (Москва, 2011); научн.-практ. конф. «Электронное законодательство: доступ к нормативно-правовой информации в электронной среде» (Санкт-Петербург, 2011); заседание научн.-технич. совета ФГУП «НИИ «Восход» (Москва, 2012).

Публикации. Результаты диссертационного исследования опубликованы в 16 печатных работах, в том числе 2 работы в издании, включенном в перечень ВАК РФ и в одной монографии. В работах, написанных в соавторстве, лично соискателю принадлежат: в [48] алгоритмическая реализации базы знаний, в [50]- критерии и методы оценки проектных решений в [51] модели машинного понимания входных текстов, в [52] - состав и алгоритм функционирования модели, в [56] - языки представления знаний, в [53,54] -схема и содержание этапов алгоритмов, в [59] - математические алгоритмы оптимизации, в [61] - алгоритм обезличивания и публикации текстов, в том числе алгоритм обезличивания подтвержден патентом № 119485 от 03.05.2012.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, приложения (акты реализации и внедрения результатов работы) и списка литературы из 81 наименования. Материал диссертации изложен на 126 страницах машинописного текста, включая 40 иллюстраций и 10 таблиц.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Самков, Евгений Юрьевич

Результаты исследования нашли применение в ФГУП НИИ «Восход» при проведении плановых научно-исследовательских и опытно-конструкторских работ, и применялись для поддержки решений на всех этапах создания БЗ по судебной практике и судебным решениям в составе ГАС РФ «Правосудие».

ЗАКЛЮЧЕНИЕ

Диссертация посвящена разработке методов и алгоритмов интеллектуальной поддержки проектных решений по созданию БЗ в составе крупномасштабных ИКС и их практической реализации применительно к проекту ГАС РФ «Правосудие», что соответствует паспорту специальности 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей.

Исследования, получившие отражение в диссертации, выполнены в соответствии с планами научно-исследовательских и опытно-конструкторских работ ФГУП НИИ «Восход» (г. Москва) в рамках Федеральной целевой программы развития судебной системы.

Лично автором получены следующие научные результаты.

Определены принципы построения БЗ в составе ИКС типа ГАС РФ «Правосудие» в части организации общения между пользователем и БЗ, модели машинного понимания входных текстов.

Исследованы языковые средства с учетом особенностей крупномасштабных ИКС. Рекомендован перечень языковых средств для реализации БЗ в составе ИКС.

Разработаны алгоритмы интеллектуальной поддержки решений по созданию баз знаний, которые позволяют формализовать знания о предметной области с использованием методов задания единиц знаний.

Решена проблема оценки качества проектных решений по созданию БЗ путем оценки по показателям, учитывающим социальную, функциональную, эргономическую, прагматическую, техническую и технологическую составляющие;

Реализованы теоретические положения исследования применительно к проектированию БЗ в составе ГАС РФ «Правосудие». По качеству своих параметров предлагаемый автором проект по созданию БЗ СПиСР в структуре

ГАС РФ «Правосудие» на 84% соответствует эталонным требованиям и может быть реализован с вероятностью не менее 94%.

Список литературы диссертационного исследования кандидат технических наук Самков, Евгений Юрьевич, 2012 год

1. Аржаков М.В., Дёмин Б.Е., Новосельцев В.И. Анализ функциональной работоспособности организационно-управленческих структур / Системы управления и информационные алгоритмы, № 11 (23), 2006. С. 109-112.

2. Аржаков М.В., Дёмин Б.Е., Тарасов А.К., Новосельцев В.И. Оценка работоспособности организационно-управленческих систем / Надежность, № 3, 2005, С.18-24.

3. Брябрин В.М. и др. Диалоговые системы в АСУ. М.: Машиностроение, 1983.-286 с.

4. Бурков В.Н., Новиков Д.А. Как управлять проектами. М.: Синтег, 1997. - 188 с.

5. Ван Дейк Т. Язык, познание, коммуникация. М.: Прогресс, 1989.

6. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1977. - 479 с.

7. ГОСТ 24.702-1985 Единая система стандартов автоматизированных систем управления. Эффективность АСУ. Основные положения.

8. ГОСТ 28195-1989 Оценка качества программных средств. Общие положения.

9. ГОСТ Р 50739-1995 Средства вычислительной техники. Защита от несанкционированного доступа. Общие технические требования.

10. Дёмин Б.Е. Методологические основы и модели обоснования проектов крупномасштабных информационно-коммуникационных систем / Б.Е.Дёмин. Воронеж: Изд-во Научная книга, 2006. - 332 с.

11. Дёмин Б.Е. Основные положения методологии проектирования информационных систем на опыте ГАС «Выборы-М» / Тр. научно-технической конференции «Информационные алгоритмы» (ИТ-2005), Воронеж, ВГТУ, 2005.

12. Дёмин Б.Е., Голиков В.К., Новосельцев В.И., Тарасов Б.В. Теоретические основы системного анализа / Под ред. В.И. Новосельцева / М.: Изд-во Майор, 2006. - 592 с.

13. Интеллектуальные системы в морских исследованиях и алгоритмах / Под ред. Ю.И. Нечаева. Санкт-Петербург, ГМТУ, 2001

14. Инфокоммуникации XXI века: алгоритмы, услуги, качество / Под ред. Л.Д. Реймана и JI.E. Варакина. М.: МАС, 2001.

15. Крон Г. Исследование сложных систем по частям диакоптика. - М.,1972.

16. Кузнецов В.И. Системное проектирование радиосвязи. Часть 1 (Системотехника). Воронеж: Воронежский научно-исследовательский институт связи, 1994.278 с.

17. Липаев В.В. Обеспечение качества программных средств. М.: СИНТЕГ,2001.

18. Литвак Б.Г. Экспертная информация: методы получения и анализа. М.: Радио и связь, 1982. 184 с.

19. Литвак Б.Г. Экспертные оценки и принятие решений. М.: Патент, 1996. -271 с.

20. Лукацкий A.B. Атаки на информационные системы. «Электроника Наука Алгоритмы и Бизнес», №1, 2000.

21. Мальцев А.И. Алгебраические системы. М.: Наука, 2001, 320 с.

22. Маркова Е.В., Чеботарева Н.Г. Методоориентированная система по планированию и анализу эксперимента ПЛАНЕКС // Приборы и системы управления. 1989.№1, с.7-9.

23. Математическая статистика /В.М. Иванов, В.Н. Калинин, Л.А. Неклумов и др.- М.: Высшая школа, 1981.-371 с.

24. Нечаев Ю.И. Искусственный интеллект: концепции и приложения. -Санкт-Петербург: ГМТУ. 2001.

25. Нечеткие множества в задачах управления и искусственного интеллекта / Под ред. Д.А.Поспелова -М.: Наука, 1986.

26. Новосельцев В.И. Системный анализ: современные концепции / изд. 2-е испр. и дополн. Воронеж: Кварта, 2003. 360 с.

27. Новосельцев В.И., Тарасов Б.В. и др. Логико-лингвистические модели в военных системных исследованиях. М.: Воениздат, 1988. 232 с.

28. Питер Джексон. Введение в экспертные системы — 3-е изд. — М.: «Вильяме, 2001. —С. 624

29. Поспелов Д.А. Ситуационное управление: теория и практика М.: Наука, 1986. 288 с.

30. Рыков A.C. Модели и методы системного анализа: принятие решений и оптимизация. М.: МИСИС, 2005. 552 с.

31. Рындин A.A., Хаустович A.B., Долгих Д.В., Мугалев А.И., Сапегин C.B. Проектирование корпоративных информационных систем. Воронеж: Кварта, 2003. 320 с.

32. Самков Е.Ю. Методы интегральной оценки качества крупномасштабных ИКС / В.В. Клочков, Е.Ю. Самков / Сб. научн. тр. Десятой науч.-практ. конф «Современные информационные технологии в управлении и образовании».-М: ФГУП НИИ «Восход», 2011. С. 104-107.

33. Самков Е.Ю. Модели машинного понимания входных текстов / Б.Е. Дёмин, В.И. Новосельцев, Е.Ю. Самков / Вестник Воронежского государственного технического университета, т.6, 33, 2010. С. 124-127.

34. Самков Е.Ю. Общая технология проектирования интеллектуальных баз знаний / Б.Е.Дёмин, Е.Ю. Самков / Сб. тр. первой Всеросс. научн.-техн. конф. «Системы организационного поведения (80В'2009)». Воронеж: ВГАСУ, 2009. С. 6874.

35. Самков Е.Ю. Понятие интеллектуальной базы знаний / Сб. тр. Всеросс. научно-технич. конф. «Управление в системах организационного поведения». М: АтомТехноПром, 2010. С.95-97.

36. Самков ЕЛО. Представление знаний на основе ролевых фреймов / Б.Е.Дёмин, Е.Ю. Самков / Сб. тр. первой Всеросс. научн.-техн. конф. «Системы организационного поведения (80В'2009)». Воронеж: ВГАСУ, 2009. С. 75-79.

37. Самков Е.Ю. Представление знаний с помощью концептуальных семантических сетей. / Сб. тр. первой Всеросс. научн.-техн. конф. «Системы организационного поведения (80В'2009)». Воронеж: ВГАСУ, 2009. С. 80-81.

38. Самков Е.Ю. Синтаксический анализ текстов с помощью аппарата нейронных сетей / Е.Ю. Самков / Вестник Воронежского государственного технического университета, т.2, №1, 2012. С. 104-105.

39. Самков ЕЛО., Сбоев A.A. Технология обезличивания и публикации текстов судебных документов в Интренет-портале ГАС «Правосудие» / Е.Ю.Самков,

40. A.А.Сбоев / Сб. тр. межрегион, научн.-технич. конф.«Проблемы управления в социальных и экономических системах». М: НГЖ «АтомТехноПром», 2010. С. 173174.

41. Силич М. П. Использование объектно-ориентированного подхода для формирования предложений на естественном языке // М. П. Силич // Научно-техническая информация. Сер. 2. Информационные процессы и системы. 2005. -№2.-С. 8-12.

42. Силич М. П. Инструментальный комплекс для создания экспертных систем, использующих модели функциональных отношений / М. П. Силич, Н.Ю. Ха-бибулина // Известия Томского политехнического университета. 2005. - Т. 308, № 2. - С. 149-152.

43. Системный анализ и его приложения: учебное пособие / С.А. Баркалов,

44. B.Н. Бурков, П.Н. Курочка, В.И. Новосельцев, В.В. Шульгин Воронеж: «Научная книга», 2008. - 439 с.

45. Сырцов В.А., Тарасов Б.В. Модели и механизмы конкурсного управления региональными проектами по охране окружающей среды. Воронеж: Научная книга, 2008. - 300 с.

46. Уинстон П. Искусственный интеллект. М.: Мир, 1980.

47. Уэно X., Исидзука М. Представление и использование знаний / Пер. с англ. М.: Наука, 1989. - 228 с.

48. Фаин B.C. Новые аспекты машинного понимания сообщений. Известия АН СССР. Техническая кибернетика, №5, 1990, С. 100-112.

49. Форсайт Р. Экспертные системы. М., Радио и связь, 1987. 224 с.

50. Франк Д. Семь грехов прагматики: тезисы о теории речевых актов, анализе речевого общения, лингвистике и риторике/ Зарубежная лингвистика.Н,— М.: Прогресс, 1999.

51. Химмельблау Д. Анализ процессов статистическими методами. М.: Мир, 1973.-957 с.

52. Хиршман И.И., Уиддер Д.В. Преобразования типа свертки. М.: ИЛ, 1958.-350 с.

53. Шенк Р. Обработка концептуальной информации М.: Энергия, 1990.

54. Яцук В.Я. Использование Я-фреймов и метода продукций при построении интеллектуальных систем принятия решений. В кн.: Материалы международного симпозиума по искусственному интеллекту. Л., 1982.

55. Яцук В.Я. Логико-алгебраический язык с привлечением А,-конверсий для представления знаний в сложных технических системах. В кн.: Интеллектуальные банки данных, 1982.

56. Church A. The calculi of À-conversion. Princeton, 1941.

57. Minsky M. A. Framework for Representing Knowledge, in The Psychology of Computer Vision, P.H. Winston (éd.), McGraw-Hill, 1975.

58. Proceedings of the Seventh International Joint Conference on Artificial Intelligence. Canada, 1981. - In two volumes.

59. Zadeh L. Fuzzy logic, neural networks and soft computing // Fuzzy sys-tems.v.37. №3.1994. p.p.77-84.348 c.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.