Метод и технологии семантической обработки информации для государственного и муниципального управления тема диссертации и автореферата по ВАК РФ 05.13.10, кандидат технических наук Ломов, Павел Андреевич
- Специальность ВАК РФ05.13.10
- Количество страниц 178
Оглавление диссертации кандидат технических наук Ломов, Павел Андреевич
Оглавление
Введение
1 Теоретические и практические основы проведения информационной интеграции в сфере ГиМУ
1.1 Специфика проблемы интеграции информации в сфере ГиМУ
1.2 Основные методы информационной интеграции
1.3 Примеры систем интеграции данных в сфере ГиМУ
1.4 Описание предлагаемого метода создания и использования единого информационного пространства в сфере ГиМУ
Выводы
2 Онтологическая модель для проведения семантической интеграции информации в области ГиМУ
2.1 Проблематика разработки интегрирующей модели
2.2 Определение расширяемого тезауруса
2.3 Отображение понятий онтологии верхнего уровня DOLCE в тезаурусе
2.4 Представление в тезаурусе онтологии DnS
2.5 Представление обобщенных понятий предметной области ГиМУ в тезаурусе
2.6 Разработка технологии семантического регулирования доступа к информационным ресурсам на основе онтологии
2.7 Выводы
3 Технология семантической интеграции информации предметной области ГиМУ
3.1 Интеграция онтологий в контексте семантической интеграции информации
3.2 Использование различного вида семантики при сравнении понятий
3.3 Технология интеграции онтологий разнородных информационных ресурсов на базе расширяемого тезауруса
2
3.4 Технология реализации высокоуровневого пользовательского интерфейса пользователя на основе тезауруса
3.5 Корректировка весов отношений в процессе работы пользователя
3.6 Выводы
4. Программная реализация системы семантической интеграции распределенных информационных ресурсов ГиМУ
4.1 Назначение и функциональные возможности разработанной системы
4.2 Структура системы и назначение функциональных модулей
4.3 Инструментальные средства и принципы разработки системы
4.4 Пример внедрения программного комплекса
4.5 Выводы
Заключение
Список использованных источников
Рекомендованный список диссертаций по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК
Модели и методы интеграции структурированных текстовых описаний на основе онтологий2009 год, кандидат физико-математических наук Иванов, Владимир Владимирович
Методы и технологии комплексного информационного обеспечения управления инновационным развитием региональной экономики2009 год, доктор технических наук Шишаев, Максим Геннадьевич
Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа2014 год, кандидат наук Лукашевич, Наталья Валентиновна
Программные системы информационного обеспечения научной деятельности: модели, структуры и алгоритмы2010 год, доктор технических наук Барахнин, Владимир Борисович
Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии2009 год, кандидат технических наук Привезенцев, Алексей Иванович
Введение диссертации (часть автореферата) на тему «Метод и технологии семантической обработки информации для государственного и муниципального управления»
Введение
Функционирование органов государственного и муниципального управления (ГиМУ) в основном связанно с выработкой и исполнением решений и оказанием государственных услуг населению. При этом базовой компонентой этих процессов всегда являлась информация, значение которой все более возрастало. На сегодняшний день уровень информационного обеспечения органов ГиМУ является одной из важнейших характеристик, от которой существенно зависит результативность их управленческой деятельности и в конечном итоге социально-экономическое развитие общества. Поэтому совершенствование информационного обеспечения следует рассматривать как одно из стратегических направлений повышения эффективности деятельности на государственном, отраслевом, региональном, международном уровнях.
Среди основных факторов, оказывающих негативное влияние на информационное обеспечение органов ГиМУ Российской Федерации (РФ) можно выделить: огромные объемы данных, хранящиеся в гетерогенных и распределенных информационных ресурсах, большое количество государственных учреждений, а также наличие слабого информационного взаимодействия между ними. Данные обстоятельства затрудняют или делают невозможным оперативное получение набора необходимых данных для принятия решений или оказания государственных услуг.
Вышеизложенное обуславливает актуальность разработки методов, технологий и средств интеграции информационных ресурсов с целью образования единого информационного пространства и предоставления на его основе необходимого информационного обеспечения ГиМУ.
На сегодняшний день существуют подходы к интеграции путем консолидации или распределения данных, применяемые в коммерческом секторе и промышленности. Они ориентированы, как правило, на интеграцию данных для решения узкого круга задач, что подразумевает приведение различных фрагментов данных под некоторых общий шаблон. Тем самым происходит потеря части семантики данных в процессе интеграции, что
4
приводит к сильному снижению выразительности полученного в итоге единого информационного пространства. В сфере ГиМУ, где действует множество субъектов, рассматривающих сходные информационные фрагменты с различных точек зрения, данное обстоятельство существенно ограничивает возможности использования единого информационного пространства. Особенно это существенно в отношении информационного обеспечения задач управления, так как сложно предсказать какая информация и в каком контексте потребуется для решения социальных и экономических проблем. Также утрата части семантики фрагментов данных приводит к появлению смысловых конфликтов и ошибок в программных продуктах, вызванных произвольными трактовками смысла интегрированной информации. Другими недостатками данных подходов являются: отсутствие ответственности за информацию, переданную во время интеграции, ее дублирование, а также потеря контроля доступа к ней. Перечисленные обстоятельства определяют необходимость применения иных подходов к интеграции информации в сфере ГиМУ, ориентированных в первую очередь на оперирование семантикой данных в процессе их интеграции.
Большое влияние на развитие средств и методов семантической интеграции оказывает инициатива Semantic Web, направленная на явное представление машинопонимаемой информации в сети Интернет. Для этого в рамках данной инициативы применяются онтологии, являющиеся формальным преставлениями понятийных систем предметных областей (ПО) и задач. Онтологии определяют разделяемую машинопонимаемую метаинформацию, которой аннотируются фрагменты данных информационного ресурса. Это позволяет оперировать данными, с точки зрения семантики, определенной в онтологии, и тем самым получать в результате интеграции информационное пространство с явно выраженным смысловым представлением включенной в него информации. Его использование позволит повысить эффективность информационного обеспечения ГиМУ, предоставлять широкий спектр государственных услуг, требующих рассмотрения информационных
5
фрагментов как описаний различных понятий ПО, а также создаст предпосылки для разработки и широкого применения интеллектуальных системы для решения задач в данной сфере.
Целью работы является совершенствование информационного обеспечения ГиМУ за счет формирования и использования интегрированного семантического представления разнородных информационных ресурсов на основе современных методов инженерии знаний; В ходе исследования были поставлены и решены следующие задачи исследования:
1. Определены основные этапы метода формирования и использования интегрированного семантического представления разнородных информационных ресурсов ГиМУ в условиях их семантической, структурной и организационной разнородности;
2. Создана интегрирующая онтологическая модель ПО ГиМУ - расширяемый тезаурус, которая используется в качестве основы для разработки и последующего единого унифицированного представления онтологий исходных информационных ресурсов;
3. Разработана технология регулирования доступа к информационным ресурсам с разноподчиненными владельцами, основанная на применении логического вывода над специализированной онтологией процедур доступа;
4. Разработана технология автоматизированной интеграции онтологий информационных ресурсов ГиМУ, основанная на проведении комплексной оценки семантической близости понятий, а также ее последующей корректировки;
5. Разработана технология реализации высокоуровневого интерфейса для обеспечения интерактивного взаимодействия с пользователем на основе метаинформации, хранящейся в тезаурусе;
6. Создан программный комплекс, ориентированный на формирование и использование интегрированного семантического представления разнородных информационных ресурсов для осуществления информационного обеспечения ГиМУ.
Объектом исследования являются онтологии, языки их представления, а также информационные процессы и ресурсы ГиМУ.
Предметом исследования являются методы семантической интеграции и обработки информации.
Используемые методы
Для решения поставленных в работе задач использованы методы, разработанные в области интеграции данных, онтологического моделирования, информационного поиска, машинного обучения и математической логики, описанные в работах отечественных и зарубежных ученых: Д. А. Поспелова, Т. А. Гавриловой, Л. А. Калиниченко, М. Р. Когаловского, В. А. Серебрякова, Г. С. Осипова, И. А. Тихомирова, Б. В. Доброва, В.Ф. Хорошевского, Н. В. Лукашевич, С. Д. Кузнецова, А. В. Смирнова, Н. А Скворцова, Н. Гуарино, Н. Ной, Т. Грубера, Т. Бернерса-Ли, Д. МакГиннесс, Ф. Баадера, и других.
Научная новизна исследования
1. Создана интегрирующая онтологическая модель предметной области ГиМУ - расширяемый тезаурус. Использование тезауруса, наряду с разработанным для него инструментальным программным обеспечением, позволяет разрабатывать онтологии с необходимой выразительностью, сообразной целям и предполагаемым затратам на интеграцию описываемого ими ресурса, дает возможность отразить важные для последующей интеграции свойства понятий исходных онтологий, а также позволяет повторно использовать понятия из онтологий других учреждений;
2. Создана технология регулирования доступа к информационным ресурсам на основе специализированной онтологии, содержащей общую понятийную систему для описания процедур доступа. Отличительной особенностью данной технологии является использование онтологии как для задания правил доступа, так и в процессе его регулирования. Это достигается благодаря сведению задачи регулирования доступа к проведению классификации экземпляров онтологии с помощью типовой машины
логического вывода. Использование данной технологии позволяет владельцам ресурсов самостоятельно определять в терминах предметной области ГиМУ и использовать правила доступа к интегрируемым ресурсам;
3. Разработана технология интеграции семантически разнородных онтологии на основе расширяемого тезауруса. Основным отличием технологии является отсутствие необходимости привлечения эксперта как на этапе отображения понятий онтологий в тезаурусе, так и на этапе корректировки данного отображения. Это достигается за счет выполнения комплексной оценки семантической близости понятий с возможным установлением между ними взвешенных отношений и последующей корректировкой весов на основе статистики работы пользователя;
4. Разработана технология реализации высокоуровневого пользовательского интерфейса. Она позволяет облегчить поиск информации пользователем в интегрированных информационных ресурсах ГиМУ. Это достигается за счет интерактивного формирования поисковых запросов на основе правил, учитывающих помимо иерархических, синонимичных и ассоциативных отношений между понятиями, также отношения из онтологий верхнего уровня и метасвойства, содержащихся в тезаурусе.
Положения, выносимые на защиту:
1. Онтологическая интегрирующая модель ПО ГиМУ - расширяемый тезаурус;
2. Технология регулирования доступа на основе специализированной онтологии процедур доступа;
3. Технология интеграции онтологий информационных ресурсов в тезаурусе;
4. Технология реализации высокоуровневого интерфейса для обеспечения интерактивного взаимодействия с пользователем.
Практическая значимость
Разработанные онтологические модели и технологии могут быть в дальнейшем использованы в области онтологического моделирования, Semantic Web, а также для решения практических задач интеграции данных и информационного обеспечения в сфере ГиМУ.
Основу диссертационной работы составляют результаты, полученные автором в ходе исследований, проводимых по планам научно-исследовательских работ Института информатики и математического моделирования технологических процессов Кольского научного центра РАН в период с 2008 по 2010 годы: тема «Методы и технологии информационного обеспечения жизненного цикла инноваций» (№ гос. регистрации 0120.0 850592). Отдельные направления исследований поддержаны грантами РФФИ (проекты РФФИ № 08-07-00301, № 09-07-98800 р_север, № 09-07-98800-р_север_а).
Апробация работы
Основные результаты и положения диссертационной работы докладывались на следующих конференциях:
- VII, VIII Всероссийская школа-семинар «Прикладные проблемы управления макросистемами». Апатиты, 2008, 2010 г.;
- IV Всероссийская научно-практическая конференция «Теория и практика системной динамики», Апатиты. 2011 г.;
- XI Всероссийская научная конференция "Электронные библиотеки: перспективные методы и технологии, электронные коллекции". Петрозаводск, 2009 г.;
- Всероссийская молодежная конференция «Управление знаниями и технологии семантического веба», Санкт-Петербург, 2010 г.;
- IV школа молодых ученых «Сбалансированное природопользование». Апатиты, 2007 г.
Публикации
По теме диссертации опубликовано 14 работ, в том числе 6 из списка ВАК. Личный вклад автора состоит в разработке интегрирующей онтологической модели ГиМУ, инструментального программного обеспечения для работы с ней, создании онтологии управления доступом и определения способов ее применения, разработки алгоритма интеграции онтологий, формализации оценок семантической близости понятий и правил расширения пользовательских запросов.
Структура и объем диссертации
Диссертация состоит из введения, четырех глав, заключения, списка литературы (92 наименования), имеет общий объем 178 страницу, содержит 39 рисунков и 2 таблицы.
В введении обоснована актуальность работы, обозначены объект и предмет исследования. Представлена формулировка целей и задач исследования, описание научной новизны и практической ценности результатов. Излагаются краткое содержание и основные результаты диссертационной работы.
В первой главе предлагается общая характеристика решаемой в работе проблемы. Рассматриваются особенности предметной области ГиМУ, существенные в контексте решения проблемы семантической интеграции.
Представлены общие методы структурной интеграции корпоративной информации и их недостатки. Описаны основные подходы к семантической интеграция на основе онтологий. Отдельное внимание уделено проблематике использования онтологий в информационных системах. Рассмотрены технологии и стандарты Semantic Web и их роль в семантической интеграции информации, а также кратко рассмотрены существующие в Российской Федерации информационные системы, одной из основных задач которых является интеграция распределенных гетерогенных информационных ресурсов.
В заключении сформулированы выводы о применимости общих подходов
к семантической интеграции на основе онтологий.
10
Во второй главе представлена онтологическая интегрирующая модель ПО ГиМУ в виде расширяемого тезауруса.
Сформулированы основные требования к составу ее элементов, а также принципы ее разработки для учета специфики предметной области. Приведен анализ онтологий верхнего уровня DOLCE, DnS, методологии Ontoclean, рассмотрено отображение их элементов в тезаурусе. Рассмотрено определение обобщенных понятий ПО, а также принципы их конкретизации в онтологиях исходных ресурсов. Представлена разработка технологии регулирования доступа на основе онтологии.
В третьей главе рассматривается процесс интеграции онтологий исходных информационных ресурсов, путем отображения их понятийных систем в расширяемом тезаурусе. Рассмотрены основные трудности, связанные с сравнением семантики понятий различных онтологий. Для их преодоления предложено применять составную семантическую метрику.
Представлен метод интеграции разнородных онтологий в тезаурусе, обладающей высокой степенью автоматизации за счет совмещения фаз интеграции онтологий в тезаурусе и последующего его использования в процессе функционирования системы. Предложена технология реализации интеллектуализированного интерфейса, позволяющего облегчить взаимодействие пользователя с тезаурусом путем обеспечения поддержки формирования запроса, а также навигации по понятийной системе предметной области ГиМУ, представленной в тезаурусе.
В четвертой главе описывается практическая реализации разработанных моделей, метода и технологии виде системы интеграции распределенных информационных ресурсов, а также ее применения для осуществления информационной поддержки ГиМУ.
1 Теоретические и практические основы проведения информационной интеграции в сфере ГиМУ
В данной главе предлагается общая характеристика решаемой в работе проблемы. Рассматриваются особенности предметной области ГиМУ, существенные в контексте решения проблемы семантической интеграции.
Представлены общие методы структурной интеграции корпоративной информации и их недостатки. Описаны основные подходы к семантической интеграция на основе онтологий. Отдельное внимание уделено проблематике использования онтологий в информационных системах. Рассмотрены технологии и стандарты Semantic Web и их роль в семантической интеграции информации, также описаны существующие в России информационные системы, одной из основных задач которых является интеграция распределенных гетерогенных информационных ресурсов.
В заключении сформулированы выводы о применимости общих подходов к семантической интеграции на основе онтологий. Предложен метод формирования и использования интегрированного семантического представления информационных ресурсов ГиМУ в условиях их семантической, структурной и организационной разнородности.
1.1 Специфика проблемы интеграции информации в сфере ГиМУ
На сегодняшний день уже существуют средства, методы и технологии, которые в целом решают проблему интеграции корпоративной информации. Однако их применение возможно лишь в масштабах одной организации или предприятия, имеющей один административный центр, который вырабатывает детальную программу процесса интеграции, осуществляет выбор средств и технологий, производит контроль полученного результата. Однако такой сценарий проведения типовой корпоративной интеграции сложно реализовать в сфере ГиМУ РФ, в виду наличия некоторых особенностей.
Среди таких ключевых особенностей ПО ГиМУ, важных в контексте проведения информационной интеграции, можно выделить следующие:
- разобщенная автоматизация [1], вызванная тем, что в Российской Федерации работы по информатизации на федеральном, региональном и муниципальном уровнях плохо скоординированы. Это приводит к появлению разнородных информационных систем, решающих задачу интеграции в рамках одной организации и не ориентированных на будущее информационное взаимодействие с информационными системами других организаций;
неопределенный и динамический состав интегрируемых информационных ресурсов. Это вызвано различной степенью готовности информационных ресурсов к интеграции, которая зависит от общего уровня автоматизации ведомства, а также от используемых в ее ИС технологий обработки, хранения и представления информации. Данное обстоятельство делает невозможной одновременную интеграцию информационных ресурсов всех ведомств, а только по мере совершенствования их информационной инфраструктуры до приемлемого уровня. Наряду с этим помимо ресурсов различных государственных организаций и учреждений в пространство интеграции было бы целесообразно впоследствии включать ресурсы и негосударственных организаций и фирм, которым может потребоваться доступ к информации для более быстрого и качественного оказания услуг населению;
- разные цели интеграции у владельцев информационных ресурсов. Цели могут варьироваться от обеспечения автоматизированного семантического поиска и навигации в контенте ресурса, представленного как часть единого информационного пространства, до определения взаимосвязей фрагментов информации, находящихся в разных источниках, с целью обеспечения их совместного изменения, проверки непротиворечивости и их объединения в процессе получения совокупной информации об объекте предметной области;
- наличие организационной разнородности, которая выражается в подчинении владельцев информационных ресурсов разным руководящим инстанциям. Это делает затруднительным согласованную реализацию в разноподчинённых ведомствах и организациях информационных систем, обладающих взаимной интероперабельностью и ориентированных на
дальнейший обмен и совместную обработку информации. Организационная разнородность также определяет различный уровень прав доступа пользователей к информационным элементам исходных ресурсов, который может зависеть как от роли обращающегося по отношению к организации-владельца ресурса, так и контекста обращения.
Учет данных особенностей определяет необходимость модификации какого-либо из существующих общих подходов к интеграции, используемого в качестве основного. Это позволит разработать интегрирующую систему, осуществляющую необходимое информационное обеспечение процессов ГиМУ.
1.2 Основные методы информационной интеграции
Интеграция данных в информационных системах понимается как обеспечение единого унифицированного интерфейса для доступа к некоторой совокупности, вообще говоря, неоднородных независимых источников данных [2]. Она характеризуется большим разнообразием постановок задач, подходов и методов, используемых для их решения.
С точки зрения архитектуры можно выделить системы с материализованной и виртуальной интеграцией [3]. В случае материализованной интеграции данных создается новый источник интегрированных данных, который используется автономно от породивших его источников и периодически синхронизируется с ними.
В случае виртуальной интеграции, система интеграции использует виртуальный источник, который в любой момент времени «содержит» актуальные данные интегрируемых источников. Данные для ответа на запросы пользователя, в этом случае берутся из информационных источников непосредственно в процессе выполнения запроса. Пользователи системы интеграции получают непосредственный доступ только к виртуальному источнику, воплощаемому данной системой.
С точки зрения преодолеваемых видов гетерогенности информационных ресурсов методы можно разделить на структурные или логические и семантические методы интеграции. Структурные методы интеграции предполагают оперирование данными на основе структур данных, в которых они хранятся. Отсюда и следует основной недостаток данных методов -высокая вероятность появления семантических конфликтов между фрагментами информации из разных источников. Это вызвано тем обстоятельством, что структурной семантики, выражаемой, например, в схеме реляционной базы данных, явно недостаточно для установления соответствия или различия между информационными фрагментами.
Для устранения недостатков структурных методов и преодоления семантической гетерогенности применяют семантические методы интеграции. Семантическая интеграция основывается на знании и учете природы данных. Разумеется, хранение данных вместе с метаданными создает дополнительные сложности, но обеспечивает большее удобство работы.
При использовании семантических методов интегрируемые источники рассматриваются не как совокупности фрагментов информации определенной структуры, а как описания объектов, субъектов и процессов предметной области. Такое представление семантики понятий становиться возможным благодаря использованию формальных описаний концептуализаций предметных областей, называемых онтологиями.
1.2.1 Структурные методы интеграции данных
Структурные методы применяются, как правило, в корпоративной среде для интеграции данных предприятия. Среди структурных методов интеграции можно выделить консолидацию, федерализацию и распределение данных [4].
Самым распространенным является метод консолидации данных (рис. 1.1). Он предполагает создание единого постоянного хранилища или операционного склада данных путем сбора информации из отдельных первичных источников. Данные при этом проходят несколько этапов
предварительной обработки: извлечение, анализ, профилирование, трансформацию и загрузку в общий респозиторий.
Рисунок 1.1- Консолидация данных.
Основной проблемой при использовании данного подхода является неактуальность интегрированной в центральном хранилище информации. Как правило, она решается компаниями, предоставляющими решения проблемы интеграции, с помощью оперативного и пакетного приложений. Оперативное приложение отслеживает изменения данных и сразу инициирует их отправку в хранилище, пакетное, в свою очередь, накапливает изменения данных в течение некоторого времени, впоследствии отправляя их. Однако обеспечение данных реального времени, то есть не отстающих от источника, является довольно сложной задачей в рамках данного подхода и часто вместо нее гарантируют обеспечение так называемого режима приближенного к реальному времени.
Существенным недостатком можно считать необходимость трансформации данных для приведения к структурам единого хранилища. Этот этап особенно в случае требования данных реального времени может потребовать значительных вычислительных ресурсов. Однако, необходимо заметить, что при трансформации происходит реструктуризации, согласование, очистку и/или агрегирование данных, что, свою очередь, повышает качество извлекаемой информации.
Необходимо отметить, что требование централизованного хранения всех данных нарушает соглашения об ответственности определенных ведомств и организаций за актуальность, адекватность и сохранность принадлежащей им информации, ввиду того, что контроль за интегрированными данными не может осуществляться ими непосредственно.
Метод распространения данных предполагает наличие приложений, сопряженных с информационными ресурсами, производящих копирование из одного места в другое (рис. 1.2). Основным преимуществом данного метода является то, что он может быть использован для перемещения данных в режиме реального времени или близком к нему. В тоже время он требует достаточных ресурсов памяти для хранения всего объема интегрируемой информации и, также как и консолидация, порождает проблему регулирования доступа владельцев к их ресурсам и защиты данных.
< прлг'ожйнкй пр^ппнвнгй _">«*—р|"нтожеь«м >
"Ч^ии ичнлла А ...-"'" ч,-ч искм-кй В^у"** .. с". ич-),*^ С
| ( П&рнлч-ыЛ
!—\ информационный ! источник О
\
Ж
Рисунок 1.2 - Распределение данных.
При использовании метода федерализация данных создается единая виртуальная картина первичных информационных ресурсов (рис. 1.3). Запросы осуществляются непосредственно к виртуальному представлению, а данные для ответа берутся из информационных источников в процессе выполнения запроса. Все необходимые преобразования данных также осуществляются при их извлечении.
Права владельцев исходных интегрируемых источников в этом случае сохраняются. Они продолжают автономно поддерживать их в своих интересах, предоставляя вместе с тем права доступа к их ресурсам пользователям системы
интеграции данных в соответствии с установленным регламентом. Авторизованные пользователи системы интеграции получают непосредственный доступ только к виртуальному источнику, воплощаемому данной системой.
Вир I унЯькчи
картина
Пятничный лчшормгшиош-ь и. ис~сн ы<А
J Рнр+мчи-ыД » и|фсрмадис-мии ис~ачнилС
Пй-рйичнь^ 1 \ I информационные источал D
т
Рисунок 1.3 - Федерализация данных.
Один из важнейших элементов федеративной системы это метаданные, которые используются для доступа к первичным источникам. В некоторых случаях эти метаданные могут состоять исключительно из определения интегрирующей (глобальной, канонической) схемы (модели), которая сопоставляется с локальными схемами (моделями) источников. Детализация глобальной схемы производиться в зависимости от целей интеграции. В нее может быть включена дополнительная информация о количестве данных, а также о способах доступа к ним, что, несомненно, оказывает положительное влияние на функциональность системы в целом.
Интегрирующую систему, реализующую метод федерализации данных, можно представить в виде тройки [5]: I = <G, S, М>, где G - глобальная схема; £ - набор гетерогенных схем ресурсов; М - отображение (mapping) запросов между G и S;
Общими подходами к определению отображения глобальной и локальной схем(моделей) являются[6, 7]: Global as View и Local as View. Первый из них (Global as View) предусматривает определение интегрирующей схемы в терминах схем локальных источников. Отображение М в этом случае включает для каждого элемента G запрос над S. Такой подход эффективен в случае, когда множество всех используемых источников предопределено заранее и его расширение не предполагается. При использовании второго подхода (Local as View) предполагается, что схема для каждого из локальных источников данных определяется в терминах глобальной. Отображение М в этом случае включает для каждого элемента S запрос над G. Это усложняется отображение пользовательских запросов в среду локальных источников данных. Однако такой подход имеет важное достоинство - он допускает динамичность состава множества интегрируемых источников данных. Существует также подход GLAV [8], являющийся комбинацией LAV и GAV подходов. Он предполагает использование глобальной схемы G для разрешения противоречий в схемах ресурсов S и трансформации запроса в элементах S в представление G. Это упрощает построение отображения по сравнению с LAV подходом и в то же время позволяет добавлять новые ресурсы в пространство интеграции.
Выполнение отображения в процессе функционирования системы интеграции выполняют медиатор и адаптеры ресурсов. Медиатором является функциональный компонент системы, задачей которого является поддержка глобальной схемы и организации обработки пользовательских запросов, выраженных в ее терминах, декомпозируя их на подзапросы, адресуемые соответствующих источникам. Адаптеры служат для представления информационных ресурсов источников в терминах глобальной схемы данных, принимают на обработку подзапросы от медиатора, выполняют обработку источника и возвращают результаты медиатору.
Основным преимуществом федеративного подхода является то, что он обеспечивает доступ к текущим данным и избавляет от необходимости консолидировать первичные данные в едином хранилище. Следует также
19
учитывать, что федерализация плохо подходит для извлечения и согласования массивов данных, где существуют проблемы с качеством данных в первичных системах.
Таким образом, помимо недостатков отдельных подходов, у них можно выделить один общий - ориентацию на оперирование данными на основе их структурной спецификации и без принятия во внимание семантики, что неизбежно влечет появление смысловых конфликтов и противоречий между информационными фрагментами.
Заметим также, что образованное в результате использования данных методов интегрированное информационное пространство можно будет применять для решения ограниченного круга задач, сформулированных на этапе проектирования интеграционной системы. Это вполне допустимо в рамках отдельного предприятия или организации в сфере бизнеса. Однако для предоставления информационного обеспечения процессов управления в сфере ГиМУ, которая характеризуется множеством субъектов, преследующих разные цели и имеющих различные точки зрения на определенные массивы данных, данное обстоятельство является крайне нежелательным, ввиду того, что заранее сложно спрогнозировать какие данные и в каком контексте потребуются для формулировки задач, их решения и контроля их выполнения.
1.2.2 Применение онтологий семантической интеграции данных
Ключевым моментом семантической интеграции является использование машинопонимаемых описаний концептуализации предметных областей в виде онтологий [9, 10] . Под концептуализацией понимается согласованное видение предметной области группой специалистов (экспертов). При этом основной цель использования таких описаний является как можно более полное представление понятийной семантики. Это позволяет разрабатывать информационные системы, в рамках которых могут применяться различные алгоритмы анализа и обработки к фрагментам информации на основании их описания в виде понятий в онтологии. Такое представление данных в виде
системы понятий предметной области можно отнести к одному из методов представления знаний предметной области.
Несомненно, проблема представления знаний является давно изучаемой в областях когнитологии и искусственного интеллекта. Традиционно знания об определенной предметной области представлялись в виде иерархии объектов, для этого часто использовались такие формализмы, как семантические сети, фреймы. Однако при всей своей наглядности такое представление не позволяло формально отразить значение того или иного термина или отношения, что затрудняло машинную обработку знаний.
На сегодняшний день широкое распространение в качестве средства описания концептуализации получили онтологии. Их достоинствами являются большие выразительные возможности, наглядность, а также, что является особенно важным, возможность формального отражения семантики. Онтология это, своего рода, попытка всеобъемлющей и детальной формализации некоторой области знаний с помощью концептуальной схемы. Обычно такая схема состоит из иерархической структуры данных, содержащей все релевантные классы объектов (концепты), их связи и правила, принятые в этой области. Онтология является виденьем эксперта предметной области, выраженном в некотором формальном представлении, что делает возможным использование онтологических моделей в широком спектре автоматизированных информационных систем.
Существует множество определений понятия онтологии. Довольно известным является определение, данное Грубером [11]: Онтология -спецификация концептуализации. Данное определение позволяет называть онтологиями огромное множество моделей, используемых для описания понятийных систем предметных областей. В работе [12] представлен так называемый спектр онтологий по степени их формализованности и использованию тех или иных синтаксических конструкций (рис. 1.4).
Произвольные логические ограничения
словари терминов
Неформальные таксономии
Ограничения на значения
Формальные экземпляры
Дизъюнктивные классы, Обратные свойства
Свойства на основе фре ймов
Тезаурусы.
Отношение «Выше-Ниже»
Каталоги на основе ID
Формальные таксономии
Рисунок 1.4 - Спектр онтологий.
В работе [13] онтологии разделяются на неформальные (вербальные) и формальные. Отличие между ними состоит в том, что формальная онтология описывается на логическом языке или языке, транслируемом в какую-либо логику, тогда как для описания неформальных используется язык, близкий к естественному.
Для большей определенности в рамках данной работы будем использовать определение онтологии, сформулированное Н. Гуарино в работе [14]. Гуарино четко разделяет понятия «концептуализация» и «онтология». Онтология определяется им как явное частичное представление подразумеваемых в соответствии с некоторым онтологическим соглашением (ontological commitment) моделей логического языка. Онтологическое соглашение, есть отображение константных и предикатных символов логического языка на элементы концептуализации (объекты реального мира и концептуальные отношения на них). Моделью (интерпретацией) логического языка является отображение символов логического языка на элементы
структуры некоторого возможного мира (possible world), представляющего некоторую часть концептуализации.
Это значит, что если задан логический язык L со словарем V, и определено онтологическое соглашение К, то онтология - это формальная теория, состоящая из аксиом, сформулированных на языке L таким образом, чтобы ограничить набор возможных моделей (интерпретаций) языка L только теми, которые удовлетворяют онтологическому соглашению К. Из этого определения следует, что онтология описывает концептуализацию, посредством частичного представления онтологического соглашения, то есть совокупности взаимосвязей между символами логического языка и объектами, а также отношениями между ними, представленными в концептуализации.
Таким образом, онтологию можно рассматривать как набор ограничений, задаваемых аксиомами, на интерпретации классов и отношений. Сами же интерпретации, явно в онтологии не присутствуют. Их подразумевает эксперт, добавляя соответствующие аксиомы, которые в итоге и определяют формальную семантику элементов онтологии.
Формализованное представление смыслового содержания информационного ресурса в онтологии позволяет ЭВМ работать с ним на основе семантики. В этом случает идея использования онтологий для интеграции разнородных ресурсов заключается в том, что при принятии решения об отождествлении некоторой пары информационных фрагментов из различных источников, осуществляется анализ их смысловой эквивалентности путем выявления связей между соответствующих им классов (концептов) в онтологии предметной области.
1.2.3 Онтологические подходы к интеграции
В целом онтологические подходы к интеграции напоминают подходы структурной интеграции, отличие состоит в том, что унификация проводиться в отношении заданной в онтологии формальной семантики, а не формата представления. Среди общих подходов к семантической интеграции данных,
основанных на использовании онтологий, выделяют [15]: централизованный, децентрализованный и гибридный.
Централизованный (моноонтологический) подход предполагает использование единой онтологии [16, 17, 18] (рис. 1.5). Концепты, входящие в нее ее, а также связи между ними, представляют понятийную систему предметной области, с элементами которой связываются фрагменты данных интегрируемых источников. Как правило процесс разработки общей онтологии проводиться группой экспертов предметной области и инженеров по знаниям. Эксперты в этом случае договариваются о значении терминов предметной области и отношениях между ними, а инженеры по знаниям задают в онтологии наборы аксиом, отражающие подразумеваемое значение терминов. Основным преимуществом является быстрота и малая трудоемкость проведения процесса интеграции на начальном этапе при известном перечне ресурсов для интеграции. Однако впоследствии с разрастанием общей онтологии в ней также происходит увеличение количество отношений и ограничений, что в конечном итоге приводит к усложнению ее поддержки. Вместе с тем проблематичной становиться повторное использование такой онтологии, так как определения новых понятий могут приводить к большому числу различных противоречий. Их можно разрешить путем упрощением существующих определений и тем самым потерей части формальной семантики или достаточно сложной модификацией общей онтологии, выполненной после ее тщательного анализа.
Централизованный подход можно считать разновидностью федерализации, где в качестве глобальной схемы используется онтология, а качестве подхода ее сопоставления с локальными схемами используется ОАУ.
Общая
0Н10Я01ИЯ
• Информационный I Ресурс А
Информационный
Ресурс В
—--!
И нфо р м аци ониь I й \
Ресурс Б
Рисунок 1.5 - Интеграция ресурсов с использованием единой онтологии.
При применении децентрализованного (мульти-онтологического) подхода каждый информационный ресурс описывается своей онтологией. Вследствие этого нет необходимости в какой-либо обобщающей онтологии, и каждая новая онтология может разрабатываться независимо от других, что облегчает подключение новых информационных ресурсов.
Мульти-онтологический подход плох тем, что необходимо устанавливать соответствие между различными онтологиями (рис. 1.6). Обычно это делается путем связывания семантически эквивалентных терминов в двух или более онтологиях. Для реализации этой идеи в существующих системах используется, в том или ином виде, специализированный формализм для установления соответствия. На практике реализация связи онтологий представляет собой очень сложную задачу, поскольку онтологии, в общем случае, разнородны -представляют знания различных предметных областей, различную глубину и детализации концептов, и т.п.
Он голо! ин
Роьурга А
Ohioj.oi и я
Б 1
Он iojioi ия
Ресурса В
Информа! |ионн^1й Ресурс А
, • }
Ииформсндиим ны и Ресурс В
Информа циан ный Ресурс Б
Рисунок 1.6 - Мульти-онтологический подход к интеграции ресурсов.
Гибридный подход призван нивелировать недостатки моно- и мульти-онтологических подходов к интеграции разнородных ресурсов (рис. 1.7). В сравнении с централизованным, он позволяет обеспечить гораздо большую выразительность при создании онтологий исходных информационных ресурсов и, как следствие, более точное отражение семантики понятий. Наряду с этим, в отличие от децентрализованного, существенно облегчается задача установления различных отношений с терминами отдельных онтологий.
Онюлошя Pocyf >оа А
Общая omonotHH '
*"! Онюпо! им * I Ресурса Б *
Информацией»1ый
Ресурс А
Отологии Porypcj В
Информации i н ы й
Ресурс В
Информационный Ресурс Б
Т
Рисунок 1.7 - Гибридный подход к интеграции ресурсов с использованием онтологий.
Перечисленные положительные свойства обеспечиваются благодаря использованию общего словаря, на основании которого строятся частные онтологические описания. Однако само построение словаря может производиться разными способами. Так, например, в работе [19] в разделяемом словаре содержатся термины-примитивы, которые, комбинируясь друг с другом, формируют лейблы описывающие отдельные концепты. Вследствие этого появляется возможность производить автоматизированное сравнение концептов, исходя из описывающих их лейблов. Недостаток такого способа заключается в том, что выразительность описания того или иного информационного элемента ограничивается выразительной мощностью общего словаря, и в ряде случаев приводит к усреднению семантических описаний. При расширении же словаря появляется проблема задания одного и того же лейбла, с помощью различных комбинаций терминов-примитивов, что приводит к проблеме неоднозначности формально заданной семантики термина.
В других работах [20, 21] общий словарь реализован в виде некоторой онтологии, постулирующей общие концепты, которые уточняются частными онтологиями. Это позволяет устанавливать различные семантические отношения между концептами частных онтологий, относящихся, например, к одному классу общей онтологии. Данный подход ориентирован на применение в рамках одной предметной области, где можно явно установить набор базовых классов. Однако здесь возникает вопрос об уровне абстракции концептов общей онтологии, так как их множества интерпретации могут быть довольно большими, что не позволить разнести по ним концепты отдельных онтологий. Если же добавлять в общую онтологию дополнительные аксиомы, сужающие множества интерпретации концептов, то это будет накладывать дополнительные ограничения на определение концептов и отношений включаемых онтологий.
Однако представленные разновидности гибридного подхода оставляют без внимания проблему установления соответствия между экземплярами
27
онтологий, представляющих экстенсионалы понятий. Определение какого-либо соответствия между концептами разных онтологий, например, эквивалентности, означает наличие этого отношения только между множествами их интерпретаций, а не их элементами. Иными словами это означает, что отсутствует возможность установить соответствие между экземплярами разных онтологий, интерпретации которых представляют один и тот же объект реального мира. В контексте семантической интеграции в сфере ГиМУ это является серьезным недостатком, так как информационные источники часто содержат данные, описывающие одну и ту же сущность. Их обработку необходимо вести совместно во избежание появления различного рода противоречий.
1.2.4 Проблематика использования онтологий
Использование онтологий связанно с появлением определенных проблем, которые необходимо решить при разработке системы семантической интеграции. Одной из них является проблема интеграции самих онтологий. Ее успешное решение обеспечивает семантическую интероперабельность информации. Следует также заметить, что данная проблема тесно связана с проблемой повторного использования нескольких онтологий для описания общей для них предметной области или задачи [22].
В общем интеграцию онтологий принято определять как процесс построения новой онтологии, описывающей некоторую предметную область, на основе имеющихся, онтологий, описывающих схожие между собой предметные области [23].
Выделяют различные уровни интеграции онтологий, в зависимости от числа изменений, которые необходимо сделать, чтобы получить некую общую онтологию из частных [24]:
- соответствие (alignment). Соответствие есть отображение понятий и отношений одной онтологии на другую. Соответствие может быть определенно не полностью, так может существовать несколько понятий в одной онтологии,
не имеющих своих эквивалентов в другой. Иногда для приведения онтологий в соответствие в них добавляют новые подклассы и суперклассы понятий. Никаких других изменений аксиом, определений, доказательств или вычислений не производиться;
частичная совместимость (partial compatibility). Частичная совместимость есть соответствие онтологий, которое поддерживает также эквивалентные выводы и вычисления для всех эквивалентных понятий и отношений. Если две онтологии являются частично совместимыми, то любой вывод или вычисление, которые могут быть выражены в одной онтологии с использованием понятий и отношений, имеющих своих близнецов, могут быть транслированы в эквивалентный вывод или вычисление в другой онтологии;
- унификация (unification). Унификация есть взаимнооднозначное соответствие всех понятий и отношений в двух онтологиях, которое позволяет любой процесс вывода или вычислений, выраженных в одной онтологии, отображать в эквивалентный процесс вывода или вычислений в другой. Обычным способом унификации двух онтологий является усовершенствование каждой из них в более детальные онтологии, чьи категории взаимнооднозначно эквивалентны.
Самой слабой формой интеграции является соответствие, так как она требует минимальных изменений исходных онтологий, но может поддерживать выводы и вычисления. Частичная совместимость требует больших изменений, при этом она обеспечивает более широкую способность к взаимодействию. Унификация или полная совместимость требуют, как правило, значительных изменений или, в некоторых случаях, полной перестройки исходных онтологий, но ее результатом является наиболее полная способность к взаимодействию, то есть все, что может быть сделано в одной онтологии, может быть сделано эквивалентным способом в другой.
Интеграция онтологий является довольно сложной проблемой, решение которой осуществляется, как правило, с помощью привлечения экспертов. Негативной стороной интеграции онтологий является потеря или изменение
формальной семантики элементов отдельных онтологий, которая используется при программной обработке контента информационного ресурса. Это в свою очередь может привести к неточному или ошибочному результату его обработки. Конечно, значимость данного обстоятельства может варьироваться в зависимости от предметной области и конкретной задачи.
На сегодняшний день не существует способов выполнять автоматическое полностью верное отображение терминов онтологий. В большинстве случаев машина может лишь предлагать определенные соответствия и проверять валидность соответствий, заданных человеком-оператором. Среди различных подходов для решения проблемы интеграции онтологий выделяют [15]:
1. Определение отображения. Объединение онтологий осуществляется отображением их объектов с помощью специального промежуточного программного агента. Причем трансляция может производиться в широких пределах, начиная от простых классов и значений свойств до картирования сложных выражений. Этот подход обеспечивает высокую гибкость, но не может гарантировать сохранения семантики, так как разработчик может определять какие угодно правила транслирования, даже если это приводит к определенным конфликтам;
2. Лексическое связывание. Данный метод привносит некоторую семантику в процесс отображения. Он предполагает создание общей описательной логической модели, основанной на лингвистических отношениях между онтологиями. Как правило, в системах, использующих этот метод, отношениями являются: синоним (synonym), гипоним (hyponym), перекрытие (overlap), покрытие (covering) и несвязность (disjoint). В то время как эти отношения подобны конструктам в дескриптивной логике и позволяют формально осуществить отображение терминов, но, используя их, далеко не всегда в достаточной степени можно отразить семантику. Данный алгоритм получается в большей мере эвристическим, нежели формальным;
3. Использование общего основания. Самым простой и легкий способ не выйти за пределы необходимого формализма - это использовать некую общую онтологию, чьи концепты будут наследоваться связываемыми онтологиями. Это позволит решить некоторые семантические конфликты. Минусом может являться тот факт, что не будет возможности установить, когда это необходимо, прямое соответствие между классами, а только через суперкласс общей онтологии;
4. Семантические соответствия. Данный подход позволяет устанавливать прямое соответствие там, где это необходимо. Он заключается в переклассификации концептов одной семантической структуры в другую. Задача переклассификации состоит в определении отношений членства между рассматриваемым концептом одной онтологии и набором классов другой. Формально этот процесс можно выразить следующим образом [25]:
Пусть существуют множества классов двух онтологий:
С* ={<$.4) С = ^.4)
Пусть существует набор, так называемых, явных наблюдений:
V = {№ | с е С5}
В нашем случае это необходимые условия для принадлежности концепта к определенному классу. Они предоставляются исходной семантической структурой. Пусть существует набор правил установления соответствия:
Я = {5"' | с е С7'}
В данном случае это достаточные условия для членства в классе. Они предоставляются целевой семантической структурой. Используя данные определения, концепт одной онтологии может быть причислен к определенному классу другой онтологии, если выполняется условие:
где сеСГ.
Данный подход также предполагает создание общего словаря в терминах свойств для определения различных концептов и отнесения их впоследствии к соответствующим онтологическим классам. Как правило, его создание осуществляется экспертом, знакомым с проблемами и задачами определенной области знаний, но не имеющего отношения к конкретному информационному ресурсу.
Основной проблемой данного метода является невозможность, в случае семантически плохо связанных онтологий, создания достаточно полного общего словаря, в результате чего пропадает возможность переклассифицировать некоторые концепты с сохранением их точной семантики.
На сегодняшний день существует несколько программных продуктов, направленных на решение задачи отображения онтологических понятий, среди которых можно выделить:
- PROMPT [26] представляет собой подключаемый модуль к редактору онтологий Protégé [27]. Процесс работы системы заключается в анализе онтологий и представлении эксперту списка предложений по объединению и последующей его корректировке списка путем выбора того или иного действия. Формирование списка предложений осуществляется на основе схожести символических имен понятий, их словоформ, а также таксономических связей между ними;
- Chimaera [28] является компонентом сервера Ontolingua. Выполняет задачи объединения онтологий и выявления последующих логических несогласованностей. При генерации списка своих предложений Chimaera основывается главным образом на сходстве имен понятий, учитываются также непосредственные таксономические связи;
- ONION [29] в результате анализа онтологий предлагает пользователю набор правил объединения. Сам анализ включает две стадии - лингвистическую и структурную. На лингвистической определяются сходства названий
терминов, а также их определений, полученных из стороннего словаря. На структурной стадии осуществляется оценка близости понятий на основе их отношений со схожими терминами. Эксперт в итоге определяет применение тех или иных правил, предлагающих различные разрешения неоднородностей в соответствии с их эвристической оценкой.
- OntoMerge [30] строит объединенную онтологию из исходных. Данный процесс включает фазу унификации представлений онтологий путем их описания на внутреннем языке, определение связывающих аксиом экспертом и последующего автоматического вывода заключения, формирующего объединенную онтологию. Авторы данного программного продукта указывают на целесообразность его применения для онтологий, содержащих большее количество аксиом Abox (Assertional box), определяющих отношения между экземплярами и концептами, нежели Tbox (Terminological box), декларирующих термины и их таксономию.
Немаловажной проблемой также является связывания онтологий с описываемыми ими информационными ресурсами. Разумеется, речь идет о явных связях, которые могут быть использованы программными агентами при выполнении клиентского запроса, сформулированного в терминах онтологии.
Выделяют следующие способы связывания:
1. Копирование структуры (Structure Resemblance). Наиболее быстрый подход, заключающийся в создании копии схемы базы данных в виде онтологии на языке, позволяющем проводить автоматизированную обработку. Впоследствии переработанная таким образом модель может быть легко преобразована в оригинальный формат ресурса;
2. Определение терминов (Definition of Terms). В некоторых случаях, для того чтобы более ясно выразить семантику информационного ресурса, онтология может включать описания терминов предметной области. Данные описания представляют собой набор правил, связывающих термин с фрагментом данных, относящимся к нему;
3. Обогащение структуры (Structure Enrichment). Это наиболее распространенный метод для связи онтологий и информационных ресурсов. Он является комбинацией ранее-упомянутых методов и включает построение фрагментарной копии схемы базы данных и задания определений новых концептов;
4. Использование метаописаний (Meta-annotation). Данный подход предполагает включение метаописаний, выражающих семантику, в контент информационного ресурса. Такое связывание онтологии с данными наиболее характерно для использования в веб-ресурсах.
1.2.5 Технологии и стандарты Semantic Web в контексте семантической интеграции
На сегодняшний день в глобальной сети Интернет представлено огромное множество различных информационных ресурсов. Их использование человеком заключается в отборе ресурсов и, далее, содержащихся в них данных, наиболее релевантных решаемой задаче. Данный процесс можно рассматривать как проведение семантической интеграции информации человеком с целью образования информационного пространства, с использование которого он способен выработать определенное решение. Существенной трудность при этом является гигантский объем данных в сети Интернет. Для решения данной проблемы используются поисковые машины. Они позволяют облегчить сбор информации путем предоставления ранжированного, согласно субъективной релевантности (т.е. «с точки зрения поисковой машины»), перечня ресурсов, который можно также отнести к своего рода интегрированному представлению информации об объекте запроса. Однако такое преставление, как правило, включает большие фрагменты данных, в которых может находиться лишь небольшое количество нужной пользователю информации. Это приводит к необходимости последующей обработки представленного набора информационных ресурсов уже человеком.
Усложнение же механизмов индексации и поиска не оказывает должного влияния на эффективность информационного обеспечения пользователя. Например, использование в поисковых машинах методов компьютерной лингвистики позволяет повысить релевантность результатов. Что достигается за счет выявления семантики в индексируемых ресурсах в процессе их комплексного языкового анализа, но ценой этого является существенное уменьшение быстродействия поисковых систем и требует привлечения дополнительных вычислительных ресурсов [31].
Основной проблемой все же является то, что веб-ресурсы представлены в большинстве своем отформатированными при помощи HTML разметки текстовыми блоками, связанными друг с другом URL ссылками. Разумеется, никакой машинопонимаемой семантики информации такие ресурсы не несут. Данное обстоятельство является следствием того, что с появлением ЭВМ долгое время не уделялось должного внимания проблеме сопряжения данных, хранимых в ЭВМ, и их смысла, подразумеваемого человеком. Разумеется, в рамках решения одиночных задач это не так важно. Программист в этом случае создает некоторую структуру с данными и программный код, в котором реализует свои знания о семантике данных. Это приводит к тому, что программа «знает» смысл того или иного фрагмента информации, и каким образом он должен быть обработан.
Однако Интернет предполагает общий доступ к информационным ресурсам, то есть их обработка может осуществляться впоследствии множеством программ и людей. Но если для людей, как правило, семантика информации представлена, в виду описания данных посредством естественного языка, то для программ такого сказать нельзя. Это не позволяет использовать ЭВМ для осуществления эффективной обработки большого объема данных и приводит к проблеме информационного хаоса в сети Интернет.
На преодоление обозначенных трудностей направлен проект построения так называемой семантической сети (Semantic Web) [32]. Основной идеей данного проекта является представления у любой информации ее семантики в
виде метаииформации в рамках одного информационного ресурса. Это позволит сделать данные машинопонимаемыми (machine readable) и соответственно обеспечить их обработку с помощью программных агентов.
В рамках проекта Semantic Web используются такие технологии, языки и стандарты как:
- XML (Extensible Markup Language) [33], является гибким текстовым форматом для описания документов произвольной структуры. XML обеспечивает возможность включения метаииформации, несущей машинопонимаемую семантику, в контент ресурса;
- RDF (Resource Definition Framework) [34], стандарт принятый в 1999 году консорциумом W3C и поддержанный ведущими производителями ПО. Он включает две части: способ описания ресурсов и способ задания схем, по которым ресурс описывается. Первая часть (RDF) определяет простую модель для описания информационного ресурса в виде троек или триплетов, состоящих из элементов: объект, атрибут и значение. Вторая часть (RDF Schema) определяет более сложную модель, позволяющую представить структуру предметной области в виде сходном с диаграммой классов UML;
- OWL (Web Ontology Language) [35] определяет модель и язык, расширяющие возможности RDF и RDFS. Язык OWL использует синтаксис XML, включает конструкции для представления таксономии классов их свойств и экземпляров. Основной целью языка OWL является описание онтологий в виде веб-ресурсов. Онтологии в этом случае используются для определения семантики метаданных, которыми в свою очередь аннотируются фрагменты данных в информационных ресурсах;
- SPARQL (Protocol and RDF Query Language) [36] - язык запросов к RDF ресурсам и, одновременно, протокол передачи информации в виде RDF троек.
Таким образом, использование технологий, стандартов и языков, применяемых в проекте Semantic Web, в решении задачи интеграции данных позволяет преодолеть их синтаксическую и структурную гетерогенность за счет повсеместного использования языка XML и хранения данных в виде наборов
36
триплетов RDF. Наличие же модели и языка OWL, позволяющего формально представит семантику ресурса в машинопонимаемом виде посредством описания его онтологии, в свою очередь создает предпосылки для успешного осуществления семантической интеграции.
1.3 Примеры систем интеграции данных в сфере ГиМУ
На сегодняшний день в РФ можно выделить несколько проектов российских компаний по проектированию информационных систем, решающих, в том числе, и проблему интеграции информации государственных учреждений различного уровня.
В основном, данные проекты разрабатывались в рамках реализации федеральной целевой программы «Электронная Россия», основными целями которой является обеспечение эффективного межведомственного информационного взаимодействия на основе внедрения системы межведомственного электронного документооборота, интеграции государственных информационных систем, предоставление
регламентированного доступа к содержащимся в них данным и автоматизации процедур информационного обмена.
В данном разделе рассмотрены примеры таких информационных систем с точки зрения их архитектуры, а также методов и технологий, применяемых для их реализации.
1.3.1 Система персонального учета населения
Система персонального учета населения (СПУН) РФ направлена на решение задач взаимодействия государства и граждан при учете и обмене персональными данными, а также предоставления государственных услуг. Разработчиком системы является компания ЗАО «ИВЦ Инсофт».
СПУН представляет собой территориально распределенную информационную систему, функционирующую на федеральном, региональном и муниципальном уровнях. Она обеспечивает взаимодействие
автоматизированных систем учета органов государственной власти, органов местного самоуправления, государственных и муниципальных организаций. Основными компонентами системы являются (рис. 1.8):
АИС
федерального уровня
КСА СПУН федерального уровня
Система рсалта-ции )АР
Единая енс <ем;( справочников и к.тссифи-""■"" кагоров
Похожие диссертационные работы по специальности «Управление в социальных и экономических системах», 05.13.10 шифр ВАК
Разработка и реализация семантической цифровой библиотеки как основы для построения пространства научных знаний2020 год, кандидат наук Атаева Ольга Муратовна
Методы и алгоритмы обнаружения семантических ошибок в гипертекстовых информационных ресурсах на основе онтологических моделей2004 год, кандидат технических наук Хлопотов, Михаил Викторович
Представление предметной области "Анализ изображений" в виде специализированного тезауруса2009 год, кандидат технических наук Трусова, Юлия Олеговна
Теоретические принципы и методы повышения эффективности автоматизации образовательных учреждений на основе онтологического подхода2009 год, доктор технических наук Шахгельдян, Карина Иосифовна
Модели, алгоритмы и программные средства поиска и композиции ВЕБ-сервисов с использованием семантических описаний2012 год, кандидат технических наук Климов, Валентин Вячеславович
Заключение диссертации по теме «Управление в социальных и экономических системах», Ломов, Павел Андреевич
4.5 Выводы
1. Процесс подключения информационных ресурсов к системе интеграции не требует изменения исходных информационных систем, так как осуществляет путем надстройки новых компонентов над уже имеющимися. Это позволяет выполнить интеграцию информационного ресурса без помех для действующей ведомственной информационной системы.
2. Разработанная система интеграции образует единое информационное пространство, в котором семантика фрагментов данных выражено явно в виде понятий предметной области, связанных между собой. Это позволяет пользователю взаимодействовать для получения информации с использованием знакомого ему понятийного аппарата.
Заключение
Предложенные в диссертационной работе модели, метод и технологии позволяют решить проблему семантической интеграции данных в сфере ГиМУ с учетом таких ее характерных особенностей как разобщенная автоматизация, организационная разнородность и различная целевая направленность интеграции информационных ресурсов. Это определяет основные отличия представленной системы и лежащей в ее основе методологии от существующих подходов и систем интеграции, применяемых в данной предметной области.
Учет разобщенной автоматизации, предполагающей наличие уже существующих разнородных ведомственных информационных систем, производиться благодаря добавлению набора дополнительных компонентов в исходную информационную систему для обеспечения семантического представление ресурса. Это не только позволяет обеспечить интероперабельность информационных ресурсов, но и дает возможность плавного выполнения процесса интеграции без существенного изменения существующих архитектур исходных информационных систем, а также принципов их функционирования.
В предложенном в диссертации методе интеграции также принята во внимание проблема разработки онтологий исходных информационных ресурсов. Ее решение может потребовать временных, финансовых и трудовых затрат, определяемых целями интеграции того или иного информационного ресурса. Для облегчения ее решения и обеспечения требуемой выразительности полученной в итоге онтологии ресурса, определяемой в зависимости от целей и предполагаемых затрат на его интеграцию, предлагается использовать расширяемый тезаурус в качестве основы. При этом ввиду наличия в нем, как атомарных атрибутов так и обобщенных понятий при создании онтологии можно применять подходы «снизу-вверх», «сверху-вниз» или их комбинацию.
Процесс интеграции с использованием разработанной системы не предполагает консолидации или перемещение данных, как это производиться в системах с материальной интеграцией. Это позволяет использовать данную систему в условиях организационной разнородности информационных ресурсов. При этом владелец не теряет контроля доступа к ресурсу и может осуществлять его регулирование путем определения правил в терминах предметной области в онтологии процедур доступа к принадлежащему ему ресурсу.
Главным же отличием полученной в итоге системы интеграции является ее оперирование семантикой данных в процессе функционирования. Это становиться возможным посредством использования онтологий исходных информационных ресурсов. Таким образом, созданная система позволяет образовать единое семантическое информационное пространство. Его использование позволяет качественно изменить процедуры информационного взаимодействия в отношении их большей автоматизации и уменьшении времени выполнения, что приводит к совершенствованию информационного обеспечения ГиМУ в целом.
Основными результатами диссертационной работы являются:
1. Онтологическая интегрирующая модель предметной области ГиМУ в виде расширяемого тезауруса. В него включены понятия и отношения онтологий верхнего уровня, концепты, представляющие обобщенные модели понятий, процессов и явлений, описываемых в информационных ресурсах предметной области, а также общезначимые атомарные атрибуты, источниками, для определения которых явились общероссийские классификаторы. Представленный набор элементов позволяет производить разработку исходных онтологических моделей с различной выразительностью, обусловленной целями и затратами на интеграцию. Также наличие в тезаурусе общезначимых атрибутов позволяет создавать согласованные системы учета информации в тех ведомствах и организациях, где это необходимо.
2. Технология интеграции семантически разнородных онтологий многочисленных информационных ресурсов в тезаурусе. Она предполагает использование составной семантической метрики для оценки семантической
166 близости понятий, находящихся и включаемых в тезаурус. В результате чего между ними формируется взвешенное отношение синонимии или ассоциации. Вес отношения впоследствии изменяется на основании статистики использования связанных понятий пользователем. Это позволяет осуществлять подстройку тезауруса под представление пользователя и устранять ошибочные отношения, созданные на этапе интеграции онтологии в тезаурус.
3. Технология регулирования доступа на основе онтологии. Она позволяет владельцу информационного ресурса предоставлять санкционированный им доступ к его ресурсу, подвергшемуся процедуре интеграции. При этом владелец может самостоятельно формулировать гибкие правила доступа в терминах предметной области в онтологии процедур ресурса, а также осуществлять регулирования доступа с использованием типовой машины логического вывода.
4. Технология реализации высокоуровневого пользовательского интерфейса, позволяющая представлять возможные контексты поискового запроса, а также наиболее важные условия поиска. Это достигается за счет использование правил расширения запроса, учитывающих наличие между понятиями отношения предметной области, а также инвариантных к ней отношений онтологии верхнего уровня и метасвойств. Благодаря этому технология позволяет облегчить работу пользователя с понятийной системой тезауруса, содержащей большой объем понятий и отношений многих онтологий.
Список литературы диссертационного исследования кандидат технических наук Ломов, Павел Андреевич, 2011 год
Список использованных источников
1 Жихарев А. П. Методология интеграции и государственного регулирования информационных ресурсов (Региональный аспект): Автореферат диссертации на соискание ученой степени доктора экономических наук -Москва, 2008.
2 Manolescu I., Florescu D., Kossman D. Answering. XML Queries over Heterogeneous Data Sources // Proceedings Of the 27th VLDB Conference, Roma, Italy, 2001.-pp. 241 -250.
3 Когаловский M.P. Интеграция данных в информационных системах. // Стандарты в проектах современных информационных систем. Сб. трудов 111-й Всероссийской практической конф., М., 2003, с. 83-85.
4 Кудинов А. Хранилище данных как основа корпоративной интеграции // PC Week/RE, 2006, №20.
5 Lenzerini М. Data Integration: A Theoretical Perspective" // In PODS '02: Proceedings of the twenty-first ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems - 2002 - pp. 233-246.
6 Calvanese D., DeGiacomo G., Lenzerini M.,Nardi D., Rosati R, Description logic framework for information integration / In Proc. of the 6-th Int. Conf. on Principles of Knowledge Representation and Reasoning (KR'98), pages 213, 1998.
7 Levy A. Logic-based techniques in data integration // In Jack Minker, editor, Logic-Based Articial Intelligence, Kluwer Academic Publishers, Dordrecht -2000 - pp. 575 - 595.
8 Вовченко A.E. Анализ и сравнение систем интеграции неоднородных информационных ресурсов/ Вовченко А.Е., Калиниченко JI.A. // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: Труды 10 Всероссийской научной конференции
"RCDL-2008". - Дубна: ОИЯИ, 2008. - С. 246-251.
168
9 Черняк JI. Интеграция данных: синтаксис и семантика. // Открытые системы 10/2009- С.24-30.
10 Baader F., McGuinness D., Nardi D., Patel Schneider P. The description logic handbook: theory, implementation and applications. - Cambridge: Cambridge University Press, 2003.
11 Gruber, Т., A translation approach to portable ontology specifications // Knowledge Acquisition, Vol. 5, 1993- pp. 199 - 220.
12 Добров Б.В., Иванов В.В., Лукашевич Н.В., Соловьев В.Д. Онтологии и тезаурусы: модели, инструменты, приложения: учебное пособие / - М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2008. - 172 с.
13 Скворцов Н. А. Вопросы согласования неоднородных онтологических моделей и онтологических контекстов. Труды Симпозиума «Онтологическое моделирование», г. Звенигород, 19-20 мая 2008 г. Ред. Калиниченко Л.А. - М: ИПИ РАН, 2008. - стр. 149-166. - ISBN 978-5-902030-546
14 Guarino, N. Formal Ontology and Information Systems. In: Guarino, N. (ed.) Proc. 1st Int'l Conference on Formal Ontology in Information Systems, 3-15. IOS Press/Ohmsha, 1998.
15 Wache H., Vogele Т., Visser U., Stuckenschmidt H. et al. Ontology-Based Integration of Information - A Survey of Existing Approaches // Proceedings of the IJCAI-2001 Workshop: Ontologies and Information Sharing. - Seattle, WA, 2001. -P. 108-117.
16 Ashburner M., Ball C. A., Blake J. A., Botstein D., Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. // Nature Genetics, Vol. 25, No. 1. (01 May 2000), pp. 25-29.
17 Etzold T., Ulyanov A., Argos P. SRS: Information retrieval system for molecular biology data banks // Methods in Enzymology, Volume 266, 1996, Pages 114-128.
18 Paton, N. W., Stevens, R. D., Baker, P. G. et al. Query processing in the TAMBIS Bioinformatics Source Integration System, // Proceedings of 11th International Conference on Scientific andStatistical Database Management (SSDBM), IEEE Press, pp. 138-147.
19 Wache H., Scholz Th., Stieghahn H., Konig-Ries В. An integration method for the specification of rule-oriented mediators / Wache H., Scholz Th., Stieghahn H., Konig-Ries В. // Proceedings of the 1999 International Symposium on Database Applications in Non-Traditional Environments, Kyoto, 1999 - pp. 109 -112.
20 Stuckenschmidt H., Wache H.,T. Vogele, U. Visser, Enabling technologies for interoperability // In Workshop on Information Sharing: Methods and Applications at the 14-th International Symposium of Computer Science for Environmental Protection, vol.20, TZI, 2000, - pp.35 - 46.
21 Arens Y., Knoblock C., Hsu N., «Query Processing in the SIMS Information Mediator» // In Advanced Planning Technology: AAAI Press, 1996, pp. 61-69.
22 Pinto HS, Martins JP. A methodology for ontology integration.// In Proceedings of the International Conference on Knowledge Capture K-CAP2001, pages 131-138. ACM Press, 2001.
23 Pinto HS, Gómez-Pérez A, Martins JP (1999) Some Issues on Ontology Integration. / /In Proc. of IJCAI99's Workshop on Ontologies and Problem Solving Methods: Lessons Learned and Future Trends. Vol. 18, pp. 1 - 12. Stockholm, Sweden, 1999.
24 Клещев A.C., Артемьева И.Л. Математические модели онтологий предметных областей. Часть 3. Сравнение разных классов моделей онтологий.
// Научно-техническая информация, Сер. 2. Информационные процессы и системы, № 4, 2001, С. 10-15.
25 Stuckenschmidt H., Visser U. Semantic translation based on approximate re-classication. // In International Conference on Principles of Knowledge Representation and Reasoning - Breckenridge, 2000, - pp. 110-118.
26 Noy N., Musen A Prompt: Algorithm and tool for automated ontology merging and alignment // Proceedings of the Seventeenth National Conference on Artificial Intelligence, 2000, pp. 450-455.
27 Gennari JH, Musen MA, Fergerson, RW et al. The evolution of Protégé: an environment for knowledge-based systems development // International Journal of Human-Computer Studies, vol. 58, 2003, pp. 89-123.
28 McGuinness DL, Fikes R, Rice J, Wilder S (2000) An environment for merging and testing large ontologies. Proc. 7th International Conference on Principles of Knowledge Representation and Reasoning, Breckenridge, Colorado, April 2000, pp 483-493.
29 Gangemi A, Pisanelli DM, Steve G. An Overview of the ONIONS Project: Applying Ontologies to the Integration of Medical Terminologies // Data & Knowledge Engineering 31(2), pp.183-220.
30 Dou D., McDermott D., Qi P., Ontology translation by ontology merging and automated reasoning // EKAW'02 workshop on Ontologies for Multi-Agent Systems. Spain, 2002. - pp. 3-18.
31 Осипов Г.С., Тихомиров И.А., Смирнов И.В. Семантический поиск в сети Интернет средствами поисковой машины Exactus // Труды 11-ой национальной конф. по искусственному интеллекту КИИ-2008. — 2008. - С. 323-328.
32 Berners-Lee Т., Hendler J., Lassila О., The Semantic Web // Scientific American, May 2001, p. 29-37.
33 Extensible Markup Language (XML) 1.0, W3C Recommendation 10.02.1998. [Электронный ресурс]. - Режим доступа: http://www.w3.org/TR/1998/REC-xml-19980210, свободный.
34 Resource Description Framework (RDF), 2004. [Электронный ресурс]. -Режим доступа: http://www.w3.org/RDF, свободный.
35 OWL - Web Ontology Language. Overview, 2004. [Электронный ресурс]. - Режим доступа: http://www.w3.org/TR/owl-features, свободный.
36 SPARQL Query Language for RDF W3C Candidate Recommendation 14 June 2007. [Электронный ресурс]. - Режим доступа: http://www.w3.org/TR/rdf-sparql-query
37 В. А. Виттих, Г. Д. Светкина, П. О. Скобелев, Д. В. Волхонцев, Е. А. Гриценко, А. Н. Никитин, О. JI. Сурнин, М. А. Шамашов. Разработка первой очереди системы управления регионом с применением мультиагентных технологий. // Труды VI Международной конференции по проблемам управления и моделирования сложных систем, Самара: Самарский научный центр (СНЦ) РАН, 2004, с. 346-351.
38 В. А. Виттих, Д. В. Волхонцев, А. В. Горбенко, М. А. Караваев, П. М. Ревин, П. О. Скобелев, О. JI. Сурнин, М. А. Шамашов. Применение мультиагентных технологий при создании распределенной системы взаимодействия в сфере государственного управления. // Труды VII Международной конференции по проблемам управления и моделирования сложных систем, — Самара: СНЦ РАН, 2005, с. 366-373.
39 Garshol L. Metadata? Thesauri? Taxonomies? Topic Maps! Making sense of it all // Published in Journal of Information Science, pages 378-391, volume 30, number 4, 2004; ISSN 0165-5515.
40 Нариньяни А. С. Кентавр по имени TEOH: тезаурус + онтология /Нарирьяни А. С. // Компьютерная лингвистика и интеллектуальные
технологии: международный семинар Диалог 2002 - М.: Наука, 2002. - Т. 1 — С. 307-313.
41 Скворцов Н. А. Специфика подходов к отображению онтологий //Труды семинара «Знания и Онтологии *ELSEWHERE* 2009», Москва, 2009 -С. 91-103.
42 Masolo С., Borgo S., Gangemi A, Guarino N., Oltramari A., Schneider L. DOLCE: a Descriptive Ontology for Linguistic and Cognitive Engineering // DOLCE documentation - Режим доступа: http://www.loa-cnr.it/DOLCE.html.
43 Gugliotta A., Cabral L., Domingue J. Knowledge Modelling for Integrating E-Government Applications and SemanticWebServices // AAAI Spring Symposium «Semantic Web meets eGovernment», AAAI Press SS-06-06, 2006, Stanford University, California, USA.
44 Guarino, N., Welty, C. An overview of OntoClean. In Staab, S. and Studer, R. (Eds), Handbook on Ontologies, Springer, Berlin, 2004, pp. 151-172
45 Скворцов H. А. Формальное представление метаинформации для некоторых подходов к согласованию онтологий // Труды XI Всероссийской научной конференции Электронные библиотеки: перспективные методы и технологии, электронные коллекции. - Петрозаводск: КарНЦ РАН, 2009. - С. 133 - 140.
46 Guarino, Nicola and Chris Welty. 2002. Identity and Subsumption. In Rebecca Green, Carol A. Bean, & Sung Hyon Myaeng (Eds.), The Semantics of Relationships: An Interdisciplinary Perspective, pp. 111-125.
47 [DNS] Gangemi A., Mika P., «Understanding the Semantic Web through Descriptions and Situations» Lecture Notes in Computer Science Vol. 2888/2003: On the Move to Meaningful Internet Systems 2003: CoopIS, DOA, and. ODBASE, 2003 - pp. 689-706.
48 Masolo, M., Vieu, L., Bottazzi, E., Catenacci, C., Ferrario, R., Gangemi, G., Guarino, N. Social Roles and their Descriptions // Proceedings of the Ninth
International Conference on the Principles of Knowledge Representation and Reasoning (KR2004) - Whistler, Canada, 2004. - p.267-277.
49 Giunchiglia, F., Ghidini, Local models semantics, or contextual reasoning = locality + compatibility // Artificial Intelligence archive, Volume 127 , Issue 2, ISSN:0004-3702, 2001, pp. 221 - 259.
50 Ломов П.А., Шишаев М.Г. Использование базовых классов для установления смысловой эквивалентности в семантически гетерогенных информационных ресурсах // Информационные технологии в региональном развитии: Сборник научных трудов ИИММ КНЦ РАН, вып. VIII. Под ред. В.А. Путилова - Апатиты: Изд-во КНЦ РАН, 2008. - С. 62-68.
51 Федеральный закон от 27 июля 2006 г. N 152-ФЗ «О персональных данных» // «Российская газета». 2006. 29 июля.
52 OASIS extensible Access Control Markup Language Technical Committee, «extensible Access Control Markup Language (XACML). - Режим доступа: http://www.oasis-open.org/committees/tc__home.php?wg_abbrev=xacml
53 Fisler K., Krishnamurthi S., Meyerovich L.A., Tschantz M.C., Verification and change - impact analysis of access - control policies. In ICSE'05: Proceedings of the 27th international conferenceon Software engineering, pages 196 -205,2005.
54 Kolovski V., Hendler J., Parsia В., «Analyzing web access control policies» // Proceedings of the 16th international conference on World Wide Web, (New York, NY, USA), pp. 677-686, ACM, 2007.
55 Knechtel M., Hladik J., Dau F. "RBAC Authorization Decision with DL Reasoning" In ICWI '08: Proceedings of the IADIS International Conference WWW/Internet, pages 169-176, 2008.
56 Torsten P., Wolfgang D., Nora K. Supporting Attribute-based Access Control with Ontologies // First International Conference on Availability, Reliability and Security (ARES'06), 2006 - pp.465-472.
174
57 Hecker A., Dillon T., Elizabeth C. «Privacy Ontology Support for ECommerce», Internet Computing, Issue No. 2 - March/April, 2008 - pp. 54 - 61.
58 Fenz S., Ekelhart A. Formalizing information security knowledge ASIACCS '09 // Proceedings of the 2009 ACM symposium on Information, computer and communications security, ACM, 2009 - pp. 183-194.
59 Kim A, Luo J. Myong K, Security Ontology for Annotating Resources, Naval Research Lab, NRL Memorandum Report, NRL/MR/5540-05-641: Washington, D.C., 2005 - pp. 51-57.
60 Horridge M., Drummond N., Goodwin J., Rector A., Stevens R., Wang H. The Manchester OWL Syntax // Proceeding of the 2006 OWL Experiences and Directions Workshop (OWLED), Vol. 216, Athens, 2006.
61 Kalinichenko L.A., Missikoff M., Schiappelli F., Skvortsov N. Ontological Modeling // Proc. of the Fifth Russian Conference on Digital Libraries RCDL'2003. -St.-Petrsburg: St.-Petrsburg State University, 2003. - P. 7-13.
62 Shvaiko P., Euzenat J. A Survey of Schema-Based Matching Approaches // Journal on Data Semantics IV In Journal on Data Semantics IV (2005), pp. 146171.
63 Rahm, E.; Bernstein, P. A. A Survey of Approaches to Automatic Schema Matching // VLDB Journal: Very Large Data Bases, Vol. 10, No. 4, 2001- pp. 334350.
64 Bruijn J., Martin-Recuerda F., Manov D., Ehrig M. State-of-the-art Survey on Ontology Merging and Aligning VI. SEKT-project report D4.2.1(WP4), IST-2003-506826, 2003.
65 Do H-H., Melnik S., Rahm E. Comparison of Schema Mapping Evaluations // In Proceedings of the 2nd Int. Workshop on Web Databases (German Informatics Society), Erfurt, 2002, - pp. 221—237.
66 Abels S., Haak L., Hahn A., Identification of common methods used for ontology integration tasks // In proc. First international workshop on Interoperability of heterogeneous information systems IHIS '05, 2005, - pp. 75 - 78.
67 Кудрявцев Д. В. Практические методы отображения и объединения онтологий // Труды 11-й Национальной конференции по искусственному интеллекту с международным участием (КИИ-08), семинар «Знания и Онтологии ^ELSEWHERE*», 29 сентября-3 октября 2008. г. Дубна, Россия. Том 3. - М.: URSS, 2008. - С. 164-173.
68 Скворцов Н. А. Применение уточнения понятий в решении задач манипулирования онтологиями // Труды IX Всероссийской научной конференции Электронные библиотеки: перспективные методы и технологии, электронные коллекции. RCDL'2007. - Переславль-Залесский: Университет города Переславль, 2007. - Р. 225 - 229.
69 Левашова Т.В., Пашкин М.П., Смирнов А.В., Шилов Н.Г. Управление онтологиями. Часть II // Известия академии наук. Теория и системы управления. №5, 2003, С.89 -101.
70 Смирнов А.В., Пашкин М.П., Шилов Н.Г., Левашова Т.В. Онтологии в системах искусственного интеллекта: способы построения и организации// Новости искусственного интеллекта. № 1 (49) 2002 г.
71 Goh С. Н. Representing and Reasoning about Semantic Conflicts in Heterogeneous Information Sources. Thesis (Ph. D.) Massachusetts Institute of Technology, Sloan School of Management, 1997.
72 Шалфеева E.A. Классификация свойств онтологий. Свойства онтологий и их классификации // Научно-техническая информация. Сер. 2. 2005. № 11. С. 9-16.
73 Madhavan J., Bernstein P., Rahm E. Generic Schema Matching with Cupid The VLDB Journal, 2001, pp. 49-58.
74 Knight К., Luk. К, Building a large knowledge base for machine translation. // In Proceedings of the American Association for Artificial Intelligence Conference (AAAI-94), Seattle, WA, 1994, pp 185 - 109.
75 Xiao L., Ellen R. Automated Schema Mapping Techniques: An Exploratory Study // Res. Lett. Inf. Sci 4, 2003, pp. 113 - 136.
76 C. Fellbaum. WordNet - an Electronic Lexical Database // MIT Press, Cambridge, 1998.
77 Benzi F., Maio D., Rizzi S., VISIONARY: a viewpoint-based visual language for query in relational databases, J. Vis. Lang. Computers, 10(2), 1999 pp. 117-145.
78 Pichat E., Saker D. An Automatic and Cooperative Visual Database Interface // In: Proc. of the IFIP 2.6 Third Working Conference on Visual Database Systems (VDB-3), Lausanne, Switzerland, 1995 pp. 333-348.
79 Keim D. Databases and Visualization, Tutorial // International Conference on Management of Data Montreal, Canada, 1996, p. 543.
80 Catarci Т., Francesca M., Levialdi S., Batini C., Visual query systems for databases: A survey // Journal of Visual Languages and Computing, 8(2), 1997 pp. 215-260.
81 Обухова О.JI., Бирюкова Т.К., Гершкович М.М., Соловьев И.В., Чочиа А.П. Метод динамического создания связей между информационными объектами базы знаний // Труды XI Всероссийской научной конференции Электронные библиотеки: перспективные методы и технологии, электронные коллекции. - Петрозаводск: КарНЦ РАН, 2009. - С. 39 - 45.
82 Песков Д.Н., Каберник В.В., Михеев А.Н., Афонцев С.А. Динамическая фасетная классификация (MGI-классификация) и ее применение к задачам управления знаниями в вузе // Образовательные технологии и общество. - 2006. - №3(9).
83 Catarci Т., Dongilli P., DiMascio Т., Franconi E., Santucci G., Tessaris S. An Ontology-based Visual Tool for Query Formulation Support // In Proceedings of the Sixteenth European Conference on Artificial Intelligence, 2004.
84 Bechhofer S., Stevens R., Ng G., Jacoby A., Goble C. Guiding the user: An ontology driven interface, //UIDIS, 1999, pp. 158-161.
85 Feikje H, Chris M, Peter E, Evaluating an Ontology-Driven WYSIWYM Interface // Proceedings of the Fifth International Conference on Natural Language Generation, 2008 - pp. 138-146.
86 OWLIM - a Pragmatic Semantic Repository for OWL // In Proc. of Int. Workshop on Scalable Semantic Web Knowledge Base Systems, WISE 2005, 20 Nov, New York City, USA. Springer-Verlag LNCS series, LNCS 3807, 2005 -pp.182-192.
87 Broekstra J., Kampman A., Harmelen F., Sesame: A Generic Architecture for Storing and Querying RDF and RDF Schema // In: ISWC, Springer, 2002 - pp. 54-68.
88 SKOS Simple Knowledge Organization System Reference, W3C Recommendation, 2009. [Электронный ресурс]. - Режим доступа: http://www.w3.org/TR/skos-reference.
89 Chmiel К., Gawinecki М., Kaczmarek P., Szymczak M., Paprzycki M., Efficiency of JADE agent platform, Scientific Programming 2, 2005, - pp. 159-172.
90 Laclavik M., Babik M., Balogh Z., Hluchy V. AgentOWL: Semantic Knowledge Model and Agent Architecture //In Computing and Informatics. Vol. 25, no. 5 (2006), p. 419-437.
91 Bechhofer S., Lord P., Volz R. Cooking the Semantic Web with the OWL API. In 2nd International Semantic Web Conference, ISWC, volume 2870 of Lecture Notes in Computer Science, Sanibel Island, Florida, October 2003. Springer.
92 Jupp S., Bechhofer S. Stevens R. A Flexible API and Editor for SKOS.
ESWC 2009. LNCS 5554, 2009 - pp 506-520.
178
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.