Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Привезенцев, Алексей Иванович

  • Привезенцев, Алексей Иванович
  • кандидат технических науккандидат технических наук
  • 2009, Томск
  • Специальность ВАК РФ05.13.11
  • Количество страниц 239
Привезенцев, Алексей Иванович. Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии: дис. кандидат технических наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. Томск. 2009. 239 с.

Оглавление диссертации кандидат технических наук Привезенцев, Алексей Иванович

ПЕРЕЧЕНЬ УСЛОВНЫХ ОБОЗНАЧЕНИЙ.

ВВЕДЕНИЕ.

Глава 1. Организация баз знаний в ИС.

1.1 Представление знаний.

1.1.1 Концептуализация.

1.1.2 Инженерия онтологий.

1.1.3 Представление данных, информации и знаний в Semantic Web.

1.1.3.1 Extensible Markup Language (XML).

1.1.3.2 Resource Description Framework (RDF).

1.1.3.3 Ontology Web Language (OWL).

1.1.4 Дескриптивная логика и машины вывода.

1.2 Информационные системы.

1.2.1 Определение информационной системы.

1.2.2 Слои информационной системы.

1.3 Ресурсы информационной системы.

1.3.1 Определение информационных ресурсов.

1.3.2 Метаданные.

1.4 Обзор информационных систем по молекулярной спектроскопии.

1.4.1 Информационные ресурсы в предметной области молекулярной спектроскопии.

1.5 Выводы по главе.

Глава 2. Информационная модель предметной области с процедурными знаниями.

2.1 Информационная модель предметной области с процедурными знаниями в виде цепей её прямых и обратных задач.

2.2 Информационная модель молекулярной спектроскопии.

2.2.1 Прямые задачи.'.

2.2.2 Обратные задачи.

2.3 Модель данных молекулярной спектроскопии. XML-схемы результатов решений прямых и обратных задач молекулярной спектроскопии.

2.3.1 Прямая задача определения физических характеристик изолированной молекулы.

2.3.2 Прямая задача определения параметров спектральной линии изолированной молекулы.

2.3.3 Прямая задача определения параметров контура спектральной линии.

2.3.4 Обратная задача приписывания квантовых чисел спектральным линиям.

2.3.5 Обратная задача определения коэффициентов Эйнштейна.

2.3.6 Обратная задача определения уровней энергии изолированной молекулы.

2.4 Выводы по главе.

Глава 3. База знаний по спектроскопии молекул воды.

3.1 Прикладная онтология спектроскопии молекулы воды.

3.2 Свойства и классы прикладной онтологии спектроскопии воды.

3.2.1 Классы.

3.2.2 Свойства.

3.3 Индивиды в прикладной онтологии по молекулярной спектроскопии воды.

3.3.1 Представление источника информации в форме индивида прикладной онтологии для задач по определению, уровней энергии.

3.3.2 Представление источника информации в форме индивида прикладной онтологии задач по определению переходов.

3.3.3 Представление источника информации в форме индивида прикладной онтологии задач определения параметров контура спектральных линий.

3.3.4 Представление информации о среднеквадратических отклонениях в форме индивида прикладной онтологии.

3.4 Применение прикладной онтологии по молекулярной спектроскопии воды.

3.4.1 Канонические источники информации и проблема достоверности

3.4.2 Организация поиска источников информации по запросам пользователя.

3.4.3 Размещение прикладной онтологии в сети Интернет.

3.5 Схемы метаданных прямых и обратных задач молекулярной спектроскопии.

3.5.1 Представление метаданных результатов решений задач по определению уровней энергии.

3.5.2 Представление метаданных результатов решений задач по определению переходов.

3.5.3 Представление метаданных результатов решений задач по определению параметров контура спектральных линий.

3.6 Выводы по главе.

Глава 4. Программное обеспечение "Мета+" для организации базы знаний.

4.1 Архитектура программного обеспечения "Мета+".

4.2 Алгоритмы организации базы знаний предметной области.

4.2.1 Алгоритм фиксации схем метаданных.

4.2.2 Алгоритм создания метаданных для решений задач.

4.2.3 Алгоритм формирования индивидов (АВох) прикладной онтологии

4.3 Проектирование программного обеспечения "Мета+".

4.3.1 Функциональность для разработчика.

4.3.2 Функциональность для пользователя.

4.4 Реализация программного обеспечения "Мета+".

4.5 Характеристики программного обеспечения "Мета+".

4.6 Выводы по главе.

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Организация онтологических баз знаний и программное обеспечение для описания информационных ресурсов в молекулярной спектроскопии»

Молекулярная спектроскопия является одним из широко используемых во многих прикладных исследованиях разделов физики. Предметом изучения молекулярной спектроскопии являются спектральные свойства молекул. Детальное изучение спектральных свойств молекул не закончено до сих пор. Связано это с тем обстоятельством, что в расчетах физических характеристик атмосферы используются сотни тысяч линий, каждая из которых описывается десятком параметров. Работа с такими массивами данных требует, с одной стороны, предметной систематизации данных, а с другой стороны, программных средств для их обработки. Систематизация спектральных данных проведена теоретиками несколько десятков лет назад.

Классификацией, сбором, хранением и распространением информационных ресурсов по молекулярной спектроскопии занимаются несколько групп, среди которых выделяются группы, поддерживающие банки данных HITRAN [36] и GEISA[25]. В России работы по созданию информационных ресурсов- в области молекулярной спектроскопии ведутся в Институте Оптики Атмосферы СО РАН с начала 80-х годов [95].

Стоит отметить, что задача классификации данных в предметной области относится к задачам спектроскопии, и её решение во многом определяет организацию сбора, хранения и распространения данных и знаний - действий, являющихся предметом изучения в информатике.

Процесс наполнения банков данных далек от завершения. За почти сорокалетнюю историю группа, поддерживающая HITRAN, несколько раз модифицировала как набор физических сущностей, так и формат документов и файлов, в котором хранятся данные. Современная техника измерения спектров позволяет получать данные с большей точностью и в тех диапазонах длин волн, в которых ранее измерения не проводились. Количество расчетных спектров растет еще более стремительно, например, за последние десять лет данные по молекуле воды выросли более чем в сто раз. Растет также число исследовательских групп. Все это указывает на необходимость сбора, хранения, обработки и распространения информации с использованием современных информационных технологий для коллективной работы с информацией, на базе информационных систем.

Качественный скачок в создании информационных систем (ИС) произошел с появлением персональных компьютеров в начале 90-х, когда появились системы, работающие на клиентском месте. Дальнейшее техническое развитие привело к появлению глобальной информационной системы Web [1]. Web-технологии позволили сделать значительный шаг в развитии информационно-вычислительных систем (ИВС) коллективного использования по молекулярной спектроскопии. В 1999 году появилась первая Web-информационная система «Спектроскопия атмосферных газов» (http://spectra.iao.ru) [90], опирающаяся на известные банки спектроскопических данных HITRAN и GEISA. В последние годы произошло переосмысление принципов создания ИВС, как в целом в информатике [15], так и, в частности, в молекулярной спектроскопии [122]. Это связано с инициативой World Wide Web Consortium (W3C) по преобразованию Web в Semantic Web [5], где декларируется представление информации, используемой компьютерами, для автоматизации, интеграции и повторной используемости приложениями [84]. В рамках этой инициативы ведутся активные работы по созданию инфраструктуры Semantic Web, создаются рекомендации [64, 68, 87], программное обеспечение, онтологические базы знаний. Использование этих рекомендаций является элементом технологий, актуальным для представления знаний в Интернете.

Активные исследования по представлению знаний в виде онтологии начались в начале 1990-х и продолжаются до сих пор. Среди большого количества работ можно выделить M.R. Genesereth [27], T.R. Gruber [32], N. Guarino [34], R. Mizogushi [48], J.F. Sowa [70], R. Studer [74]. Актуальные исследования онтологий в рамках Semantic Web [37, 46, 51, 52, 53, 68] представлены в работах I.A. Horrocks, D.L. McGuinness, P.F. Patel-Schneider.

Среди отечественных публикаций существует разнообразие подходов к представлению знаний в виде онтологий, и исследования в данной области активно ведутся [89, 97, 100, 101, 102, 116, 123, 124] И.Л. Артемьевой, Е.М. Бенеаминовым, В.И. Воробьевым, Б.В. Добровым, Т.А. Гавриловой, Н.Г. Загоруйко, Ю.А. Загорулько, JI.A. Калиниченко, А.С. Клещевым, Н.В. Лукашевич, Д.Е. Пальчуновым, А.Ф. Тузовским, В.Ф. Хорошевским. Большое количество публикаций в данной области указывает на решение разнообразных задач с помощью баз знаний, основанных на онтологиях (онтологических баз знаний).

Создание рекомендаций RDF и OWL в W3C заставило переосмыслить роль метаданных в информационных системах. Создатели рекомендаций построили базис для формирования инструментов и сервисов для разработчиков информационных систем с целью "проектирования и реализации высококачественных, значимых, корректных, минимально избыточных и хорошо аксиоматизированных онтологий" [55]. На базе этих онтологий должна быть решена следующая ключевая задача - создание машинно-обрабатываемых аннотаций для информационных ресурсов в Web.

При современном подходе к построению модели научной информационно-вычислительной системы (НИВС) используют её трёхслойную модель [15]. В число слоев входит:

- слой данных и вычислений;

- слой метаданных (информации);

- слой знаний.

Так, слой данных и вычислений ориентирован на непосредственное решение предметных задач, информационный слой ориентирован на описание данных предыдущего слоя и возможности обмена этой информацией между программами. Это означает, что такая информация должна быть формализована и машинно-обрабатываема. Эта задача в рамках подхода Semantic Web решается с помощью языков разметки XML [87] и RDF [65]. Слой знаний необходим для машинной интеграции и структурирования разнородных ресурсов из различных предметных областей с возможностью унифицированного доступа к ним в рамках информационной системы и последующей их логической машинной обработкой. Данный слой создается на основе онтологий, для описания которых W3C рекомендовало язык спецификации OWL [52].

Онтология задач, разработанная Лабораторией Прикладных Онтологий [45] и реализованная в KIF и OWL Full, является онтологией верхнего уровня, которую можно использовать при решении задач коллективного машинного использования знаний в рамках парадигмы Semantic Web. Стоит отметить работы [88, 89], которые представляют прикладные онтологии решения задач. В настоящее время развитый в них поход лежит вне рамок развития Semantic Web.

Ссылочная онтология по молекулярной спектроскопии воды представляет собой «domain-lightweight-reference» онтологию, то есть предметную ссылочную онтологию, которая основной акцент делает на составление предметной описательной картины, не изменяющейся во времени и являющейся основой для других онтологий. Тогда как онтология задач молекулярной спектроскопии воды представляет собой «domain-lightweight-application» онтологию, то есть предметную онтологию приложения, которая основной акцент делает на индивиды, динамически формирующиеся во время описания решаемых задач в информационной системе с определенными входными предметными данными. Первая упрощенная версия ссылочной онтологии по молекулярной спектроскопии воды была опубликована в [122].

Прикладные онтологии, связанные с приложениями, относящимися к нашей информационной системе, формализованы таким образом, чтобы с ними можно было работать в реальном масштабе времени (например, машинное отнесение фактов к классам осуществляется за небольшой промежуток времени). Они созданы, в частности, для решения задачи поиска источников данных, характеризующих решения конкретных задач молекулярной спектроскопии воды. По выделенной цели и выразительности такие онтологии, согласно классификации, называют прикладными онтологиями [49].

Такой подход тесно связан с трактовкой информационного ресурса в виде связанных между собой данных и метаданных. С появлением НИВС по молекулярной спектроскопии стала явной необходимость создания информационных ресурсов в виде структур, содержащих не только параметры спектральных линий, но и ряд других физических величин. Более того, потребовалось расширение набора метаданных, используемого в банках данных (например, HITRAN и GEISA). Стало очевидным, что для коллективной работы в ИБС необходимо предоставить пользователю возможность самостоятельного формирования структуры массивов спектральных данных и их наполнение конкретными значениями, проведения на их основе расчетов и сравнения с результатами экспериментов. Работа в этом направлении состояла, в первую очередь, в создании системы ввода данных произвольной структуры.

Наряду с работами, в которых информационные ресурсы представляются в виде связанных между собой данных и метаданных, в настоящее время ведутся активные работы по разработке и внедрению информационных систем, основанных на знаниях [101, 116, 124]. Существующие информационно-вычислительные системы по молекулярной спектроскопии [47, 90] содержат в себе только слой данных и вычислений. Качественно новый скачок в работе с информационными ресурсами в ИС предоставляет реализация информационного слоя и слоя знаний. Учёт этих слоев повышает эффективность и качество обработки спектральной информации. Отсутствие этих двух слоев, необходимых для перехода к автоматической машинной обработке информации и знаний, указывает на ограниченность развития существующих информационно-вычислительных систем.

Таким образом, задача создания слоя знаний для НИВС по молекулярной спектроскопии является актуальной. Решение задач в молекулярной спектроскопии логическими программными агентами позволит повысить эффективность работы ученых в своих специализированных предметных областях. Имеющиеся инструментальные средства для работы со знаниями, представленными в виде онтологий, позволяют уже сейчас проверять корректность отнесения понятий и делать логические выводы с помощью машин вывода.

Для предметной области молекулярной спектроскопии введение в модель ИС слоя метаданных и слоя знаний даёт возможность учёным проводить анализ решений задач и проверять согласованность своих неявных знаний с другими научными публикуемыми знаниями. Кроме этого, ученые, анализируя получаемое знание о результатах решения предметных задач, могут своевременно реагировать на важные сведения, например, о некорректных данных.

В рамках диссертационной работы рассматривается ИС, позволяющая собирать, хранить, распространять и представлять информацию и знания о трёхатомных молекулах типа ассиметрического волчка, относящихся к группам симметрии Сгу и Cs. К молекулам, которые может описывать созданная ИС, относятся: Н20, SCb, 03, H2S, НОС1, НОВг и их изотопомеры. Так как основное заполнение АВох в НИВС сделано для спектральных параметров молекулы воды, то для простоты именования спектроскопии молекул этих групп симметрии в нашей работе используется понятие спектроскопия молекул воды.

В работе анализируется состояние информационных систем в предметной области спектроскопии молекул и предлагается переход к трехслойной модели информационной системы, где важным является использование семантического описания ресурсов, используя онтологический подход, рекомендованный инициативой W3C по Semantic Web, для формирования слоя метаданных и слоя знаний.

В настоящее время в молекулярной спектроскопии в рамках НИВС отсутствуют машинно-обрабатываемые базы знаний.

На основе всего вышеперечисленного можно сделать вывод о том, что исследование подхода к организации онтологической базы знаний по молекулярной спектроскопии имеет научную и практическую актуальность.

Цель диссертационной работы: разработка и исследование подхода к построению в рамках научной информационно-вычислительной системы онтологических баз знаний для описания разнородных данных молекулярной спектроскопии, извлечённых из научных публикаций и проверяемых на достоверность.

Для достижения цели диссертационной работы решаются следующие задачи:

1. Создание информационных моделей для представления данных и знаний в области молекулярной спектроскопии.

2. Разработка структур данных для информации, извлеченной из научных публикаций по спектроскопии молекул, допускающих автоматическую проверку целостности данных и необходимых для обмена между интеллектуальными агентами.

3. Создание терминологической компоненты (ТВох) онтологической базы знаний для представления знаний в области молекулярной спектроскопии.

4. Разработка алгоритма формирования онтологического описания опубликованных данных с целью построения набора фактов в базе знаний по молекулярной спектроскопии, содержащих знания о их первоисточниках и достоверности.

5. Реализация программного обеспечения, созданного на основе разработанного алгоритма онтологического описания информационных ресурсов и практического использования этого описания в НИВС по спектроскопии молекул воды.

6. Реализация фактографической компоненты (АВох) онтологической базы знаний по описанию опубликованных данных спектроскопии молекул воды.

Объектом исследования являются структуры данных и модели представления знаний в информационных системах по молекулярной спектроскопии.

Предметом исследования являются подходы и алгоритмы создания баз знаний и систем управления ими в научных информационно-вычислительных системах по молекулярной спектроскопии.

Методы исследования. В ходе диссертационного исследования были использованы методы онтологического моделирования, теории множеств, дескриптивной логики, объектно-ориентированного проектирования и программирования.

Научная новизна диссертационной работы заключается в следующем:

1. Впервые построена семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением информационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач, позволившая решить задачу автоматической систематизации знаний о достоверности этих решений.

2. Впервые создан алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах, являющийся необходимым для машинной актуализации знаний о достоверности решений задач и применимый для всех спектральных молекул.

3. Впервые создана онтологическая база знаний спектроскопии молекул воды, в которой фактологическая компонента (АВох) содержит наиболее полную информацию о значениях параметров спектральных линий молекул воды, опубликованную в мире.

Теоретическая значимость исследования состоит в разработке онтологии спектроскопии молекул как основы для построения и проверки научных гипотез, разнообразных систематизаций знаний, интеграции', знаний ' различных предметных областей, что открывает перспективы для постановки и решения новых предметных задач, как в молекулярной спектроскопии, так и смежных с ней областях науки, таких как астрономия, атмосферная радиация, оптика атмосферы.

Практическая ценность диссертационной работы заключается:

1. В создании наиболее полной прикладной онтологии по опубликованным данным спектроскопии молекул воды.

2. В возможности использования открытых результатов семантического описания решений задач, оформленных по стандарту OWL DL, во внешних специализированных системах по работе с онтологиями, использующих машины вывода.

3. В разработке программного обеспечения в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, на основе предложенного алгоритма онтологического описания информационных ресурсов и применении этого программного обеспечения рядом ведущих исследовательских групп спектроскопистов в России (Санкт-Петербургский государственный университет, Институт прикладной физики РАН, Институт оптики атмосферы РАН).

Основные защищаемые положения:

1. Семантическая модель в виде терминологической компоненты (ТВох) базы знаний, являющаяся объединением информационных моделей объектов молекулярной спектроскопии, представляющая собой решения двух цепей прямых и обратных задач спектроскопии и свойств решений этих задач.

2. Алгоритм для автоматизации построения фактологической компоненты (АВох) базы знаний о решениях задач молекулярной спектроскопии и их свойствах.

3. Программное обеспечение в рамках научной информационно-вычислительной системы, имеющей трёхслойную архитектуру, созданное на основе разработанного алгоритма онтологического описания информационных ресурсов и полученная с его использованием онтологическая база знаний спектроскопии молекул воды.

Апробация диссертационной работы. Все результаты работы докладывались и обсуждались на следующих научных конференциях:

- IX Рабочем совещании по электронным публикациям с участием иностранных ученых "El-Pub2004" - Академгородок, Новосибирск, 23-25 сентября 2004;

- V Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям с участием иностранных ученых — Академгородок, Новосибирск, 1-3 ноября 2004;

- Международной конференции по вычислительно-информационным технологиям для наук об окружающей среде «Cites-2005» — Академгородок, Новосибирск, 13-23 марта 2005;

- X Байкальской Всероссийской конференции "Информационные и математические технологии в науке, технике и образовании" — Северобайкальск, 12-19 июля 2005;

- 7-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005) -Ярославль, 4-6 октября 2005;

- International conference on environment observations, modeling and informational systems (ENVIROMIS-2006) - Tomsk, 1-8 June 2006;

- XVth Symposium on High Resolution Molecular Spectroscopy "HighRus-2006" -Nizhny Novgorod, 18-21 July 2006;

- Рабочем семинаре «Проблемы и решения задач в области наук о Земле в распределенной ИНТЕРНЕТ среде» - Москва, 13-15 февраля 2007;

- European Geosciences Union General Assembly 2007 - Vienna, 15-20 April

2007;

- International conference on Computational Information Technologies for Environmental Sciences «Cites-2007» - Томск, 14-25 июля 2007;

- Всероссийской конференции с международным участием «Знания -Онтологии - Теория» — Новосибирск, 14-16 сентября 2007;

- 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2007) -Переславль-Залесский, 15-18 октября 2007;

Всероссийской Научно-Практической конференции «Свободное программное обеспечение: разработка и внедрение» - Томск, 17-18 мая 2008;

- XIII Байкальской Всероссийской конференции "Информационные и математические технологии в науке, технике и образовании" - Иркутск, 7-16 июля 2008;

- International conference on environment observations, modeling and informational systems (ENVIROMIS-2008) - Tomsk, 28-5 July 2008;

- Всероссийской конференции с международным участием «Знания -Онтологии - Теория» - Новосибирск, 20-22 октября 2009;

По теме диссертационной работы опубликовано 17 научных работ:

- из них шестнадцать печатных [8, 9, 24, 93, 105, 106, 107, 109, 110, 112, 113, 117, 118, 119, 120, 121] и одна в электронном журнале [104];

- из них четырнадцать работ на русском языке [93, 104, 105, 106, 107, 109, 110, 112, 113, 117, 118, 119, 120, 121] и три на английском [8, 9, 24];

- из них две в журналах из перечня ВАК по управлению, вычислительной технике и информатике [93, 109], две в журналах из перечня ВАК по физике [107, 112], две в журналах [104, 110], одиннадцать в трудах и материалах конференций [8, 9, 24, 105, 106, 113, 117, 118, 119, 120, 121].

Внедрение результатов диссертационной работы, было осуществлено в трех основных исследовательских группах спектроскопистов в России:

- Институт оптики атмосферы СО РАН, где результаты доступны активно используется в рамках НИВС (http://saga.iao.ru);

- Институт прикладной физики РАН, где результаты доступны в рамках НИВС по адресу http://saga.atmos.appl.sci-nnov.ru;

- Санкт-Петербургский государственный университет, где результаты доступны в рамках НИВС по адресу http://saga.molsp.phys.spbu.ru.

Работа выполнена при поддержке грантов: Российского Фонда Фундаментальных Исследований (РФФИ) «Распределенная информационная система «Молекулярная спектроскопия»« (05-07-90196, А.Д. Быков, 2005-2007); РФФИ «Интернет доступная информационная система по молекулярной спектроскопии, основанная на знаниях» (08-07-00318-а, А.З. Фазлиев, 20082010); UIPAC task 2004-035-1-100 «А database of water transitions from experiment and theory».

Личный вклад автора.

Опубликованные работы написаны в соавторстве с экспертами предметной области спектроскопии молекулы воды и сотрудниками центра интегрированных информационных систем ИОА СО РАН. В совместных работах диссертант принимал участие в непосредственной разработке схем XML-данных, метаданных и их дальнейшем внедрении в модель НИВС, в разработке прикладной онтологии задач по спектроскопии молекул воды, во внедрении результатов работы. В разработке перечисленного программного обеспечения ему принадлежит определяющая роль.

Благодарности.

Автор выражает благодарность профессорам А.А. Мицелю и А.Ф. Тузовскому за внимание к работе, ценные замечания и помощь, способствующие окончательному варианту рукописи. Автор признателен с.н.с. А.З. Фазлиеву за ценные консультации, постановки задач и всестороннюю поддержку данной работы.

Автор благодарен чл.-корр. РАН |С.Д. Творогову а также благодарит д.ф.м. н. А.Д. Быкова и к.ф.-м.н. Б.А. Воронина за консультации и помощь при определении структуры данных в молекулярной спектроскопии воды; Н.А. Лаврентьева за реализацию программ для расчета коэффициентов поглощения газов; А.Ю. Ахлёстина за реализацию ядра НИВС; А.В. Козодоева за реализацию системы ввода данных; д.ф.-м.н. О.Б. Родимову за помощь в составлении типовых вопросов для задачи нахождения уровней энергии.

Структура и объём диссертационной работы. Диссертация состоит из перечня условных обозначений, введения, четырёх глав, заключения, списка использованных источников и шести приложений. Общий объем работы составляет 239 страниц. Список использованных источников насчитывает 128 наименований. Работа содержит 42 рисунка и 25 таблиц.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Привезенцев, Алексей Иванович

4.6 Выводы по главе

1. Архитектура программного обеспечения "Мета+" имеет программное ядро, являющееся самостоятельным программным решением.

2. Программное обеспечение «Мета+» было интегрировано в НИВС «W@DIS» для организации в ней дайджеста метаданных и онтологической базы знаний.

3. Предложены алгоритмы для подготовки и формирования онтологических описаний в НИВС по молекулярной спектроскопии. Алгоритм фиксации схем метаданных предлагает подход к подбору схем метаданных для наиболее полного описания информационных ресурсов, расширяя понятие «метаданные» до понятия «аннотация». Алгоритм создания метаданных описывает поход к составлению метаданных для решений задач, используя анализ входных и выходных данных задач и способов их описания. Алгоритм формирования индивидов онтологии предназначен для преобразования информации в семантические метаданные, основанные на прикладной онтологии решений задачи.

4. Реализация программного обеспечения произведена с использованием современных подходов к созданию Web-ориентированных приложений, используя существующие прикладные интерфейсы (pOWL, RAP, jQuery).

5. Программное обеспечение «Мета+» позволяет:

- производить машинное вычисление значений метаданных источника информации о решении задачи;

- создавать индивиды, характеризующие источники информации, являющимися экземплярами расширения OWL-класса;

- использовать индивиды OWL-класса «источник информации» при работе пользователя (человек) с решениями предметных задач посредством просмотра, попарного сравнения физических величин (отклонение, среднеквадратичное отклонение) и атрибутного и семантического поиска;

- переводить внутреннее представление модели онтологии в XML-синтаксис для практической работы с ней редакторов онтологий и машин вывода.

ЗАКЛЮЧЕНИЕ

Диссертационная работа посвящена решению научно-технической задачи разработки структур данных, алгоритмов и программного обеспечения для онтологического описания ресурсов в НИВС по молекулярной спектроскопии воды. Разработанное программное обеспечение "Мета+", реализующее алгоритмы формирования онтологического описания, является современным и актуальным решением задачи создания трех уровней НИВС: уровня данных и вычислений, уровня метаданных и уровня знаний.

В работе определены подходы к научной информационно-вычислительной системе, учитывая актуальные задачи логической машинной обработки в сети Internet. Исследовано использование онтологий в информационных системах. Разработаны схемы данных решений задач для молекул симметрии СгУ и Cs с целью их автоматической проверки и обмена в распределенной НИВС.

Использование систематизированной цепи прямых и обратных задач в предметной области «W@DIS» позволяет разработать онтологию задач в этой предметной области. Результаты решения задач в молекулярной спектроскопии связываются с информационным источником, позволяя проводить анализ результатов. Кроме того, онтология задач предметной области «W@DIS», осуществляет интеграцию разнородных информационных ресурсов и позволяет осуществлять семантический поиск по ним.

Подходы к формированию онтологического уровня (ТВох) и уровня экземпляров (АЬох) в онтологии по молекулярной спектроскопии отличаются. Терминологический уровень (ТВох) формируется экспертным советом во время разработки онтологии, а уровень экземпляров (АЬох) создается во время работы НИВС. Это позволяет формировать постоянно пополняемые профессиональные знания в предметной области.

Предложены алгоритмы для подготовки и формирования онтологических описаний в НИВС по молекулярной спектроскопии воды. Разработанное программное обеспечение на основе этих алгоритмов позволяет: производить автоматическое аннотирование метаданными решения вычислительных задач и решений задач, загружаемых в НИВС, использовать индивиды OWL-класса решения задач для идентификации данных в информационных задачах: визуализации, манипуляции, сравнения и поиска.

Результаты диссертационной работы внедрены в основных спектроскопических группах России, находящихся в Институте Оптики Атмосферы СО РАН, в Институте прикладной физики РАН и в Санкт-Петербургском Государственном Университете. Планируется внедрить результаты работы на международном уровне в основных спектроскопических группах Европы.

Планируется дальнейшее развитие представляемой работы по следующим основным направлениям: создание онтологических моделей для смежных областей, использующих решения задач молекулярной спектроскопии;

- создание Web-сервисов и OWL-S онтологий для них;

- создание "интеллектуальных " агентов, выстраивающих потоки работ в решении комплексных задач, допускающих автоматизацию алгоритма их решения.

Список литературы диссертационного исследования кандидат технических наук Привезенцев, Алексей Иванович, 2009 год

1. Alesso, Н. P. Thinking on the Web: Berners-Lee, Godel, and Turing / H. P. Alesso, C. F. Smith. Hoboken: John Wiley & Sons, 2006. - 261 pp.

2. Antoniou, G. A Semantic Web Primer / G. Antoniou, F. van Harmelen. -Cambridge: MIT Press, 2004. 238 pp.

3. Baader, F. Description Logics / F. Baader, I. Horroks, U. Satter // Handbook of knowledge representation / edited by F. van Harmelen, V. Lifschitz, B. Porter. Oxford: Elsevier Science, 2008. - pp. 135-180.

4. Barber, R. J. A high accuracy computed water line list BT2 / R.J. Barber, J. Tennyson, G.J. Harris, R.N. Tolchenov // Mon. Not. R. Astron. Soc. - 2006. - Vol. 368.-pp. 1087-1094.

5. Berners-Lee, T. The Semantic Web / T. Berners-Lee, J. Hendler, O. Lassila// Scientific American. -2001. 284. pp. 34-43.

6. Borst, W. N. Construction of engineering ontologies for knowledge sharing and reuse : CTIT Ph.D. Thesis Series No. 97-14, Universiteit Twente / W. N. Borst Enschede, 1997. - 243 pp.

7. Brachman, R. J. An Overview of the KL-ONE Knowledge Representation System / R. J. Brachman, J. Schmolze // Cognitive Science. 1985. - Vol. 9. - № 2. -pp. 171-216.

8. Bykov, A. D. Distributed information system on molecular spectroscopy / A. D. Bykov, A. Z. Fazliev, A. V. Kozodoev, A. I. Privezentsev, L. N. Sinitsa, M. V.

9. Tonkov, N. N. Filippov, M. Yu. Tretyakov // Proc. of SPIE, 15th Symposium on High-Resolution Molecular Spectroscopy -Vol. 6580. pp. 65800W. - 2006. - 12 pp.

10. Chandrasekaran, В. What are ontologies, and why do we need them? / B. Chandrasekaran, J. R. Josephson, V. R. Benjamins // IEEE Intelligent Systems. -1999.-Vol. 14. -№ l.-pp. 20-26.

11. Cycorp, Inc. Home Page Электрон, текстовые дан. - 2007. - Режим доступа: http://www.cyc.com/.

12. Daconta, М. С. The Semantic Web: A Guide to the Future of XML, Web Services, and Knowledge Management / M. C. Daconta, L. J. Obrst, К. T. Smith. -Indianapolis: Wiley, 2003. 281 pp.

13. Davies, J. Semantic Web Technologies Trends and Research in Ontology-based Systems / J. Davies, R. Studer, P. Warren. Chichester: John Wiley & Sons, 2006.-312 pp.

14. Description Logic Complexity Navigator Электронный ресурс. / edited by E. Zolin. Электрон, текстовые дан. — 2007. — Режим доступа: http://www.cs.man.ac.uk/~ezolin/dl/. - The University of Manchester.

15. Description Logic Reasoners Overview Электронный ресурс. / edited by U. Sattler. Электрон, текстовые дан. - 2007. - Режим доступа: http://www.cs.man.ac.uk/~sattler/reasoners.html. - The University of Manchester.

16. Descriptive Ontology for Linguistic and Cognitive Engineering (DOLCE) Электронный ресурс. / Laboratory for Applied Ontology. Электрон, текстовые дан. - 2007. - Режим доступа: http://www.loa-cm-.it/DOLCE.html.

17. Devedzic, V. Semantic Web and education / V. Devedzic. New York: Springer, 2006. - 353 pp.

18. DL Implementation Group (DIG) Home Page Электронный ресурс. / University of Manchester. Электрон, текстовые дан. - 2007. - Режим доступа: http://dl.ki-.org/dig/.

19. Dublin Core Metadata Initiative (DCMT) Home Page Электронный ресурс. / Dublin Core Metadata Initiative. Электрон, текстовые дан. — 1995 - . -Режим доступа: http://www.dublincore.org/.

20. FaCT++ Home Page Электронный ресурс. / University of Manchester. -Электрон. текстовые дан. 2007. - Режим доступа: http://owl.man.ac.uk/factplusplus/.

21. Genesereth, M. R. Logical Foundation of Artificial Intelligence / M. R. Genesereth, N. J. Nilsson. San Francisco: Morgan Kaufmann, 1987. - 405 pp.

22. Gomez-Perez, A. Ontological engineering with examples from the areas of knowledge management, e-Commerce and the Semantic Web / A. Gomez-Perez, M. Fernandez-Lopez, O. Corcho. London: Springer-Verlag, 2004. - 403 pp.

23. Goodman, D. JavaScript Bible / D. Goodman, M. Morrison. -Indianapolis: Wiley, 2004. 1236 pp.

24. Gregor, Sh. The struggle towards an understanding of theory in information systems / Sh. Gregor // Information systems foundations: constructing and criticising / edited by D. Hart, Sh. Gregor. Canberra: ANU E Press, 2005. - pp. 311.

25. Gruber, T. R. A Translation Approach to Portable Ontology Specifications / T. R. Gruber // Knowledge Acquisition. 1993. - Vol. 5. - № 2. - pp. 199-220.

26. Gruber, T. R. Toward Principles for the Design of Ontologies Used for Knowledge Sharing / T. R. Gruber // Human-Computer Studies. 1993. - № 43. - pp. 907-928.

27. Guarino, N. Formal Ontology in Information Systems / N. Guarino // Proceedings of Conference on Formal Ontology in Information Systems (FOIS'98) — Trento, 6-8 June 1998. Amsterdam: IOS Press, 1998. - pp. 3-15.

28. Guarino, N. Ontologies and Knowledge Bases: Towards a Terminological Clarification / N. Guarino, P. Giaretta // Towards Very Large Knowledge Bases: Knowledge Building and Knowledge Sharing / edited by N. Mars. Amsterdam: IOS Press, 1995.-pp. 25-32.

29. Harold, E. R. XML 1.1 Bible / E. R. Harold. Indianapolis: Wiley, 2004. - 1022 pp.

30. HITRAN Home Page Электронный ресурс. / Harvard-Smithsonian Center for Astrophysics. Электрон, текстовые дан. - 2007. - Режим доступа: http://cfa-www.harvard.edu/hitran/.

31. Information systems: the state of the field / edited by J. L. King, K. Lyytinen. Chichester: John Wiley & Sons, 2006. - 362 pp.

32. Lenat, D. В. Building Large Knowledge-based Systems: Representation and Inference in the Cyc Project / D. B. Lenat, R. V. Guha. Boston: Addison-Wesley, 1989.-372 pp.

33. Leuf, B. The Semantic Web: crafting infrastructure for agency / B. Leuf. — Chichester: John Wiley & Sons, 2006. 358 pp.

34. Luke, S. Web Agents that Work / S. Luke, J. Hendler // IEEE MultiMedia. 1997. - Vol. 4. - № 3. - pp. 76-80.

35. MacGregor, R. Inside the LOOM clasifier / R. MacGregor // ACM SIGART Bulletin. 1991. - Vol. 2. - № 3. - pp. 88-92.

36. McGuinness, D. L. Ontologies come of age / D. L. McGuinness // Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential / edited by D. Fensel, J. Hendler, H. Liebemian, W. Wahlster. Boston: MIT Press, 2002.-pp. 171-194.

37. Mikhailenko, S. M. The DataBank of Ozone Spectroscopy on WEB (S&MPO) / S. M. Mikhailenko, B. L. Babikov, V. G. Tyuterev, A. Barbe // Computational Technologies. 2002. - Vol. 7. - pp. 64-70.

38. Oberle, D. Semantic management of middleware / D. Oberle. Berlin: Springer, 2006. - 268 pp.

39. Ontologies for software engineering and software technology / edited by C. Calero, F. Ruiz, M. Piattini. Berlin: Springer-Verlag, 2006. - 339 pp.

40. OWL 1.1. Web Ontology Language Overview Электронный ресурс. / edited by P. F. Patel-Schneider, I. Horrocks. — Электрон, текстовые дан. — 2006. -Режим доступа: http://www.w3.org/Submission/owlll-overview/. W3C Recommendation.

41. OWL Web Ontology Language Overview Электронный ресурс. / edited by D. L. McGuinness, F. van Harmelen. Электрон, текстовые дан. - 2004. -Режим доступа: http://www.w3.org/TR/owl-features/. - W3C Recommendation.

42. OWL Web Ontology Language Semantics and Abstract Syntax Электронный ресурс. / edited by P. F. Patel-Schneider, I. Horrocks. Электрон, текстовые дан. - 2004. - Режим доступа: http:/Avww.w3.org/TR/owl-semantics/. -W3C Recommendation.

43. Partridge, H. The determination of an accurate isotope dependent potential energy surface for water from extensive ab initio calculations / H. Partridge, D. W. Schwenke // Journal of Chemical Physics. 1997. - Vol. 106. - №. 11. pp. 46184639.

44. Passin, Т. B. Explorer's Guide to the Semantic Web / Т. B. Passin. -Greenwich: Manning, 2004. 281 pp.

45. Pellet: The Open Source OWL DL Reasoner Home Page Электронный ресурс. / Clark & Parsia. Электрон, текстовые дан. - 2006-2007. - Режим доступа: http://pellet.owldl.com/.

46. Polyansky, О. L. A High-Accuracy ab Initio Rotation-Vibration Transitions for Water / O. L. Polyansky, A. G. Csaszar, S. V. Shirin, N. F. Zobov, P. В arietta, J. Tennyson, D. W. Schwenke, P. J. Knowles // Science. 2003. - Vol. 299. -№5606.-pp. 539-542.

47. Pn^ge Ontology Editor and Knowledge Acquisition System Home Page Электронный ресурс. / Stanford Medical Informatics. — Электрон, текстовые дан.- 2007. Режим доступа: http://protege.stanford.edu/.

48. Racer Pro Home Page Электронный ресурс. / Racer Systems GmbH & Co. KG. Электрон, текстовые дан. - 2007. — Режим доступа: http.V/www.racer-systems.com/.

49. RAP RDF API for PHP Home Page Электронный ресурс. / Freie Universitat Berlin. — Электрон, текстовые дан. — 2007. — Режим доступа: http://sites.wiwiss.fu-berlin.de/suhl/bizer/rdfapi/.

50. RDF Vocabulary Description Language 1.0: RDF Schema Электронный ресурс. / edited by D. Brickley, R. V. Guha. — Электрон, текстовые дан. 2004. — Режим доступа: http://www.w3.org/TR/rdf-schema/. - W3C Recommendation.

51. Resource Description Framework (RDF) Model and Syntax Specification Электронный ресурс. / edited by O. Lassila, R. R. Swick. — Электрон, текстовые дан. 1999. - Режим доступа: http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/. - W3C Recommendation.

52. Resource Description Framework (RDF): Concepts and Abstract Syntax Электронный ресурс. / edited by G. Klyne, J. Carroll. — Электрон, текстовые дан.- 2004. Режим доступа: http://www.w3.org/TR/rdf-concepts/. - W3C Recommendation.

53. Rodriguez, М. A. Using RDF to Model the Structure and Process of Systems / M.A. Rodriguez, J.H. Watkins, J. Bollen, C.O. Gershenson // International Conference on Complex Systems — Boston, October 2007. LA-UR-07-5720. - 8 pp.

54. Rothman, L. S. The HITRAN 2004 molecular spectroscopic database / Rothman L.S., Jacquemart D., Barbe A., Benner D. Chris, Birk M., Brown L.R.,

55. Semantic Web Activity Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. — 2001 — . — Режим доступа: http ://www. w3. org/2001 / sw/.

56. Semantic Web and Peer-to-Peer: Decentralized Management and Exchange of Knowledge and Information / edited by S. Staab, H. Stuckenschmidt. -Berlin: Springer-Verlag, 2006. 318 pp.

57. Sowa, J. F. Knowledge representation: logical, philosophical and computational foundations / J. F. Sowa. Pacific Grove, CA: Brooks Cole, 2000. -594 pp.

58. SPARQL Query Language for RDF Электронный ресурс. / edited by E. Prud'hommeaux, A. Seaborne. Электрон, текстовые дан. — 2007. — Режим доступа: http://www.w3.org/TR/rdf-sparql-query/. - W3C Candidate Recommendation.

59. Standard Upper Ontology Working Group (SUO WG) Home Page -Электрон, текстовые дан. — 2007. — Режим доступа: http://suo.ieee.org/.

60. Stuckenschmidt, Н. Information Sharing on the Semantic Web / H. Stuckenschmidt, F. van Harmelen. Berlin: Springer, 2005. - 276 pp.

61. Studer, R. Knowledge Engineering: Principles and Methods / R. Studer, R. Benjamins, D. Fensel // Data and Knowledge Engineering. — 1998. — Vol. 25. — №. 1-2.-pp. 161-197.

62. Su, X. Using a Semiotic Framework for a Comparative Study of Ontology Languages and Tools / X. Su, L. Ilebrekke // Information modeling methods andmethodologies / edited by J. Krogstie, T. Halpin, K. Siau. — Hershey: Idea Group, 2005.-pp. 278-299.

63. Suehring, S. MySQL Bible / S. Suehring. New York: Wiley, 2002. - 686pp.

64. Suggested Upper Merged IEEE Systems GmbH & Co. KG. Электрон, текстовые дан. - 2007. — Режим доступа: http://www.ontologyportal.org/.

65. The description logic handbook: theory, implementation, and applications / edited by F. Baader, D. L. McGuinness, D. Nardi, P. F. Patel-Schneider. Cambridge: Cambridge University Press, 2003. - 505 pp.

66. Tennyson, J. IUPAC Critical Evaluation of the Rotational-Vibrational17

67. Transformation of knowledge, information and data: theory and applications / edited by P. van Bommel. — London: Idea Group, 2005. 318 pp.

68. Van Welie, M. An Ontology for Task World Models / M. van Welie, G. C. van der Veer, A. Eliens // 5th International Eurographics Workshop on Design Specification and Verification of Interactive Systems Abingdon, 3-5 june 1998. -14pp.

69. Walton, C. Agency and the Semantic Web / C. Walton. New York: Oxford University Press, 2007. - 249 pp.

70. Web semantics and ontology / edited by D. Taniar, J. W. Rahayu. -London: Idea Group, 2006. 404 pp.

71. World Wide Web Consortium (W3C) Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. - 1994 - . - Режим доступа: http://www.w3.org/.

72. XML Activity Home Page Электронный ресурс. / World Wide Web Consortium. Электрон, текстовые дан. — 1996 — . - Режим доступа: http://www.w3. org/XML/.

73. Артемьева, И. JI. Концепция оболочки для разработки решателей задач на основе моделей онтологий / И. JI. Артемьева, Д. А. Крылов // Искусственный интеллект. — 2005. — № 3. С. 109-116.

74. Артемьева, И. JI. Спецификации задач в терминах онтологии химии и методы их решения / И. JI. Артемьева, Н. В. Рештаненко. Владивосток: ИАПУ ДВО РАН, 2006.-36 с.

75. Бек, К. Экстремальное программирование: разработка через тестирование / К. Бек. — СПб.: Питер, 2003. 224 с.

76. Быков, А. Д. Структурирование ресурсов информационной системы по молекулярной спектроскопии / А. Д. Быков, А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Вычислительные технологии. — 2007. Т. 12. - С. 10-18.

77. Васильев, И. А. Методы и инструментальные средства построения семантических Web-порталов: дис. . канд. техн. наук: 05.13.11: защищена 14.12.2005 / И. А. Васильев Томск, 2005.- 190 с.

78. Войцеховская, О. К. Информационная система по спектроскопии высокого разрешения / О. К. Войцеховская, А. В. Розина, Н. Н. Трифонова. -Новосибирск: Наука, 1988. 150 с.

79. Гаврилова, Т. А. Базы знаний логических систем / Т. А. Гаврилова, В. Ф. Хорошевский. СПб.: Питер, 2000. - 384 с.

80. Гранд, М. Шаблоны проектирования в Java / М. Гранд. М.: Новое знание, 2004. - 559 с.

81. Гутмане, Э. РНР 5. Профессиональное программирование / Э. Гутмане, С. Баккен, Д. Ретанс. СПб.: Символ-Плюс, 2006. — 704 с.

82. ЮО.Добров, Б. В. Онтологии и тезаурусы: модели, инструменты, приложения : учеб. пособие / Б. В. Добров, В. В. Иванов, Н. В. Лукашевич, В. Д. Соловьев. — М.: Интернет-Университет Информационных Технологий; БИНОМ. Лаборатория знаний, 2008. 172 с.

83. Клещёв, А. С. Математические модели онтологий предметных областей. Часть 1. Существующие подходы к определению понятия "онтология" / А. С. Клещёв, И. JI. Артемьева // Научно-техническая информация. 2001. — Серия 2. - № 2. - С. 20-27.

84. ЮЗ.Когаловский, М. Р. Перспективные технологии информационных систем / М. Р. Когаловский. М.: ДМК Пресс; М.: Компания АйТи, 2003. -288 с.

85. Козодоев, А. В. Информационная система для решения задач молекулярной спектроскопии. 3. Уровни энергии молекул / А. В. Козодоев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. — 2007. — Т. 20. — №9.-С. 805-809.

86. Козодоев, А. В. Информационная система для решения задач молекулярной спектроскопии. 2. Операции преобразования наборов параметров спектральных линий / А. В. Козодоев, А. 3. Фазлиев // Оптика атмосферы и океана.-2005.-Т. 18.-№9.-С. 760-764.

87. Конноли, Т. Базы данных: проектирование, реализация и сопровождение. Теория и практика / Т. Конноли, К. Бегг, А. Страчан. — М.: Вильяме, 2000.-1120 с.

88. Лаврентьев, Н. А. Информационная система для решения задач молекулярной спектроскопии. 4. Переходы в молекулах симметрии C2v и Cs / Н. А. Лаврентьев, А. И. Привезенцев, А. 3. Фазлиев // Оптика атмосферы и океана. 2008. - Т. 21. - № 11. - С. 957-962.

89. Пальчунов, Д. Е. Виртуальный каталог / Д. Е. Пальчунов, Е. С. Сидорова // Труды Всероссийской конференции с международным участием «Знания Онтологии - Теория» — Новосибирск, 14-16 сентября 2007. - Т. 1. — Новосибирск: Омега Принт, 2007. — С. 166-175.

90. Труды симпозиума «Онтологическое моделирование Звенигород, 19-20 мая 2008. - Москва: ИЛИ СО РАН; под ред. Калиниченко Л. А. - 2008. -303 с.

91. Тузовский, А. Ф. Онтолого-семантические модели в корпоративных системах управления знаниями: дис. . докт. техн. наук: 05.13.01: защищена 10.10.2007 / А. Ф. Тузовский Томск, 2007. - 376 с.

92. Фаулер, М. UML. Основы / М. Фаулер, К. Скотт. СПб.: Символ-Плюс, 2002.- 192 с.

93. Фаулер, М. Рефакторинг: улучшение существующего кода / М. Фаулер. СПб.: Символ-Плюс, 2003. - 432 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.