Управление гетерогенными данными в корпоративной информационной системе на основе XML-технологий тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Мутин, Денис Игоревич
- Специальность ВАК РФ05.13.01
- Количество страниц 153
Оглавление диссертации кандидат технических наук Мутин, Денис Игоревич
СПИСОК СОКРАЩЕНИЙ.
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ МЕТОДОВ УПРАВЛЕНИЯ ГЕТЕРОГЕННЫМИ ДАННЫМИ В КОРПОРАТИВНЫХ
ИНФОРМАЦИОННЫХ СИСТЕМАХ.
1.1. Уровни обработки информации в корпоративной информационной системе.
1.2. Интеграция гетерогенных данных.
1.2.1. Понятие «интеграция данных».
1.2.1.1. Возникновение понятия.
1.2.1.2. Современные представления.
1.2.2. Методы интеграции данных.
1.2.3. Программные средства для интеграции данных.
1.2.4. Обоснование выбора метода интеграции.
1.2.4.1. Проблема межсистемного информационного взаимодействия.
1.2.4.2. Сфера примененияXML.
1.2.4.3. Достоинства ZML-технологии.
ГЛАВА 2. МОДЕЛИРОВАНИЕ СТРУКТУРЫ КОМПОЗИТНОГО
ДОКУМЕНТООБОРОТА.
2.1. Декомпозиция потоков.
2.2. Синтез модели.
2.2.1. Использование графов в модели документооборота.
2.2.2. Графовая модель.
2.2.3. Типы графа в модели.
2.2.4. Время в модели.
2.2.5. Матричная форма представления.
2.2.6. Операции над моделями.
2.3. Применение матричной модели.
ГЛАВА 3. ТЕХНОЛОГИЯ Лт-БАЗ ДАННЫХ.
3.1. Расширяемый язык разметки (XML).
3.1.1. Назначение языка разметки.
3.1.2. Различие между HTML и XML.
3.2. СтруктураА'МС-документа.
3.2.1. Правила создания XML- документа.
3.2.2. Конструкции языка.
3.2.3. ПросмотрXML- документов.
3.3. Использование XML-баз данных.
3.3.1. Выбор базы данных XML.
3.3.2. Данные и метаданные в XML-ориентированных БД.
3.3.3. Естественная база данных (NXD).
3.3.4. XML-CYEJ\ Sedna.
3.3.4.1. Предпосылки появления и архитектура СУБД Sedna.
3.3.4.2. Система хранения и управление памятью.
3.3.4.3. Исполнение запросов.
ГЛАВА 4. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ СИСТЕМЫ УПРАВЛЕНИЯ ГЕТЕРОГЕННЫМИ ДАННЫМИ В
КОРПОРАТИВНЫХ ИНФОРМАЦИОННЫХ СИСТЕМАХ.
4.1. Медицинская информационная система.
4.1.1. Современные представления о МИС.
4.1.2. Основные функции МИС.
4.2. XML-ориентированные БД применительно к МИС.
4.2.1. Структура МИС.
4.2.2. Проектирование XML-структуры медицинских документов.
4.2.3. Создание базы данных XML-документов.
4.2.4. Логическая модель БД «Регистратура».
4.3. Оценка эффективности разработанных методик.
4.3.1. Оценка способа интеграции гетерогенных данных в ИС в условиях риска на основе функции полезности.
4.3.2. Обоснование экономической эффективности разработанных методик.
4.3.2.1. Определение суммарных затрат на внедрение.
4.3.2.2. Определение показателей экономической эффективности использования разработанной методики.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Разработка моделей и инструментальных средств корпоративного документооборота в многопрофильном лечебном учреждении2010 год, кандидат экономических наук Борисенко, Елена Владимировна
Исследование и разработка автоматизированных информационных распределенных систем управления производственными процессами медицинских комплексов2017 год, кандидат наук Мутин, Денис Игоревич
Повышение эффективности принятия решений в распределенной системе на основе гибридного подхода в анализе данных2008 год, кандидат технических наук Мутина, Елена Игоревна
Алгоритмические и программные средства интеграции данных при создании электронных медицинских карт2011 год, кандидат технических наук Фам Ван Тап
Совершенствование управления информацией о кадровом составе организации путем применения проблемно-ориентированного информационного реестра и аппарата генетических алгоритмов2007 год, кандидат технических наук Мельникова, Анастасия Владимировна
Введение диссертации (часть автореферата) на тему «Управление гетерогенными данными в корпоративной информационной системе на основе XML-технологий»
Актуальность работы. В современном мире меняется как количественное, так и качественное содержание информационных ресурсов, отдельные информационные массивы объединяются, интегрируются между собой. Появилось понятие — «единое информационное пространство», как системообразующая составляющая в принятии решений, обеспечивающая интеграцию как процессов управления по вертикали и горизонтали, так и взаимодействующих компонентов управления. Составными частями данного пространства выступают гетерогенные, т. е.- имеющие разнородную структуру и содержание, информационные потоки.
Несмотря на бурное развитие современных информационных технологий, они не способны обеспечить построение сложных систем, состоящих из большого числа компонентов и имеющих большое количество источников информации, имеющих место в корпоративных информационных системах (КИС). Необходимо, чтобы информация одних потоков дополняла, уточняла, подтверждала информацию из других.
Для реализации взаимодействия между отдельными функциональными подсистемами необходимо обеспечить количество информационных потоков, равное п(п —1)/2, где п - количество функциональных подсистем. Затраты на реализацию возможностей информационного обмена между функциональными подсистемами в этом случае велики и быстро начнут преобладать над затратами по реализации функциональности самих подсистем. В целях снижения количества информационных потоков до количества функциональных подсистем предлагается метод интеграции гетерогенных информационных потоков.
Суть метода заключается в приведении всех информационных потоков к единому универсальному формату представления информации и осуществлении всего информационного обмена путем приведения к нему.
В роли универсального носителя выступает XML-документ (Extensible Markup Language), способный хранить сведения любой, ранее определенной структуры. Программная технология, основанная на XML, позволяет контролировать корректность данных, хранящихся в документах, производить проверки иерархических соотношений внутри документа и устанавливать единый стандарт на структуру документов, содержимым которых могут быть самые различные данные. В качестве инструмента хранения выступает XML-база данных, позволяющая хранить и обрабатывать документы в XML-формате.
Поскольку задача систематизации и управления гетерогенными слабоструктурированными данными является на сегодняшний день актуальной, в диссертационной работе в качестве предметной области исследования рассматривается распределенная медико-техническая система, включающая в свой состав медицинское и лабораторное диагностическое оборудование, выполненное на базе современных ЭВМ различных типов и архитектур.
Объект исследования. Объектом исследования диссертационной работы являются алгоритмы, методы и модели для эффективной работы с гетерогенными данными в КИС.
Цель работы. Повышение эффективности управления гетерогенными данными в КИС за счет их систематизации и интеграции путем применения современных .XML-технологий.
Методы исследований. При решении задач, поставленных в работе, были использованы основные положения системного анализа, теория передачи информации, методы интеграции данных; для разработки моделей и алгоритмов проектирования — теории баз данных, объектно-ориентированного моделирования и проектирования, а для программной реализации - структурного и объектно-ориентированного программирования.
Научная новизна. Научная новизна диссертационной работы заключается в следующих положениях:
1. Определен новый подход к повышению эффективности управления гетерогенными данными в корпоративных информационных системах, заключающийся в использовании XML-баз данных.
2. Разработан метод интеграции гетерогенных данных, обеспечивающий сокращение времени передачи информации и повышение ее достоверности.
3. Определена структура прикладной XML-базы данных, обеспечивающая эффективное хранение и интеграцию XML-документов предметной области.
Практическая ценность работы заключается в повышении эффективности управления гетерогенными данными в КИС за счет улучшения методов обмена и интеграции данных в системе электронного документооборота, а также - сокращения времени их передачи между информационными подсистемами.
Реализация результатов работы. Методики повышения эффективности управления гетерогенными данными в КИС путем применения XML-технологий используются в информационных системах клинико-диагностических и лабораторных отделений консультативного центра клинической больницы (г.Москва). Помимо этого, определена целесообразность использования предложенных методик при создании прикладного программного обеспечения и интеграции распределенных информационных систем в научно-практических разработках малого предприятия ООО «Компьютерные системы и технологии» (г.Москва).
Упомянутые выше методики внедрены в учебный процесс ГОУ ВПО МГТУ «Станкин», используются при подготовке бакалавров по направлению 220200 «Автоматизация и управление» и магистрантов по магистерской программе 220200.68-20 «Человеко-машинные системы управления». Материалы диссертационной работы использованы в качестве методологической основы при разработке курса лекций и практических занятий по дисциплинам «Информатика», «Программирование и основы алгоритмизации» и специальной дисциплине «Интеллектуальные системы обработки информации».
Апробация работы. Основные положения диссертационной работы неоднократно докладывались и обсуждались на расширенных заседаниях кафедры «Биотехническая кибернетика» и научных семинарах в ГОУ ВПО МГТУ «Станкин», а также - международных и всероссийских научно-технических конференциях: VIII Международной конференции «Производство. Технология. Экология. ПРОТЭК'05» (Москва, ГОУ ВПО МГТУ «Станкин», 2005 г.), VIII научной конференции МГТУ «Станкин» и «Учебно-научного центра математического моделирования МГТУ «Станкин» - ИММ РАН» (Москва, ГОУ ВПО МГТУ «Станкин», 2006 г.), V Международной научно-технической конференции «Информационно-вычислительные технологии и их приложения» (Пенза, МНИЦ ПГСХА, 2006 г.), IV Международной научно-технической конференции «Управление в социальных и экономических системах» (Пенза, МНИЦ ПГСХА, 2006 г.).
Публикации. По теме диссертационной работы опубликованы 8 научных работ, включая тезисы докладов, подготовленные для международных и региональных научно-технических конференций; одна публикация - в научном журнале «Мехатроника, автоматизация, управление», входящем в Перечень ВАК Министерства образования и науки РФ.
Структура и объем. Диссертация состоит из списка сокращений, введения, четырех глав, основных результатов и выводов, списка используемой литературы 76-ти наименований и 12-ти приложений, изложена на 153 страницах машинописного текста, включая 38 рисунков и 8 таблиц.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Теория и методы управления транспортными технологическими процессами на основе электронной технической документации железнодорожной автоматики и телемеханики2011 год, доктор технических наук Булавский, Петр Евгеньевич
Развитие методологических основ разработки и внедрения автоматизированных систем управления документами: зарубежный опыт: 1990 - 2011 гг.2012 год, кандидат исторических наук Володин, Дмитрий Владимирович
Разработка моделей и методов взаимодействия интернет-ориентированных систем управления документооборотом со средствами аутентификации2011 год, кандидат технических наук Клименко, Светлана Глебовна
Автоматизация процессов оперативного управления нефтедобычей: На примере ОАО "Роснефть-Сахалинморнефтегаз"1999 год, кандидат технических наук Троянов, Тимофей Александрович
Разработка интегрированной информационной платформы для обеспечения функционирования машиностроительного производства2004 год, доктор технических наук Стамировски, Ежи Тадеушович
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Мутин, Денис Игоревич
Общие выводы
На основании проведенных в работе исследований получены следующие результаты:
1. Решена актуальная задача, заключающаяся в повышении эффективности управления гетерогенными данными в КИС за счет их систематизации и интеграции путем применения современных XML-технологий.
2. Как результат анализа существующих методов интеграции данных определен наиболее эффективный и оптимальный для повышения эффективности управления композитным документооборотом в условиях КИС.
3. Всесторонне проанализированы существующие XML-технологии и выявлены области предпочтительного применения, их преимущества и недостатки.
4. Спроектирована структура XML-документов для решения задачи интеграции данных из гетерогенных источников, что позволило модифицировать обмен информацией в системе электронного документооборота клинико-диагностических и лабораторных отделений консультативного центра клинической больницы.
5. С целью реализации XML-базы данных разработана методика построения ее логической и физической структуры для обеспечения обмена информацией в КИС.
6. Определена архитектура программных средств при автоматизации системы документооборота, обеспечивающая повышение эффективности управления данными на основе применения XML-технологий и позволяющая использовать различные классы вычислительных устройств с применением сетевых беспроводных технологий на базе различных протоколов обмена.
7. Получены практические результаты, иллюстрирующие актуальность и ценность диссертационных исследований, в виде набора информационных моделей и алгоритмов, направленных на повышение эффективности управления гетерогенными данными в КИС с комплексным применением XML-технологий в системе документооборота ЛПУ.
Список литературы диссертационного исследования кандидат технических наук Мутин, Денис Игоревич, 2009 год
1. Вольфман Б. Разработка корпоративных систем с использованием современных инструментальных средств Техническая конференция "Корпоративные базы данных 97": Доклады и тезисы. http://www.citforum.ru/database/kbd97/21 .shtml
2. Верников Г. Технологическая эволюция корпоративных информационных систем. http://www.citfomm.ra/cf!n/articles/kis xml.shtml# 1
3. Баранов В. Двадцать один вопрос о корпоративных информационных системах. http://www.iteam.ru/publications/it/section 4. 52/article 2210/ Попович В.В., Воронин М.Н. Гармонизация, интеграция и слияние данных три источника и три составных части геоинформационных технологий Международный семинар «Интеграция информации и геоинформационные системы»: Труды семинара. СПб., 2005. 152-158.
4. Blasch Е. Fundamentals of Information Fusion and Applications. Tutorial. TD
5. Valet L., Mauris G., Bolon Ph. A statistical overview of Recent Literature in Information Fusion. IEEE AES. Fusion 2000. 7.
6. Проблемы интеграции данных. http://www.citcitv.ru/! 1154/ Панькин А.В. Интеграция гетерогенных информационных потоков, циркулирующих в контуре управления. Труды 2-го международного семинара «Интеграция информации и ГИС». СПб.: «Анатолия», 2005.
7. White Data Integration: Using ETL, EAI, and EII Tools to Create an Integrated Enterprise). http://www.tdwi.org/Publications/What Works/display.aspx?id:=7979
8. Филиппов B.A., Щукин Б.А., Тюрина Н.Г. Исследование методов обмена данными в гетерогенных информационных системах, включающих приложения SAP и базы данных, поддерживаемые СУБД D3. М.: КомКнига, 2006.
9. Information Technology-Database Language SQL, Standard No. ISO/IEC 9075, International Organization for Standardization (1999); New York.
10. Кузнецов Когда, как, что и зачем http://citcitv.ru/10881/
11. Data Integration: The Key to Effective Decisions. http://www.businessobiects.com/global/pdwhitepapers/data_integration
12. Филиппов В., Электронные хранилища информации и Web-технлогии. М.:УРСС,2001.
13. Эшвин Р., Вибха определения Д. Основы использования XML перевод Intersoft Lab Schema для http://wwwстоит интегрировать? элементов, 106.ibm.com/developerworks/library/xml-schema/?dwzone=xml
14. Филиппов B.A., Щукин Б.А., Тюрина Н.Г. Обмен данными в гетерогенных системах http://www.appcom.ru
15. Филиппов В.А., Щукин Б.А. XML документы и XML базы данных. http://www.appcom.ru
16. Слукин П.А. Адаптивные интерфейсы обмена коммерческой информацией: Автореф. дисс. канд. экон. наук. М., 2006. 19. XML-формат обмена данными Сбалансированной системы показателей. http://www.citcitv.ru/l 1184/
17. Extensible Markup Language 1.0 (Second Edition), W3C Recommendation. http://\v\vw. w3. org/TR/REC-xml.
18. Круковский М.Ю. Концепция построения моделей композитного документооборота Математические машины и системы.-2004.-№2.С.149-163.
19. Глушков В.М. Введение
20. Саттон М.Дж. Корпоративный документооборот. М.: Азбука, 2002. 448 с.
21. Круковский М.Ю. Методология построения композитных систем документооборота Математичш машини i системи. 2004. 1. 101-114.
22. Круковский М.Ю. Графовая модель композитного документооборота// Математичш машини i системы. 2005. 3. 149-163.
23. Алферова З.В. Математическое обеспечение экономических расчетов с использованием теории графов. М.: Статистика, 1974. 208 с.
24. Anderson J.A. Discrete mathematics with combinatorics. New Jersey: Prentice Hall, 2001. 807 p.
25. Питц-Моултис H., Кирк 4.. XML в подлиннике. СПб.: BHV, 2000. 736 c.
26. Храмцов П. Зачем нам нужен язык XML? http://www.citforum.ru/
27. Дунаев С Б Технология Интернет-программирования. СПб.: BHV, 2001.
28. Антипин К.В., Фомичев А.В., Гринев М.Н., Кузнецов Д., Новак Л.Г., Плешачков П.О., Рекуц М.П., Ширяев Д.Р. Оперативная интеграция данных на основе XML: системная архитектура BizQuery. http://www.citforum.ru/internet/xml/bizquery/
29. Grinev, М., Kuznetsov, S.: UQL: A Query Language on Integrated Data in Terms of UML// Programming and Computer Software. 2002. 4. С 189-196
30. Extensible Markup Language (XML) 1.0, W3C Recommendation, 2nd edition. http://www.w3.org/TR/2000/ElEC-xml-20001006 34. XSL Transformations (XSLT) 2.0, W3C Working Draft. http://www.w3.org/TR/2002/WD-xslt20-20021115/
31. Chawathe, S., Garcia-Molina, H., Hammer J., Ireland, K., Papakonstantinou, Y., Ullman, J., Widom, J.: The TSIMMIS Project: Integration of Heterogeneous Information Sources//IPSJ. 1994. С 7-18 36. RDF Vocabulary Description Language 1.0: RDF Schema, W3C Working Draft. http://www.w3 .org/TR/rdf-schema/
32. Document Object Model. http://www.w3.org/DOM/ 38. The Tukwila Data Integration System, University of Washington. http://data.cs.washington.edu/integration/tukwila/
33. Sheth, A., Larson, J.: Federated Database Systems for Managing Distributed, Heterogeneous, and Autonomous Databases// ACM Computing Surveys. 1990. 2 2 3 С 183-236 40. XML и базы данных? Доверьтесь своей интуиции. http://www.iso.ru/iournal/articles/206.html/
34. Рональд Б. XML и база данных. http://www.intersoft.ru/xml
35. Воинов Е.В., Гайсарян С, Дмитриева О.Л., db Дышлевой К.В., Кимельман М.Л., Кузнецов Д., Пономаренко В.Н., Рыбаков А.А.. Российский проект свободно распространяемой СУБД Открытые системы. 1993. 4
36. Когаловский М. Р. Энциклопедия технологий баз данных: Эволюция технологий. Технологии и стандарты. Инфраструктура. Терминология. М. Финансы и статистика, 2002.
37. Bourret R. Storing XML files. http://lists.xml.org/archives/xml- dev/200110/msg00347.html
38. Champion M. XML Database Decision Tree? http://lists.xml.Org/archives/xml-dev/200110/mso:00698.html
39. Kiel P. Profiling XML Schema. http://www.xml.eom/pub/a/2006/09/20/profilina:-xml-schema.html
40. Схемы данных. http://www.citforum.ru/internet/xml/part5.shtml
41. Ладыженский Г. Распределенные информационные системы и базы данных. http://www.citforum.ru/database/kbd96/45.shtml
42. Старых В.А. Спецификация и форматы обмена данными в разнородных информационных системах на базе XML-технологий. http://w\\av.citforum.ru/internet/xml/xmltech/
43. Грейвс М. Проектирование баз данных на основе XML. М.: Вильяме, 2002. 640 с. 51. Web Services for Business Process Design. http://www.gotdotnet.com/team/xml wsspecs/xlang-c/
44. Native XML Databases. http://www.rpbourret.com/xml/XMLAndDatabases.htiTi
45. Scardina M., Chang В., Wang J. Oracle Database lOg XML SQL: Design, Build, Manage XML Applications in Java, C, C++, PL/SQL. Osborne. ISBN: 0072229527, 2004. 600 p.
46. Sedna XML DBMS. http://www.modis.ispras.ru/Development/sedna.htm 55. XQuery 1.0: An XML Query Language, W3C Working Draft. http://wvvW.w3.org/TR/2003/WD-xquerv-20031112/ 56. XQuery 1.0 and XPath 2.0 Data Model, W3C Working Draft. http://www.w3.org/TR/xpath-datamodel/
47. Mary F. Fernandez, Jerome Simeon: Growing XQuery// ECOOP. 2003. C. 405-430
48. Особенности СУБД Sedna. XML-СУБД Sedna: технические особенности и варианты использования Открытые системы. 2004. №8
49. Чемберлин Д. XQuery: язык запросов XML Открытые системы. 2003.-№1 60. XQuery 1.0: An XML Query Language, W3C Working Draft. http://www.w3.org/TR/2002/WD-xquerv-20021115/
50. Jagadish H., Al-Khalifa S., Chapman A., Lakshmanan L., Nierman A., Paparizos S., Patel J., Srivastava D., Wiwatwattana N., Wu, Y. and Yu, C TIMBER: A Native XML Database The VLDB Journal. 2002. №11 62. Al-Khalifa S., Jagadish H., Patel J., Wu Y., Koudas N., Srivastava D.: Structural Joins: A Primitive for Effecient XML Query Pattern Matching. Proceedings of ICDE, 2002.
51. Chou H.-T., DeWitt D. J. An Evaluation of Buffer Management Strategies for Relational Database Systems. Proceedings of VLDB, 1985.
52. Abiteboul S., Quass D., McHugh J., Widom J., Wiener J. The Lorel Queiy Language for Semistructured Data International Journal on Digital. -1997. -№1.
53. Grinev M., Pleshachkov P. Rewriting-based Optimization for XQuery Transformational Queries. Submitted at VLDB, 2004.
54. Antipin K., Fomichev A., Grinev M., Kuznetsov S., Novak L., Pleshachkov P., Rekouts M., Shiryaev D. Effecient Virtual Data Integration Based on XML. In Proc. ADBIS Conference, LNCS 2798, 2003. 67. XML Query Working Group. http://www.w3.org/XML/Ouery
55. European Research Gateways Online. http://www.cordis.lu/ergo
56. Laitinen S., Sutela P., Tirronen K. Development of Current Research Information Systems in Finland. Proceeding of CRIS, 2000.
57. Соколов И.А., Босов А.Б., Бездушный A.H. Об Информационном Webпортале Российской Академии Наук Системы и средства информатики, Выпуск 13, ISSN 0869-6527. М: Наука, 2003, с. 139-155
58. Рузайкин Г.И. Медицинские информационные системы, или МИС// Мир П К 2 0 0 1 3
59. Айламазян А.К., Гулиев Я.И., Комаров СИ., Малых В.Л., Морозов В.Ю. Информационные системы в медицине: проблемы и решения Программные системы: Теоретические основы и приложения Под ред. А.К. Айлмазяна. М Наука. Физматлит, 1999. 162-168.
60. Назаренко Г.И. Медицинские информационные системы: Теория и практика Г.И. Назаренко, Я.И. Гулиев, Д.Е. Ермаков. Под редакцией Г. И. Назаренко, Г. Осипова. Москва: ФИЗМАТЛИТ, 2005. 320 с.
61. Общие требования, структура и правила формирования электронного документа. Приказ Департамента здравоохранения от 22.11.2004 г. 507
62. Вольдер Б.С. Планирование на предприятии. Учебное пособие. М.: МГТУ "Станкин", 1999, 172 с.
63. Горфинкель В.Я., Купряков Е.М. Экономика предприятия. Учебник для ВУЗов. М.: "Банки и биржи", ЮНИТИ, 1996, -367 с.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.