Управление метаданными в гетерогенных информационно-аналитических системах масштаба предприятия тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат технических наук Шовкун, Алексей Владимирович
- Специальность ВАК РФ05.13.11
- Количество страниц 277
Оглавление диссертации кандидат технических наук Шовкун, Алексей Владимирович
1. Проблемная область «Хранилища данных»
1.1. Цели построения хранилища данных
1.2. Базовые элементы хранилища данных
1.3. Проблемы построения хранилища данных
1.4. Описание метаданных на основе моделей
1.5. Постановка задачи создания инструмента управления метаданными в хранилищах данных
1.6. Выводы по главе
2. Теоретические аспекты эффективного управления метаданными в хранилищах данных
2.1. Организация обмена метаданными
2.1.1. Децентрализованный доступ к метаданным
2.1.2. Подход OMG (общая шина метаданных)
2.1.3. Централизованный доступ к метаданным
2.1.4. Конфедеративный доступ к метаданным
2.1.5. Доказательство эффективности конфедеративного подхода
2.2. Классификация метаданных для хранилища данных
2.2.1. Классификация по фазе жизненного цикла проекта
2.2.2. Классификация по модели данных
2.2.3. Классификация по уровню абстракции
2.2.4. Классификация по этапу жизненного цикла данных
2.2.5. Классификация по пользователям
2.2.6. Классификация по степени общности
2.2.7. Сводная классификация метаданных для ХД
2.3. Теоретические основы технологии манипулирования метаданными
2.3.1. Спецификация Meta Object Framework (MOF)
2.3.2. Спецификация XML Metadata Interchange (XMI)
2.4. Выводы по главе
3. Технология создания и использования центрального Репозитория метаданных хранилища данных
3.1. Концептуальная архитектура Репозитория метаданных
3.1.1. Связь со спецификацией OMG Common Warehouse Metamodel
3.1.2. Обоснование использования многомерной модели данных для описания предметной области
3.1.3. Виды моделей метаданных Репозитория
3.1.4. Модель метаданных Репозитория как расширение спецификации CWM
3.2. Модель метаданных Репозитория
3.2.1. Используемые обозначения
3.2.2. Структура описания модели метаданных Репозитория
3.2.3. Отображение концептуального уровня метаданных на логический
3.3. Технология создания корпоративного хранилища данных с использованием Репозитория метаданных
3.3.1. Сценарий 1: «Создание хранилища данных»
4 3.3.2. Сценарий 2: «Модификация хранилища данных (решение новой прикладной задачи)»
3.3.3. Обмен метаданными с другими компонентами системы
3.4. Выводы по главе
4. Практическое применение и оценка эффективности
4.1. Практическое применение технологии управления метаданными в хранилищах данных
4.1.1. Описание Корпоративного каталога показателей
4.1.2. Использование Корпоративного каталога показателей на
•ф примере производственно-торговой компании
4.2. Оценка экономической эффективности проекта по созданию
Репозитория
4.2.1. Оценка прибыли за счет внутренней экономии ресурсов на проектах по созданию ХД
4.2.2. Оценка прибыли за счет исполнения внешних проектов по созданию крупных хранилищ данных
4.2.3. Оценка финансовых показателей
4.3. Выводы по главе
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Модель многомерного представления данных и методы ее анализа2010 год, кандидат физико-математических наук Висков, Алексей Валерьевич
Методы и средства автоматизации проектирования и эксплуатации хранилищ данных: В сфере электроэнергетики и регионального управления2001 год, кандидат технических наук Левенец, Ирина Анатольевна
Методика синтеза сложных телекоммуникационных систем1998 год, кандидат технических наук Корсаков, Алексей Валентинович
Разработка и исследование методов построения защищенных корпоративных аналитических систем2006 год, кандидат технических наук Тульский, Сергей Александрович
Автоматизация проектирования систем оперативной аналитической обработки данных: на примере информационно-аналитических систем в энергетике1999 год, кандидат технических наук Щавелев, Леонид Вячеславович
Введение диссертации (часть автореферата) на тему «Управление метаданными в гетерогенных информационно-аналитических системах масштаба предприятия»
Актуальность работы
Любая крупная компания рано или поздно сталкивается с задачей сбора информации для принятия управленческих решений. С одной стороны в компании существует множество информационных систем, в которых есть все необходимые для анализа детальные данные, с другой стороны эти системы не представляют собой единого источника согласованной информации, необходимого для принятия стратегических решений. Возникает потребность в организации цепочки доставки информации: от существующих оперативных систем и других источников данных (например, периодические издания или интернет ресурсы) до информационно-аналитических систем. Одним из вариантов построения цепочки доставки информации является создание корпоративного хранилища данных (информационно-аналитической системы масштаба предприятия).
Идею хранилищ данных предвосхищали в своих работах многие исследователи. Можно смело утверждать [77], что первой публикацией, посвященной именно хранилищам данных, была статья Девлина ^(Devlin) и Мэрфи (Murphy), вышедшая в 1988 году [10]. В 1992 году Уильям Г. Инмон (William Н. Inmon) написал монументальную монографию «Building the Data Warehouse» [20], в которой определил хранилище данных как «предметно-ориентированную, интегрированную, вариантную по времени, не разрушаемую совокупность данных, предназначенную для поддержки принятия управленческих решений». Для анализа содержащейся в хранилище данных информации, как правило, применяется технология оперативного анализа данных (OLAP). В 1995 году создатель аналитического издания OlapReport Найгель Пендс (Nigel Pendse) резюмировал определение OLAP только пятью ключевыми словами: Быстрый Анализ Разделяемой Многомерной Информации - или, кратко - FASMI (в переводе с английского: Fast Analysis of Shared Multidimensional information) [38].
Современные хранилища данных объединяют большое количество баз данных, файловых систем, инструментов и приложений. Каждая из объединяемых компонент обычно имеет свою собственную модель данных и структуры для хранения и передачи данных. Например, в качестве источников данных могут использоваться реляционные базы данных с разными логическими схемами данных, плоские файлы, XML или EDIFACT файлы и т.п. Аналогично, для построения витрин данных и для анализа данных разные инструменты используют различные модели: OLAP, объектные, объектно-реляционные, реляционные. Таким образом, построение хранилища данных является задачей системной интеграции. Все модели данных, используемые в инструментах и средствах, включенных в хранилище данных, взаимосвязаны. Эти модели так или иначе описывают понятия предметной области, для которой создается хранилище. Для поддержания семантической целостности необходимо отслеживать зависимости и соответствия между различными моделями данных различных компонент хранилища. Эту задачу необходимо решать не только на этапе проектирования хранилища, но и в процессе его эксплуатации при появлении новых источников информации или новых понятий предметной области. Сложность этой задачи возрастает при увеличении числа компонент хранилища данных (нелинейно).
Ключевым аспектом при решении такой задачи системной интеграции является то, что все это разнообразие средств и технологий собирается вместе для построения единой цепочки доставки информации в одной компании. Другими словами, все интегрируемые системы имеют дело с общим набором предметных областей - в них присутствует и используется одна и та же информация, разница существует лишь в форме представления этой информации или в выполняемых над ней операциях.
Проблема эффективной интеграции программных продуктов различных производителей на уровне данных может быть разрешена (или сведена к более простым задачам) путем интеграции метаданных между используемыми в хранилище данных системами. Для этого в хранилище данных должна входить специальная компонента, управляющая моделями данных остальных компонент, - Репозиторий. Репозиторий предназначен для управления метаданными, т.е. информацией о структуре, содержимом и взаимосвязями между компонентами хранилища данных. Репозиторий облегчает работу проектировщикам и администраторам, поскольку является единым местом сбора информации о структуре и составе хранилища данных. Также он полезен бизнес пользователям, поскольку содержит информацию о предметной области, которая необходима при навигации по хранилищу данных и при построении аналитических запросов.
Используемые сегодня подходы и технологии создания информационно-аналитических систем масштаба предприятия (хранилища данных) обладают рядом недостатков:
- Низкое качество информации и отсутствие возможности обзора у конечных пользователей и у ИТ специалистов информационного наполнения системы;
- Высокая трудоемкость создания ХД при осуществлении интеграции на уровне метаданных традиционными способами;
- Высокая трудоемкость по поддержанию ХД в актуальном состоянии (стоимость владения системой составляет до 40-100% в год от первоначальной стоимости разработки [7]);
- Несовместимость на уровне метаданных программных продуктов различных производителей, используемых в качестве компонентов ХД, что делает практически нерентабельным построение ХД из лучших в своем классе продуктов различных производителей.
Цель исследования
Целью диссертационной работы является исследование и разработка теоретических способов эффективной интеграции программных продуктов различных производителей на уровне метаданных и создание на их основе технологии и инструментария для управления метаданными в гетерогенных информационно-аналитических системах масштаба предприятия (хранилищах данных), что позволит автоматизировать процессы построения и развития таких систем в крупных организациях. Основные задачи (направления исследований)
Для достижения указанной цели необходимо решить следующие задачи:
• Разработать модель порождения и обмена метаданными внутри информационно-аналитической системы;
• Построить классификацию метаданных, встречающихся в среде гетерогенных информационно-аналитических систем масштаба предприятия (хранилищ данных);
• Выделить классы метаданных, подлежащих ведению в центральном Репозитории информационно-аналитической системы;
• Построить модель метаданных центрального Репозитория, покрывающую потребности в метаданных всех компонентов информационно-аналитической системы;
• Разработать механизмы конфигурационного управления и версионного контроля для модели метаданных центрального Репозитория информационно-аналитической системы;
• Спроектировать и осуществить программную реализацию центрального Репозитория информационно-аналитической системы;
• Разработать технологию создания информационно-аналитических систем масштаба предприятия (хранилищ данных) на основе управления метаданными и с использованием центрального Репозитория.
Научная ценность
Научная новизна работы заключается в следующих результатах:
• Предложен новый «конфедеративный» подход к управлению и обмену метаданными в среде информационно-аналитической системы масштаба предприятия (хранилища данных);
• Автором предложена многомерная классификация метаданных, встречающихся в среде информационно-аналитической системы масштаба предприятия (хранилища данных), состоящая из 6 классификаций;
• Автором разработана модель общих метаданных информационно-аналитической системы масштаба предприятия (хранилища данных), включающая описания бизнес объектов, структур хранения данных и гибкие описания связей между бизнес понятиями и структурами хранения данных; модель состоит из 119 классов. Практическая ценность
Практическая значимость работы заключается в следующих результатах:
• Разработана технология построения гетерогенной информационно-аналитической системы масштаба предприятия (хранилища данных) на основе конфедеративного управления метаданными;
• Модель метаданных для ХД разработана на основе и совместима с промышленными стандартами MOF, CWM, XMI, XML;
• Осуществлена программная реализация центрального Репозитория хранилища данных на платформах J2EE и .NET.
Методы исследования
В работе использовались методы и аппараты теории множеств, реляционного моделирования данных, теории графов, системного анализа, объектно-ориентированного анализа и проектирования, календарного планирования, теории решения изобретательских задач. Апробация работы
Результаты работы применяются Отделением Системной Интеграции холдинга ЛАНИТ в процессе исполнения проектов по созданию гетерогенных информационно-аналитических систем масштаба предприятия. В частности, положения разработанной технологии управления метаданными применялись под руководством и при участии автора при разработке информационно-аналитической системы для одного из крупнейших банков России. По сформулированным в данной работе требованиям и технологическим решениям под руководством и при участии автора создан программный продукт «Корпоративный каталог показателей» («Enterprise Metadata Center»)1.
По теме диссертационной работы опубликовано 13 печатных работ и сделаны доклады на следующих семинарах и конференциях:
1 Свидетельство об официальной регистрации программы для ЭВМ №2004611855, 11 августа 2004г., выдано Федеральной службой по интеллектуальной собственности, патентам и товарным знакам.
• Научная сессия МИФИ-2003, Москва, февраль 2003 г.1;
• Всероссийская Научная Конференция по Проблемам Математики, Информатики, Физики, Химии и Методики Преподавания Естественнонаучных дисциплин, Москва, апрель 2003 г.;
• Семинар "Хранилища данных и аналитические системы - от концепции к решению", Москва, Oracle, декабрь 2003 г.;
• XL VII научная конференция Московского Физико-Технического Института «Современные проблемы фундаментальных и прикладных наук», Москва, ЛАНИТ, ноябрь 2004 г.
Положения, выносимые на защиту
На защиту выносятся следующие положения:
1. Конфедеративный подход к обмену метаданными в среде информационно-аналитической системы масштаба предприятия;
2. Классификационная модель метаданных в среде информационно-аналитической системы масштаба предприятия;
3. Формальная модель метаданных центрального Репозитория информационно-аналитической системы масштаба предприятия;
4. Технология создания информационно-аналитических систем масштаба предприятия на основе конфедеративного управления метаданными.
Структура и объем работы
Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и пяти приложений. Работа состоит из 152 страниц, 49 рисунков и 26 таблиц. Краткое содержание работы
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Разработка алгоритмического и программного обеспечения для проектирования и поддержки регионального банка цифровой геологической информации2000 год, кандидат технических наук Уваров, Владислав Вадимович
Исследование и реализация распределенной информационной системы управления финансовыми данными2003 год, кандидат технических наук Горелов, Борислав Борисович
Технология доступа к документам в научно-исследовательской организации2007 год, кандидат технических наук Ковязина, Елена Васильевна
Модели и методы организации информационной поддержки принятия решений в сфере энергетики2007 год, доктор технических наук Ратманова, Ирина Дмитриевна
Информационная технология хранилищ данных на основе балансового метода2003 год, кандидат технических наук Аксенов, Евгений Геннадьевич
Заключение диссертации по теме «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», Шовкун, Алексей Владимирович
Основные результаты диссертационной работы
1. Разработан конфедеративный способ обмена метаданными между компонентами информационно-аналитической системы масштаба предприятия (хранилища данных). Применение этого способа позволяет минимизировать трудозатраты на ввод метаданных, сократить количество ошибок при порождении метаданных в различных компонентах системы и осуществлять интеграцию в единую систему программных продуктов различных производителей.
2. Создана классификация метаданных, встречающихся и используемых в ИАС масштаба предприятия. На основе этой классификации выявлено множество метаданных, подлежащее централизованному ведению при конфедеративном управлении метаданными.
3. Разработана формальная модель метаданных для ИАС масштаба предприятия. Модель метаданных разработана в соответствии со спецификацией OMG Meta Object Facility и является расширением спецификации OMG Common Warehouse Metamodel. Разработанная модель метаданных позволяет описывать одновременно как бизнес, так и технические аспекты функционирования хранилища данных, а также описывать и отслеживать взаимосвязи между всеми объектами метаданных. Основные расширения спецификации CWM выполнены в части описания способов представления многомерных данных в реляционных структурах данных.
4. Разработана технология создания информационно-аналитических систем масштаба предприятия на основе конфедеративного управления метаданными. Данная технология позволяет строить такие системы из программных продуктов различных производителей, изначально подготовленные к эволюции при изменении бизнес требований.
5. Под руководством и при участии автора осуществлена реализация двух программных продуктов, выполняющих роль центрального Репозитория ИАС масштаба предприятия: Технический Каталог Показателей (платформа реализации ЛЕЕ, WEB, СУБД Oracle) и Корпоративный Каталог Показателей / Enterprise Metadata Center (платформа реализации .NET, клиент-сервер, СУБД Oracle).
6. В среде Корпоративного каталога показателей выполнено описание метаданных для предметных областей «банковская деятельность», «анализ сбыта слабоалкогольной продукции» и «анализ деятельности транзитной телекоммуникационной компании».
7. Достаточность описательной мощности предложенной автором модели метаданных подтверждена успешной программной реализацией алгоритмов преобразования метаданных во внутренний формат метаданных аналитического инструмента BusinessObjects и многомерного сервера данных Oracle OLAP Option 9i.
Научная новизна теоретических положений и результатов экспериментальных исследований
Для системного решения задач управления метаданными в гетерогенных информационно-аналитических системах масштаба предприятия (хранилищах данных) автором создана многомерная классификация классов метаданных, встречающихся и используемых в таких системах. Данная классификация позволяет наглядно и обозримо произвести выбор классов метаданных, подлежащих ведению и передаче между компонентами хранилища данных. Такой набор классов метаданных представляет собой спецификацию интерфейса обмена метаданными между компонентами системами.
Впервые предложена технология конфедеративного обмена метаданными между компонентами информационно-аналитической системы масштаба предприятия (хранилища данных).
Автором предложена и разработана уникальная модель метаданных, позволяющая описывать связь между бизнес и техническими метаданными гетерогенной информационно-аналитической системы масштаба предприятия (хранилища данных).
Методы исследования, достоверность и обоснованность результатов диссертационной работы
В работе использовались методы и аппараты теории множеств, реляционного моделирования данных, теории графов, системного анализа, объектно-ориентированного анализа и проектирования, календарного планирования, теории решения изобретательских задач.
Разработка теоретических положений и создание на их основе технологии и инструмента для управления метаданными стали возможными благодаря комплексному использованию современных стандартов и спецификаций в области описания метаданных и проектирования информационных систем: OMG Unified Modeling Language, OMG Model Driven Architecture, OMG Meta Object Facility, OMG Common Warehouse Metamodel, Rational Unified Process и др. Описание предложенной в данной работе модели метаданных выполнено в терминах Модели Meta Object Facility в виде расширения спецификации Common Warehouse Metamodel.
Разработанные теоретические положения и новые технические решения опробованы экспериментально. Процесс создания информационно-аналитической системы по предложенной технологии конфедеративного управления метаданными и с использованием Корпоративного Каталога Показателей был продемонстрирован на семинаре «Хранилища данных и аналитические системы - от концепции к решению», проведенном совместно компаниями ЛАНИТ и Oracle в декабре 2003 года [66].
Практическая ценность результатов диссертационной работы
Разработанные в диссертационной работе конфедеративный подход к организации обмена метаданными и модель метаданных позволяют повысить эффективность процессов разработки и развития (эксплуатации) гетерогенных информационно-аналитических систем масштаба предприятия (хранилищ данных), а также повысить качество информационного обслуживания конечных пользователей таких систем за счет использования единого и формального описания предметной области.
Использование предложенной автором технологии конфедеративного управления метаданными и Корпоративного каталога показателей на этапе проектирования и разработки системы позволяют снизить трудоемкость (и стоимость) создания небольших хранилищ данных на 40-50%. Использование предложенной технологии и инструментария (Корпоративный каталог показателей) при создании крупных хранилищ данных позволяет создавать системы, способные к эволюции при изменении бизнес требований (без проектирования и доработки со стороны разработчиков хранилища данных). При этом система может создаваться на основе программных продуктов различных производителей. Совмещение этих возможностей в одной системе является уникальным результатом для современной индустрии создания хранилищ данных.
Апробация работы
Основные положения и результаты работы докладывались и обсуждались на семинарах и конференциях:
• Научная сессия МИФИ-2003, Москва, февраль 2003 г.1;
• Всероссийская Научная Конференция по Проблемам Математики, Информатики, Физики, Химии и Методики Преподавания Естественнонаучных дисциплин, Москва, апрель 2003 г.;
• Семинар "Хранилища данных и аналитические системы - от концепции к решению", Москва, Oracle, декабрь 2003 г.;
• XLVII научная коференция Московского Физико-Технического Инстиута, Москва, ЛАНИТ, ноябрь 2004 г.
Реализация результатов работы и достигнутый эффект подтверждены соответствующим актом.
Разработанный программный продукт зарегистрирован в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам под именем «Корпоративный каталог показателей» (свидетельство об официальной регистрации программы для ЭВМ №2004611855, 11 августа 2004г.).
1 Работа «Технология построения репозитория метаданных для хранилищ данных» отмечена дипломом Научной сессии.
Словарь терминов и сокращений
Сокращения
CWM Common Warehouse Metamodel - спецификация OMG метаданных для хранилищ данных, является MOF моделью.
DDL Data Definition Language. Язык для описания структуры данных.
DML Data Manipulation Language. Язык для описания операций над данными.
DTD Data Definition Table. Представляет собой описание допустимого содержимого (синтаксиса) XML файла в нотации РБНФ.
ETL Extraction, Transformation and Loading. Общее название для процедур, выполняющих перегрузку и преобразования данных.
J2EE Java 2 Enterprise Edition
JMI Java Metadata Interface
MDA Model Driven Architecture
MOF MetaObject Facility - спецификация OMG для построения моделей метаданных (метамоделей)
OCL Object Constraint Language - язык объектных ограничений.
OLAP Online Analytical Processing. Аналитическая обработка информации.
OLTP Online Transaction Processing. Оперативная обработка транзакций.
OMG Object Management Group
SQL Structured Query Language, язык структурированных запросов
XMI XML Metadata Interchange - спецификация OMG для сохранения MOF моделей в XML файле
XML Extensible Markup Language
UML Unified Modeling Language
АРМ Автоматизированное Рабочее Место
БД База данных
ВД Витрина Данных. Многомерная или реляционная база данных, предназначенная для исполнения аналитических отчетов. Витрина наполняется данными из ЦХД и содержит часть всех данных хранилища, ограниченную по времени и/или по предметной области
ИТ
КИАС
ООП ОСД
ПО РБНФ
РСУБД СУБД ХД ЦХД
Информационные технологии
Корпоративная информационно-аналитическая система. Общее название для систем масштаба предприятия, предназначенный для поддержки аналитической и управленческой деятельности. Синонимы: система поддержки принятия решений (Decision Support System, DSS), хранилище данных (Data Warehouse, DWH), система класса Business Intelligence (BI System/Platform). Объектно-Ориентированное Проектирование Оперативный Склад Данных. Реляционная база данных, содержащая порцию данных (за некоторый промежуток времени), которые проходят этап согласования, очистки и проверки перед загрузкой в
ЦХД.
Программное обеспечение
Расширенная Бэкуса-Наура Нормальная Форма. Нотация для описания синтаксиса языков. Реляционная СУБД Система управления базами данных Хранилище данных
Центральное Хранилище Данных, реляционная база данных, содержащая хранилища (за все время по всем
Большая» все данные предметным областям) в форме, удобной для хранения информации.
ER моделирование
ER модель предметной области)
Абстрактный синтаксис
Буферная область
Ведение метаданных
Метаданные
Термины
Описание данных в виде диаграмм Entity-Relationship.
Набор диаграмм, получаемых при ER моделировании предметной области
Описание структуры данных, независящее от аппаратной реализации и способа кодирования. Общее название компонент хранилища данных, находящихся в цепочке доставки информации между источниками данных и ЦХД (или витриной данных, если ЦХД не создается)
Множество функций по созданию, модификации и удалению объектов метаданных, поддерживаемых репозиторием метаданных.
Метаданные - это все физические данные (содержащиеся в программах и других средах) и знания (имеющиеся у людей и представленные в любой
Метамодель Модель
Платформа
Платформо-зависимая модель, ПЗМ
Платформо-независимая модель, ПНЗМ Предметная область
Репозиторий метаданных форме), собранные как внутри, так и вне организации, и содержащие информацию о физических данных организации, индустрии, технических процессах и бизнес процессах (Д. Марко [30]). Модель метаданных (М2)
Представление части функций, структуры и/или поведения системы. Соответствует первому уровню Ml абстракции данных в терминах MOF. Программная инфраструктура реализованная с использованием конкретной технологии (UNIX платформа, CORBA платформа, Windows платформа) на конкретной аппаратной технологии [33]. Платформо-зависимая модель выражается в терминах спецификационной модели целевой платформы. ПЗМ использует такие механизмы платформы, как исключения, типы параметров (включая специфичные для платформы правила для объектных ссылок, типах данных значений, семантике вызова по значению и т.п.) и компонентная модель [33].
Формальная спецификация структуры и функций системы, абстрагированная от технических деталей [33].
Логическое подмножество всех понятий и процессов, которыми оперирует определенное подмножество бизнес-пользователей
Специализированная информационная система, предназначенная для хранения, управления и предоставления доступа к метаданным.
Заключение
Список литературы диссертационного исследования кандидат технических наук Шовкун, Алексей Владимирович, 2005 год
1. Abello A., Samos J., Saltor F. Understanding Analysis Dimensions in a Multidimensional Object-Oriented Model. // In 3rd International Workshop on Design and Management of Data Warehouses (DMDW). SwissLife, 2001.
2. Adamson Ch., Venerable M. Data Warehouse Design Solutions. New York: John Wiley & Sons Inc., 1998.
3. Ananthakrishna R., Chaudhuri S., Ganti V. Eliminating Fuzzy Duplicates in Data Warehouses // Proceedings of 28th International Conference on Very Large Data Bases. -China, August 20-23. Hong-Kong: 2002, p. 586-597.
4. Bernstein P.A. etc. Microsoft Repository Version 2 and the Open Information Model // Bernstein P.A., Bergstraesser Th, Carlson J., Pal S., Sanders P. and Shutt D. Information Systems. - vol. 24, no 2. - 1999.
5. Chang T. CWM Enablement Showcase // UML Forum. Tokyo. - March 21 2001.
6. Connor D. Report: Data warehouse failures commonplace // Network World. — 2003.
7. Cui Y., Widom J. Lineage Tracing for General Data Warehouse Transformations // Proceedings of 27th International Conference on Very Large Data Bases. Italy, September 11-14. - Roma: 2001, pp. 471-480.
8. Dart, S.A. Concepts in Configuration Management Systems // In Proceedings of the 3 rd International Workshop on Software Configuration Management. -New York, USA: ACM Press. 1991. - pp. 1-18.
9. Devlin B. A., Murphy P. T. An Architecture for a Business and Information System // IBM Systems Journal. 27(1). - 1988.
10. Feiler P. Configuration Management Models in Commercial Environments / Technical report, Software Engineering Institute. CMU/SEI-91-TR-7. — Pittsburgh. -1991.
11. Geoff Coupe, KALIDO. A Technical Overview for an Information Warehouse //www.kalido.com. June 2001.
12. Gingras F., Lakshmanan L. nD-SQL: A Multi-dimensional Language for Interoperability and OLAP // Proceedings of the 24th International Conference on Very Large Data Bases. New York. - August 1998.
13. Giovinazzo W. A. Object-Oriented Data Warehouse Design. Prentice Hall, 2000.
14. Hong Hai Do, Rahm E. On Metadata Interoperability in Data Warehouses: Report / Department of Computer Science, University of Leipzig. ISSN 14303701. - Leipzig, Germany. - March 2000
15. Jarke M., Rose T. Managing knowledge about information system evolution // Proceedings of the ACM SIGMOD International Conference of the Management of Data.- pp. 303-311.- 1998.
16. Java Community Process: Java Metadata Interface (JMI), version 1.0. June 2002.
17. Java Community Process: Java OLAP Interface (JOLAP). Final Draft / John D. Poole etc. September 2003.
18. Jennings M. Managing Current and Historical Views of Information in The Data Warehouse // DM Review. August 2001.
19. Inmon W. H. Building the Data Warehouse. New York: John Wiley & Sons Inc., 2002.
20. Inmon W.H. Metadata in the Data Warehouse: A Statement of Vision // White paper. 1997. - http://www.billinmon.com/library/whiteprs/techtopic/ttlO.pdf
21. Iyengar S. Implementing Model Driven Architectures // DAMA/Meta-data Conference. 2001.
22. Kimball R. Slowly Changing Dimensions // DBMS Magazine. April 1996.
23. Kimball R. etc. The Data Warehouse Lifecycle Toolkit. Expert Methods for Designing, Developing, and Deploying Data Warehouses / Ralph Kimball, Laura Reeves, Margy Ross, Warren Thornthwaite. New York: John Wiley & Sons Inc., 1998.
24. Kimball R., Ross M. The Data Warehouse Toolkit Second Edition, The Complete Guide to Dimensional Modeling. — New York: John Wiley & Sons, 2002.
25. Lehner W., Albrecht J., Wedekind H. Normal Forms for Multidimensional Databases. // In Proc. of 8th Int. Conf. on Statistical and Scientific Database Management (SSDBM). IEEE Computer Society, 1998.
26. Luedtke J. Implementing Slowly Changing Dimensions // SQL Magazine, February 2000.
27. Madhavan J., Bernstein, P.A., Rahm, E., Generic Schema Matching with Cupid // VLDB Magazine. 2001. - pp. 49-58.
28. Marco D. Building and Managing the Meta Data Repository: A Full Lifecycle Guide. New York: John Wiley & Sons Inc., 2000.
29. Marco D. Meta Data & Knowledge Management: Meta Data Repository Myths // DM Review. March 2002.
30. Melnik, S., Rahm, E., Bernstein, P.A. Rondo: A Programming Platform for Generic Model Management // SIGMOD. 2003. - p. 193-204.
31. Object Management Group: Common Warehouse Metamodel (CWM) Specification, version 1.0. January 2001.
32. Object Management Group: Model Driven Architecture (MDA) — A Technical Perspective. July 2001.
33. Object Management Group: Model Driven Architecture (MDA) Guide /Ed. by Joaquin Miller, Jishnu Mukerji. — 2003.
34. Object Management Group: Meta Object Facility (MOF) Specification, version 1.4.-April 2002.
35. Object Management Group: Unified Modeling Language (UML) Specification, version 1.4. September 2001.
36. Object Management Group: XML Metadata Interchange (XMI) Specification, version 1.2. January 2001.
37. Pendse N. What is OLAP? // OLAP Report. 1995. (http://www.olapreport.eom/fasmi.htm#top)
38. Poole J. etc. Common Warehouse Metamodel: An Introduction to the Standard for Data Warehouse Integration /Poole J., Chang D.,Tolbert D., Mellor D. — New York: John Willey & Sons, Inc. 2002.
39. Pottinger R., Bernstein P.A. Merging Models Based on Given Correspondences // Proceedings of 29th International Conference on Very Large Data Bases. — Germany September 9-12, 2003. Berlin: 2003, pp. 826-873.
40. Rahm E., Bernstein P. A. A Survey of Approaches to Automatic Schema Matching // VLDB Journal, 10(4). 2001. - pp. 334-350.
41. Thomsen E. OLAP Solutions: Building Multidimensional Information Systems.- New York: John Wiley & Sons Inc., 1997.
42. Vassiliadis P. Modeling Multidimensional Databases, Cubes and Cube operations. // In Int. Conf. on Scientific and Statistical Database Management (SSDBM). IEEE Computer Society, 1998.
43. Velegrakis Y., Miller R.J., Popa L. Mapping Adaptation under Evolving Schemas // Proceedings of 29th International Conference on Very Large Data Bases. Germany September 9-12, 2003. - Berlin: 2003, pp. 584-595.
44. Vetterli Th., Vaduva A., Staudt M. Metadata Standards for Data Warehousing: Open Information Model vs. Common Warehouse Model // SIGMOD Record.- 2000. vol. 29(3): pp. 68-75.
45. Warmer J., Kleppe A. The Object Constraint language: Precise Modeling with UML. MA: Addison Wesley Longman, Inc. - 1998.
46. World Wide Web Consortium: Extensible Markup Language (XML) . — December 1997.
47. World Wide Web Consortium: Extensible Markup Language (XML) 1.0 (Third Edition). W3C Recommendation . February 2004.
48. World Wide Web Consortium: RDF/XML Syntax Specification (Revised). W3C Recommendation . February 2004.
49. Архангельский Г.А. Организация времени: от личной эффективности к развитию фирмы. СПб.: Питер, 2003.
50. Архипенков С. Аналитические системы на базе Oracle Express OLAP. — М: Диалог-МИФИ. 2000.
51. Бентли Д. Жемчужины программирования. 2-е издание. / Пер. с англ. — СПб.: Питер, 2002.
52. Брукс Ф. Мифический человеко-месяц или как создаются программные системы. / Пер с англ. СПб.: Символ-Плюс, 2001.
53. Буч Г., Рамбо Дж., Джекобсон A. UML. Руководство пользователя. ДМК, 2000.
54. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++, 2-е изд./ Пер. с "англ. — М.: «Издательство Бином», СПб.: «Невский диалект», 1999 г. 560 е., ил.
55. Грейвс М. Проектирование баз данных на основе XML. Научно-популярное издание / Пер. с англ. — М: издательский дом «Вильяме». — 2002.
56. Дальви Д. и др. XML для разработчиков-профессионалов .NET / Пер. с англ., М.: ЛОРИ, 2003. 846 с.
57. Дюк В., Самойленко A. Data Mining: Учебный курс. СПб:ПИТЕР. - 2001.
58. Валиков А. Технология XSLT . СПб.: БХВ-Петербург, 2002.
59. Висков А.В., Фомин М.Б., Шовкун А.В. Моделирование хранилищ данных // XXXIX Всероссийская Научная Конференция по Проблемам
60. Математики, Информатики, Физики, Химии и Методики Преподавания Естественнонаучных дисциплин. Тезисы докладов. Математические секции. М.: РУДЫ, 2003. С. 61.
61. Висков А.В., Шовкун А.В. Математический аппарат для описания многомерных моделей данных // Инженерная физика. М.: НАУЧТЕХЛИТИЗДАТ, 2004. №4.
62. Кратчен Ф. Введение в Rational Unified Process. Второе издание / Пер. с англ. - М: издательский дом «Вильяме». - 2002.
63. Крег Л. Применение UML и шаблонов проектирования. / Пер. с англ. -М: издательский дом «Вильяме». - 2002.
64. Мартин Д. и др. XML для профессионалов / Пер. с англ., М.: ЛОРИ, 2001.- 864 с.
65. Мацяшек Л.А. Анализ требований и проектирование систем. Разработка информационных систем с использованием UML. / Пер. с англ. М.: Издательский дом «Вильяме», 2002.
66. Михайлов С. КИАС: слагаемые успеха при создании и внедрении // СЮ руководитель информационной службы. Апрель 2004. - № 4(25). - С. 6871.
67. Наумов Е.В., Шовкун А.В. Создание ситуационного центра как задача системной интеграции // Сетевой журнал. — М: Издательский дом мировой периодики, 2004. №9 (53). . с. 46-50.
68. Нефедов В.Н., Осипова В.А. Курс дискретной математики: Учеб. Пособие.- М.: Изд-во МАИ, 1992.
69. Новиков Ф.А. Дискретная математика для программистов. СПб.: Питер, 2002.
70. Розенберг Д., Скотт К. Применение объектного моделирования с использованием UML и анализ прецедентов / Пер. с англ. — М: ДМК Пресс.-2002.
71. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. том 1. - издательский дом «Вильяме», 2001.
72. Урман С. Oracle 8i Новые возможности программирования на языке PL/SQL./ Пер. с англ. М.: Издательство «ЛОРИ». - 2001.
73. Фаулер М. Архитектура корпоративных программных приложений. / Пер. с англ. М.: Издательский дом «Вильяме», 2004.
74. Хрусталёв Е. М. Агрегация данных в OLAP-кубах. // Алеф Консалтинг & Софт. http://www.olap.ru/home/mut.asp, 2003.
75. Худякова А.Н., Шовкун А.В. Интеграция Oracle 9i OLAP Option и BusinessObjects // Oracle Magazine Русская Редакция . сентябрь-октябрь 2004.
76. Шаллоуей А., Тротт Д.Р. Шаблоны проектирования. Новый подход к объектно-ориентированному анализу и проектированию. / Пер с англ. — М.: Издательский дом «Вильяме», 2002.
77. Шовкун А.В., Дельцов В.В. Создание корпоративного хранилища данных в условиях постоянно изменяющегося бизнеса // XLVII научная конференция Московского физико-технического института. Труды конференции. - Т.2. - М.: МФТИ, 2004. - С. 82.
78. Шовкун А.В. Обзор способов и средств для предоставления OLAP-отчетов в WEB // Науч. сессия МИФИ-2001 Сб. науч. трудов. Т.2. М.: МИФИ, 2001.
79. Шовкун А.В., Соколов М.В. Современные способы представления метаданных // Науч. сессия МИФИ-2003 Сб. науч. трудов. Т.2. М.: МИФИ, 2003. С. 70-71.
80. Шовкун А.В. Классификация метаданных для хранилища данных // Естественные и технические науки. — М.: Спутник+, 2004. №4. - С. 229-234.-ISSN 1684-262
81. Шовкун А.В. Конфедеративное управление метаданными в хранилищах данных // Естественные и технические науки. М: Спутник+, 2004. - №4. -С. 229-234. - ISSN 1684-262
82. Шовкун А.В. Построение корпоративной информационно-аналитической системы в условиях постоянно изменяющегося бизнеса // Научно-техническая информация. Серия 1. — М.:ВИНИТИ, 2004. №9. — С. 1-6
83. Шовкун А.В. Технология построения репозитория метаданных для хранилища данных // Науч. сессия МИФИ-2003 Сб. науч. трудов. Т.2. М.: МИФИ, 2003. С. 76-77.
84. Шовкун А.В. Управление метаданными в хранилищах данных // Научно-техническая информация. Серия 1. -М.:ВИНИТИ, 2004. №10. — С. 8-14
85. Эккель Б. Философия Java. Библиотека программиста / Пер. с англ. — СПб: Питер, 2001.
86. Энсор Д., Стивенсон Й. Oracle. Проектирование баз данных / Пер. с англ. К.: Издательская группа BHV, 2000. - 560 с.
87. Эпплман Д. Переход на VB .NET: Стратегии, концепции, код. / Пер. с англ. СПб.: Питер, 2002.ог-г/тз 77 2,
88. МОСКОВСКИЙ ИНЖЕНЕИЮ-ФИЗИЧЕСКИЙ ИНСТИТУТ (ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ)1. На правах рукописи
89. Шовкун Алексей Владимирович
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.