Проектирование аналитических баз данных корпоративных информационных систем тема диссертации и автореферата по ВАК РФ 08.00.13, кандидат экономических наук Скачкова, Виктория Валерьевна
- Специальность ВАК РФ08.00.13
- Количество страниц 172
Оглавление диссертации кандидат экономических наук Скачкова, Виктория Валерьевна
Введение.
1 Проблемы создания АнБД КИС в экономике.
1.1 Концепции КИС.
1.1.1 Функциональная архитектура КИС.
1.1.2 Информационные технологии для решения аналитических задач.
1.2 Проблемы организации данных для решения аналитических задач.
1.2.1 Программное обеспечение для решения аналитических задач
1.2.2 Характеристики информационной базы для аналитических задач.
1.2.3 Архитектура АнБД.
1.2.4 Методология проектирования АнБД.
Выводы.
2 Анализ и синтез аналитической БД.
2.1 Структурные единицы информации АнБД.
2.1.1 Структура информации.
2.1.2 Структурные единицы аналитической информации.
2.2 Информационные технологии создания АнБД.
2.2.1 Схема формирования АнБД.
2.2.2 Критерии синтеза оптимальной информационной структуры АнБ.
2.3 Проектирование АнБД.
2.3.1 Спецификация требований к АнБД.
2.3.2 Логическая модель АнБД.
2.4 Модель синтеза структуры АнБД.
2.4.1 Модель затрат внутренней и внешней памяти.
2.4.2 Модель затрат времени.
2.4.3 Модель стоимости использования.
2.4.4 Обобщенная модель синтеза АнБД и метод реализации.
Выводы.
3 Практическая апробация модели.
3.1 Разработка программного комплекса проектирования АнБД на основе моделей синтеза структуры АнБД.
3.2 Разработка АнБД «Продажи».
Выводы.
Рекомендованный список диссертаций по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК
Автоматизация проектирования систем оперативной аналитической обработки данных: на примере информационно-аналитических систем в энергетике1999 год, кандидат технических наук Щавелев, Леонид Вячеславович
Методы и процедуры рационализации внутримашинной базы данных на этапе логического проектирования системы обработки данных1984 год, кандидат технических наук Младинов, Николай Иванович
Разработка моделей, методов и инструментальных средств анализа и синтеза оптимальных структур баз данных в автоматизированных информационно-управляющих системах1999 год, доктор технических наук Сиротюк, Владимир Олегович
Инструментальные средства построения комплексов моделей и аналитических приложений в OLAP-технологии2006 год, кандидат технических наук Ишенин, Павел Петрович
Модели и методы повышения эффективности разработки и функционирования диалоговых распределенных информационных систем в сфере образования2002 год, доктор технических наук Волков, Андрей Евгеньевич
Введение диссертации (часть автореферата) на тему «Проектирование аналитических баз данных корпоративных информационных систем»
Тенденция современного бизнеса заключается в выдвижении на первый план технологий «информационной аналитики». Информационная аналитика выполняет качественно новую задачу содержательного преобразования информации, функционально пересекаясь в этом плане с управленческой деятельностью (разработка вариантов решений, сценариев).
В соответствии с этим в корпоративных информационных систем (КИС) возрастает роль задач, связанных с подготовкой и принятием решений на различных уровнях управления. В КИС появляется новый класс «аналитических задач», для реализации которых необходима особая информационно-технологическая среда обработки данных.
Информационная база КИС для аналитических задач должна обеспечивать хранение больших объемов разнородной информации и обработку данных в сжатые сроки с использованием инструментов анализа, базирующихся на статистических и математических методах.
Операционные базы данных (ОБД) КИС, хранящие оперативные и детальные данные о хозяйственных процессах, не удовлетворяют требованиям эффективной реализации аналитических задач. На накопление агрегированных данных о деятельности предприятия за длительный период времени для целей аналитической обработки ориентирована новая информационная технология «хранилищ данных» (ХД или Data Warehouse, DW).
Совершенствование программных средств анализа данных — On Line Analytical Processing (OLAP) и внедрение их в состав большинства КИС требует развития концепции ХД для поддержки аналитических задач
Аналитическая база данных (АнБД) рассматривается как особым образом структурированное ХД, обладающее следующими характеристиками:
• предметная ориентация информации на решение аналитических задач;
• интеграция данных из различных источников (ОБД, ХД);
• многомерное представление данных;
• возможность обновления и модификации структуры данных АнБД.
Целью работы является разработка экономико-математических моделей и методик проектирования АнБД оптимальной структуры с учетом экономических критериев функционирования КИС, специфики аналитических задач; разработка инструментария реализации моделей синтеза структуры АнБД. В этом направлении решались следующие задачи:
1. Определение терминов структурных единиц информации АнБД.
2. Разработка комплекса моделей для проектирования структуры АнБД:
• обоснование критериев и ограничений синтеза оптимальной структуры;
• создание комплекса взаимосвязанных моделей синтеза АнБД.
3. Разработка информационной технологии проектирования структуры АнБД:
• выбор программных средств описания параметров модели (метабазы процесса проектирования);
• выбор математического аппарата реализации модели синтеза структуры; разработка архитектуры программного комплекса автоматизации синтеза структуры АнБД.
Похожие диссертационные работы по специальности «Математические и инструментальные методы экономики», 08.00.13 шифр ВАК
Модели и методы проектирования информационно-управляющих систем реального времени долговременных орбитальных станций: На примере МКС "Альфа"2000 год, доктор технических наук Микрин, Евгений Анатольевич
Модели и методы автоматизированного проектирования информационных систем со сложно структурированными графическими данными2005 год, кандидат технических наук Смирнов, Сергей Владимирович
Теория системной интеграции специализированных обеспечений САПР для сред поддержки открытого образования2003 год, доктор технических наук Сидоркина, Ирина Геннадьевна
Разработка интеллектуальных компонентов информационных систем предприятий2000 год, доктор технических наук Пятковский, Олег Иванович
Исследование и разработка моделей распределенных баз данных информационных систем корпоративного типа2002 год, кандидат технических наук Силин, Андрей Владимирович
Заключение диссертации по теме «Математические и инструментальные методы экономики», Скачкова, Виктория Валерьевна
Выводы.
1. В соответствии с предложенной методикой проектирования и комплексом моделей синтеза оптимальной структуры аналитической БД был разработан программный комплекс «Проектирование АнБД», обеспечивающий ввод и накопление информации для проектирования, анализ технико-экономических параметров АнБД, формирование предложений по выбору исходных показателей, варианту реализации аналитических показателей в рамках заданных требований. Использование данного комплекса позволяет: унифицировать процесс проектирования АнБД, накапливать информацию по проектированию АнБД в метабазе проектирования, применять разные критерии синтеза АнБД (стоимость использования, время получения данных, расход машинных ресурсов), ограничения. Есть возможность применять критерии как персонально для аналитического показателя, так и для АнБД в целом, сократить время разработки АнБД
4 Заключение.
В диссертационной работе получены следующие основные научные и практические результаты:
1. Определена аналитическая база данных как предметно-ориентированное, интегрированное, собрание данных, представленное как многомерные структуры и предназначенное для решения аналитических задач. Дана терминология аналитических баз данных в терминах структурных единиц информации. Проанализирована технология создания АнБД как проекция от оперативной БД и (или) хранилища данных.
2. В качестве критериев синтеза оптимальной информационной структуры АнБД обоснованы критерии экономического характера: полнота функций аналитической обработки, стоимость владения, время получения данных, расход машинных ресурсов для АнБД.
3. Предложена методика проектирования аналитических информационных структур, базирующаяся на объектном подходе. Показана последовательность этапов проектирования, описаны классы объектов КИС для разработка АнБД, построена диаграмма классов.
4. Предложена модель синтеза аналитической базы данных, которая включает: модель затрат времени, модель затрат машинных ресурсов, модель стоимости использования. Особенностью является отсутствие определенного критерия для оптимизации. Приоритеты критериев оценки могу устанавливаться как для всей АнБД, так и персонально по показателям в зависимости от функционального назначения АнБД и ресурсов корпорации.
5. В соответствии с предложенной методикой проектирования и комплексом моделей синтеза оптимальной структуры аналитической БД был разработан программный комплекс «Проектирование АнБД», который был опробован при разработке АнБД для анализа продаж.
6. Методы, модели и средства проектирования, описанные в работе , в целом представляют собой методический и математический аппарат для формализации анализа и синтеза информационных структур корпоративных аналитических баз данных. Универсальность разработанных моделей, алгоритмов и программ позволяют использовать их как в комплексе, так и отдельно для поддержки принятия решения при создании структур аналитических БД различного назначения. Использование материалов данной работы при проектировании структур АнБД позволяет:
6.1. повысить эффективность использования информационных аналитических ресурсов за счет выбора оптимальных структур, вариантов реализации, размещения массивов показателей,
6.2.повысить эффективность разработки корпоративных аналитических БД за счет возможности координации работ на основании накопления полной информации в метабазе проектирования и автоматизации процессов проектирования,
6.3.получить объективную оценку разработанных аналитических баз данных в смысле оптимальности их структуры, варианта реализации и размещения данных.
Глоссарий
CASE (Computer Aided System Engineering)-средства - средства автоматизации проектирования информационных систем.
OLAP (On-Line Analytical Processing) - технология работа с базами данных, ориентированная на обработку произвольных, заранее не регламентированных запросов больших массивов распределенных данных, организованных в виде многомерных баз данных под управлением СУБД для поддержки принятия решения. Данные OLAP представлены в виде иерархии, для их хранения используются кубы.
База данных - определенным образом организованные структуры взаимосвязанных данных, предназначенные для накопления данных для дальнейшего преобразования в целях поддержки управленческих функций.
Автономная реализация - является наполненной структурой агрегированных данных. Обновляется данными из хранилища по специальным процедурам, по необходимости.
Виртуальная реализация - в его основе - метаданные, которые описывают источники информации (оперативные БД, внешние данные и др.), SQL-запросы для их считывания и процедуры обработки и предоставления информации. Создается как бы «скелет» хранилища, где есть информация откуда брать данные, что с ними делать, как представить, но самих данных нет.
Время актуальности - период, в течении которого данный аналитический показатель актуален (определяется в результате анализа).
Время потребности - определяет периодичность обращения пользователя к данной структуре
Географическая зона— группа пользователей, расположенных рядом и связанных локальной сетью.
Измерения АнБД - - реквизиты-признаки аналитического показателя, используемые для классификации (упорядочивания, разбиения на группы) и обобщения значений показателей АнБД
Кардинальность отношения — массив значений показателя
Корпоративная информационная система (КИС)- совокупность методов и средств для сбора и регистрации данных, их организации, преобразования и хранения, преобразования и использования массивов информации в целях успешного управления корпорацией; охватывающая различные стороны процессов управления на всех уровнях.
Куб - структура данных OLAP, включает в себя измерения и параметры.
Операционные БД - БД, созданные в расчете на решение конкретных регламентированных задач рутинной обработки данных. Основным источником информации чаще всего являются первичные документы; находятся на управляемых уровнях.
Параметр - реквизит-основание, расчетное значение, характеризующее хозяйственные операции. Расчет параметра происходит на основе одной из статистических функций.
Подсхема - описание данных, которые использует конкретный пользователь.
Показатель — является минимальной структурой данных, , имеющей самостоятельное значение, не содержащая вложенных СЕИ.
Показатель АнБД — показатель, содержащий итоговое (статистическое) значение реквизитов-оснований в заданных измерениях
Полная стоимость владения (Total Cost of Ownership) АнБД — полная стоимость создания и ведения АнБД за определенный интервал времени
Реквизит-основание (Ro) дает количественную характеристику объекта, и имеет, как правило, числовое представление, являющиеся результатом расчетов или непосредственного наблюдения, счета
Реквизиты-признаки (Rp) дают качественную характеристику объект и имеют, как правило, символьное (текстовое) представление.
Синтез структуры аналитической базы данных — организация объектов АнБД на машинных носителях по географическим зонам корпорации
Составная единица информации (СЕИ) — логически взаимосвязанная совокупность реквизитов и других СЕИ.
Схема БД - описание логической структуры БД. Содержит имена объектов и их атрибуты, определяет существующую между ними связь
Схема данных СЕИ - отражает состав реквизитов и их объединение в логически связанные совокупности на определенном уровне иерархии.
Узел БД - территориально независимая система накопителей, где размещается отдельный фрагмент оперативной БД.
Список литературы диссертационного исследования кандидат экономических наук Скачкова, Виктория Валерьевна, 2002 год
1. А. А. Сахаров. Концепции построения и реализации информационных систем, ориентированных на анализ данных — М: СУБД N4. 1996 — с. 55-70.
2. Ансофф И. Новая корпоративная стратегия. — СПб: Питер, 1999.— 416с.
3. Базы данных: достижения и перспективы на пороге 21-го столетия/ Под ред. А. Зильбершатца, М. Стоунбрейкера, Д. Ульмана. СУБД, 1996, N 3, с. 103-117.
4. Басалыга В.И., Левкович О.А., Мелких Е.Г., Яссюкевич Т.А. Ведение оперативного учета в среде программного комплекса Галактика. Минск: Топ Софт Сервис — 1997с.
5. Бовыкин В.И. Новый менеджмент. Управление предприятием на уровне высших стандартов. Теория и практика эффективного управления. М.: Экономика, 1997. — 366с.
6. Бугорский В.Н., Сококлов Р.В. Экономика и проектирование информационных систем. —СПб: РИФ Роза ветров, 1998. —386с.
7. Вендров. A.M. CASE-технологии. Современные методы и средства проектирования информационных систем. — М.: Финансы и статистика, 1998, 176 с
8. Ю.Вентцель Е.С. Исследование операций. — М: Сов. Радио, 1972.— 552с.
9. Вентцель Е.С. Теория вероятностей. — М: Наука, 1969.— 576с.
10. Гради Буч. Объектно-ориентированный анализ и проектирование. С примерами приложений на С++. 2 -е изд. М.: Бином и СПб :Невский диалект, 1998, 560 с. Пер. с англ.
11. Гук М. Аппаратные средства IBM PC. СПб.: Питер, 1999. — 928 с.
12. Дейт, К.Дж. Введение в системы баз данных: Пер. с англ. — 6-е изд. — К: Диалектика, 1998. — 784с.
13. Дьяконов В. Mathcad 8/2000. Специальный справочник. СПб.: Питер, 2000. — 595 с.
14. Ильина О.П. Информационные технологии бухгалтерского учета : Учеб-ник.-СПб.: Питер, 2001.-684с.
15. Исследование операций в экономике: Учебн. пособие для вузов/ Под ред. проф. Н.Ш. Кремера. — М.: Банки и биржи, ЮНИТИ, 1997, 407 с.
16. Как работать над терминологией. Основы и методы КНТТ АН СССР. — М.: Наука, 1968. —76 с.
17. Калянов Г.Н. CASE. Структурный системный анализ (автоматизация и применение). — М.: Лори, 1996, —180с.
18. Корнеев В.В., Горев А.Ф., Васютин С.В., Базы данных. Интеллектуальная обработка информации. — М.: Нолидж, 2000. — 352с.
19. Короткое Э.М. Исследование систем управления. — М.: ООО Издатель-ско-консалтинговая компания ДеКА, 2000,288с.
20. Корпоарция SAP AG. Корпоративные решения, http://www.sap.com
21. Корпорация Парус. Корпоративные решения, http://www.parus.ru
22. Курейчик В.М. Математическое обеспечение конструкторского и технологического проектирования с применением САПР. — М: Радио и связь, 1990, 352 с.
23. Львов В.В. Создание систем поддержки принятия решений на основе хранилищ данных. — СУБД. 1997,- N 3. - с. 30-40.
24. Маклаков С.В. BPwin, ERwin. CASE-средства разработки информационных систем. — Москва: Диалог-Мифи, 1999. —295с.
25. Мартин Дж. Организация баз данных в вычислительных системах. . — М: Мир, 1980, 662с.
26. Лиходедов Н.П.,. Товстых Л.Е Информационные ресурсы для бизнеса.-СПб.: ЭЛБИ, 1998. 402с.
27. Новоженов Ю.В. Объектно-ориентированные технологии разработки сложных программных систем. — М.: Аргуссофт компани, 1996, 115 с.
28. ЗО.Ойхман Е.Г., Попов Э.М. Реинжиниринг бизнеса: реинжиниринг организаций и информационные технологии. — М: Финансы и статистика, 1997, —333с.31.0лифер В.Г., Олифер Н.А. Компьютерные сети. Принципы, технологии,протоколы. СПб.: Питер, 1998. — 672. —
29. Педерсен Т., Иенсен К. Технология многомерных баз данных. Открытые системы, 2002 №1 http://www.olap.ru
30. Пендс Н. Что относится к OLAP, перевод Ш. Абушаева The OLAP Report 18 января 1999г. http://www.olap.ru
31. Предприятие: стратегии, структура, положения об отделах и службах, должностные инструкции./ Волкова К.А., Дожкина И.П., Казакова Ф.К., Сергеева М.А. — М.: Экономика: Норма, 1997 — 525 с.
32. Романовский И.В. Алгоритмы решения экстремальных задач. — М: Наука, 1977, 352с.
33. Саати К., Керне К. Аналитическое планирование. Организация систем. — М.: Радио и связь, 1991.— 226с.
34. Сергеев В.И. Менджемент в бизне-логистике. М.:Филинъ, 1997 — 772с.
35. Система R/3®. Описание функций. — Germany, Walldorf: SAP AG Представительство в Москве, 1998-2000, — 250с.
36. Система Галактика. Принципы, решаемые задачи, отраслевые решения. http://www.galaktika.ru
37. Сляднева Н.А. Информационно-аналитическая деятельность: проблемы и перспективы. — М.: Факт №6, 2001. — с.25-34
38. Спивак В.А. Корпоративная культура. Ключевые вопросы. СПб.: Питер, 2001. —352 с.
39. Спирли Э. Корпоративные хранилища данных. Планирование, разработка, реализация. М.: Вильяме, 2001 — 400с.
40. Тихомиров Ю.В. Microsoft SQL Server 7.0: разработка приложений. — СПб.: БХВ — Санкт-Петербург, 1999, 352с.
41. Уткин Э.А. Управление фирмой. М.: АКАЛИС, 1996. — 516с.
42. Федоров А., Елманова Н, Введение в OLAP. — М.: КомпьютерПресс № 4-12, 2001.
43. Холл М. Комбинаторика. — М: Мир, 1970, 424с.
44. Хорнгрен Ч. Т., Фостер Дж. Бухгалтерский учет: управленческий аспект: Пер. с англ./Под ред. Я.В. Соколова.— М.: Финансы и статистика, 1995. — 416с.
45. Хорошевский В.Ф., Гаврилова Т.А. Базы знаний интеллектуальных систем. СПб.: Питер, 2001. — 384 с.
46. Ху Т. Целочисленное программирование и потоки в сетях. . — М: Мир, 1974, 520с.
47. Шаймарданов Р.Б. Моделирование и автоматизация проектирования структур баз данных. — М.: Радио и связь, 1984, 120 с.51 .Шапот М. Интеллектуальный анализ данных в системах поддержки решений. Открытые системы № 1, 1998 с.30-35
48. Шикин Е. В., Чхартишвили А. Г. Математические методы и модели в управлении. М: Дело, 2000.— 440.
49. Шуленин А. Масштабируемость аналитических систем. Windows 2000 Magazine, 2002, № 1 с.78-88
50. Щавелев Л.В. Способы аналитической обработки данных для поддержки принятия решений. М.: — СУБД. 1998,- N 4-5. - с. 25-34.
51. Якубайтис Э.А., Информационные сети и системы. Справочная книга. — М.: Финансы и статистика, 1996. —367с.
52. Смирнов Г.Н., Сорокин А.А., Тельнов Ю.Ф. Проектирование экономических информационных систем. — М.: Финансы и статистика, 2001. — 510с.
53. Adelman S., Terpeluk L. Moss Data Warehouse Project Management. — Addison Wesley Professional, 200.— 448p.
54. Ballard C, Herreman D, Data Modeling Techniques for Data Warehousing, ITSO, 1999, p.200
55. Inmon, W. H., Building the Data Warehouse. — Prentice Hall, 1992, p. 640.
56. Kimball R. The Data Warehouse Toolkit : Practical Techniques for Building Dimensional Data Warehouses. — John Wiley & Sons, 1996. — 416p.61 .Managing the dynamic small firm, /reading by Lawrence A. Klatt — Belmont: Wadsworth, 1971 —359p.
57. Tewari S. Optimizing Cube Performance with OLAP Services. SQL Server Magazine, September 2000 http://www.sqlmag.com/Articles/ In-dex.cfm?ArticleID=9140.1. Указатель таблиц
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.