Модели и методы проектирования программных аналитических комплексов с декартово замкнутой категорией тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат наук Родионова Людмила Евгеньевна

  • Родионова Людмила Евгеньевна
  • кандидат науккандидат наук
  • 2019, ФГБОУ ВО «Уфимский государственный авиационный технический университет»
  • Специальность ВАК РФ05.13.11
  • Количество страниц 140
Родионова Людмила Евгеньевна. Модели и методы проектирования программных аналитических комплексов с декартово замкнутой категорией: дис. кандидат наук: 05.13.11 - Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей. ФГБОУ ВО «Уфимский государственный авиационный технический университет». 2019. 140 с.

Оглавление диссертации кандидат наук Родионова Людмила Евгеньевна

Выводы по главе

Глава 2 Разработка математического теоретико-множественного метода для отображения функционального взаимодействия программных систем

2.1 Разработка математического теоретико-множественного метода моделирования процессов для проектирования программного аналитического комплекса

2.2 Теоретико-множественная модель процесса соглашения

2.3 Применение метода динамического программирования

в теории топосов

Выводы по главе

Глава 3 Формальная модель процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией

3.1 Формирование схемы отображения категорий объектов

3.2 Формирование теоретико-множественной модели стадии применения жизненного цикла (на примере управления кадровым резервом)

3.3 Представление структуры программного аналитического комплекса

на основе знаний предметной области в виде семантической сети

Выводы по главе

Глава 4 Прототип программного аналитического комплекса на основе математического теоретико-множественного метода функционального взаимодействия программных систем

4.1 Разработка структуры программного аналитического комплекса

4.2 Структура мандатного управления доступом в программного аналитического комплекса

4.3 Требования к системной и аппаратной части программного аналитического комплекса

4.4 Примеры реализации модуля интеграции программного аналитического комплекса

4.5 Анализ оценки результатов исследований на основе предложенного математического теоретико-множественного метода

Выводы по главе

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЕ

Используемые сокращения и условные обозначения

БД - база данных БЗ - база знаний

ВХД - виртуальные хранилища данных

ЖЦ - жизненный цикл

ИО - информационный объект

ИК - интеллектуальный контент

ИС - информационная система

ЛПР - лицо, принимающее решение

ПАК - программный аналитический комплекс

ПО - предметная область

ПС - программная система

СУБД - Система управления базами данных

ХД - хранилище данных

ISO - International Organization for Standardization HOLAP - Hybrid Online Analytical Processing MVC - Model-View-Controller

MOLAP - Multidimensional Online Analytical Processing

OLAP - Online Analytical Processing

OLTP - Online Transaction Processing

ROLAP - Relational Online Analytical Processing

Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Введение диссертации (часть автореферата) на тему «Модели и методы проектирования программных аналитических комплексов с декартово замкнутой категорией»

ВВЕДЕНИЕ Актуальность темы исследования

В настоящее время, в соответствии с концепцией «Индустрия 4.0», современные предприятия стремятся применять цифровое производство, внедряя умные технологии. Управление происходит на основе знаний, держателями которых являются как университеты, так и предприятия; соединение таких знаний в итоге приводит к созданию образовательно-производственной структуры [85, 95, 96].

\ \ Й / \\ //

/# /1 // * ?Л 8 \\\ " \ \ а \ « Ф \ а % \ % о \ о, \ \ / / Я /£ * 1 Мм Щё % Ш\Л % \ £ /а. чг / & т /// "3 § // А Ч

Рисунок 1.1 - Концепция «Индустрия 4.0»

На рисунке 1.1 представлена концепция «Индустрия 4.0», которая разделяется на три составляющих: цифровизацию и интеграцию виртуальных цепочек оценки стоимости, цифровизацию продуктов и услуг, цифровые бизнес-модели и доступ клиентов. Проводя дальнейшую детализацию, приходим к совокупности следующих составляющих: большие данные; технологии искусственного интеллекта; а так же системы распределенного реестра;

современные производственные технологии; квантовые вычисления; индустриальный интернет; элементы робототехники и сенсорика; технологии беспроводной связи; технологии дополненной и виртуальной реальности. Проводя их кластеризацию и классификацию, приходим к выделению девяти направлений, связанных между собой отношениями [85].

Промышленными предприятиями накоплен достаточно большой объем данных, разнородных и зачастую плохо формализованных. Появилась проблема их использования, т.н. проблема Big Data.

В широком смысле под Big Data понимается сбор, хранение, анализ, передача, визуализация, обновление структурированных, неструктурированных и полуструктурированных данных, характеризующихся большим объемом [105].

При этом совокупность отношений может быть рассмотрена в виде дополнительных объектов Big Data. Рассматривая эволюцию развития концепции от «Индустрия 1.0» до «Индустрия 4.0», можем выделить некоторые аспекты:

- «Индустрия 1.0» - развитие паровых двигателей, механических ткацких станков;

- «Индустрия 2.0» - электрическая энергия, поточное производство, разделение труда;

- «Индустрия 3.0» - автоматизация и роботехника;

- «Индустрия 4.0» - киберфизические системы, соединение реальных объектов с информационными процессами или виртуальными объектами через информационные сети и интернет [85]. Более того, «Индустрия 4.0» предполагает цифровизацию и интеграцию процессов по вертикали, начиная с разработки (продуктов или закупок) и заканчивая организацией логистики и обслуживания, а интеграция по горизонтали включает и поставщиков, и потребителей.

Возникает интерес к использованию аналитики больших данных, категории информационных объектов - программных модулей, обеспечивающих реализацию соединения реальных и виртуальных объектов с информационными процессами с учетом их взаимных отношений в программном аналитическом комплексе (ПАК). Все это может быть также добавлено к проблемам Big Data.

Таким образом, объекты учета Big Data могут быть представлены различными категориями объектов, связанных между собой отношениями, существуют задачи их категоризации и кластеризации.

Рассматривая отношения между информационными объектами, выделяя виртуальные и реальные объекты, приходим к нахождению возможности построения символьной модели хранилища данных. Получаем отношения между виртуальными объектами и реальными объектами, которые выражаются символьной моделью хранилища данных и определяют структуру; отношения представлены в терминах теории категорий.

Представление знаний об исследуемой предметной области позволяет применять формализованные формальные логические свойства, графоаналитические метаязыки и правила для разработки и проектирования программных аналитических комплексов.

Метод построения иерархий Хомского на базе категорийного подхода с применением математических теоретико-множественных моделей, с использованием требований системной инженерии позволяет сформировать границы между семантическими и синтаксическими описаниями процессов исследуемой предметной области и функциональными модулями программного аналитического комплекса [1 - 5]. При этом формирование семантической модели смещается в область формализации логических отношений. Применяя системный подход для определения границ исследуемой предметной области, определяем цель (семантическая мера), далее точку зрения (рисунок 1.2). Очевидно, что происходит сужение предметной области. Далее определяем функциональное содержание предметной области (контекстная диаграмма), при этом взаимодействие с внешней средой происходит через вход, выход, управление (ограничения) и механизм (ресурсы) (рисунок 1.2).

Согласно классификации формальных грамматик Н. Хомского приходим к возможности классификации систем на четыре уровня [42, 88]:

0 - общая система (неограниченная);

1 - описание системы на метаязыке (контекстно-зависимая);

2 - расширяет понятие семантики, показывая взаимодействие с внешней средой, система моделируется и создается с помощью case-средств и высокоуровневых языков программирования (контекстно-свободная);

3 - полностью формализованная система, которая применяется при создании компиляторов низкого уровня, прописан синтаксис, но семантика простая, описывается набором слов и отношением между этими словами (автоматная).

Определим отношение как математическую структуру, которая формально определяет свойства различных объектов и их взаимосвязи (т.е. как подмножество декартова произведения). Используя метод «синтаксически-ориентированной трансляции», базирующийся на разработках Н. Хомского [88], можем уйти от проблемы семантического анализа путем введения двух шаговой процедуры и переходом к синтаксическому анализу: сначала - распознать структуру, затем -построить выходные действия на ее основе. И в результате приходим к математическому методу анализа предметной области (он основывается на определении некоторого конечного перечня цепочек и их рассмотрении). В дальнейшем открывается возможность представления информационной системы

в виде конечного множества функций и отношений между ними (т.е. можем рассматривать отношения в виде функций независимо от соответствующих объектов). В результате приходим к атрибутивно транслируемой грамматике [2, 4, 88].

Следовательно, для отображения знаний в рассматриваемой предметной области (системное моделирование) используются математически-формализованные правила и могут быть применены какие-либо графоаналитические языки, предназначенные для описания объектов (объектные языки). При этом формальные логические свойства таких метаязыков соответствуют следующим положениям [88]:

1. Не противоречат положениям теории категорий и теории множеств.

2. Требованиям, предъявляемым к грамматикам Н. Хомского (не выше второго уровня).

Для проведения количественной и качественной оценки отношений между информационными объектами применяется метод семантических дифференциалов Ч. Осгуда, который показывает, что отношения между реальными объектами, связаны отношением отрицания (противоположность по Декарту), а виртуальные объекты являются частными определениями в терминологии квадрата Декарта [88].

Таким образом, можем говорить о том, что отношения двух объектов в ряде случаев могут быть представлены в виде нового объекта, который может быть либо реальным, либо виртуальным.

Виртуальный объект - это объект, полученный в результате отношений, достраиваемый до декартово замкнутой категории, которой также не противоречит необходимому разнообразию У. Эшби.

При грамотном аналитическом извлечении этих данных появляется возможность строить стратегические планы развития предприятия, оперативно принимать управленческие решения. Принцип обеспечения «электронной» прозрачности в организационно-экономическом, правовом и многих других аспектах для образовательно-производственных систем во многом реализован.

Расширяется возможность обеспечения «электронной» прозрачности и в управленческих, и технологических, и других аспектах, т. е. такие организации приобретают свойства открытых или полуоткрытых.

Технически это обеспечивается, прежде всего, разработкой и применением программных аналитических комплексов (ПАК), создаваемых на основе унифицированных математических и программных средств. Таким образом, в структуру создаваемого ПАК может быть включена информация, которая в дальнейшем обеспечит возможность проведения реинжиниринга, например, путем замены виртуальных объектов реальными с сохранением действующих отношений. Рассмотрение данного было произведено на примерах ПАК: управления кадровым резервом предприятия; управления технологическими и производственными процессами нефтегазовой отрасли, управления учебным процессом.

Сегодня особое внимание уделяется программным аналитическим комплексам с элементами интеллектуального управления, способных не только генерировать регламентные сведения и отчеты, но и предоставлять возможность глубокой аналитической работы лиц, принимающих решения (ЛПР).

Таким образом, становится актуальным проектирование и разработка программных аналитических комплексов (ПАК), которые могут быть использованы крупными компаниями, решающими задачи управления персоналом, кадровым резервом, показатели которых в большей степени определяют критерии эффективности.

Следующая проблема исследования - формализация и идентификация информационных объектов и поддержание их соответствия реальным объектам исследуемой предметной области, а также соответствие прослеживаемости информационных и реальных объектов параметров для базы знаний ПАК. Для определения реальных объектов, соответствия их информационным объектам и прослеживаемости на абстрактном уровне исследуемых образовательных производственных систем применим понятия и правила стандарта ISO/IEC/IEEE 15288.

Возьмем за основу определение, что категория А называется декартово замкнутой, если она удовлетворяет трем условиям:

- в категории А имеется объект I, обладающий свойством: «для V объекта В в категории А 3 единственный морфизм I ^ В » [58];

- любые два объекта В, С в категории А имеют произведение В ® С;

- любые два объекта С, Б в категории А имеют декартово замкнутую

категорию Бс.

Отсюда можем заключить, что положения стандарта КОЛЕСЛЕЕЕ 15288 полностью отвечают понятиям декартово замкнутой категории.

Основная задача проектирования ПАК при декомпозиции абстрактного уровня заключается в обеспечении замкнутости на нижних уровнях. Это будет соответствовать законам логики высказывания Аристотеля и формальной логики первого порядка. В этом случае будут исключены логические противоречия при решении задач идентифицируемости и прослеживаемости информационных объектов.

Формальная система - это совокупность следующих компонентов [34, 83]:

ФС = (G, Я, в),

где

ФС - формальная система;

G - множество базовых элементов;

Я - совокупность правил (предикаты на множестве базовых элементов);

О - множество операций (синтаксические правила построения слов и формул - алгебра).

Формальная система отличается свойством автономности, если организовать формальную систему, то она самостоятельно начнет формировать выводы, которые будут определяться на основании правил и множества операций, таким образом, если О - пустое множество, то формальная система вырождается в системную модель (СМ). Если Я(о) является пустым множеством, то получаем формальную алгебру [18, 34, 43, 83].

Под системной моделью будем понимать организационно-функциональную систему, включающую множество информационных объектов: в структурном, информационном, семантическом, лингвистическом, математическом и других представлениях [43].

Если предикатное множество определено логикой высказываний или формальной логикой первого порядка и оно будет декартово замкнуто, то данная модель будет непротиворечива по структуре относительно логики первого порядка, т.к. помимо формальной логики имеет место логика второго порядка, или логика Гегеля. Здесь идентификаторы первого порядка в течение времени не изменяются. А при логике второго порядка информационные объекты могут меняться.

Данную теорию рассмотрим на примере проектирования и разработки ПАК управления кадровым резервом машиностроительного предприятия, управления производственными и технологическими процессами нефтегазовой отрасли и управления учебным процессом университета.

На сегодняшний день существует большое количество как российских, так и зарубежных программных систем, реализующих автоматизированную обработку информации следующих процессов: по управлению кадровым резервом, включающих модули «Кадровый резерв». Лидерами таких систем являются: SAPERPHCM, OracleHRMS, «Галактика ERP: Контур управления персоналом», «1С: Зарплата и управление персоналом 8», «БОСС-Кадровик, Компас: Управление персоналом», «RB HR & Payroll - управление кадрами и зарплата» и другие.

Для автоматизации производственных и технологических процессов применяются программные средства, такие как ИС «ОКО», ПС «ЕСРФ», НПК «Альфа».

Для управления учебным процессом ВУЗа: web-портал кафедры АСУ, «1С: Университет ПРОФ», ИС «Orgflow-ВУЗ», «Галактика. Управление Вузом», управление обучением система Moodle, LMS Blackboard Learn.

Однако большинство перечисленных программных комплексов не обладают в полном объеме свойствами аналитических систем и при решении многих задач требуют соответствующих доработок и дооснащения - интеграции со специализированными аналитическими пакетами. Все это связано с задачей реинжиниринга и потерей времени и средств. Становится актуальным проектирование и разработка программных аналитических комплексов, которые могут быть использованы большими компаниями, решающими задачи управления, показатели которых, определяют в большей степени критерии эффективности.

Степень разработанности темы исследования

Исследованием проблем формализации знаний и описания отношений на основе теории категорий, а также проектированием и реализацией архитектуры программного обеспечения занимается ряд отечественных ученых, таких как А. П. Бельтюков, С. П. Ковалев, Л. В. Массель, В. В. Антонов, В. И. Васильев, М. Б. Гузаиров, Г. Г. Куликов, В. В. Мартынов, В. В. Миронов, С. В. Павлов, А. Х. Султанов, Н. И. Юсупова.

В качестве зарубежных выделим следующих - G. L. Kovács, Р. Голдблатт, Б. Мандельброт, Дж. Захман, D. F. Salas, W. B. Powell [12, 27, 28, 52, 98, 1 - 5, 15, 21, 91, 36, 37, 39-41, 51, 54, 61, 78, 103, 19, 53, 42, 97, 99, 100,].

При решении проблем формализации знаний и описания отношений на основе теории категорий, для проектирования и реализации программного аналитического комплекса в диссертационной работе использовались результаты трудов отечественных авторов, в том числе:

в области теории математических методов проектирования информационных систем - С. П. Ковалева, в области фрактального подхода к структурированию знаний, интеллектуальных систем и систем поддержки принятия решений - Л. В. Массель, в области моделирование взаимодействия и самоорганизации в современных интерфейсах, сетях и средах, а также разработкой и проектированием математического и программного обеспечения с применением теории категорий и множеств - А. П. Бельтюкова, В. В. Антонова,

Г. Г. Куликова, в области информационных моделей данных - В. В. Миронова, в области моделирования задач интеллектуального управления сложными техническими системами, управления образовательными процессами в высшей школе - Н. И. Юсупова, в области системного анализа и проектирования многофункциональных систем автоматического управления сложными объектами, систем искусственного интеллекта - В. И. Васильев, в области моделей передачи данных - А. Х. Султанова, в области проблем управления социально-экономическими системами, качества образования - М. Б. Гузаиров, в области информационных систем и технологий, методов исследования операций применительно к задачам оптимального размещения - В. В. Мартынов, также применялись результаты трудов зарубежных исследователей: в области моделирования и методов управления качеством на основе приложений искусственного интеллекта, а также создание методологии поддержки ЖЦ различных систем, включающих управление данными - G. L. Kovács, Дж. Захмана, в области применения топосных моделей и теории категорий -Р. Голдблатта, в области методов динамического программирования - D. F. Salas, W. B. Powell.

В результате проведенного анализа определяется проблемное поле исследования - модели и методы проектирования ПАК для организации интеграции программ и программных систем, а также инструментарии их представления (последовательности применения ряда метаязыков: естественного языка, метаязыка теории множеств и категорий множеств). Структура самих моделей - вербальных, математических с различными логическими ограничениями в виде формальных графоаналитических языков высокоуровневого программирования (программирование, моделирование), языков BPMN, а также структура программирования и реализации, отвечающих требованиям кроссплатформенного программирования в средах web-порталов, интранет, интернет и др.

Решается проблема формализации задачи синонимии при идентифицируемости и прослеживаемости информационного объекта на каждом уровне соответствующего описания.

При этом под информационным объектом понимают объекты предметной области в программном аналитическом комплексе, обуславливающие его атрибуты, структуру, ограничения целостности и поведение.

Таким образом, применение теории множеств и категорий рассматривается как один из способов формализации этих подходов.

Объект и предмет исследования

Объект исследования процессы проектирования программных аналитических комплексов для проблемно-ориентированных аналитических систем и хранилищ данных и знаний.

Предметом исследования являются формальные модели и методы проектирования программных аналитических комплексов для реализации функционального взаимодействия программных систем с декартово замкнутой категорией.

Цель и задачи диссертационного исследования

Цель диссертационной работы заключается в повышении эффективности обработки разнородных данных, метаданных и знаний, их передачи и интеграции на основе разработки программного аналитического комплекса, обеспечивающего интеграцию разнородных программных систем с декартово замкнутой категорией.

Для осуществления цели определены следующие задачи исследования.

Задачи исследования

1. Разработать математический теоретико-множественный метод для отображения функционального взаимодействия программных систем, при реализации динамических свойств предметной области и процессов обработки информации (соответствует пп. 1, 3 паспорта специальности 05.13.11).

2. Разработать формальную модель процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией (соответствует п.1 паспорта специальности 05.13.11).

3. Разработать универсальную структуру и прототип ПАК для повышения эффективности обработки, передачи, интеграции данных и знаний интеллектуального контента в компьютерных сетях (соответствует пп.1, 2 паспорта специальности 05.13.11).

4. Провести оценку результатов исследований по проблеме проектирования ПАК на основе предложенного математического теоретико-множественного метода отображения функционального взаимодействия программных систем (соответствует п. 3. паспорта специальности 05.13.11).

Положения, выносимые на защиту

1. Математический теоретико-множественный метод для отображения функционального взаимодействия программных систем, основанный на применении основных положений теории категорий, позволяющий объединить в единую комплексную структуру разные категории информационных объектов.

2. Формальная модель процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией основанная на представлении программного аналитического комплекса в виде многомерной структуры с учетом потенциальных свойств виртуальных объектов, позволяющая применять поэтапный реинжиниринг программной системы.

3. Универсальная структура и прототип программного аналитического комплекса основанные на применении языков высокоуровневого программирования и моделирования, позволяющие повысить эффективность обработки и передачи разнородных данных и знаний.

4. Оценка результатов исследований по проблеме проектирования программного аналитического комплекса на основе предложенного математического теоретико-множественного метода отображения функционального взаимодействия программных систем, позволяющая оценить

показатели на примерах применения программного аналитического комплекса в исследуемых предметных областях.

Научная новизна результатов.

1. Математический теоретико-множественного метод для отображения функционального взаимодействия программных систем, отличающийся, функциональным взаимодействием программных систем и предложенной классификацией реальных и проектируемых виртуальных информационных объектов, объединенных в комплексную формальную структуру.

2. Формальная модель процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией, отличающаяся построением многомерной структуры программного комплекса с учетом потенциальных свойств виртуальных объектов.

3. Универсальная структура и прототип программного аналитического комплекса отличающийся возможностью интеграционного представления независимых объектов учета, для аналитического использования на основе предложенного метода и формальной модели предметной области, свойство которой определяются согласно методологии системной инженерии.

Теоретическая и практическая значимость работы

Теоретическая значимость работы заключается в том, что разработанная формальная модель процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией, позволяет применять многомерную матрицу, параметры которой определяются на основе категориальных отношений с применением виртуальных объектов, а также формализовать основные понятия и ограничения программного аналитического комплекса. Это расширяет возможности управления жизненным циклом создаваемой программной системы в соответствии с требованиями стандарта КОЛЕС/ШЕЕ 15288.

Практическая значимость проведенного исследования заключается в том, что на основе методов и моделей разработан прототип программного аналитического комплекса для различных предметных областей.

Методология и методы исследования

В данной диссертационной работе применялись теоретико-множественные методы, основы реляционной алгебры для организации хранилищ данных, теория категорий и теория алгоритмов, методологии моделирования и проектирования программных систем (8АОТ, БРМК и др.), методы модульного программирования. Для оценки результатов и достоверности предложенных моделей и разработанных алгоритмов были использованы данные результатов внедрения разработанного прототипа программного аналитического комплекса в исследуемых предметных областях [70].

Апробация результатов исследования

Основные теоретические положения диссертационной работы и полученные практические результаты были опубликованы и доложены: на Всероссийских научных конференциях: «Интеграция образования, науки и производства в условиях многоуровневого профессионального образования» (IV НПК с международным участием, 24 марта 2016 г., г. Кумертау), «Современные инновации в науке и технике» (VII НТК, 14 апреля 2017 г., г. Курск), «Информационные технологии поддержки принятия решений» 1ТВ8-2018 (VI научная конференция с международным участием, 28-31 мая 2018 г., г. Уфа); на Международных НПК и симпозиумах: «Достижения и инновации в науке, технологиях и медицине» (г. Пенза, 25 июля 2016 г.); на Международных симпозиумах XIX СЗ!Т-2017 (г. Карлсруэ, Баден-Баден, Германия, 8-10 октября 2017 г.) и XX С8ГГ-2018 (г. Варна, Болгария 24-26 сентября 2018 г.).

Внедрение результатов исследования

Результаты, полученные в работе внедрены в деятельность кадровой службы АО «Кумертауское авиационное производственное предприятие» в деятельность цеха добычи нефти и газа №1 Нефтегазодобывающего управления «Сургутнефть», а также в учебный процесс кафедры автоматизированных систем управления (АСУ) ФГБОУ ВО «УГАТУ» г. Уфа.

Публикации

По теме диссертации опубликовано 10 работ, из них в том числе 3 в журналах из списка ВАК - 3 работы. Имеется 4 свидетельства о государственной регистрации программы для ЭВМ: № 2019611359 «Программный аналитический комплекс с архитектурой декартово замкнутой логики», № 2018615366 «Подсистема учета данных для кадрового резерва», № 2018616289 «Программная система развития профессиональных компетенций», № 2019611218 «Интегрированный модуль программного аналитического комплекса по декартово замкнутой логике».

Личный вклад автора заключается в выполнении основного объема теоретических и экспериментальных исследований, а также в разработке структуры ПАК с применением многомерной матрицы, параметры которой определяются категориальными отношениями. Автор выполнил анализ и оформление полученных результатов диссертационной работы в виде публикаций, научных докладов, четырех свидетельств о государственной регистрации программ для ЭВМ.

Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК

Список литературы диссертационного исследования кандидат наук Родионова Людмила Евгеньевна, 2019 год

Источники данных

Внешние источники

СУБД

Электронные архивы

Хранение данных

ODS

Доставка данных (бизнес-приложения)

Аналитика и статистика

Интеллектуальный анализ

Информационные панели

Финансы

Продажи

Рисунок 1.12 - Архитектура хранилищ данных

Рассматривая основные типы хранилищ данных, выделим следующие:

- блочные;

- файловые;

- объектные.

Блочный тип организации хранения данных лежит в основе жестких дисков или магнитных лент. Суть данного типа в том, что файл разбивается на блоки одинакового размера (но без метаданных), где у каждого блока есть свой адрес. Такой тип хранения данных используется множеством приложений, а также реляционными базами данных. В сетях доступ к хостам с таким типом хранилищ используется по специальным протоколам (Fibre Channel, iSCSI или АОН).

Блочный тип хранилищ данных обеспечивает высокую производительность, т. к. не сильно нагружает процессор. В итоге такой тип хранилищ хорошо подходит для виртуализации и для работы с базами данных.

К недостаткам стоит отнести высокую стоимость и высокую сложность в управлении. Также из-за отсутствия метаданных дополнительную информацию приходится обрабатывать на уровне приложения.

В файловом типе хранилищ данных информация хранится в виде файлов и папок, организованных в иерархическую структуру. Доступ обычно предоставляется через клиентские интерфейсы по имени файла или названию каталога и т.д.

Среди преимуществ файловых хранилищ выделяют простоту. У файла есть имя, метаданные, а также определенное место в иерархии. В итоге подобные хранилища данных хорошо подходят для обработки небольших объемов данных, организовывая системы совместного использования файлов и локального архивирования.

Недостаток файлового хранилища заключается в его ограниченности, т.к. увеличивается количество хранимых папок с данными и поиск по ним становится осуществлять сложнее. В связи с изложенным использование файловых систем в большинстве крупных центрах обработки данных (DATA-центрах), нецелесообразно из-за требований в скорости поиска.

Прикреплять метаданные к объектам и агрегировать их в контейнеры позволяют большинство объектных хранилищ. Каждый объект в хранилище состоит из следующих элементов: метаданных, данных и идентификатора (присвоенного адреса). В объектном хранилище, в отличие от блочного, возможна настройка метаданных атрибутами файлов.

Т.к. объектные хранилища достаточно хорошо масштабируются, они могут работать с большим объемом информации. Поскольку объектные хранилища могут работать с большим количеством данных, являющиеся стандартом для знаменитых сервисов в облаке: от Facebook до DropBox [59].

С развитием информационных технологий появились следующие типы ХД:

- виртуальное ХД (ВХД);

- облачные технологии.

Виртуальным ХД является система, которая представляет методы доступа к регистрируемым системам, позволяющим работать с данными в этой системе. ВХД организовано на основе технологии БД, либо используются специальные

средства доступа (например, Desktop OLAP, представлены BusinessObjects, Brio Enterprise и др.).

Сфера облачных технологий состоит из большого количества изолированных друг от друга облачных IT-услуг, к которым клиенты подключаются по отдельности. С ростом современных IT-технологий будет постепенно объединяться каждое предприятие в один из узлов в большом облаке, которое займет длительный процесс.

Существуют два вида хранилищ данных: нормализованные хранилища данных и хранилища с измерениями [35].

Нормализованные хранилища данных состоят из предметно -ориентированных таблиц, относящихся к третьей и более нормальной форме.

Хранилища с измерениями используют схемы размерностных хранилищ в виде звезд» или снежинки, центром являются данные, находящиеся в таблице фактов, а лучами являются измерения [35].

Данные, хранящиеся в ХД, доступны только для чтения. Данный факт является достоинством, т.к. выполняются три категории информационной безопасности: целостность, доступность (единожды поступившие данные всегда доступны), конфиденциальность. Недостатком является сложность подготовки и загрузки данных [35, 55]: для этого необходима система управления базами данных (СУБД), предназначенная для организации ведения базы данных (БД).

Существует множество классификаций СУБД, например, по моделям данных, по степени распределенности, по способу доступа к БД (рисунок 1.13) [25].

Рисунок 1.13 - Классификация СУБД

Рассмотрим классификацию по модели данных. Реляционные СУБД характеризуются компактным хранением, возможен поиск, наращивание и изменение информации. Это относится к плюсам. К минусам можно отнести сложное хранение больших объектов, а также то, что поиск информации при больших объемах данных занимает очень много времени. Для поиска информации этого существуют индексные массивы, по ним ведется поиск, когда этот массив сопоставим с обычным файлом, то возникает проблема второго этапа индексирования или агрегирования. Например, существует фамилия, если документов немного, при поиске по атрибуту «Фамилия» поиск осуществляется быстро, как только это количество увеличивается, становится необходим интеллектуальный или составной группы индекс. В ряде случаев возникает необходимость введения многоуровневой агрегации, что приводит к многочисленным ссылкам при выполнении поиска в реляционных БД.

В случае использования многомерной матрицы / поликубической организации данных такой поиск производится практически мгновенно. Но при этом существуют следующие недостатки: например, при указании размерности могут оставаться пустые клетки, которые занимают большой объем дискового пространства (гиперкубическая организация данных). Существуют различные приемы, для того чтобы не хранить пустую информацию, например, использование поликуба (поликубическая организация данных). Т.е. предполагается, что в базу данных (БД) можно определить некоторые гиперкубы с разной размерностью и измерениями в качестве граней (например, сервер Oracle Express Server).

При этом существуют недостатки, например, при указывании размерности остаются пустые клетки, т.е. матрица становится разреженной. Основной проблемой при использовании поликубической системы является система отношений между кубами [23, 89].

Достоинством является возможность описать структуру на первоначальном этапе проектирования, определить перечень вопросов, на которые она должна отвечать, при этом эффективность поиска будет соответственной.

Многомерные СУБД предназначены для обработки аналитической информации в виде многомерного логического представления структуры информации. Такие СУБД характеризуются тем, что данные изображаются в виде многомерных матриц - кубов, причем массивы имеют упорядоченную направленность, а ячейки куба - одинаковую размерность (гиперкубическая организация данных). Получается, что все ячейки куба должны быть заполнены. Появляется следующая проблема: те значения, которые пропущены, заполняются неопределенными значениями, предполагается, что если блок заполнен неопределенными значениями, то он не должен храниться, но это не всегда бывает так. А в поликубической организации данных многомерная база данных представлена несколькими гиперкубами, с различной размерностью и измерениями.

На данный момент набирают популярность объектно-ориентированные, или постреляционные СУБД (Caché, PostgreSQL, DB2), объектами в них могут быть как данные, так и правила хранения данных [62, 48, 70].

Но аналитику недостаточно только структуризации и централизации, ему важно визуальное представление информации, а для этого необходим инструмент.

В качестве инструмента для оперативной и аналитической обработки данных и знаний образующегося интеллектуального контента в гетерогенном хранилище данных эффективно использовать Olap-систему, т.к. возможно быстро и удобно осуществить доступ к информации.

Olap представляет удобные инструменты доступа для визуализации и анализа информации. В зависимости от метода обработки и хранения, Olap-системы делятся на следующие типы (рисунок 1. 14):

Типы Olap-систем

[ROLA

LOLAP (Relational OLAP - реляционны* OLAP-системы), с помощью SQL-запросов можно осуществлять многомерный анализ. Достоинством является то. что возможно осуществлять болге эффективно числовую и текстовую обработку данных-Недостаток - низкая производительность и ограниченная функциональность.

il OLAP (Multidimenaonal OLAP - многомерные OLAP-системы), относящиеся к традиционным СИ ар-системам, т.к. выполняют предварительную подготовку (выполняется на сервере) и оптимизацию данных, представляется в виде многомерных массивов - Olap-кубы. Достоинства - эффективны при обработке данных, способны быстро реорганизовывать и структурировать данные, это происходит за счет предварительного формирования 01 ар-кубов. Недостаток - избыточность данных и ограничение объема обрабатываемых данных из-за дублирования данных по ■азличным аспектам при формировании многомерных кубов.у

ÍHOLJ

OLAP (Hybrid OLAP - гибридные OLAP-системы) - системы способны хранить большое количество данных, за счет Olap -систем и размещать данные в многомерных массивах в предварительно построенных 01ар-кубах. Достоинства: быстрая обработка данных, масштабируемость и гибкость в доступе к источникам данных

/R-ROLAP - это ROLAP реального времени, в котором hi создаются дополнительные реляционные таблицы для хранения агрегатов, а многомерный запрос к OL АР-системе преобразуется в SQL-запрос к реляционным данным. Достоинства - не существует угрозы «взрыва» данных, так как в кубе не сохраняются предварительно вычисленные значения; вычисления по требованию позволяют не перегружать основную память RAM. Недостатки - ограниченность хранения и обработки куба, данных объемом основной памяти:

снижение скорости обработки из-за вычислений по ребованию.

Рисунок 1.14 - Типы Olap-систем

На основании рассмотренных типов хранения можем сделать следующий вывод, каждый тип хранения имеет свои достоинства и недостатки. Основные проблемы применения ОЬАР-систем заключаются в создании выбора запросов и

базовых данных, т.к. данные должны быть полными и непротиворечивыми [101, 102].

На сегодняшний день представлено большое количество инструментов для разработки собственных приложений извлечения и создания аналитических отчетов, панелей, Olap-кубов и др. [84]. В таблице представлена сравнительная характеристика аналитических инструментов (таблица 1.1).

В результате сравнения семи программных продуктов, выделим трех лидирующих:

1) QlikView;

2) Tableau;

3) Prognoz Platform.

QlikView, Tableau были выделены, т. к. реализуют большой комплекс задач, являются лидерами в сфере разработки BI-платформ, включают встроенные средства ETL, однако имеют слишком высокую стоимость.

Таблица - 1.1 Сравнительная характеристика аналитических инструментов

№ Названи е Платформы Страна -разработч ик Ст-ть ПО Функции

1 QlikVie w Windows, мобильные версии приложения Швеция 1400001050000 руб- - многомерный анализ в срезах; - кросс-таблицы (pivoting); - произвольные запросы; - информационные панели; - статистический анализ (отслеживание трендов, выявление корреляции, проверка гипотез); - моделирование и прогнозирование; - создание персональных и общедоступных отчетов; - рассылка уведомлений, управляемая событиями.

2 TableaU BI Windows, мобильные версии приложения США 1500000 руб- - панели ключевых показателей (dashboards) с доступом в ХД; - инструменты для создания dashboard и аналитики бизнес-пользователей; - web-интерфейсы для панели ключевых показателей и аналитических приложений; - отправка представлений для аналитики другим пользователям по запросу.

3 Prognoz Platform Windows, мобильные версии приложения Россия 500000 руб. - формирование регламентных отчетов любой степени сложности; - создание аналитических записок, в том числе в формате Microsoft Word; - адаптация внешнего вида инструмента под потребности пользователя, его схожесть с интерфейсом электронных таблиц; - расширенные настройки печати отчета; - функционал настройки сортировки, фильтрации, условного форматирования; - возможность редактирования данных и сохранения изменений в источник; - интеграция Microsoft Office.

4 Microsof t Power BI Windows, мобильные версии приложения США 624 000 руб. в месяц - панели ключевых показателей (dashboards); - инструменты для создания dashboard и аналитики бизнес-пользователей; - web-интерфейсы для панели ключевых показателей и аналитических приложений; - рассылки аналитики другим пользователям по запросу; - интеграция Microsoft Office.

5 Tibco Spotfire Windows, мобильные версии приложения США 140000720000 РУб. - прогнозирование и построение статистических моделей; - геопространственная аналитика в облачном сервисе; - автоматизация анализа данных с учетом историч. контекста; - панели ключевых показателей (dashboards)

6 IBM Cognos Windows, Linux, мобильные версии приложения Канада 1500000 РУб. - формирование отчетов и выполнения произвольных запросов; - гибкий анализ и визуализация данных; - обеспечение планирование и анализ бизнес-информации в Microsoft Excel

7 Pentaho Windows, Linux, мобильные версии приложения Канада 1500000 РУб. - средство разработки и представления отчетов, источники данных различные СУБД; - выполнение OLAP-анализа данных, с языком запросов MDX; - позволяет конструирование информационных панелей мониторинга KPI и прогнозирования; - средство для автоматизации ИАД; - позволяет осуществлять интеграцию данных из различных источников в хранилище Pentaho.

Prognoz Platform является единственной российской разработкой и имеет достаточный функционал для разработки аналитических инструментов.

На основе технической документации был изучен функционал данных систем. По результатам анализа, приоритетной BI-платформой для создания информационной аналитической системы является Prognoz Platofrm [72].

Для проектирования базы данных ПАК применяется постреляционная СУБД с открытым кодом PostgreSQL. В отличие от других баз данных, например, MySQL, MariaDB и Firebird, не являющихся объектно-ориентированными, PostgreSQL предоставляют более мощную функциональность. Выбор БД обусловлен наличием у нее следующих преимуществ, PostgreSQL [24, 25]:

- надежная, интегрированная и масштабируемая СУБД;

- запускается на всех основных платформах, включая Windows;

- поддерживает множество типов данных;

- обеспечивает расширенную емкость данных;

- имеет API для C/C++, Java, Perl, Python, Ruby и др. [65, 71];

- являясь постреляционной СУБД класса предприятия, предоставляет такие возможности, как восстановление по точке во времени, точки сохранения, упреждающее журналирование на случай поломки;

- может обрабатывать много данных;

- бережное отношение к целостности данных.

Таким образом, PostgreSQL - это не только мощная СУБД, позволяющая обеспечить деятельность организации, но и платформа разработки приложений, требующих использования постреляционной (многомерной) СУБД.

Представляется целесообразным в данной диссертационной работе рассмотреть применение Olap инструментов на примере разработки ПАК управления кадровым резервом промышленного предприятия, для формирования кадрового резерва сотрудников, способных развивать дополнительные навыки, личностные компетенции, посредством автоматизации. В настоящее время на рынке программных продуктов все больше изучается вопрос о построении ПАК. Таким образом, определяется актуальность проектирования программных аналитических комплексов.

Рисунок 1.15 - Обобщенная схема программного аналитического комплекса

Под программным аналитическим комплексом будем понимать комплекс инструментов, содержащих хранилище данных (ХД), средства извлечения данных, средства преобразования и загрузки данных (ETL) и аналитические средства (OLAP) (рисунок 1.15) [102].

ETL - система, использующаяся для переноса, извлечения, преобразования и загрузки данных.

Data Warehouse - ХД.

Информацию целесообразно представить в виде многомерных кубов, размерностями которых будут являться значения атрибутов предметных областей. Принцип многомерных моделей основан на концепции Olap. Olap-технологии ориентированы на решение сложных аналитических задач.

Предметная область представляется множеством информационных объектов. Количество объектов может увеличиваться до определенного момента (например, отчеты с кросс-таблицами, графики и т.д).

В каждом множестве информационных объектов происходят следующие преобразования: множество программных систем совмещается в гетерогенное хранилище, из которого берутся данные и разделяются на предметно-ориентированные системы (многомерные матрицы). Далее над данными

производятся операции агрегирования, слияния (в виде графиков) и т.д. На основе этих же данных строятся модели, таблицы, графики (рисунок 1.15).

На каждом этапе происходит взаимодействие двух объектов, (в рамках стандарта системной инженерии 180/1ЕС/1ЕЕЕ 15288 процесса соглашения). Математически процесс соглашения изображен в терминах теории категории.

Учитывая изложенное в данной главе определили, что при проектировании ПАК, появляется возможность сведения процесса к формальному алгоритму (рисунок 1.16), информационное наполнение которого является информационное назначение процессов, а также анализа программ, и из реинжиниринга, связанного с обеспечением наблюдения и актуализации. В ходе чего, происходит выполнение необходимых требований формальной грамматики Н. Хомского. Символьным базисом выступает - декартово произведение, оно будет равнозначно OLAP-кубу [2 -5].

I а у I

к ч

Интерфейс взаимодействия с пользователем

ФС - формальная система; Мн— множество носителей; Р - предикаты на Мп

О— множество операций (алгебра)у

Рисунок 1.16 - Графо-аналитическое представление преобразования

информации в ПАК

На основании изложенного и выводов, предложенных в [1-5], представляется возможность определять качественную составляющую по наличию некоторых количественных атрибутов и на основе полученных данных принимать управленческие решения, т.е. перейти от формальной к семантической модели [1-5].

Появляется возможность проектирования ПАК в виде совокупности объектов (которые являются категориями), для организации взаимодействия функциональных программ, обеспечивая интеграцию системы анализа объектов предметной области с учетом изменений предметной области. [42].

ВЫВОДЫ ПО ГЛАВЕ 1

1. Проведено исследование подходов разработки и проектирования ПАК согласно стандарта КОЛЕС/ШЕЕ 15288.

2. Проведен обзор способов организации хранилищ данных и построения моделей хранилищ данных и средств их реализации на основе многомерной СУБД, а также хранения данных в виде OLAP-кубов.

3. На основе проведенного анализа представлена диаграмма описания стадий ЖЦ ПАК в нотации ВРММ

ГЛАВА 2. РАЗРАБОТКА МАТЕМАТИЧЕСКОГО ТЕОРЕТИКО-МНОЖЕСТВЕННОГО МЕТОДА ДЛЯ ОТОБРАЖЕНИЯ ФУНКЦИОНАЛЬНОГО ВЗАИМОДЕЙСТВИЯ ПРОГРАММНЫХ СИСТЕМ

До настоящего времени остается актуальным вопрос полноты представления предметной области и ее семантического описания, выраженного соответствующими методологиями и моделями различных уровней. При этом возрастает значимость адекватности формализованных правил и алгоритмов нормативной базе соответствующей предметной области. В связи с динамикой изменения нормативной базы ПАК постоянно подлежит реинжинирингу, что требует определенной стандартизации работ на всех этапах жизненного цикла. Наиболее интересен в этом отношении международный стандарт 18О/1ЕС/1ЕЕЕ 15288 [5, 40, 41, 95 и др.]. Теме не менее существует проблема формализации задач при проектировании ПАК относительно требованиям стандарта 18О/1ЕС/1ЕЕЕ 15288, которая приводит к повышению сложности при выявлении проблем проекта, а также при анализе данных и принятии решений. Из-за большого количества данных и знаний, которые выражены в плохо структурированном или неформализованном виде, а также хранения в различных хранилищах данных возникают новые задачи обработки, передачи и сохранения семантики данных и знаний в условиях их семантической неоднородности и разобщенности [1, 4, 78].

При проектировании ПАК остро стоит проблема устранения семантического разрыва между представлением о предметной области и средствами ее формальной спецификации. Одним из традиционных способов уменьшения семантического разрыва является повышение уровня абстрактного моделирования [32, 49]. Например, применение формального языка теории категорий позволяет выявить и описать связи между объектами посредством морфизмов, сохраняя их логические и топологические свойства во времени и в пространстве как внутри одной категории [1, 88], так и между категориями [40].

При рассмотрении простых систем обмен информации между уровнями снизу-вверх и сверху вниз везде одинаков, однако в сложной системе стоит

рассматривать диалектическую пару: энтропия и информация. Причём сумма энтропии и информации в стабильной системе постоянна. Энтропия может интерпретироваться как мера неопределённости (неупорядоченности) некоторой системы, например, какого-либо опыта (испытания), который может иметь разные исходы, а значит, и количество информации [99].

2.1 Разработка математического теоретико-множественного метода моделирования процессов для проектирования программного

аналитического комплекса

Выявление множества данных с сохранением их семантики в ПАК требует дополнительной формализации и структурирования образующихся данных и знаний в виде контента, учитывая при этом предметно-ориентированную направленность. В качестве формального аппарата описания информационных объектов для моделирования, обработки и передачи данных и знаний применим положения теории категорий и теории множеств.

1. Программные компиляции, интерпретации, методы моделирования, на основе которых они строятся, являются формальными.

2. Напротив, методы формального моделирования применяют методы доказательств и рассуждений, обозначения, принятые в математике.

При обследовании предметной области образуется много данных и знаний, которым необходима своевременная обработка и передача в ПАК. Эти сведения описаны на естественном языке, не предполагающим выражения языком традиционной математики. Определяем, что в данном случае целесообразно использовать онтологический аспект при анализе предметной области и гносеологический при анализе знаний об этой реальности [43].

В случае использования математического аппарата появляются значительные сложности с качественными данными, поскольку рассматриваются не сами объекты, а математические описания реальных объектов, т.е. их абстракции. Это позволяет формировать многоаспектное отображение предметной области в виде формальной алгебраической структуры или

исчисления в виде ФС = (^Я, О), где имеется множество G (носитель) с заданным

на нем множеством отношений Я и множеством операций О. В частности ФС с пустым множеством операций О есть модель, а с пустым множеством отношений Я - алгебра. При этом непротиворечивость модели обеспечивает правило формальной логики на множестве G, где множество отношений Я является множеством предикатов р, т.е. я = Р.

Для дальнейшего рассмотрения математического описания реальных объектов и их информационных процессов введем следующие обозначения:

£ е^, I = 1,..., п, где ^ - множество из возможных состояний ПАК;

еQ, I = 1,...,т, где Q - конечное число состояний ПАК.

Переход ПАК из одного состояния в другое показано функцией Ь отображения V —> /<',

Г^Р, (2.1)

где V- множество информационных процессов для построения ПАК, т.е. 111 будет отображать следующее состояние ПАК после выполнения этапа

построения VI и может быть представлено формулой:

/+1 =1 (Ач), I = ^п, (2.2)

где V-, - информационный процесс, предназначенный для проектирования ПАК в определенный момент времени.

При этом множество состояний ПАК связаны рекуррентной формулой и, кроме того, каждая пара объектов / и / с заданным множеством морфизмов

Нот/, ) образует класс объектов, например, gq е Нот(/,) и ¡ч е Нот/,/к), где

определена их композиция^ <=Нот^,/к).

С учетом изложенного, а также того, что модули ПАК использованы в качестве информационных объектов, сам ПАК проектируется в виде совокупности объектов (которые являются категориями) для организации

взаимодействия функциональных программ, обеспечивающих интеграцию системы анализа объектов предметной области с учетом динамических свойств предметной области, следовательно, состояния ПАК образуют категорию множеств [4, 5].

Таким образом, при формализации предметной области с использованием положений теории категорий, можем описать все отношения объектов между собой.

При этом в процессе формирования интеллектуального контента возникает проблема из-за использования двух взаимосвязанных бизнес-процессов, (например, кадрового резерва и образовательного учреждения). При рассмотрении информационных объектов двух взаимосвязанных бизнес-процессов (на примере кадрового резерва и образовательного учреждения) появляется возможность использования наиболее распространенного в системной инженерии стандарта 18О/1ЕСЛЕЕЕ 15288, позволяющего на примере процессов соглашения формализовать и структурировать интеллектуальный контент и отношения между рассматриваемыми объектами.

Рассмотрим модель бизнес-процессов предприятия для организации работы с кадровым резервом. Относительно стандарта 18О/1ЕСЛЕЕЕ 15288, каждый процесс имеет цель, выходной продукт или услугу, набор действий, выполняющий определенные процедуры. Процессы, сформированные с использованием стандарта КОЛЕС 15288, представляют собой полное множество, предприятия могут строить различные модели ЖЦ программных систем, в зависимости от потребностей, выделяя определенные подмножества.

Процессы жизненного цикла стандарта КОЛЕСЛЕЕЕ 15288 содержат: процессы предприятия; процессы проекта; технические процессы; процессы соглашения. Первые три процесса способствуют эффективному формированию и применению систем, достигая цели предприятия. А процессы соглашения представляют собой рабочие взаимоотношения, путем заключения соглашений [95]. Для проведения исследований применялся формализованный вариант стандарта КОЛЕСЛЕЕЕ 15288 [42].

Будем обозначать процессы жизненного цикла следующим образом (рисунок 2.1):

- процессы предприятий - РР;

- процессы проекта - РРЯ;

- технические процессы - ТР;

- процессы соглашений - РБ.

/ / \ \

/ \ \ / \ V

W /

pp2 р2)

ppr2

tp2

Рисунок 2.1 - Множество процессов организации

Применяя информационный подход А.А. Денисова [18], для формализации предметной области, определяем первичные категории объектов и отношения между ними. В результате, предметная область представляется множеством объектов предметной области и множеством отношений между ними [36].

Таким образом, проблема применения формальных методов моделирования процессов для проектирования ПАК может быть решена применением математического аппарата теории категорий при использовании стандарта ISO/IEC/IEEE 15288 и информационного подхода А. А. Денисова.

Формализуем рассмотренные условия в виде матрицы (аналога матрицы Дж. Захмана), где по столбцам представлены стадии ЖЦ ПАК, а по строкам -

бизнес-процессы, обеспечивающие указанные стадии согласно стандарта КОЛЕСЛЕЕЕ 15288 (рисунок 2.2).

Введем следующие обозначения:

1. Стадии жизненного цикла - М = |м:,...,М61.

2. Множество процессов соглашения - Р8 = *,..., РБМ 21.

3. Множество процессов проекта - РРЯ = {РРЯМ1,..., РРРМ 2}.

4. Множество процессов предприятия - РР = |РРМ *,..., РРМ 21.

5. Множество технических процессов - ТР = |тРМ*,..., ТРМ 21.

Рисунок 2.2 - Архитектура семантической модели системы деятельности

предприятия

В результате получаем многомерную таблицу, определяющую архитектуру структуры семантического аспекта модели информационной системы и программного аналитического комплекса ее реализующего, с учетом взаимодействия функциональных программ с окружающей средой [42].

Модель позволяет формировать как структуру ЖЦ ПАК в пространстве ЖЦ бизнес-процесса, так и структуру ЖЦ отдельных БП в рамках выполняемого проекта.

2.2. Теоретико-множественная модель процесса соглашения

Согласно стандарту 180/1ЕС/1ЕЕЕ 15288 процесс соглашения состоит из процессов приобретения и процессов поставки [94, 95].

Применим для моделирования данного процесса базовые положения теории категорий. Будем использовать следующие обозначения [42]: процессы соглашения РБ, процессы приобретения РБрг, процессы поставки РБро.

Выделим процессы соглашения РБ, приобретения РБрг и поставки РБро в

отдельные категорию и подкатегории, которые состоят из целей процесса, деятельности процесса и результата [39, 47]. Рассматривая взаимодействие подкатегорий, внутри которых расположены информационные объекты, приходим к коммутативному треугольнику по категории и отдельным подкатегориям (рисунок 2.3).

Рисунок 2.3 - Упрощенная схема коммутативного треугольника

процесса соглашения

Процессы соглашения РБ состоят из процесса приобретения РБрг (например, заключается соглашение между специалистом и экспертом на подготовку

резервиста для определенной должности) и процесса поставки -РБро (например,

эксперты должны подготовить резервиста в соответствии с требованиями к определенной должности) [2, 5].

Данная категория РБ образует класс объектов с заданным отношением для любых пар (РБ, РБрг) и (РБ, РБро), отношения которых определены множеством

морфизмов: //2,ръР2} [47].

Рассматривая процессы соглашения РБ как взаимосвязанные процессы приобретения РБрг и поставок РБро, процесс взаимодействия можно представить

декартовым произведением g:PS ^ РБрг ® РБро, где g является единственным

морфизмом, выражающимся результатом процесса соглашения (рисунок 2.3). Отметим, что эти операции соответствуют правилам формальной логики.

Таким образом, процесс соглашения формализуется в виде морфизмов, обладающих следующими свойствами [47]:

- результат взаимодействия информационных объектов может быть представлен декартовым произведением РБрг ® РБро с морфизмами

рх:РБ ® РБро ^ РБрг и р2:РБрг ® РБро ^ РБротакими, что для любого объекта

РБ с морфизмами /: РБ ^ РБрГ и /2 : РБ ^ РБро существует единственный

морфизм g:PБ ^ РБрг ® РБро, при котором выделяется диаграмма в форме

коммутативного треугольника, где

® - декартово произведение, g - морфизм, являющийся результатом процесса.

Рассмотрим следующую отдельную подкатегорию: процесс приобретения РБ , который складывается из трех составляющих (рисунок 2.4):

1. Цели процесса приобретения РБ^ = {рГ}.

2. Деятельности в процессе приобретения РБ2рг = | рг2,..., рг821.

3. Результата процесса приобретения РБрг =| рг± ,.., рг73|.

Рисунок 2.4 - Коммутативный треугольник процесса приобретения

Цели процесса приобретения РБ1рг = {ргр}.

С учетом внесения изменений в стандарт, что может быть локализован для данного случая в таком виде.

Цель процесса приобретения определяется получением продукта или услуги с учетом условий приобретающей стороны [61].

Деятельность в процессе приобретения РБ2рг = {рг2,..., рг2}:

- рг1 2 - утверждение плана приобретения, подбора;

- рг2 2 - формирование заявки для продукта или услуги;

- рг3 2 - отправка заявки на поставку выбранным поставщикам;

- рг4 2 - подбор поставщика;

- рг52 - заключение договора с поставщиком;

- рг6 2 - оценка работы;

- рг7 2 - утверждение, что продукт или услуга выбраны правильно;

- рг8 2 - проведение согласованных расчетов с поставщиком.

Результат процесса приобретения РБр^г =| ргр3,..., рт^:

- рг1 - формируется стратегия приобретения;

3

- рг2 - определяется поставщик;

3

-рг3 - определяется связь с поставщиком;

- рг4 - доказывают выбор именно конкретного поставщика;

-5

- рг5 - определяется соглашение о приобретении продукта или услуги с определенными критериями приемки;

3

- рг6 - принимается продукт или услуга, которые соответствуют соглашению;

3

- рг7 - оплата.

1 9

Взаимодействие информационных объектов РБрг и РБрг может быть

1 9

представлено декартовым произведением РБрг ® РБрг с морфизмами

р1:РБ1рг ® РБ2рг ^ РБрг и р2 :РБрг ® РБр2г ^ РБрг такими, что для любого информационного объекта РБрг с морфизмами /¡:РБрг ^ РБрг и /2:РБрг ^ РБ2г

1 9

существует единственный морфизм gl:PБpг ^ РБрг ® РБрг, который

определяется коммутативной диаграммой.

Также рассматривается взаимодействие информационных объектов с

1 О 1 1 о о

морфизмами р3:РБрг ® РБрг ^ РБрг и р4 :РБрг ® РБрг ^ РБрг при котором для любого объекта РБрг с морфизмами /р:РБрг ^ РБрг и /3:РБрг ^ РБрг

1 'З

существует единственный морфизм g2:PБ ^ РБрг ® РБрг, который определяется коммутативной диаграммой.

о ^

Таким же образом рассматривается взаимодействие объектов РБрг ® РБрг с морфизмами р5:РБрг ® РБрг ^РБрг и р6:РБрг ® РБрг ^ РБрг такими, что для любого объекта РБрг с морфизмами /2:РБ ^РБрг и /3:РБрг ^РБрг,

о ^

существует единственный морфизм g3:PSpг ^РБрг ® РБрг который определяется

коммутативной диаграммой.

В результате процесс приобретения может быть представлен в виде декартового произведения следующих проекций:

РБрг = (РБ1рг) ® (РБрг) ® (РБр,г^ ® (РБрг) ® (РБрг) ® (РБрг). (2.3)

Упростив, формулу (2.3), получаем:

PSpr = ® PS2pr), (PSlpr ® PSpr), (PSърг ® PS2pr)\

Рассмотрим следующую отдельную подкатегорию: процесс поставки PSpo. Процесс поставки (PSpo) состоит:

1. Из цели процесса поставки PSlpo = {po\}.

2. Деятельности в процессе поставки PSp0 = {po2x,..., pol}.

3. Результата процесса поставки PSpa = {po\,..., pop}. Цели процесса поставкиPS^0 = {po\}

Цель процесса поставки состоит в определении приобретающей стороной продукции или услуги, удовлетворяющих требованиям и потребностям предприятия.

Деятельность в процессе поставки PSpD = {pof,..., pol}:

- po21 - определение наличия и подлинности приобретающей стороной;

- po22 - оценивание заявки на поставку;

- po23 - определение предложения по удовлетворению ходатайства; -po24 - заключение соглашения с приобретающей стороной;

-po25 - выполнение соглашения по определенным обязательствам;

- po26 - оценка выполнения плана;

- po27 - поставка продукта или услуги в соответствии с требованиями соглашения;

- po28 - подтверждение оплаты;

-po29 - передача ответственности, предусмотренная соглашением. Результата процесса поставки PSp0 = {po\,..., pop} В результате успешного осуществления процесса поставки:

-5

- po 1 - определяется приобретающей стороной;

-5

- po 2 - формирование заявки на ответ приобретающей стороны;

3

- po 3 - заключение соглашения на товар или услугу;

3

- po 4 - определение связи с поставщиками;

po 5 - поставка продукта или услуги, удовлетворяющих соглашению

кандидатов;

3

po 6 - передача ответственности;

3

po 7 - оплата.

1 9

Взаимодействие информационных объектов PSpo и PSpo может быть

1 9

представлено декартовым произведением PSpo 0 PS с морфизмами

p: PSpo 0 PSpo ^ PSpo и p2 : PSpo 0 PSpo ^ PSpo такими, что для любого

" 1

информационного объекта PSpo с морфизмами f : PSpo ^ PSpo и

"9 '19

f2 : PSpo ^ PSpo существует единственный морфизм g :PSpo ^ PSpo 0 PSpo

который определяется коммутативной диаграммой в виде треугольника (рисунок 2.5).

Аналогично может быть рассмотрено взаимодействие объектов:

- PSpo и PSpo PSpo 0 PSpo с морфизмами p3:PSlpo 0 PS3po ^ PSpo и

pf : PS],o 0 PSpo ^ PSpo такими, что для любого объекта PSpo с морфизмами

" 1 " ^ f : PSpo ^ PSpo и fp : PSpo ^ PSpo существует единственный морфизм

g2:PSpo ^ PSpo 0 PSpo, представленный коммутативной диаграммой;

-PSpo 0 PSpo с морфизмами p : PSpo 0 PSpo ^ PSpo и

' о о о

p6 : PSpo 0 PSpo ^ PSpo такими, что для любого объекта PSpo с морфизмами

II Л II О

f2 : PSpo ^ PS и f : PSpo ^ PSpo существует единственный морфизм

f p 2 g :PSpo ^ PSpo 0 PSpo такой, что диаграмма коммутативна.

Рисунок 2.5 - Коммутативный треугольник процесса поставки

В результате процесс приобретения может быть представлен в виде декартового произведения:

РБро = (РБ1р0 ) ® (РБ2р0 ) ® (РБ1р0 ) ® (РБЪр0 ) ® {Р8рю ) ® (РБ2р0 ), (2.4)

Упростив формулу (2.4), получаем:

Р$р0 = {(Р^ ® Р^Р0), (РЯ1Р0 ® Р^З0) (Р^З0 ® Р$2Р0)} .

Результат может быть представлен в виде декартового произведения, причем если результатом является независимая величина, то он может быть промежуточным. Это позволяет выявить зависимость рекурсивной точки одной от другой. Т.е. если меняется цель, то возможно спрогнозировать результат, при этом информационные объекты представимы в виде категорий, а отношение перехода одной стадии в другую - в виде морфизмов [47].

Таким образом, теоретико-множественное моделирование процессов соглашения (рисунок 2.4) может быть представлено формулами (2.3) и (2.4). Получаем, что для каждого процесса будут свои составляющие множества.

2.3 Применение метода динамического программирования в теории топосов

Метод динамического программирования состоит в решении сложных задач путем деления их на подзадачи. Выделяют следующую классификацию динамического программирования: восходящее и нисходящее. В данной диссертационной работе будем применять нисходящее динамическое программирование, заключающееся в делении задач на подзадачи, которые затем объединяются для решения исходной задачи [13, 92].

Для дальнейшего представления теоретико-множественной модели, приведенной в предыдущем параграфе, рассмотрим понятие «топос».

По определению топос является декартово замкнутой категорией.

Под топосом будем понимать декартово замкнутую конечную полную категорию, в которой выделен один объект, называемый классификатором подобъектов и мономорфизм в него из терминального объекта, называемый истиной, такой, что для любого мономорфизма существует единственный морфизм, для которого диаграмма является

декартовым квадратом [19].

Путем формализации топоса, используя последовательное применение

линейки или множества линеек преобразований, получаем диаграмму, приведенную на рисунке 2.6 [19, 47].

При рассмотрении процессов соглашения процесс приобретения РБрг, процесс поставки Р£ро, представим в виде категорий взаимодействия объектов, которые являются совокупностью декартовых произведений:

РБрГ ® РБр0 = РР, ® Р82рг, Р^, ® , ® Р8р2г, Р^ ® Р^,

РБ'Ь ® РБ'рО, РБ'рО ® Р^20 >. .

Здесь ® - декартово произведение, которое отражает взаимодействие объектов по какому-либо правилу.

Рисунок 2.6 - Категории процесса соглашения, представленные согласно теории

топосов

Очевидно, что процесс соглашения в данном случае может быть представлен формулой:

РБ = ((РБрг ® РБр0),(РБр0 ® РБрг)>. (2.6)

Проводя выше приведенные рассуждения для процесса приобретения РБрг, согласно стандарту 180/1ЕС/1ЕЕЕ 15288, процесс приобретения РБрг может быть представлен формулой:

РБрГ ={((РБХрГ ® РБрг ),(РБрг ® РБ\Г )>, ((РБ\Г ® РБрг ),(РБърг ® РБхрг )>,

((РБрг ® РБрг ),(РБ^ ® РБрг )>}. .

Аналогично процесс поставки РБро может быть представлен формулой:

Л(РБ 1 ® РБр„)>.

(2.8)

РБро ={((РБ1ро ®РБ2ро),(РБро ®РБ1ро)>,

((РБ1ро ® РБро),(РБро ® РБ1ро)>,((РБро ® РБ2о),(РБр2о ® РБро)>}

Таким образом, взаимодействие между приведенными выше процессами, представленными в виде категорий, может быть описано в виде функтора на основе представленных выше декартовых произведений.

Так, на основании изложенного и согласно стандарту ISO/IEC/IEEE 15288, в категории Р8рг любой объект будет отображаться в объекты категории Р8ро следующим функтором:

/ е НсшРрГ,Р£ро )

{/ е Нсш(Р^рг ,Р8Хро ), / е Нош^ ,Р82ро ),/ е Нош(Р^г Що ) }.

Так же описывается отображение объектов в категории Р£ро:

Е е Наш(Р8рГ,Р8ро),

{е е Нош(Р^рг,Р^ро), е е Нош^^),Е е Нош^^)}. '

Аналогично описывается и отношение - «декартово произведение», поскольку будем рассматривать его как новый объект:

/ е НошРрГ ® РБро,РБро),

Е е Нош(Р8ро,Р8ро ® Р8рг),

/о 8 е Но т(Р8рг®Р8ро,Р8ро®Р8рг).

Приходим к выводу, что приведенные объекты могут быть описаны взаимодействием функторов. В данном случае можем использовать квадрат Декарта, где композиция представленных выше двух процессов (рисунок 2.6) является прямым отображением приведенного процесса соглашения на результат. Результат процесса может рассматриваться и как композиция произведения целей и деятельностей путем получения еще одного «треугольника», где независимо от порядка выполнения последовательности операций и отображений результат будет одинаков.

Приходим к количественному описанию информационных процессов в рамках стандарта ISO/IEC/IEEE 15288. Выполняя приведенную выше последовательность действий, в конечном итоге приходим к возможности связать между собой стадии жизненного цикла ПАК.

ВЫВОДЫ ПО ГЛАВЕ 2

1. Разработан математический теоретико-множественный метод для отображения функционального взаимодействия программных систем при реализации динамических свойств предметной области и процессов обработки информации.

2. Указанный математический теоретико-множественный метод позволяет перейти к количественному многовариантному описанию информационных процессов в рамках стандарта 180/1ЕС/1ЕЕЕ 15288, более того, он позволяет связать каждые стадии жизненного цикла программного аналитического комплекса путем введения обратной связи.

3. На основании математического теоретико-множественного метода появляется возможность перейти к формальной модели процессов взаимодействия компонентов программного аналитического комплекса с декартово замкнутой категорией.

ГЛАВА 3. ФОРМАЛЬНАЯ МОДЕЛЬ ПРОЦЕССОВ ВЗАИМОДЕЙСТВИЯ КОМПОНЕНТОВ ПРОГРАММНОГО АНАЛИТИЧЕСКОГО КОМПЛЕКСА С ДЕКАРТОВО ЗАМКНУТОЙ КАТЕГОРИЕЙ

В настоящее время для описания предметной области основной проблемой является то, что невозможно структурировать и описать все знания единообразно. В данном случае представим их с помощью двух типов: структурированная часть и неструктурированная часть знаний. Процесс выделения объектов и отношений между ними будет непрерывно-последовательным при работе с предметной областью. Процесс также организован стандартом 180/1ЕС/1ЕЕЕ 15288.

3.1 Формирование схемы отображения категорий объектов

На основании проведенных исследований [46, 47, 68, 69] и представленных выводов в главе 2, приходим к структуризации отношений объектов, в виде функторных отношений. При дальнейшем выделении объектов внутри больших объектов, получаем уменьшение неструктурированной части внутри этого объекта, и увеличение общей структурированной части предметной области по определенным правилам.

В результате приходим к тому, что в итоге такой декомпозиции сложность объектов снижается, а сложность отношений увеличивается. В пределе, с точки зрения моделирования, получается полное покрытие информационной области информационными объектами и отношениями между ними, где отношения между объектами формализованы и структурированы могут быть описаны на основе функторных отношений объектов категорий, т.е. могут быть категорированными.

В предыдущей главе, проводя последовательно декомпозицию или композицию объектов в форме коммутативных треугольников, мы получаем в итоге Декартов квадрат и приходим к структуре процессов соглашения, которая выполняет действия по единому правилу [37, 69, 44, 46, 47].

В результате выполнения описанных действий получаем большое количество данных, включая формализованные знания, которые можем хранить в едином информационном хранилище, что в дальнейшем дает возможность

единообразного отношения к ним при передаче и обработке. Полученный результат может быть использован в качестве аналога основного рекуррентного соотношения формальной основы на примере метода динамического программирования (принцип оптимальности Беллмана), т.к. на каждом шаге построения указанной ПАК выбирается некоторое оптимальное управление в предположении об оптимальности всех последующих шагов [1, 2, 11, 43, 50, 99].

Из описанных ранее параметров получается, что процесс соглашения может быть представлен иерархической совокупностью вложенных процессов. Справедлива зависимость у = / (х, у)=> у = / (х, / (х, у )), получается

самоподобие масштабной инвариантности (фракталы) [72, 73, 74]. Таким образом, ПАК характеризуется множеством своих состояний в любой момент времени.

На основании проведенных исследований [69, 44, 46, 47] и правило синтеза самоорганизующейся структуры процесса соглашения (представленное в главе 2, пп. 2.1), основанное на композиции объектов-процессов, может быть определено путем логического сложения некоторых фракталов в форме коммутативных треугольников в квадраты Декарта [64, 47, 100].

С учетом изложенного, проектирование программного комплекса может быть сведено к представлению его в виде множества объектов, структурированных по категориям. В ходе проведенных исследований установлено, что отношения между объектами разных категорий соответствуют понятию функторного отношения. В результате приходим к множеству функторов, которые могут быть объединены в виде отдельной категории. Т.е. отношения между элементами фрактала [52, 69, 46, 47, 100], строятся на уровне категориального отношения [42].

Таким образом, подобъекты, составляющие фрактал, могут быть описаны в виде функторных отношений, т.е. элементы разных категорий относятся друг к другу через функтор. В результате категории между собой связаны отношением «самоподобия» для конкретной предметной области.

Фрактальный подход был применен впервые Б. Мальденбротом в 90-е годы, он применил понятие «фрактал» для описания объектов реального мира.

Существует несколько определений фрактала, но в представленном исследовании фрактал представляет собой определенный объект, получившийся непредсказуемым образом, который возможно представить логическими формулами. Основное свойство фракталов - это самоподобие, т.е. отдельные фракталы самоподобны в целом самой фигуре [53, 98, 13]. Может быть использовано следующее определение: фракталом называется некая структура, состоящая из частей, которые по какому-либо правилу подобны самой структуре. Таким образом, речь идет о способах хаотичных структур соединяться в систему. Использование правил фрактального построения систем может быть применено при проектировании структуры программных аналитических комплексов, например на основе фрактальных графов и фрактоидных преобразований [72]. Объединение графа и фрактала есть фрактальный граф со свойствами фракталов: самоподобием, масштабной инвариантностью [72, 73]. Разновидностью нечетких вычислений являются фрактальные вычисления, которые представлены алгебраической структурой - фрактоидом. Применяя функторные отношения, возможно описать фрактальные процессы, объединяя в ранее описанные цепочки - «итерированные отображения» [74].

На основе вышеизложенного и проведенных исследований [68, 44, 46], фрактальные решетки могут определяться не только функциями, но и функторными отношениями. Сам фрактал в данном случае выступает не как геометрическое место точек, а как объект категориального отношения, назовем его «категориальный фрактал» [58].

В терминах теории категорий свойства фрактала будут удовлетворять определенным условиям. Объекты преобразуются в программный модуль, который определяется цепочкой отношений, т.е. чем ниже уровень фрактала, тем больше количество отношений (рисунок 3.1).

'м 1 >

/

\МЛп

Таблица 1

Поле 1.1 Поле 1.2 Поле 1.п

Таблица 2 ^_

Поле 2.1 Поле 2.2 Поле 2.п

Рисунок 3.1 - Схема определения информационных маршрутов в виде функциональной последовательности

Взаимодействие этих объектов открывает возможность их дальнейшей композиции в виде достраивания. Новые отношения позволяют достраивать объекты до квадрата Декарта. В результате получаем множество объектов идентифицируемых и прослеживаемых по пространству и времени.

Определим минимальные требования к структуре ПАК с декартово замкнутой категорией:

1. Отношения соответствуют логике функторов.

2. Вершина имеет минимум два объекта.

3. Цепочка отношений образует маршрут, который становится новым объектом.

Вывод: согласно данным требованиям в каждом объекте, в котором имеется хотя бы два отношения, происходит достраивание до квадрата Декарта, позволяющее дальнейшее построение ПАК (тем самым обеспечивается открытость системы).

Таким образом, ПАК может быть определен как комплекс программ связанных между собой какими-то отношениями (многомерными векторами связи), которые и есть предмет настоящего рассмотрения.

Предлагается следующий метод: выстраивание отношений для дальнейшей разработки и проектирования ПАК, т.е. отношения между модулями [42].

Рассмотрим категории объектов: предметную область, модель предметной области и модель СУБД для предметной области (рисунок 3.1) Верхний уровень, является аналогом предметной области - уровень процессов. Второй уровень -уровень моделей, свойств и отношений, третий уровень - уровень обработки данных и метаданных.

Для описания отношений между уровнями фрактала введем следующие обозначения:

1. Предметная область - Р.

2. Множество моделей предметной области - М^ = {Мрх,..,М^} .

3. Множество моделей данных предметной области - М^ = {Мах,..., МА}.

Выберем две категории объектов предметную область и модель

предметной области. Получаем, предметная область отображается в модели предметных областей, которых может быть большое количество.

Таким образом, предметная область формализуется в виде морфизмов, обладающих следующими свойствами [10, 47]: результат взаимодействия информационных объектов может быть представлен декартовым произведениемМрх ®Мр2 с морфизмами р^:Мр^ ®М^ ^М^ и

р :М ® Мр2 ^ Мр2 такими, что для любого объекта М с морфизмами

/1: Р ^ М^ и /2 : Р ^ Мр существует единственный

морфизм g1:P ^ М' ® Мр , при котором выделяется диаграмма в форме

коммутативного треугольника.

Результатом данного отображения являются модели предметный области, которые могут быть построены в различных нотациях (рисунок 3.1).

Взаимодействие информационных объектов М и М , может быть представлено декартовым произведением - Ма ® Ма с морфизмамир[:Ма ®М^ ^ М^ и р'2:Ма ® М^ ^ МА такими, что для любого информационного объекта Мс морфизмами /':М ^ Ма и / :М' ^ М а существует единственный морфизм :М ^ Мс ® М а , который определяется

коммутативной диаграммой.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.