Специальное математическое и программное обеспечение реляционных СУБД для интервальнозначных типов данных тема диссертации и автореферата по ВАК РФ 05.13.11, кандидат наук Мирошников Артём Игоревич
- Специальность ВАК РФ05.13.11
- Количество страниц 115
Оглавление диссертации кандидат наук Мирошников Артём Игоревич
ВВЕДЕНИЕ
ГЛАВА 1. Обзор математического и программного обеспечения для представления интервальнозначных данных в реляционных СУБД
Введение
1.1. Понятие интервальной арифметики
1.2. Понятие интервального анализа
1.3. Применение методов интервального анализа
1.4. Архитектура системы управления базами данных
1.5. Требования и подходы к реализации интервальнозначных типов данных в реляционных системах управления базами данных
Выводы по главе и постановка задач исследования
ГЛАВА 2. Программная реализация интервальнозначных данных в реляционных СУБД
Введение
2.1. Способы создания пользовательских типов данных
2.2. Описание базовой структуры пользовательского типа iInterval
2.3. Реализация интервального типа данных с использованием объектно-ориентированной технологии доступа (ORM)
Выводы по главе
ГЛАВА 3. Сравнительный анализ эффективности разработанной библиотеки интервальнозначного типа данных
Введение
3.1. Методика реализации операции сравнения интервальных данных в СУБД SQL Server
3.2. Эффективность выполнения запросов над интервальнозначными данным
3.3. Индексирование в системах управления базами данных
3.4. Применение индексов к базам данных с объектами интервального типа
Выводы по главе
ГЛАВА 4. Применение пользовательского интервальнозначного типа данных в прикладных программах при реализации интервальных алгоритмов
Введение
4.1. Использование библиотеки для работы с интервальнозначными типами в СУБД
4.2. Описание программы интервальной кластеризации марок чугуна
4.3. Применение интервальнозначного типа данных в задачах кластеризации
Выводы по главе
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
ПРИЛОЖЕНИЯ
ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ
Актуальность темы. В процессе развития информационных технологий происходит накопление объемов данных о разнообразных процессах, которые содержат погрешности, удобно учитывающиеся в виде интервальных значений, где значению параметра ставятся в соответствие нижняя и верхняя граница интервала, в котором оно достоверно находится. Таким образом, актуальной становится работа с интервальными данными с целью извлечения точной информации в системах управления базами данных. В СУБД интервальные значения могут учитываться за счет использования двух полей для описания, в одно из которых записывается минимальное значение (нижняя граница интервала), а в другое -максимальное (верхняя граница интервала). Однако данный способ не универсален, таким образом, лучшим вариантом является создание пользовательского типа данных в самой СУБД.
Широкое внедрение информационных технологий, цифровая
трансформация предприятий в условиях перехода к Индустрии 4.0 приводят
к новым задачам по разработке методов генерирования, хранения, анализа и
передачи данных. Объемы данных, собираемых при функционировании
процессов, постоянно увеличиваются, что приводит к необходимости
разрабатывать специализированные рациональные подходы их обработки.
При принятии оптимальных управленческих решений требуется извлечение
как можно большего числа знаний из имеющихся данных, выявление
закономерностей. Даже несмотря на текущий уровень аппаратного развития
вычислительной техники для использования интеллектуальных методов
выявления зависимостей, например построение нейросетевых моделей,
требуются значительные вычислительные затраты, и адекватные результаты
не всегда могут быть получены за приемлемое время. Кроме того в больших
объемах собираемых данных могут содержаться погрешности измерений,
4
которые в случае совместной обработки накапливаются и значительно влияют на итоговый результат. Одним из способов решения данной проблемы является предобработка исходных данных с целью сокращения их объемов и учета погрешностей, в них содержащихся. Для этих целей подходит интервальное представление данных, позволяющее учесть погрешности и агрегировать определенные наборы данных путем задания нижней и верхней границы возможных значений.
Степень научной разработанности проблемы. Методы работы с интервальными значениями изучаются в интервальном анализе, большой вклад в развитие которого внесли Б.С. Добронец, С.А. Калмыков, С.П. Шарый, Ю.И. Шокин, З.Х. Юлдашев и др. Среди зарубежных ученых, занимающимися исследованием, в частности, проблем интервальных численных методов, линейной оптимизации с неточными данными (в том числе в условиях интервальной и нечёткой неопределённости), интервальных методов в задачах глобальной оптимизации функций, можно выделить G. Alefeld, J. Herzberger, M. Fiedler, R. Hammer, R. Kearfott, E. Hansen и др. Применению методов и алгоритмов интервального на практике посвящены работы С.И. Жилина, Д.Ю. Надёжина, Е.Н. Тепикина, Е.Р. Алексеева, Е.А. Чесноковой, Е.А. Рудченко и др. Для широкого практического использования подходов к интервальному представлению данных необходима реализация возможности их хранения и прозрачного использования в промышленных СУБД и в средах разработки прикладных приложений. Однако имеющиеся в настоящее время программные инструменты не обеспечивают необходимых интерфейсов для эффективной и надёжной разработки прикладного программного обеспечения.
Цель работы и задачи исследования. Целью диссертационной работы является разработка математического и программного обеспечения для надёжного хранения и повышения эффективности процессов обработки интервальнозначных данных в реляционных СУБД и сокращения сроков создания прикладных программ, использующих интервальнозначные данные.
Для достижения поставленной цели решались следующие задачи:
- анализ подходов к реализации способов хранения и манипулирования данными, содержащими интервальные значения, при разработке прикладных программных средств и проектировании СУБД;
- формализация структуры и методов обработки пользовательского интервальнозначного типа данных, основных арифметических, функциональных и статистических операций, реализуемых в виде библиотеки интервальнозначных данных;
- разработка алгоритма операции сравнения интервальнозначного пользовательского типа данных, позволяющего обеспечивать контроль целостности данных и используемого при реализации интервальных функций и алгоритмов;
- разработка и исследование механизма индексирования пользовательского интервальнозначного типа данных при обработке интервальных объектов в реляционных СУБД;
- разработка алгоритма интервальной кластеризации k-средних на основе алгоритма сравнения данных интервальнозначного типа в условиях реляционных СУБД;
- разработка структуры, реализация и тестирование программного обеспечения, применяющего предложенный интервальнозначный тип данных для осуществления интервальной кластеризации марок чугуна.
Объект исследования: интервальнозначные типы данных в реляционных СУБД.
Предмет исследования: методы и алгоритмы обработки интервальнозначных данных.
Методы исследования основаны на использовании теории интервального анализа и интервальной арифметики, объектно-ориентированного программирования, теории проектировании реляционных баз данных, теории математического кластерного анализа.
Тематика работы. Содержание диссертации соответствует следующим пунктам паспорта специальности 05.13.11 - «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»: п. 1 «Модели, методы и алгоритмы проектирования и анализа программ и программных систем, их эквивалентных преобразований, верификации и тестирования»; п. 3 «Модели, методы, алгоритмы, языки и программные инструменты для организации взаимодействия программ и программных систем»; п. 4 «Системы управления базами данных и знаний».
Научная новизна. В диссертации получены следующие основные, отличающиеся научной новизной, результаты:
- формализация структуры и методов обработки пользовательского интервальнозначного типа данных, отличающаяся автоматической проверкой целостности, позволяющая выполнять прозрачные SQL-запросы в реляционных СУБД;
- алгоритм операции сравнения разработанного интервальнозначного пользовательского типа, отличающийся возможностью вызова перегруженных операций отношения и основанный на использовании вероятностного параметра, позволяющий осуществлять достоверное сравнение интервальнозначных данных;
- механизм индексирования объектов в реляционных СУБД, отличающийся применением пользовательского интервальнозначного типа данных, позволяющий использовать переопределенные операции сравнения при построении индексных структур;
- алгоритм интервальной кластеризации к-средних, отличающийся использованием предложенного алгоритма операции сравнения и позволяющий выполнять кластеризацию объектов, значения которых представлены в интервальном виде;
- структура взаимодействия программного обеспечения, отличающаяся возможностью применения разработанной библиотеки интервальнозначных данных, которая предоставляет интерфейсы для надёжной обработки интервальных значений при создании программ и программных систем.
Практическая значимость работы заключается в создании динамически подключаемой библиотеки, реализующей пользовательский интервальнозначный тип данных, позволяющий автоматически осуществлять проверку целостности интервальных значений, осуществлять хранение интервальных значений в виде одного поля таблицы базы данных, что упрощает проектирование реляционных баз данных, давая возможность выполнять прозрачные SQL-запросы и настраивать индексирование, предоставляя прикладному программисту интерфейсы, позволяющие сокращать сроки разработки программных средств обработки интервальных данных; в создании специального прикладного программного обеспечения для предприятий металлургической отрасли, использующего созданную библиотеку интервальнозначных данных.
Компоненты программного обеспечения прошли государственную регистрацию в Федеральной службе по интеллектуальной собственности (прил. В).
Положения, выносимые на защиту:
- формализация структуры и методов обработки пользовательского интервальнозначного типа данных;
- алгоритм операции сравнения разработанного интервальнозначного пользовательского типа, основанный на использовании вероятностного параметра;
- механизм индексирования объектов в реляционных СУБД, использующий переопределенные операции сравнения;
- алгоритм интервальной кластеризации ^-средних.
Достоверность и научная обоснованность результатов диссертации
обеспечивается применением известных методов интервального анализа и интервальной арифметики, разработки алгоритмов и структур данных, согласуется с результатами, описанными в литературе, и подтверждается успешным внедрением в промышленные СУБД.
Реализация и внедрение результатов работы. Полученные практические результаты, разработанная библиотека для работы с интервальнозначными данными, комплекс программ для осуществления кластеризации марок чугуна используются в информационно -аналитической системе научно-производственного предприятия ООО «ВАЛОК-ЧУГУН» (прил. А).
Теоретические результаты диссертационного исследования используются в учебном процессе ФГБОУ ВО «Липецкий государственный технический университет» при чтении профильных дисциплин и выполнении дипломных и курсовых проектов (прил. Б).
Апробация. Основные результаты, полученные в диссертационной
работе, докладывались и обсуждались на международных конференциях:
XXI Международной конференции по мягким вычислениям и измерениям
SCM'2018 (Санкт-Петербург, 2018), VII Международной конференции по
мягким вычислениям (Баку, 2018), XIV Всероссийской школе-конференции
9
молодых ученых «Управление большими системами» (Пермь, 2017); XII международной научно-практической конференции «Современные сложные системы управления» (Липецк, 2017), а также на научных семинарах кафедры прикладной математики Липецкого государственного технического университета и научно-образовательных семинарах «Математическое моделирование, информационные технологии и проблемы управления» Липецкого научно-образовательного центра по проблемам управления (Липецк, 2016-2019).
Тематика работы соответствует приоритетному направлению исследований ФГБОУ ВО «Липецкий государственный технический университет» «Моделирование, оптимизация и управление системами, проектами и знаниями на основе информационных, телекоммуникационных и интеллектуальных технологий».
Работа выполнялась в рамках гранта РФФИ «Разработка и исследование математического и программного обеспечения для организации интервальных баз данных и выполнения интервальных запросов с целью аналитической обработки информации» (проект №16 -47480929 р_а, 2016-2018 гг.).
Публикации. Основные результаты диссертационного исследования
опубликованы в 11 научных работах, в том числе 4 в изданиях,
рекомендованных ВАК РФ, 1 в издании, входящем в международную
реферативную базу данных Web of Science; 1 свидетельство на программу
для электронных вычислительных машин. В работах, опубликованных в
соавторстве, лично соискателю принадлежат следующие результаты: [57,
68, 58, 103] - разработка алгоритма операции сравнения
интервальнозначных данных в реляционных СУБД, проведение
вычислительных экспериментов; [17] - теоретический анализ методик
создания пользовательских типов данных в реляционных СУБД, создание
процедуры проектирования пользовательского интервальнозначного типа и
10
программная реализация базовых классов и структур, интервальных функций и агрегатов; [69] - создание механизма индексирования и оценка производительности выполнения операций при использовании различных типов индексирования интервальнозначного типа данных; [ 102] -разработка алгоритма интервальной кластеризации к-средних, описание структуры взаимодействия программного обеспечения, реализация динамически подключаемой библиотеки и прикладного программного обеспечения; [70] - разработка методики реализации интервального типа данных с использованием объектно-ориентированной технологии доступа.
Объем и структура работы. Диссертация состоит из введения, четырех глав, заключения, трёх приложений и терминологического словаря. Список использованной литературы содержит 116 наименований. Основная часть работы изложена на 110 страницах машинописного текста, включая 50 рисунков и 13 таблиц.
Во введении обоснована актуальность темы диссертационной работы, сформулированы цель и задачи исследования, определены научная новизна и практическая значимость результатов работы.
В первой главе диссертации приведены основные понятия интервальной арифметики и интервального анализа, интервальных методов, позволяющих осуществлять математическое моделирование, оценивать решение задач с интервальными неопределённостями, производить строгий учёт ошибок округлений на цифровых вычислительных устройствах, находить новые подходы к решению традиционных задач.
Во второй главе представлены способы создания пользовательских типов данных в СУБД, описание структуры базового класса пользовательского интервальнозначного типа, методика реализации операций сравнения интервальнозначных данных в СУБД.
В третьей главе рассматриваются подходы к организации хранения и
доступа к данным интервального типа в реляционных базах данных.
11
Анализируется время выполнения запросов различных видов при реализации пользовательских типов данных в СУБД и при объектно-ориентированной технологии доступа к данным (ORM) и решаются вопросы индексирования полей пользовательского интервальнозначного типа в СУБД
В четвертой главе рассматриваются средства поддержки интервальнозначных типов данных в системах баз данных позволяющие решать широкий класс задач анализа данных, оперирующих интервальнозначными данными, в частности, задачу кластеризации в справочной информационно-аналитической системе марок чугуна для промышленного производства.
В заключении излагаются основные результаты диссертации.
В приложениях приведены акт внедрения, справка об использовании результатов исследования в учебном процессе, свидетельство о государственной регистрации программы для ЭВМ.
В списке терминологическом словаре содержится расшифровка сокращений, использованных в рамках диссертационной работы.
ГЛАВА 1. Обзор математического и программного обеспечения для представления интервальнозначных данных в реляционных СУБД
Рекомендованный список диссертаций по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Математическое и программное обеспечение процесса приближенной обработки запросов в реляционных системах управления базами данных2023 год, кандидат наук Филимонов Алексей Валерьевич
Проектирование и исследование свойств реляционных баз данных, нормализованных на основе операций выборки и соединения2005 год, доктор технических наук Маликов, Андрей Валерьевич
Методы и средства интеграции независимых баз данных в распределенных сетях TCP/IP2012 год, кандидат технических наук Пыхалов, Александр Владимирович
Методы параллельной обработки сверхбольших баз данных с использованием распределенных колоночных индексов2015 год, кандидат наук Иванова Елена Владимировна
Интеллектуальный анализ данных в СУБД2020 год, доктор наук Цымблер Михаил Леонидович
Введение диссертации (часть автореферата) на тему «Специальное математическое и программное обеспечение реляционных СУБД для интервальнозначных типов данных»
Введение
В данной главе рассматривается проблема использования методов интервального анализа при решении прикладных задач, ставятся проблемы организации хранения и предоставления доступа к интервальнозначным данным в реляционных базах данных, описывается архитектура системы управления базами данных.
1.1. Понятие интервальной арифметики
Основным понятием интервального анализа является интервал [98, 108]. Интервалом называется любое подмножество действительного множества, представляющее собой замкнутый отрезок:
Над интервалом могут производиться следующие основные операции: - умножение интервала на скаляр:
[х] = [х, х] = {х | х < х < х}.
(1)
(2)
сложение интервалов:
[х] + [у] = [х + У, х + у] ;
(3)
разность интервалов:
[х] - [у] = [х - у, х - у] ;
произведение интервалов:
[ x][ y] =
min{ xy, xy, xy, xy}, max{xy, xy, xy, xy}
(5)
деление интервалов:
[x] [ y]
= [ x]
1 1
y' y
о *[ y, y ].
(6)
Кроме вышеперечисленных арифметических операций, в языке запросов SQL могут применяться и математические функции, такие как корень, экспонента, тригонометрические и другие. В случае применения данных функций к интервальным аргументам результатом будет являться также интервал, содержащий возможные значения функции. Задача определения интервального расширения функций во многих случаях эквивалентна поиску области значений (поиску оптимумов) функции. Поэтому такие функции тоже требуют переопределения в языке запросов.
Для получения более точного результата и сужения результирующего интервала производится вычисление естественного и центрированного интервальных расширений, после чего из получившихся двух вариантов в качестве нижней границы возвращаемого интервала выбирается максимальная нижняя граница, а в качестве верхней - минимальная верхняя.
Естественное интервальное расширение определяется в виде: min( f (x) | x e [x])
f ([x])
(7)
max( f (x) | x e [x]) Центрированное интервальное расширение реализуется по формуле: f„v ([x]) = f (mid[x]) + f„'([x])([x] - mid[x]), (8)
где mid[ x]
x I x 2
середина интервала.
1.2. Понятие интервального анализа
Интервальные методы, помогающие решать труднейшие задачи естествознания и математического моделирования, позволяют также решать задачи с интервальными неопределённостями, производить строгий учёт ошибок округлений на цифровых вычислительных устройствах, находить новые подходы к решению традиционных задач [3, 87, 111]. Методы интервального анализа, описанные в [1, 24, 80, 105], позволяют проводить различное интервальное оценивание областей значений вещественных функций; использовать интервальную оценку области значений функции и её первой производной для вычисления нулей функции; задавать и производить действия над интервальными векторами и матрицами; создавать системы линейных уравнений вида А ■ х = Ь, в которых элементы А и Ь могут изменяться в пределах заданных границ; решать такие слабо нелинейные задачи, как задачи нахождения собственных чисел, обобщённых собственных чисел и сингулярных чисел; реализовывать интервальные методы проверки существования и оценивания решения задачи Коши для обыкновенных дифференциальных уравнений; решать некоторые классы дифференциальных уравнений в частных производных 2-го порядка; рассматривать эллиптические краевые задачи [63, 95].
1.3. Применение методов интервального анализа
В связи с повсеместным внедрением информационных технологий, их использованием в процессе ежедневной деятельности предприятий и прогнозируемым началом четвёртой промышленной революции, неизбежно возникают новые задачи по созданию методов анализа, генерирования, хранения и передачи данных.
В настоящее время информационные технологии позволяют собирать, обрабатывать и накапливать огромные объемы информации в самых различных областях деятельности человека [30, 42, 47, 66]. Одной из главных задач становится извлечение из имеющейся информации полезных знаний [4, 5, 44, 60]. Благодаря полученным знаниям могут быть приняты управленческие решения, с помощью которых будут достигнуты качественные усовершенствования процессов в рассматриваемой сфере деятельности. В свою очередь, на качество принимаемых управленческих решений влияет скорость получения знаний и их корректность [ 15, 16, 22, 33, 82].
Управленческие решения принимаются на основе информации, которая может поступать из различных источников. Так, например, информация может быть получена путем измерений. А измерения, как известно, содержат в себе погрешность, что в результате приводит к неопределенности и противоречивости полученной информации [12, 25, 49].
Из-за постоянно растущего объема данных возникает необходимость
разрабатывать новые подходы для их обработки [26, 46, 51, 62, 65, 80].
Чтобы принять наиболее оптимальные управленческие решения
необходимо извлечь как можно больше конструктивной информации из
имеющихся данных, выявить закономерности [78]. Несмотря на то что
уровень сложности вычислительной техники постоянно возрастает, этого
все еще не достаточно, так как для использования интеллектуальных
методов выявления зависимостей нужны огромные вычислительные
затраты и приемлемое время на их обработку и получение адекватных
результатов [52, 55, 83, 96]. Основная проблема заключается в том, что при
сборе больших объемов данных присутствует погрешность их измерения,
которая оказывает значительное влияние на итоговый результат. Для
решения данной проблемы существует способ предобработки исходных
данных, помогающий сократить их объем и вести учет содержащихся в них
16
погрешностей, например, для этих целей подходит представление данных в интервальном виде, позволяющее учесть погрешности и объединить определенные наборы данных путем задания верхней и нижней границы возможных значений. Методы, используемые для работы с интервальными значениями, достаточно широко применяются на практике и могут сильно отличаться от методов обработки скалярных данных [41, 53, 76, 79, 84].
В [6] вводится понятие интервальнозначной лингвистической переменной, значениями которой являются слова и предложения естественного или искусственного языка. Значение лингвистической переменной может зависеть от множества базовых значений или от области определения. В первом случае лингвистическую переменную можно рассматривать как нечёткое число а, а во втором как нечёткий интервал [ а, Ь] с функциями принадлежности треугольного и трапециевидного вида, соответственно. Введение лингвистических переменных интервального типа позволяет реализовать подход к решению задачи размещения центров обслуживания в случае, когда расстояния между рассматриваемыми объектами задаются в виде нечётких интервальных графов 6 = (X, и) с трапецеидальными функциями принадлежности, где X - вершины графа б, представляющие собой объекты на карте; а и = \11]/- множество нечётких ориентированных ребер с весами, представляющими собой нечёткие интервалы расстояний.
На основе метода нахождения оптимального размещения к заданных центров обслуживания, применимого к четким интервальным графам, решается задача определения характеристик не для одного заранее заданного числа центров обслуживания, а для произвольного значения к. При решении данной задачи вводятся операции сравнения над
произвольными нечёткими интервалами ~ и ~ [~2, ; в случае с
выполнением неравенств аг> а2 и < Ь2, интервалы ~ и ~ определяются
17
как несоизмеримые, иначе задаются операции выделения подмножеств наименьших и наибольших интервалов из множества интервалов L. Это позволяет определять множество нечетких интервалов Lxy, для которых вершина y достижима из вершины x в графе G=(X, U). Реализация больших объемов данных в виде интервальнозначной лингвистической формы представлена в [1, 107].
В [61] рассматривается оптимизация решения многокритериальной задачи о назначениях, параметры которой заданы в виде интервалов. Оптимизация основана на решении двух задач математического программирования для верхней и нижней границ интервальных оценок, определяющих требования к должностям и претендентам на эти должности по совокупности критериев. Причем число претендентов может превышать количество должностей. Общим решением задачи является пересечение решений этих двух задач по определению оптимальных матриц назначений. При оптимизации минимизируется разница между требованиями к претендентам и должностям. Численное решение получено с помощью венгерского метода для задач о назначениях. Полученные результаты сравниваются с результатами, основанными на использовании нечетких бинарных отношений.
При программной реализации решения задачи нахождения всех оптимальных решений верхней и нижней граничных задач применяется подход написания кода, отдельно обрабатывающего границы интервалов, хранящихся, например, в виде структуры данных std::pair, входящей в STL для языка программирования C++. Проверка согласованности границ интервала, точности вычислений в этом случае целиком ложится на прикладного программиста.
1.4. Архитектура системы управления базами данных
Чтобы использовать подходы интервального представления данных на практике, необходимо создать условия для их сохранения и реализовать прозрачное использование как в промышленных СУБД, так и в средах разработки прикладных приложений.
В самом распространённом сценарии взаимодействие прикладного программного обеспечения с базой данных строится, как показано на рис. 1.1.
Рисунок 1.1. Взаимодействие прикладного программного обеспечения
с базой данных
Сначала пользовательское программное обеспечение явно или с использованием промежуточных средств генерирует SQL-запрос на выборку, который передается системе управления базами данных. СУБД производит проверку синтаксиса поступившего запроса, компиляцию, оптимизацию и обращается к требуемым объектам базы данных на жестком диске [21]. Записи, удовлетворяющие условию запроса, помещаются в результирующую выборку, которая полностью передается приложению,
сгенерировавшему запрос. Прикладное приложение, получив требуемые данные, осуществляет их обработку [13, 19, 56].
Система управления базами данных выполняет следующие функции [20, 37]:
1. Хранение, извлечение и обновление данных.
2. Предоставление системного каталога, доступного конечным пользователям.
3. Поддержка транзакций.
4. Наличие служб управления параллельной работой.
5. Наличие служб резервного копирования и восстановления.
6. Наличие служб контроля доступа к данным.
7. Осуществление поддержки обмена данными.
8. Наличие служб поддержки целостности данных.
9. Наличие служб поддержки независимости от данных.
10. Предоставление вспомогательных служб.
Система управления базами данных представляет собой набор программ, позволяющих разработчикам прикладного программного обеспечения не задумываться над тем, как эффективно и безопасно хранить данные разрабатываемой ими программы [23, 43, 86]. Они просто передают необходимую информацию СУБД, которая заботится о том, где и как разместить эти данные на жестком диске таким образом, чтобы быстро их извлечь, когда от внешней программы придет соответствующий запрос [75]. Если бы в приведенной выше схеме (рис. 1.1) СУБД отсутствовала, то все реализуемые ею функции пришлось бы программировать заново в каждой разрабатываемой программе [64].
Одна из широко используемых на предприятиях систем управления базами данных MS SQL Server представляет собой программный комплекс, состоящий из трёх основных компонентов [7, 11, 14]:
- ядро СУБД Database Engine;
- службы Analysis Services;
- службы Reporting Services.
Компания Microsoft предлагает визуализацию архитектуры СУБД MS SQL Server, представленную на рис. 1.2 [85].
Компонент Database Engine представляет собой основную службу для хранения, обработки и обеспечения безопасности данных. Этот компонент обеспечивает управляемый доступ к ресурсам и быструю обработку транзакций, что позволяет использовать его даже в самых требовательных корпоративных приложениях обработки данных [73]. Компонент Database Engine используется при создании реляционных баз данных для оперативной обработки транзакций (On-Line Transaction Processing - OLTP) или оперативной аналитической обработки данных (On-Line Analytical Processing - OLAP).
Службы Microsoft SQL Server Analysis Services - «многомерные данные» осуществляют процесс OLAP, предоставляют возможность проектировать и создавать многомерные структуры данных, полученные из разных источников данных, и управлять этими многомерными объектами.
Рисунок 1.2. Архитектура СУБД MS SQL Server 2012
Службы Analysis Services позволяют аналитикам работать с многомерными структурами, содержащими детальные статистические данные в единой унифицированной логической модели, реализуя, по сути, модель хранилищ данных.
Благодаря службам Analysis Services можно проектировать, создавать и визуализировать модели интеллектуального анализа данных (ИАД). Разнообразие стандартных алгоритмов интеллектуального анализа данных позволяет создавать такие модели на основе других источников данных. Для поиска закономерностей в массиве данных используются методы Data Mining - исследование и обнаружение машинными алгоритмами в сырых данных скрытых знаний, которые ранее не были известны, нетривиальны, практически полезны и доступны для интерпретации человеком.
Службы SQL Server Reporting Services - это серверная платформа, предоставляющая средства создания корпоративных отчетов с поддержкой веб-интерфейса, которые позволяют включать в отчеты данные из различных источников, публиковать отчеты в разнообразных форматах, централизованно управлять безопасностью и подписками.
Службы Integration Services представляют собой платформу, на основе которой создаются высокопроизводительные решения по интеграции данных, а также пакеты для хранения данных, которые дают возможность извлекать, преобразовывать и загружать данные.
Репликация - это процесс, представляющий собой копирование и перенос информации между разными базами данных, а также синхронизацию этих баз данных для обеспечения их согласованности. Технологии репликации дают возможность размещения данных в различных местах, а также обеспечивают доступ к ним пользователей, которые подключены удаленно.
Компонент Service Broker применяется для создания безопасных
масштабируемых приложений баз данных. Эта технология предоставляет
22
собой платформу взаимодействия пользователей друг с другом на основе обмена сообщениями, в то время как независимые компоненты приложений выступают единым целым. В компонент Service Broker включена инфраструктура асинхронного программирования, которая может использоваться как приложениями в пределах одной базы данных или экземпляра, так и распределенными приложениями.
1.5. Требования и подходы к реализации интервальнозначных типов данных в реляционных системах управления базами данных
В настоящее время возможности программных и аппаратных средств позволяют обрабатывать и хранить большие объемы информации. Но в связи с тем, что получаемая информация поступает из различных источников, она содержит в себе погрешности и противоречия, которые могут быть не до конца устранены в процессе репликации [50, 88]. Так, одной из главных задач для современных аппаратных и программных средств является извлечение из полученной информации достоверных знаний, которые, в свою очередь, дадут существенные качественные улучшения рассматриваемых процессов [72]. Чтобы полученные знания можно было считать достоверными, необходимо учитывать неопределенность, содержащуюся в исходных данных. Сделать это возможно с помощью интервалов, задавая верхнюю и нижнюю границы вероятных значений, соответствующих тем или иным числовым параметрам [39]. Исследованием алгоритмов обработки данных, которые задаются вышеописанным образом, занимается интервальный анализ, а его методы имеют широкое применение в различных практических областях [29, 32, 80, 101, 110].
Актуальной является задача по созданию интервальнозначных типов
данных в промышленных СУБД и реализация методов для их обработки.
23
Необходимо учитывать, что при реализации эти методы должны давать возможность создавать прозрачные SQL-запросы [9, 71]. Таким образом, пользователь не должен задумываться о том, какой тип данных он обрабатывает при написании запросов, для чего в СУБД должны содержаться:
- реализация интервальнозначного типа данных;
- гарантированное выполнение арифметических операций над объектами интервальнозначного типа;
- операции сравнения интервальнозначных типов данных;
- интервальные расширения элементарных функций;
- агрегатные функции над полями интервальнозначного типа данных;
- индексация по интервальнозначным полям.
Методы и алгоритмы работы с интервальными данными на сегодняшний момент очень разнообразны. Помимо этого разработаны специализированные программные обеспечения, целью которых является реализация интервальнозначных данных [28, 8]. Ими являются пакеты программ и библиотеки, позволяющие программистам работать с интервальными значениями на уровне прикладного математического обеспечения:
- JInterval - для платформы Java;
- Int4Sci - для математического пакета SciLab;
- INTLAB - интервальное расширение для систем MATLAB и Octave;
- IntLinIncR2, IntLinIncR3 - позволяют осуществлять визуализацию
множеств решений интервальных линейных систем;
- intpakX - интервальное расширение для Maple;
- boost, filib++, C-XSC, Gaol - библиотеки интервальных
вычислений для языка C++.
Однако при обработке большого количества интервальнозначных данных, хранящихся в реляционной базе данных, разработчик не может использовать преимущества, предоставляемые СУБД, без разделения единой логической единицы на нижнюю и верхнюю границы и без сохранения их в различных полях таблиц, подвергая риску целостность базы данных.
С помощью использования вычислений над интервальными данными, появляется возможность анализировать возможные варианты и принимать на основе их оценок управленческие решения, минимизирующие риски. Реляционные системы управления базами данных на современном этапе развития позволяют работать со встроенными типами данных, а также дают возможность создавать собственные типы данных, определяемые пользователем. Однако работа со встроенными типами данных является неудобной для использования [58, 103], в то время как пользовательские данные могут определяться несколькими способами [106].
Для того чтобы обработка интервальных запросов стала возможной, разрабатываются и используются базовые инструменты в надстройках над системами управления базами данных. Это также позволяет добиться прогресса в области баз данных и, в частности, создать достоверные алгоритмы, принимающие интервальные значения, для аналитической обработки данных.
В тех случаях, когда необходимо учитывать интервальные параметры, можно действовать следующим образом:
- создать структуру таблиц в базе данных так, чтобы для интервальных параметров создавалось два поля в таблице, и столбцы содержали в себе нижнюю и верхнюю границы интервала. Основным недостатком такого подхода является сложность реализации операций над интервальными данными. Также пользователь при создании запроса над
данными вынужден каждый раз реализовывать операции над интервалами, что может повлечь за собой ошибки из-за неоднозначности определения подобных операций [115, 116];
- создать интервальнозначные типы данных и операции их обработки. Это может значительно упростить работу как программистов, так и пользователей, так как не требуется постоянно задумываться об определении операций обработки интервальных данных. Здесь SQL-запросы являются прозрачными, не отличаясь от запросов к реляционным базам данных, использующих скалярные типы данных.
Объем данных во всех сферах жизнедеятельности человека постоянно растет и этот стремительный рост является основным фактором, который диктует необходимость использования в базах данных интервальных значений, и в связи с которым, методы интервального анализа в последнее время привлекают внимание все большего количества исследователей. Изначально интервальный анализ использовался с целью учета ошибок округлений расчетов с конечной точностью для задач чувствительности, а также для учета погрешности при многих операциях и расчетах, которые выполняются на ЭВМ. Следовательно, можно сказать, что использование интервального анализа оказывает значительное влияние на эффективность ввода и поиска интервальных данных.
Главной причиной введения интервальных значений является повышение эффективности использования имеющихся данных, что достигается за счет применения интервальных алгоритмов аналитической обработки информации. На данный момент информационные системы могут учитывать неопределенность в информации, следовательно, целесообразно использовать в них данные в виде интервальных значений.
Понятие «допуск» в [80] определяется как «интервал, в котором допускается отклонение числовой характеристики параметра от его номинального значения», из чего следует, что существует возможность практически задавать допуски в системах управления базами данных. Так, например, можно задать некоторые механические или геометрические параметры механизмов, таких как размер, форма, расположение.
С целью удобного и полноценного использования базы данных с уже введенными интервальными данными используется реализация достоверных арифметических операций с интервалами. К таким операциям относятся сложение, вычитание, умножение и деление интервальных значений, что соответствует базовой интервальной арифметике.
Для этого в используемой системе управления базами данных необходимо разработать эффективные функции и процедуры. Есть возможность создания расширяющих, добавляющих и собственных функций, которые предоставляются системой управления данными. Они могут возвращать скалярное значение или таблицу и получать ноль или более параметров. Входные параметры могут быть любого типа.
В общем виде функции в системах управления базами данных объявляются инструкцией CREATE FUNCTION. Внутри этой команды задаются входные параметры, вычисляется некая функция и возвращается выходной параметр.
Значения границ интервалов в данном случае служат входными параметрами. В результате созданная функция будет работать с используемым интервалом (или интервалами), при этом применяя лишь граничные значения. Для того чтобы выполнить каждую из арифметических операций, необходимо переопределить встроенные функции.
Далее приведен пример, в котором выполняется простейший запрос на выборку интервальных значений (рис. 1.3).
SELECT Id, LowerValue, UpperValue FROM Table;
Рисунок 1.3. Реализация интервальногозначного типа с использованием двух полей таблицы
На рис. 1.3 поле Id - номер интервала, LowerValue - нижнее значение интервала, UpperValue - верхнее значение интервала, Table - таблица, из которой производится выборка.
В системе управления базами данных Microsoft SQL Server пространственные интервалы можно представлять с помощью пространственных типов данных, таких как GEOMETRY и GEOGRAPHY. Также можно оперировать этими типами данных с помощью методов.
Геометрический объект или GEOMETRY представляет данные в виде точек, прямых и многоугольников в двумерном пространстве. Он использует одну из существующих плоских пространственных моделей. Геометрический объект также можно представить как тип данных с несколькими подтипами. Эти подклассы разделяются на две категории: базовые и однородные коллекции. Базовые геометрические подклассы включают в себя, помимо прочих, классы Point, LineString и Polygon. В свою очередь, однородные коллекции включают подклассы MultiPoint, MultiLineString и MultiPolygon. Описание экземплируемых типов приведено в [54].
Типы данных GEOMETRY и GEOGRAPHY используются разработчиками приложений Microsoft SQL Server. Для этого применяется слой среды выполнения CLR (Common Language Runtime - общеязыковая среда выполнения), где основной задачей являются загрузка и управление NET-типами. Помимо этого CLR помогает разрешить такие вопросы, как, например, проверка безопасности и управление памятью [106, 114].
Стоит заметить, что вышеописанные типы данных выводятся в шестнадцатеричном формате, который является непригодным для моментальной обработки. Поэтому требуется использовать разборщик выражений, что, в свою очередь, снижает точность вычислений.
Среда SQL Server Management Studio может отображать пространственные данные в графическом формате, что продемонстрировано на примере с использованием языка Transact-SQL (рис. 1.4).
DECLARE @polygon1 GEOMETRY = 'POLYGON((1 1, 1 5, 5 5, 5 1, 1 1))';
DECLARE @line GEOMETRY = 'LINESTRING (0 1, 7 5)'; SELECT @polygon1 UNION ALL SELECT @line
Рисунок 1.4. Визуализация пространственного типа данных
В данном примере при выполнении запроса выводится прямоугольник, который задан переменной @polygon1, и прямая согласно переменной @line (рис. 1.5).
Рисунок 1.5. Графический результат выполнения запроса в SQL Server
Management Studio
В Microsoft SQL Server для интервальных значений других типов не предусмотрено специальной поддержки и обычно такие интервалы реализуют двумя атрибутами. Атрибуты содержат в себе нижние и верхние значения и используют предикаты, которые применяют эти атрибуты в запросах, связанных с интервальными значениями.
Главной проблемой такого метода является недостоверность при обращении к строкам базы данных. Связано это с ошибками округления при представлении информации в цифровом виде. Для устранения этой проблемы, требуется использование специальных алгоритмов, позволяющих осуществить достоверную обработку сохраняемых данных.
Похожие диссертационные работы по специальности «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей», 05.13.11 шифр ВАК
Методы организации систем управления данными на основе нумерационных методов и интервальных вычислений1999 год, кандидат технических наук Белоусов, Алексей Леонидович
Специальное математическое и программное обеспечение системы управления схемой реляционных баз данных на основе машинного обучения2020 год, кандидат наук Громей Дмитрий Дмитриевич
Алгоритмы, методы хранения, поиска и анализа временных рядов в промышленных СУБД2001 год, кандидат физико-математических наук Прохоров, Андрей Юрьевич
Метод поиска оптимального плана выполнения запросов к базам данных на основе нисходящей стратегии2003 год, кандидат технических наук Гребенников, Николай Андреевич
Нечисловая обработка информации на вычислительной машине нетрадиционной архитектуры потока данных1999 год, кандидат технических наук Провоторова, Анна Олеговна
Список литературы диссертационного исследования кандидат наук Мирошников Артём Игоревич, 2019 год
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Аверкин, А. Многокритериальный анализ нечетких объектов с кластеризацией экспертных оценок / А. Аверкин, О. Костюченко, Н. Титова // Нечеткие системы и мягкие вычисления. Тверь: Тверской государственный университет. - 2007. - С. 49-62.
2. Ащепков, Л.Т. Показатель интервального неравенства: свойства и применение / Л.Т. Ащепков, Д.В. Давыдов // Вычислительные технологии. - 2006. - №4. - С. 13-22.
3. Баврин, И.И. Математическая обработка информации: учебник / И.И. Баврин. - М.: Прометей, 2016. - 260 с.
4. Барсегян, А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. - СПб: БХВ-Петербург, 2007. - 384 с.
5. Барсегян А.А. Анализ данных и процессов / А.А. Барсегян, М.С. Куприянов, И.И. Холод, М.Д. Тесс, С.И. Елизаров. - СПб: БХВ-Петербург, 2009. - 512 с.
6. Беляков, С.Л. Нечеткие методы управления потоками в геоинформационных системах / С.Л. Беляков, А.В. Боженюк, Л.А. Гинис, Е.М. Герасименко. - Таганрог: изд-во ЮФУ, 2013. - 176 с.
7. Бен-Ган, И. Microsoft SQL Server 2012. Высокопроизводительный код T-SQL. Оконные функции / И. Бен-Ган. - СПб: БХВ-Петербург, 2013. - 256 с.
8. Бен-Ган, И. Интервальные запросы в SQL Server. Windows IT Pro/RE / И. Бен-Ган, 2013. - Режим доступа: http://www.osp.ru/winitpro/2013/09/13037077/
9. Бен-Ган, И. Microsoft SQL Server 2012. Основы T-SQL / И. Бен-Ган. -М.: Эксмо, 2012. - 401 с.
10. Бондаренко, П.С. Теория вероятностей и математическая статистика / П.С. Бондаренко, Г.В. Горелова, И.А. Кацко. - М.: КНОРУС, 2017. - 388 с.
11. Бондарь, А.Г. Microsoft SQL Server 2014 / А.Г. Бондарь. - СПб: БХВ-Петербург, 2015. - 592 с.
12. Бормотова, Г.О. Техники сокращения объема индекса для задач нечеткого поиска в базах данных / Г.О. Бормотова, А.К. Погодаев // Системы управления и информационные технологии. - 2014. - № 4. - С. 26-29.
13. Веелинг, Л. MySQL: учеб. пособие / Л. Веелинг, Л. Томсон. - М.: Вильямс. - 2005. - 304 с.
14. Вьейра, Р. Программирование баз данных Microsoft SQL Server 2008. Базовый курс / Р. Вьейра. - М.: Вильямс, 2010. - 816 с.
15. Гайворонский, С. Методика выбора параметров пи-регулятора для интервальной системы автоматического управления / С. Гайворонский, Т. Езангина // Вестник науки Сибири. - Национальный исследовательский Томский политехнический университет. - Томск. - 2012. - С. 143-147.
16. Галкин, А.В. Повышение эффективности процессов обработки информации в базах данных с материализованными представлениями / А.В. Галкин, Д.В. Дятчина, А.К. Погодаев // Системы управления и информационные технологии. - 2014. - Т. 57. - № 3.1. - С. 136-140.
17. Галкин, А.В. Разработка интервального типа данных и операций над ним в системе MS SQL Server / А.В. Галкин, А.И. Мирошников, А.К. Погодаев // Системы управления и информационные технологии. -2017. - №1(67). - С. 48-51.
18. Галкин, А.В. Информационно-аналитическая система классификационного анализа марок чугуна / А.В. Галкин, А.Н. Роготовский, А.А. Шипельников, Е. Михайлов, С.Ю. Сериков // Современная металлургия начала нового тысячелетия. - 2014. - С. 173-181.
19. Григорьев, Ю.А. Реляционные базы данных и системы NOSQL / Ю.А. Григорьев, А.Д. Плутенко, О.Ю. Плужников // Благовещенск: Амурский государственный университет. - 2018. - С. 331-414.
20. Гринвальд, Р. Программирование баз данных Oracle для профессионалов / Р. Гринвальд, Р. Стаковьяк, Г. Додж. - М.: Вильямс, 2007. - 784 с.
21. Грофф, Д.Р. SQL. Полное руководство / Д.Р. Грофф, П.Н. Вайнберг, Э.Дж. Оппель. - М.: Вильямс, 2014. - 960с.
22. Демидова, Л. Развитие методов теории нечётких множеств и генетических алгоритмов для задач поддержки принятия решений в условиях неопределённости: дис. ... д-ра техн. наук: 05.13.01 / Демидова Лилия Анатольевна. - Рязань, 2009. - 532 с.
23. Дейт, К. Введение в базы данных / К. Дейт. - М.: Вильямс, 2005. - 1328 с.
24. Добронец, Б.С. Интервальная математика / Б.С. Добронец. -Красноярск: Краснояр. гос. ун -т, 2004. - 216 с.
25. Дывак, Н.П. Задачи математического моделирования статических систем с интервальными данными / Н.П. Дывак. - Тернополь: Экономична думка, ТНЭУ, 2001. - 216 с.
26. Евтушенко, Т. Исследование задачи выбора допустимых режимов технологических процессов по их интервальным моделям и разработка алгоритмического и программного обеспечения решения этих задач: автореф. дис. ... канд. техн. наук: 05.13.01 / Татьяна Владимировна Евтушенко. - М., 1991. - 20 с.
27. Елтаренко, Е. Многокритериальная кластеризация объектов / Е. Елтаренко, Г. Антюфеев // Информационные технологии в проектировании и производстве. - М.: Научно-технический центр оборонного комплекса "Компас". - 2005. - С. 39-45.
28. Жилин, С.И. Архитектура библиотеки JInterval / С.И. Жилин, Д.Ю. Надёжин, Е.Н. Тепикин // Всероссийская научно-практическая конференция «Статистика. Моделирование. Оптимизация». - 2011. - Режим доступа: http://www.nsc.ru/interval/Programing/SMO2011-JInterval.pdf
29. Жолен, Л. Прикладной интервальный анализ / Л. Жолен, М. Кифер, О. Дидри, Э. Вальтер. - М.-Ижевск: Институт компьютерных исследований, 2005. - 468 с.
30. Иванова, Е. Обработка запросов к сверхбольшим базам данных с использованием распределенных колоночных хеш-индексов / Е. Иванова // Наука ЮУРГУ. - Челябинск: Издательский центр ЮУрГУ. - 2014. - С. 12-15.
31. Кабаева, Е. Решение задач интервального анализа с использованием объектно-ориентированной системы программирования / Е. Кабаева // Архивариус. - Киев: Serenity-Group. - 2016. - С. 16-21.
32. Калмыков, С.А. Методы интервального анализа / С.А. Калмыков, Ю.И. Шокин, З.Х. Юлдашев. - Новосибирск: Наука, 1986. - 223 с.
33. Кантор, О. Интервальное оценивание параметров математических моделей / О. Кантор, С. Спивак // Экономико-математические методы исследования современных проблем экономики и общества. - Уфа: ООО «Аэтерна». - 2015. - С. 69 - 83.
34. Карвин, Б. Программирование баз данных SQL. Типичные ошибки и их устранение / Б. Карвин. - М.: Рид Групп, 2012. - 338 с.
35. Качаева, Г. Обзор алгоритмов, реализующих кластеризацию данных / Г. Качаева, Ю. Магомаева // Инновационное развитие. - Пермь: ИП Сигитов Т.М. - 2018. - С. 22-27.
36. Кириллов, В. Введение в реляционные базы данных / В. Кириллов, Г. Громов. - СПб: БХВ-Петербург, 2009. - 454 с.
37. Коннолли, Т. Базы данных. Проектирование, реализация и сопровождение. Теория и практика / Т. Коннолли, К. Бегг. - М.: Вильямс, 2017. - 1440 с.
38. Кудинов, Ю. Нечеткое моделирование и кластеризация / Ю. Кудинов, И. Кудинов // Проблемы управления. - М.: Сенсидат-Плюс. - 2008. - С. 2-10.
39. Кузьмин, Е. Логика интервальной неопределенности / Е. Кузьмин // Проблемы анализа риска. - М.: Финансовый издательский дом "Деловой экспресс". - 2014. - С. 44-59.
40. Кунгурцев, А.Б. Обновление материализованных представлений и шаблонов запросов в реляционных базах данных / А.Б. Кунгурцев // Автоматика. Автоматизация. Электротехнические комплексы и системы. -2003. - № 2(12). - С.26-30.
41. Левин, В. Методы оптимизации систем в условиях интервальной неопределенности параметров / В. Левин // Информационные технологии. М.: «Новые технологии», 2012. - С. 17-22.
42. Ледащева, Т.Н. Компьютерная обработка статистических данных: учеб. пособие / Т.Н. Ледащева, В.И. Чемоданова, Л.В. Брагина. - М.: Российский ун-т дружбы народов, 2017. - 86 с.
43. Льюис, Д. Ядро Oracle. Внутреннее устройство для администраторов и разработчиков баз данных / Д. Льюис; пер. с англ. Киселев А.Н. - М.: ДМК Пресс, 2015. - 372 с.
44. Мирзоев, М.С. Основы математической обработки информации / М.С. Мирзоев. - М.: Прометей, 2016. - 316 с.
45. Мирошников, А.И. Использование библиотеки интервальнозначных данных при решении задачи кластеризации марок чугуна / А.И. Мирошников // Моделирование, оптимизация и информационные технологии. - Воронеж, 2019. - № 1. - Режим доступа: http://moit.vivt.ru/?p=8672/
46. Немкова, Е. Математическое моделирование производственных систем с интервальной неопределенностью параметров: дис. канд. техн. наук: 05.13.18 / Немкова Елена Анатольевна. - Пенза, 2014. - 153 с.
47. Низаметдинов, Ш.У. Анализ данных / Ш.У. Низаметдинов, В.П. Румянцев. - Москва: НИЯУ "МИФИ", 2012. - 285 с.
48. Окулов, С.М. Программирование в алгоритмах / С.М. Окулов. -М.: БИНОМ, 2014. - 383 с.
49. Орлов, А. Основные идеи статистики интервальных данных / А. Орлов // Политематический сетевой электронный научный журнал кубанского государственного аграрного университета. - Краснодар: Кубанский государственный аграрный университет имени И.Т. Трубилина. - 2013. -С. 55-70.
50. Паклин, Н.Б. Бизнес-аналитика: от данных к знаниям / Н.Б. Паклин, В.И. Орешков. - СПб: Питер, 2013. - 704 с.
51. Панов Н.В. Разработка рандомизированных алгоритмов в интервальной глобальной оптимизации: дис. канд. ф.-м. наук: 01.01.07 / Панов Никита Владимирович. - Новосибирск, 2012. - 178 с.
52. Перепелица, В. О вычислительной сложности интервальных задач на графах / В. Перепелица, Ф. Тебуева, Т. Шенкао // Известия высших учебных заведений. Северо-кавказский регион. Ростов-на-Дону: Южный федеральный университет. - 2006. - С. 18-30.
53. Перепелица, В. Задачи дискретной оптимизации с интервальными параметрами / В. Перепелица, Ф. Тебуева // Журнал вычислительной математики и математической физики. М.: Российская академия наук. -2010. - С. 836-847.
54. Петкович, Д. Microsoft SQL Server 2012 / Д. Петкович. - СПб: БХВ-Петербург, 2013. - 816 с.
55. Петрушин, В.Н. Информационная чувствительность компьютерных алгоритмов / В.Н. Петрушин, М.В. Ульянов. - М.: Физматлит, 2010. - 224 с.
56. Пирогов, В.Ю. Информационные системы и базы данных. Организация и проектирование / В.Ю. Пирогов. - СПб: БХВ-Петербург, 2009. - 528 с.
57. Погодаев, А.К. Сравнение интервальных типов данных в системе MS SQL Server / А.К. Погодаев, А.В. Галкин, П.В. Сараев, А.И. Мирошников // Системы управления и информационные технологии. - 2018. - № 1. - Т. 71. - С. 68-72.
58. Погодаев, А.К. Применение интервального типа данных при выполнении алгоритмов в СУБД MS SQL Server / А.К. Погодаев, А.И. Мирошников, А.А. Никольская, П.В. Сараев // Современные сложные системы управления. - Липецк: ЛГТУ. - 2017. - С. 60-64.
59. Погодаев, А.К. Операции сравнения интервальнозначных типов в базах данных / А.К. Погодаев, П.В. Сараев, А.В. Галкин // Вести высших учебных заведений Черноземья. - 2016. - №3 (45). - С. 66-72.
60. Погодаев, А.К. Универсальное информационное и программное обеспечение для аналитической обработки данных / А.К. Погодаев, П.В. Сараев, Е.П. Татаринов // Информационные технологии моделирования и управления. - 2010. - № 4 (63). - С. 543-550.
61. Попов, В.П. Интервальный подход к оптимизации решения многокритериальной задачи о назначениях / В.П. Попов, И.В. Майорова // Прикладная информатика. - 2015. - №3(57). - С. 122-131.
62. Пушков, С. Использование методов интервального анализа для вычисления размерности конечномерной реализации линейной динамической системы / С. Пушков, А. Горелик // Вестник оренбургского государственного университета. - Оренбург: Оренбургский государственный университет. - 2010. - С. 59-64.
63. Рахимова, Г. Последовательное оценивание среднего значения интервалами фиксированной ширины / Г. Рахимова, Г. Турсунов // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. - Пермь: Пермский государственный национальный исследовательский университет. - 2015. - С. 58-67.
64. Ригс, С. Администрирование PostgreSQL 9 / С. Ригс М.: ДМК, 2012. -363 с.
65. Родионова, О.Е. Интервальный метод обработки результатов
многоканальных экспериментов: автореф. дис. ... д-ра ф.-м. наук: 01.04.01
/ Родионова Оксана Евгеньевна. - М., 2008. - 34с.
104
66. Салмин, А. Анализ данных: курс лекций / А. Салмин. - Самара: ПГУТИ, 2013. - 73 с.
67. Сальников, А. Кластеризация результатов тестирования коммуникационной среды многопроцессорных систем: единицы анализа, исследование методов, визуализация результатов / А. Сальников, А. Майсурадзе, Д. Андреев, Г. Костин // Вестник уфимского государственного авиационного технического университета. - Уфа: ГОУ ВПО "Уфимский государственный авиационный технический университет". - 2012. - С. 149-157.
68. Сараев, П.В. Обработка объектов интервального типа в системе управления базами данных SQL Server / П.В. Сараев, А.В. Галкин, А.И. Мирошников, А.А. Никольская // Управление большими системами: материалы XIV Всероссийской школы-конференции молодых учёных. -Пермь: Изд-во Перм.нац.исслед.политехн.ун-та. - 2017. - С. 485-492.
69. Сараев, П.В. Исследование использования индексов в базах данных с объектами интервального типа / П.В. Сараев, А.В. Галкин, А.И. Мирошников // Вести высших учебных заведений Черноземья. - 2017. - №4. - С. 36-45.
70. Сараев, П.В. Использование объектно-ориентированной технологии доступа к данным интервального типа / П.В. Сараев, А.В. Галкин, А.И. Мирошников // Международная конференция по мягким вычислениям и измерениям. - 2018. - Т. 1. - С. 184-187.
71. Сараев, П.В. Организация интервальных баз данных в СУБД POSTGRESQL / П.В. Сараев, М. Комаров // Вести высших учебных заведений Черноземья. - 2016. - №2. - С. 52-59.
72. Сильвашко, С.А. Программные средства компьютерного моделирования элементов и устройств электроники / С.А. Сильвашко, С.С. Фролов. -Оренбург: ОГУ, 2014. - 170 с.
73. Станек, У.Р. Microsoft SQL Server 2012. Справочник администратора / У.Р. Станек. - СПб.: БХВ-Петербург, 2013. - 674 с.
74. Стивенс, Р. Алгоритмы. Теория и практическое применение / Р. Стивенс. - М.: Эксмо, 2016. - 546 с.
75. Тарасов, С. СУБД для программиста. Базы данных изнутри / С. Тарасов. - М.: СОЛОН-Пресс, 2015. - 319 с.
76. Таскин, А. Линейная регрессия с кластеризацией по признаку на данных с действительными величинами / А. Таскин, Е. Миркес // Вестник сибирского государственного аэрокосмического университета им. академика М.Ф. Решетнева. Красноярск. - 2012. - С. 71-76.
77. Фролов, К. Модификация структур данных для их использования в качестве индексов баз данных / К. Фролов, И. Казакова // Информационные технологии в науке и образовании. Проблемы и перспективы. - Пенза. - 2015. - С. 295-297.
78. Худоногова, Л.И. Комплексирование интервальных измерительных данных методом агрегирования предпочтений: дис. ... канд. техн. наук: 05.11.13 / Худоногова Людмила Игоревна. - Томск, 2017. - 142 с.
79. Целигорова, Е.Н. Разработка методов и алгоритмов для анализа и синтеза нелинейных импульсных систем управления с интервальными параметрами: автореф. дис. ... канд. техн. наук: 05.13.01 / Целигорова Елена Николаевна. - Ростов-на-Дону, 2011. - 18 с..
80. Шарый, С.П. Конечномерный интервальный анализ / С.П. Шарый // Институт вычислительных технологий СО РАН. - 2016. - 617 с. - Режим доступа: http://www.nsc.ru/interval
81. Шахнов, И. Моделирование бинарных отношений предпочтения для интервальных трехточечно заданных объектов / И. Шахнов // Управление развитием крупномасштабных систем MLSD'2012. - М.: Институт проблем управления им. В.А. Трапезникова РАН. - 2012. - С. 342-345.
82. Шахнов, И. Задача ранжирования интервальных величин при многокритериальном анализе сложных систем / И. Шахнов // Известия российской академии наук. теория и системы управления. - М.: Российская академия наук. - 2008. - С. 37-44.
83. Шашихин, В. Оптимизация интервальных систем / В. Шашихин // Автоматика и телемеханика. - М.: Российская академия наук. - 2000. -№ 11. - С. 94-103.
84. Шокин, Ю. К задаче управления в интервальных логико-динамических системах / Ю. Шокин, З. Юлдашев // Вычислительные технологии. -Новосибирск: Институт вычислительных технологий Сибирского отделения РАН. - 1997. - С. 91-96.
85. Электронная документация по SQL Server 2014. - Режим доступа: https://docs.microsoft.com/ru-ru/sql/2014-toc/books-online-for-sql-server-2014? view=sql-server-2014
86. Якунина, М. Информационное обеспечение базы данных: учебное пособие / М. Якунина. - Тюмень: Изд-во Тюменского гос. ун-та, 2010. - 211 с.
87. Яцко, А. Интервальный анализ общего риска угроз безопасности сложной технической системы / А. Яцко, В. Неронов // Вопросы теории безопасности и устойчивости систем. - М.: Федеральный исследовательский центр "Информатика и управление" Российской академии наук. - 2005. - С. 63-74.
88. Alefeld, G. Interval analysis: theory and applications / G. Alefeld, G. Mayer // Journal of Computational Applied Mathematics. - 2000. - Vol. 121. - P. 421-464.
89. Bela, S. Advanced indexing technique for temporal data / S. Bela, T. Rodney, T. Justin, S. Abdul // Computer Science and Information Systems. -2010. - Vol. 7, Iss. 4. - P. 679-703.
90. Campbell, L. Database Reliability Engineering / L. Campbell, C. Majors // O'Reilly Media, 2017. - 294 pp.
91. Connolly, T. Database Systems: A Practical Approach to Design, Implementation, and Management / T. Connolly, C. Begg // Pearson, 2015. -1440 p.
92. Corlatan, C. Query Optimization Techniques in Microsoft SQL Server / C. Corlatan, M. Lazar, V. Luca, O. Petricica // Database Systems, 2014. -Vol. 5. - № 2. - P. 33-48.
93. Cormen, T. Introduction to Algotithms / T. Cormen, C. Leiserson, R. Rivest, C. Stein // MIT Press, 2009. - 1282p.
94. Davidson, L. Performance Tuning using SQL Server Dynamic Management Views / L. Davidson, T. Ford // Simple Talk Publishing, 2010. - 325p.
95. Fiedler, M. Linear optimization problems with inexact data / M. Fiedler, J. Nedoma, J. Ramik, J. Rohn, K. Zimmermann // New York: Springer Science+Business Media, 2006. - 227 p.
96. Hansen, E. Global optimization using interval analysis / E. Hansen, G.W. Walster // New York: Marcel Dekker, 2004. - 530 p.
97. Hirani, Z. Entity Framework 6 Recipes / Z. Hirani, L. Tenny, N. Gupta, B. Driscoll, R. Vettor // Apress, 2013. - 536 p.
98. Jaulin, L. Applied interval analysis / L. Jaulin, M. Kieffer, O. Didrit, E. Walter // London: Springer, 2001. - 198 p.
99. Kaufmann, M. Storing and Processing Temporal Data in a Main Memory Column Store // Proceedings of the VLDB Endowment. - Vol. 6. - No.12. -P. 1444-1449.
100. Lerman, J. Programming Entity Framework / J. Lerman // O'Reilly Media, 2010. - 920 p.
101. Gouttefarde, M. Interval-analysis-based determination of the wrench-feasible workspace of parallel cable-driven robots / M. Gouttefarde, D. Daney, J.P. Merlet // IEEE Transactions on Robotics. - 2011. - 27(1). - P.1-13.
102. Miroshnikov, A.I. Using Interval Data Library for Solving Interval Objects Clustering Problems / A.I. Miroshnikov, P.V. Saraev // International Journal on Information Technologies and Security. - 2019. - № 3 (vol.11). - P. 25-32.
103. Miroshnikov, A.I. The research of the interval databases design and interval queries execution methods / A.I. Miroshnikov, A.A. Nikolskaya // Modern informatization problems in the technological and telecommunication systems analysis and synthesis: Proceedings of the XXII-th International Open Science Conference (Yelm, WA, USA, January 2017) / Editor in Chief Dr. Sci., Prof. O.Ja. Kravets. - Yelm, WA, USA: Science Book Publishing House. -
2017. - 273-278 p.
104. Miroshnikov, A.I. The applied application creation using interval data library / A.I. Miroshnikov // Modern informatization problems in the technological and telecommunication systems analysis and synthesis (MIP-2019'AS): Proceedings of the XXIV-th International Open Science Conference (Yelm, WA, USA, January 2019) / Editor in Chief Dr. Sci., Prof. O.Ja. Kravets. - Yelm, WA, USA: Science Book Publishing House. - 2019. - 346-350 p.
105. Moore, R.E. Introduction to interval analysis / R.E. Moore, R.B. Kearfott, M.J. Cloud // Philadelphia: SIAM, 2009. - 223 p.
106. Nagel, C. Professional C# 7 and .NET Core 2.0 / C. Nagel // NY, USA,
2018. - 1440 p.
107. Niewiadomski, A. Interval-valued linguistic summaries of databases / A. Niewiadomski, J. Ochelska, P.S. Szczepaniak // Control and Cybernetics. -2006. - Vol. 35. - № 2. - P. 415-443.
108. Neumaier, A. Introduction to numerical analysis / A. Neumaier // Cambridge: Cambridge University Press, 2001. - 251 p.
109. Petkovic, D. Microsoft SQL Server 2016: A Beginner's Guide / D. Petkovic // McGraw-Hill Education, 2016. - 896p.
110. Pickard, J.K. An interval analysis method for wrench workspace
determination of parallel manipulator architectures / J.K. Pickard,
109
J.A. Carretero // In Proceeding of the 2015 CCToMM Mechanisms, Machines, and Mechatronics Symposium, Ottawa, Canada. - 2015. - P. 1-8.
111. Rohn, J. A handbook of results on interval linear problems / J. Rohn // Institute of Computer Science, Academy of Sciences of the Czech Republic, Prague. - 2012. - №V-1163. - 79 pp.
112. Sedgewick, R. Algorithms / R. Sedgewick, K. Wayne // Courier, Westford, Massachusets, 2011. - 992 p.
113. Strate, J. Expert Performance Indexing for SQL Server 2012 / J. Strate, T. Krueger // Apress, USA. - 2012. - 354p.
114. Troelsen, A. Pro C# 7: With .NET and .NET Core / A. Troelsen, P. Japikse // Apress, USA. - 2017. - 1372 p.
115. Groff, J. SQL: the complete reference / J. Groff, P. Weinberg, A. Oppel // Mcgraw Hill Education, USA, 2011. - 882 p.
116. Shvarc, B. MySQL. Optimizing Performance / B. Shvarc, P.N. Vainberg, V. Tkachenko, J. Zavodni, A. Lenc, D. Belling // Symbol Plus, St. Petersburg, Russian Federaion, 2010. - 821 p.
Приложение А. Акт внедрения диссертационного исследования в научно-производственное предприятие ООО «ВАЛОК-ЧУГУН». Приложение Б. Справка об использовании результатов диссертации в учебном процессе.
Приложение В. Свидетельство о государственной регистрации в Федеральной службе по интеллектуальной собственности (Роспатент).
УТВЕРЖДАЮ
Проректор по учебной работе ФГБОУ ВО «Липецкий
СПРАВКА
об использовании в учебном процессе материалов, содержащихся в кандидатской диссертации старшего преподавателя кафедры прикладной математики Мирошникова Артёма Игоревича «Специальное математическое и программное обеспечение реляционных СУБД для
интервальнозначных типов данных»
Настоящей справкой удостоверяется, что результаты диссертационной работы на соискание ученой степени кандидата наук по специальности 05.13.11 «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей» используются в учебном процессе федерального государственного бюджетного образовательного учреждения высшего образования «Липецкий государственный технический университет» в рамках образовательной программы по направлению 01.03.04 «Прикладная математика», а именно: процедура проектирования пользовательского интервальнозначного типа данных, отличающаяся автоматической проверкой целостности, позволяющая выполнять прозрачные 8<ЗЬ-запросы в реляционных СУБД; алгоритм операции сравнения интервальнозначного пользовательского типа, позволяющий осуществлять достоверное сравнение интервальнозначных данных; механизм индексирования объектов в реляционных СУБД, позволяющий использовать переопределенные операции сравнения при построении индексных структур, -
при выполнении лабораторных работ по дисциплине «Архитектура СУБД», а также при подготовке выпускных квалификационных работ.
Использование результатов диссертационной работы обсуждено на заседании кафедры прикладной математики от 28.08.2019 г. протокол № 1. ^
Начальник отдела по науке
Декан факультета ав томатизации и информатики к.т.н., доцент
Заведующий кафедрой прикладной математики к.ф.-м.н., доцент
ТЕРМИНОЛОГИЧЕСКИЙ СЛОВАРЬ
CLR - Common Language Runtime;
EDMX - Entity Data Model XML;
LINQ - Language Integrated Query;
OLAP - On-Line Analytical Processing;
OLTP - On-Line Transaction Processing;
ORM - Object-relational mapping;
RI - Relation interval;
ИАД - интеллектуальный анализ данных;
ИС - информационная система;
СУБД - система управления базами данных.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.