Модели, методы и средства исследования нестационарных нагрузочных процессов в эластичных вычислительных системах тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Мартынчук Илья Геннадьевич

  • Мартынчук Илья Геннадьевич
  • кандидат науккандидат наук
  • 2023, ФГАОУ ВО «Национальный исследовательский университет ИТМО»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 224
Мартынчук Илья Геннадьевич. Модели, методы и средства исследования нестационарных нагрузочных процессов в эластичных вычислительных системах: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Национальный исследовательский университет ИТМО». 2023. 224 с.

Оглавление диссертации кандидат наук Мартынчук Илья Геннадьевич




Глава 1. Принципы организации эластичных систем

1.1 Понятие эластичной системы

1.2 Способы реализации эластичных систем

1.2.1 Центры обработки данных

1.2.2 Облачные платформы

1.2.3 Системы контейнерной оркестрации

1.3 Управление вычислительными ресурсами эластичных систем

1.3.1 Защита системы от перегрузок

1.3.2 Снижение стоимости владения

1.3.3 Анализ характера нагрузочного процесса

1.3.4 Оценка необходимого количества ресурсов

1.3.5 Планирование распределения вычислительных ресурсов

1.4 Нестационарные процессы в эластичных системах

1.4.1 Случайность и нестационарность в эластичных системах

1.4.2 Способы моделирования нестационарных процессов

1.5 Постановка задачи

1.6 Аналитический обзор источников по теме исследования

1.6.1 Научные публикации и монографии

1.6.2 Прочие источники

1.6.3 Патентный поиск по теме исследования

1.6.4 Отличия проводимого исследования

1.6.5 Выводы по результатам аналитического обзора

1.7 Выводы по главе

Глава 2. Аналитическое моделирование эластичных систем

2.1 Описание моделей эластичных систем

2.2 Метод оценки задержек в моделях эластичных систем

2.2.1 Описание метода

2.2.2 Имитационная модель для оценки точности метода

2.2.3 Результаты имитационных экспериментов

2.3 Классификация нестационарных процессов

2.4 Метод аналитического описания нестационарного распределения

2.5 Композиция нестационарных распределений

2.6 Выводы по главе

Глава 3. Численные модели и методы прогнозирования нестационарных нагрузочных процессов

3.1 Метод линейной аппроксимации временных параметров в эластичных системах

3.2 Прогнозирование нестационарных нагрузочных процессов в окружениях эластичных систем

3.2.1 Сезонная регрессионная модель случайных процессов

3.2.2 Модель мультисезонной сезонно-трендовой декомпозиции временного ряда

3.3 Алгоритм быстрого поиска периода

3.4 Сравнение моделей MSTL и SARIMA

3.4.1 Постановка эксперимента

3.4.2 Результаты экспериментов

3.5 Выводы по главе

Глава 4. Методика планирования и управления вычислительными ресурсами эластичных систем

4.1 Разработка алгоритма планирования и управления вычислительными ресурсами

4.1.1 Капитальные затраты

4.1.2 Операционные расходы

4.1.3 Оценка эффективности применения разрабатываемого алгоритма

4.1.4 Алгоритм планирования и управления вычислительными ресурсами

4.2 Тестирование разработанного алгоритма

4.2.1 Описание тестового аппаратно-программного комплекса

4.2.2 Результаты те стирования

4.3 Выводы по главе


Список сокращений и условных обозначений

Библиографический список

Список иллюстративного материала

Приложение 1. Исходный текст программы сравнения моделей


Приложение 2. Акт о внедрении результатов исследования в образовательный процесс

Приложение 3. Тесты публикаций по теме исследования


Актуальность темы исследования. В настоящее время информационно-вычислительные системы применяются для решения широкого спектра задач. Обработка телеметрии с датчиков в реальном времени, коллективная работа с офисными документами, платформа проведения трансляций, прослушивание музыкальных композиций в цифровом формате - все это и много другое решается с помощью систем различного назначения и структурно-функциональной организации. Разнообразие решаемых задач влечет за собой ряд сложностей, с которыми сталкиваются команды разработки и сопровождения информационно-вычислительных систем. Одной из таких проблем является отличие в поведении пользователей системы в зависимости от ее назначения и бизнес-логики.

Нагрузочным процессом в эластичных системах является поток пользовательских запросов и для его обработки необходимо определенное количество вычислительных ресурсов. Различные особенности поведения пользователей приводят к отличиям в нагрузочных процессах, что усложняет проектирование и управление системой, так как отсутствует возможность применения единого шаблона нагрузочного процесса с целью определения необходимого количества вычислительных ресурсов для его обработки.

Естественное поведение пользователей, связанное, например, с их суточной активностью, приводит к возрастанию или убыванию количества запросов в единицу времени. Для того, чтобы адаптироваться к таким изменениям в нагрузочном процессе, система должна обладать свойством масштабируемости - т. е. возможностью добавления или исключения вычислительных мощностей в соответствии с изменениями потока пользовательских запросов.

В настоящее время широко применяется два способа масштабирова-

ния: вертикальное и горизонтальное. При повышении нагрузки вертикальное масштабирование заключается в увеличении мощности существующих узлов системы, тогда как горизонтальное - в наращивании их количества. Процесс масштабирования может быть частично или полностью реализован в автоматическом режиме. Такой процесс называется автоматическим масштабированием.

Система, обладающая свойством автоматической горизонтальной масштабируемости, называется эластичной системой. В современных эластичных системах с открытым исходным кодом используется простой метод автоматического масштабирования, основанный на использовании мгновенных показателей нагрузки. Главным недостатком такого подхода является отсутствие возможности заблаговременного реагирования на изменения нагрузочного процесса, в результате чего система подвергается кратковременным перегрузкам, что ведет к ухудшению показателей качества обслуживания.

Таким образом, важной задачей в современных эластичных системах является прогнозирование нагрузочных процессов с целью сохранения уровня качества предоставляемых услуг и снижения стоимости владения вычислительной инфраструктурой.

Степень теоретической проработанности темы. В открытом доступе существует ряд научных трудов, описывающих прогнозирование нагрузки в облачных системах и системах контейнерной кластеризации. Однако ни в одной из найденных публикаций не было найдено описания подхода, полностью удовлетворяющего требованиям, предъявляемым к решению в рамках диссертационной работы, основным из которых является наличие возможности построения численной и аналитической моделей нагрузки для обеспечения возможности реализации алгоритмов планирования и управления ресурсами эластичных систем как на этапе проектирования, так и на всем периоде их функционирования.

Цель и задачи исследования. Целью исследования является уменьшение стоимости владения эластичными вычислительными системами с нестационарными нагрузочными процессами при повышении качества обслуживания пользователей. Для достижения поставленной цели требуется решить ряд задач.

1. Разработать модели и методы исследования эластичных систем и протекающих в них нагрузочных процессов.

2. Разработать метод прогнозирования нестационарной нагрузки на этапе эксплуатации эластичных вычислительных систем на основе численных моделей теории временных рядов.

3. Сформулировать методику планирования и управления вычислительными ресурсами эластичных систем, направленную на уменьшение стоимости владения и повышение качества обслуживания, на основе прогнозирования нагрузочных процессов с использованием разработанных моделей и методов.

Объектом исследования выбраны эластичные системы, функционирующие в условиях нестационарных нагрузочных процессов.

Предметом исследования являются методы и алгоритмы планирования и управления вычислительными ресурсами эластичных систем.

Теоретическую основу исследования составляют научные труды отечественных и зарубежных авторов в области облачных технологий, теории вероятностей и теории очередей.

Методологическую основу исследования составляют методы теории вероятностей, методы теории очередей, методы математической статистики и метод имитационного моделирования, методы теории временных рядов.

Информационная база исследования. Основными научными источниками диссертации являются книга В. Столлингса «Современные компьютерные сети», книга Т. И. Алиева «Основы моделирования дискрет-

ных систем» и книга М. Портного «Основы виртуализации».

Научная новизна работы.

1. Разработаны модели и методы для оценки характеристик функционирования эластичных вычислительных систем, в отличие от существующих, учитывающие нестационарность и произвольный характер нагрузочных процессов.

2. Предложены методы прогнозирования нестационарной нагрузки на этапе эксплуатации эластичных вычислительных систем, в отличие от существующих, учитывающие различные комбинации сезонности нагрузочных процессов и снижающие накладные расходы на процесс масштабирования.

3. Впервые сформулирована методика планирования и управления вычислительными ресурсами эластичных систем на основе комбинированного подхода с применением аналитических, имитационных и численных методов.

Основные положения, выносимые на защиту.

1. Модели и методы исследования эластичных систем и протекающих в них процессов, учитывающие нестационарность и произвольный характер нагрузки и позволяющие оценить необходимое количество вычислительных узлов в системе на этапах ее проектирования и ввода в эксплуатацию.

2. Метод прогнозирования пользовательской нагрузки на этапе эксплуатации эластичных вычислительных систем, использующий комбинацию алгоритмов быстрого поиска периода и мультисезон-ной сезонно-трендовой декомпозиции временного ряда и снижающий накладные расходы на процесс масштабирования.

3. Методика планирования и управления вычислительными ресурсами эластичных систем, использующая комбинированный подход к

прогнозированию нагрузочных процессов на основе аналитических, имитационных и численных методов.

Практическая значимость исследования состоит в том, что разработанные модели и методы, а также сформулированная методика планирования и управления вычислительными ресурсами эластичных систем могут быть использованы на этапах проектирования и эксплуатации системы для оценки характеристик ее функционирования и прогнозирования протекающих в ней нагрузочных процессов с целью повышения качества обслуживания пользователей и снижения стоимости владения системой.

Апробация результатов исследования. Основные положения работы прошли апробацию на следующих девятнадцати научных конференциях: XXII международная научная конференция «Волновая электроника и инфокоммуникационные системы (WECONF-2019)» (2019 г.); X, XI MICSECS - The Majorov International Conference on Software Engineering and Computer Systems (2018-2019 гг.); VIII и IX Научно-практическая конференция молодых ученых «Вычислительные системы и сети (Майоров-ские чтения)» (2017 г.); VI Научно-практическая конференция с международным участием «Наука настоящего и будущего» (2018 г.); XLVI и XLVII, XLVIII, XLIX, L, LI Научная и учебно-методическая конференция Университета ИТМО (2017-2022 гг.); VI, VII и VIII, IX, X, XI, XII Всероссийский конгресс молодых ученых (2017-2023 гг.).

Публикации. Основные результаты по теме диссертации изложены в 11 печатных изданиях. Одна статья издана в журналах, рекомендованных ВАК. Три статьи индексированы базой Scopus.

Внедрение результатов работы. Основные результаты диссертационной работы внедрены в учебный процесс факультета программной инженерии и компьютерной техники университета ИТМО (дисциплины «Телекоммуникационные системы», «Моделирование»), что подтверждается соответствующим актом о внедрении, а также использованы в следующих

научно-исследовательских работах (НИР).

1. НИР-ФУНД №617026 «Разработка методов интеллектуального управления киберфизическими системами с использованием квантовых технологий».

2. НИР-ФУНД №619296 «Разработка методов создания и внедрения киберфизических систем».

3. НИР-ПОИСК №620164 «Методы искусственного интеллекта для киберфизических систем».

Объем и структура работы. Работа состоит из введения, четырех глав, заключения и трех приложений. Полный объем диссертации составляет 137 страниц текста с 11 таблицами и 28 рисунками. Список литературы содержит 88 наименований.


Во введении обосновывается актуальность исследований, проводимых в рамках данной диссертационной работы, формулируется цель, ставятся задачи работы, формулируется научная новизна, теоретическая и практическая значимость работы.

В первой главе выполнен обзор предметной области, представлено описание структурно-функциональной организации эластичных вычислительных систем. Выделены основные уровни виртуализации вычислительного процесса. Определен следующий ряд задач, стоящих перед сервисом автоматического масштабирования при реализации программных систем на основе облачных платформ и платформ контейнерной оркест-рации.

1. Защита системы от перегрузок.

2. Снижение стоимости владения вычислительными ресурсами.

3. Определение характера нагрузочного процесса на целевую систему.

4. Определение необходимого количества вычислительных ресурсов.

5. Планирование распределения вычислительных ресурсов.

Выявлено, что важной задачей в эластичных системах является разработка алгоритмов управления вычислительными ресурсами, заложенных в процессы горизонтального масштабирования, с целью их более эффективного использования (рис. 1). Показано, что существует необходимость разработки единого подхода к прогнозированию необходимого количества вычислительных ресурсов как на этапе ввода системы в эксплуатацию, так и в течение всего времени ее функционирования. Сделан вывод, что для обеспечения возможности использования достоинств как аналитических, так и численных методов в алгоритмах автоматического масштабирования систем, необходимо определить степень адекватности использования численных методов теории временных рядов для предсказания поведения нагрузочных процессов в рассматриваемых системах.

« г

О 5



^ 4


! з



Требуемое кол-во узлов



Кол-во обрабатыва ющих узлов



0 5

л з

^ 4 о

1 з



Требуемое кол-во узлов

Кол-во обрабатыва ющих узлов


Рисунок 1 - Проактивное масштабирование






Для определения уровня развития предмета исследования и выявления новизны заявленной темы диссертационной работы произведен анализ публикаций, содержащих упоминания прогнозирования нагрузочных процессов и автоматического масштабирования эластичных систем или подобных им моделей.

Определено, что для достижения поставленной в диссертационном

исследовании цели к методам прогнозирования нагрузочных процессов и алгоритмам автоматического масштабирования необходимо применить следующий ряд требований.

1. Возможность построения аналитических моделей нагрузочных процессов на систему, а также моделей самих систем для обеспечения возможности их прототипирования и синтеза.

2. Возможность построения численных моделей нагрузочных процессов на систему с помощью методов статистики и теории временных рядов, а также моделей самих систем для обеспечения возможности прогнозирования влияния конкретных нагрузочных процессов на характеристики их функционирования в условиях невозможности использования аналитических методов.

3. Возможность функционирования и построения моделей в условиях нестационарных и произвольных нагрузочных процессов на систему.

4. Возможность работы с эластичными системами различных классов, то есть с публичными и частными инсталляциями как облачных систем, так и систем контейнерной кластеризации.

5. Возможность моделирования структурной организации эластичной системы и изменение модели в соответствии с протекающими в системе процессами.

По результатам аналитического обзора открытых источников сделан вывод об актуальности темы и положений диссертационного исследования. Кроме того, в патентном поиске показано, что отсутствуют охранные документы, препятствующее применению результатов исследования и сделаны следующие выводы.

1. Нестационарность, характерная для протекающих в эластичных системах процессов, усложняет исследование и прогнозирование по-

ведения системы как на этапе ее проектирования, так и во время эксплуатации.

2. Процессы автоматического масштабирования в эластичных системах нацелены на снижение стоимости владения вычислительной инфраструктурой. Типовой подход к масштабированию, основанный на анализе мгновенных данных о нагрузочном процессе, не позволяет прогнозировать изменения в нагрузке с целью своевременного добавления или исключения узлов из вычислительного процесса.

3. Для повышения качества обслуживания пользователей за счет своевременной адаптации структуры эластичной системы к изменениям интенсивности поступающих запросов, необходимо разработать прогнозные модели нагрузочных процессов.

4. Выполненный аналитический обзор открытых источников и патентный поиск подтверждает актуальность темы диссертационного исследования.

Во второй главе представлены аналитические методы исследования нагрузочных процессов и их влияния на характеристики функционирования многоканальных системы массового обслуживания.

Предложена формула для расчета приближенного среднего времени ожидания в СМО класса в/в/К:

й - т + г и, ) - (КР)К+ г ь ) ~ 2(1 - р) ' ('а) ~ К!(1 - р) 2(1 - р) } К) '

где К - количество однотипных обслуживающих приборов, р - загрузка системы, Р0 - вероятность того, что в системе нет заявок, Ь - среднее время обслуживания заявок, уа - коэффициент вариации интервалов времени между поступлениями запросов, уъ - коэффициент вариации длительности обслуживания запросов, /(уа) - корректирующая функция, рассчиты-

ваемая следующим образом:

pf \ 3p(vlWb)

fМ = < ^ а bb_ 1 л

[ехр{ - (1 - р)v^) , va > 1 .

В среде имитационного моделирования AnyLogic Professional разработана модель многоканальной системы G/G/К, использующая логнор-мальное распределение в качестве задающего распределения для интенсивности запросов и времени обслуживания.

По результатам первой серии экспериментов с варьированием параметра ß в распределении интервалов времени между поступлениями запросов определена зависимость среднего времени ожидания от загрузки системы. Показано, что с ростом нагрузки отклонение от теоретического значения снижается. Это объясняется тем, что при низких нагрузках в случае имитационных экспериментах необходимо сгенерировать большое количество событий, чтобы нивелировать в среднем длительные интервалы между запросами. Сделан вывод, что отклонения в генераторах случайных чисел проявляются сильнее, поскольку в среднем время ожидания принимает малые значения и в процентном выражении отклонения становятся больше.

По результатам второй серии экспериментов с варьированием параметра ß в распределении времени обслуживания выявлено, что разница между теоретическими расчетами и имитационными экспериментами демонстрирует схожее поведение, как в случае с варьированием интервалов времени между поступлениями запросов. Показано, что при р > 0,8 отклонение рассчитанного с помощью предлагаемых в работе аналитическим зависимостей w имеет отклонение в пределах общепринятой погрешности имитационного моделирования равной 5%.

Предложена классификация нестационарных процессов с точки зрения характера задающего распределения и характера изменения показателей.

Получено аналитическое представление нестационарного распределения, характеризующего нестационарный нагрузочный процесс:

/(х,1) = / 1(х,Х(1)) ;

т = /2(1) ,

где /(х¿) - закон распределения вероятностей, / 1(ж, А(£)) - функция, задающая закон распределения вероятностей, Х(Ъ) - параметр распределения, /2(Ъ) - функция изменения параметра распределения.

Получены результирующие аналитические модели последовательной и параллельной композиции нестационарных распределений, имеющие следующий вид:


вит(х.;Ь) = а(Х$ (¿),х)®

< <8> Ь(Хд (г),х); Хн(1) = ф)+ (1(1) .



сотр(х,Ь) = (а(Х$ (Ь),х) + + Ь(Хд (1),х))/2;


Хн = с(Ъ) + (1(Ъ) ; а + Ь=1 .

где вит(х.;Ь) - последовательная композиция, сотр(х,Ь) - параллельная композиция, Хи - результирующая функция изменения параметра распределения.

По полученным во второй главе результатам сделаны следующие выводы.

1. Нагрузочные процессы в эластичных вычислительных системах имеют нестационарную природу, обусловленную естественной суточной активностью пользователей. Известные результаты теории

массового обслуживания не применимы для исследования и расчета характеристики таких систем.

2. Предложенные модели эластичных систем в виде многоканальных систем массового обслуживания позволяют рассчитать средние значения характеристик на основе двух моментов распределений, задающих нагрузку в виде математического ожидания и коэффициента вариации.

3. Предложенная классификация нестационарных процессов позволяет выделить множество процессов, характерных для эластичных вычислительных систем и подлежащих дальнейшему исследованию.

4. Сформулированный способ аналитического описания нестационарных распределений в виде функции плотности распределения вероятности и изменения параметра распределения позволяет в конкретный момент времени оценить характер поведения нестационарного процесса.

5. Сформулированный подход к построению моделей нестационарных процессов на основе реальных данных позволяет с помощью аппроксимации вероятностных распределений, моделей нестационарных процессов и их композиции строить результирующие модели потоков, поступающих в исследуемую систему.

Третья глава посвящена разработке метода прогнозирования пользовательской нагрузки на этапе эксплуатации эластичных вычислительных систем на основе численных моделей теории временных рядов. Показано, что в современных решениях мало внимания уделяется анализу скорости изменения нагрузки, которая напрямую влияет на то, насколько заранее необходимо включать или выключать узлы из вычислительного процесса. Сделан вывод, что для определения скорости изменения нагрузочного процесса достаточно решить задачу линейной аппроксимации на

промежутке возрастания функции изменения интенсивности нагрузочного процесса. Полученная аппроксимирующая прямая образует с осью х некоторый угол а, который и определяет величину скорости возрастания интенсивности запросов к системе на рассматриваемом промежутке времени.

Определено, что для решения задачи аппроксимации необходимо выбрать метод, наиболее подходящий для разнообразных окружений эластичных систем. На основе особенностей функционирования таких систем был сформулирован ряд требований к рассматриваемым методам аппроксимации.

В результате анализа предметной области были выбраны наиболее часто используемые методы, решающие задачи линейной аппроксимации упорядоченного набора данных:

• метод наименьших квадратов (МНК);

• метод достижения консенсуса на основе случайных выборок (Random Sample Consensus, RANSAC);

• метод главных компонент (Principal Component Analysis, PCA).

По результатам анализа методов выявлено, что методы RANSAC и PCA в своих реализациях требуют проведения операций с матрицами, которые сами по себе обладают нелинейной алгоритмической сложностью. Определено, что квадратичные зависимости, использующиеся в методе наименьших квадратов, приводят к переполнениям разрядной сетки аппаратной архитектуры при оперировании с большими по модулю значениями.

Сделан вывод о необходимости разработки метода аппроксимации, удовлетворяющего всем ранее сформулированным требованиям. Предложен упрощенный метод на основе расчета центра масс исходного набора данных.

По завершению экспериментов выявлено, что с доверительной вероят-

ность 0,95, начиная с 50 точек в исходном наборе данных, разработанный метод демонстрирует линейное снижение времени выполнения аппроксимации по сравнению с МНК. При этом максимальное снижение 23% достигается на самом большом наборе данных. Определено, что с доверительной вероятностью 0,95 значение среднего отклонения 5ср для обоих методов в рамках экспериментов одинаково, что свидетельствует об одинаковой точности разработанного метода и метода наименьших квадратов.

Определено, что нестационарные нагрузочные процессы могу быть представлены в виде временных рядов (рис. 2). Показано, что нагрузочные процессы в эластичных системах являются мультисезонными, так как обладают не только дневной периодичностью, вызванной суточной активностью пользователей, но и недельной сезонностью, связанной с пятидневной рабочей неделей.

Обоснована необходимость проверки возможности использования модели мультисезонной сезонно-трендовой декомпозиции временного ряда на основе LOWESS (М8ТЬ) и сравнение ее производительности с широко используемой сезонной интегрированной моделью авторегрессонно-го скользящего среднего ^АММА) для решения задач исследования и прогнозирования мультисезонных нагрузочных процессов в эластичных вычислительных системах.

Показано, что основным допущением в реализациях методов работы с сезонными и мультисезонными временными рядами является известные заранее величины сезонности исследуемого процесса.

Для повышения степени автоматизации процессов управления ресурсами эластичных систем предложено находить величину сезонности в автоматическом режиме с помощью итерационного алгоритма быстрого поиска периода. По полученным в ходе многочисленных экспериментов показателям качества прогноза и производительности моделей (табл. 1, 2) выявлено, что высокая вычислительная сложность модели 8ЛЯ1МЛ позволяет обработать только недельный набор данных.

Таблица 1. Рассчитанные ЯМБЕ и Я2 для прогноза на день вперед на

основе недельных и месячных данных

SARIMA(0,1,0)(0,0,0)[288] MSTL(288, 2016)

Недельный набор данных Месячный набор данных Недельный набор данных Месячный набор данных

ЯМБЕ 474,94404 - 2524,79448 711,03479

Я2 0,97192 - 0,206541 0,93902

Таблица 2. Время расчета моделей и потребление памяти во время

проведения экспериментов

Недельный набор данных Месячный набор данных

Время выполнения, с Потребление памяти, ГБ Время выполнения, с Потребление памяти, ГБ

SARIMA 1080,92 ± 1,2 ОП: 48,447 swap: 6,4 ± 0,4

MSTL 6,48 ± 0,03 0,375 ± 0,025 15,23 ± 0,08 0,375 ± 0,025

Показано, что на недельном наборе данных модель 8ЛЯ1МЛ демонстрирует лучшее качество прогноза по сравнению с М8ТЬ, а при месячном наборе данных показатели качества для М8ТЬ приближаются к недельным показателям 8ЛЯ1МЛ.

Определена зависимость коэффициента детерминации от количества измерений во временном ряду (рис. 3).



0,9 0,8

$ 0,7

I 0,6


и 0 5

о °,5 Я

g 0,4

S 0,3



----Дневная и недельная


■Недельная сезонность

0 5 10 15 20

Величина набора данных для построения модели, недели

Рисунок 3 - Результаты расчета показателя В2 при различных параметрах сезонности в модели М8ТЬ

Выявлено, что в случае недельной сезонности качество прогноза

М8ТЬ значительно выше на большинстве исходных наборов данных и приближается к модели 8ЛЯ1МЛ на недельном наборе данных.

По полученным в третьей главе результатам сделаны следующие выводы.

1. Предложенный метод линейной аппроксимации временных параметров в эластичных системах, наряду с методом наименьших квадратов и в отличие от методов ЯЛК8ЛС и РСЛ, удовлетворяет требованиям, предъявляемым к методам, функционирующим в окружениях эластичных систем. Начиная с некоторой величины исходного набора данных, метод демонстрирует снижение времени выполнения аппроксимации по сравнению с МНК.

2. Естественная периодичность нагрузочных процессов, характерных для эластичных систем, требует отдельного применения методов поиска периода. Для снижения накладных расходов на операции поиска периода предложено использовать описанный в работе итерационный метод.

3. Модель М8ТЬ показала свое преимущество по сравнению с моделью 8ЛЯ1МЛ по времени выполнения и использованию памяти при исследовании и прогнозировании мультисезонных нагрузочных процессов, характерных для эластичных вычислительных систем.

Четвертая глава посвящена разработке методики планирования и управления вычислительными ресурсами эластичных систем, направленной на уменьшение стоимости владения, на основе прогнозирования нагрузочных процессов с использованием разработанных моделей и методов.

Сформулирована оценка затрат на владение эластичной системой:



где I - расчетный период, Бут - стоимость одного вычислительного узла

за расчетный период, Nvm - количество функционирующих вычислительных узлов в течение расчетного периода, Ssiav - штраф за нарушение SLA на единицу времени для арендатора; Ti - интервал времени нарушения SLA, N - количество временных интервалов нарушения SLA арендатором. На основе предложенной оценки сформулирован критерий эффективности применения алгоритма управления ресурсами:

^ = п • А + m • В, (1)

где п - вес затрат на вычислительные узлы, m - вес штрафных санкций, А - стоимость вычислительных узлов, В - величина штрафных санкций за нарушение SLA.

Разработана методика, направленная как на планирование ресурсов на этапе ввода эластичной системы в эксплуатацию, так и на управление вычислительными ресурсами системы на всех этапах ее жизненного цикла. Для тестирования предложенного алгоритма управления вычислительными ресурсами эластичных систем сформирован тестовый аппаратно-программный комплекс на основе операционной системы Windows 10, гипервизора Hyper-V, операционной системы Debian GNU/Linux и системы контейнерной оркестрации Kubernetes.

По результатам экспериментов не выявлено значимых ошибок, препятствующих применению разработанной методики в окружениях эластичных систем на основе технологий виртуализации и контейнерной ор-кестрации.

Определено, что полученные величины для длительности превышения порогового значения времени отклика и количество функционирующих вычислительных узлов отличаются в случае исходного и сглаженного нагрузочного процессов как для стандартного метода автоматического масштабирования, так и для предлагаемого алгоритма. Показано, что в случае использования исходного набора данных для формирования нагрузочного процесса стандартный метод на основе граничных значений

загрузки обеспечивает в среднем 12,5%±2,1% времени превышения порогового значения времени отклика системы, в то время как разработанный алгоритм обеспечивает снижение времени превышения до 1,5%о ± 0,3%% (рис. 4). Сделан вывод, что отсутствие прогнозирования основных изменений в нагрузке не позволяет стандартному подходу вовремя реагировать даже на типичные изменения в нагрузочном процессе, что приводит к повышению времени нахождения системы в перегруженном состоянии с повышением времени отклика на запросы.

Выявлено, что в случае использования сглаженного исходного набора данных метод на основе граничных значений загрузки обеспечивает в среднем 1,2% ± 0,3% времени превышения порогового значения времени отклика системы, в то время как разработанный алгоритм обеспечивает также снижение времени превышения до 0,1%о ± 0,05%.

Определено, что при использовании исходного набора данных стандартный метод за месячный расчетный период использовал на 7%±0,45%о меньше вычислительных узлов, а в случае сглаженного нагрузочного процесса предлагаемый алгоритм обеспечивает снижение среднего количества вычислительных узлов на 5%о ± 0,22%о.

яи 30

ен э 25


& н £ 20 и

Л т 5 15

о о

н ^ 10

Л м ел

л е т 5

и нн

л 0


Типовой алгоритм



Л! Д

1Т и


фД Д А

л ад

Разработанный алгоритм




ооооооооооооооооо ооооооооооооооооо


м т ^ ш ю ь м Время

Рисунок 4 - Превышения порогового значения времени отклика

На примере результатов с несглаженным нагрузочным процессом оценены затраты на владение эластичной системой в соответствии с критерием (1). По результатам расчета показано, что в случае, когда штраф за нарушение SLA заметно превышает величину расходов на дополнительные вычислительные ресурсы, то предложенный алгоритм показывает более высокую эффективность с точки зрения затрат на владение вычислительной инфраструктурой. Сделан вывод, что использование стандартного подхода к масштабированию может оказаться оправданным только в случае, если затраты на вычислительные ресурсы значительно больше штрафов за нарушение договора о качестве обслуживания. Однако такая ситуация не реалистична в условиях функционирования современных предприятий, поскольку штрафы за нарушение SLA не только являются прямыми расходами, но также приводят к оттоку пользователей систем и наступлению репутационных рисков, в результате уменьшая прибыль компаний.

По полученным в четвертой главе результатам сделаны следующие выводы.

1. Реализация алгоритмов планирования и управления ресурсами эластичных систем требует минимизации накладных расходов на операции построения моделей нагрузочных процессов и выполнения масштабирования.

2. Затраты на владение эластичной системой зависят от соотношения величины штрафов за нарушение качества обслуживания пользователей и стоимости аренды вычислительных узлов

3. Использование комбинации аналитических методов для приближенного расчета количества вычислительных ресурсов, а также метода быстрого поиска периода и модели мультисезонной сезонно-трендовой декомпозиции временного ряда на основе LOWESS обе с-

печивает возможность исследования эффективности функционирования эластичной системы как на этапе ее проектирования, так и во время промышленной эксплуатации.

4. В результате применения разработанного алгоритма управления ресурсами эластичных систем на тестовом аппаратно-программном комплексе удалось добиться повышения эффективности функционирования эластичной системы в соответствии с предложенным в работе критерием.

