Исследование систем стохастического поллинга с групповым обслуживанием для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Нгуен Ван Хиеу

  • Нгуен Ван Хиеу
  • кандидат науккандидат наук
  • 2024, ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)»
  • Специальность ВАК РФ00.00.00
  • Количество страниц 162
Нгуен Ван Хиеу. Исследование систем стохастического поллинга с групповым обслуживанием для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления: дис. кандидат наук: 00.00.00 - Другие cпециальности. ФГАОУ ВО «Московский физико-технический институт (национальный исследовательский университет)». 2024. 162 с.

Оглавление диссертации кандидат наук Нгуен Ван Хиеу

Введение

Глава 1. Системы поллинга. Основные понятия

1.1 Основная модель поллинга

1.2 Классификация

1.3 Обзор работ по теме систем поллинга, их методов исследования

и применений

1.4 Модель поллинга с групповым обслуживанием

1.5 Вывод по первой главе

Глава 2. Исследование систем циклического поллинга с групповым

обслуживанием

2.1 Математическое моделирование и численный метод исследования систем циклического поллинга с групповым обслуживанием

2.1.1 Уравнение равновесия. Случай исчерпывающего обслуживания

2.1.2 Уравнение равновесия. Случай шлюзового обслуживания

2.1.3 Численное решение системы уравнений равновесия

2.1.4 Оценка характеристик производительности системы

2.2 Имитационная модель систем поллинга с групповым обслуживанием

2.2.1 Общая структура имитационной модели

2.2.2 Задача остановки моделирования

2.2.3 Валидация имитационной модели с использованием результатов аналитического расчета

2.3 Анализ времени, необходимого для расчета результатов математическим и имитационным методами

2.4 Исследование систем циклического поллинга с групповым обслуживанием методами машинного обучения

2.4.1 Подготовка данных

2.4.2 Модель дерева решений

2.4.3 Модель градиентного бустинга

2.4.4 Модель многослойного персептрона

2.4.5 Сравнение результатов

2.5 Вывод по второй главе

Глава 3. Программный комплекс для оценки характеристик производительности систем циклического поллинга с групповым обслуживанием

3.1 Архитектура программного комплекса

3.2 Блок графического интерфейса пользователя

3.3 Блок вычисления результатов

3.3.1 Модуль аналитического расчета

3.3.2 Модуль имитационного моделирования

3.3.3 Модуль машинного обучения

3.4 Вывод по третьей главе

Глава 4. Оценка характеристик производительности

широкополосных беспроводных сетей с централизованным механизмом управления

4.1 Численное сравнение традиционной модели поллинга с моделью поллинга с групповым обслуживанием

4.2 Применение модели группового поллинга для оценки производительности широкополосной беспроводной сети на базе привязных БПЛА

4.2.1 Расчет зоны телекоммуникационного покрытия и характеристик канала связи беспроводной сети на базе привязной высотной беспилотной платформы

4.2.2 Архитектура широкополосной беспроводной сети на базе привязного дрона

4.2.3 Математическая модель стохастического группового поллинга для оценки производительности беспроводной

сети на базе привязного дрона

4.2.4 Оценка производительности протокола беспроводной широкополосной сети на базе привязной высотной беспилотной платформы с использованием модели группового поллинга

4.3 Вывод по четвертой главе

Заключение

Список литературы

Список рисунков

Список таблиц

Приложение А. Исходные коды основных модулей программного

комплекса PoSys

Приложение Б. Свидетельство о государственной регистрации

программы для ЭВМ

Приложение В. Акт об использовании результатов диссертационной

работы

Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК

Введение диссертации (часть автореферата) на тему «Исследование систем стохастического поллинга с групповым обслуживанием для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления»

Введение

Актуальность темы исследования. В современном информационном обществе передача данных является неотъемлемой частью нашей повседневной жизни. Исторически, начиная с изобретения телеграфа в XIX веке, и развития телефонии и радиосвязи в XX веке, человечество стремилось к увеличению скорости и эффективности передачи информации на расстояние. С развитием компьютерных технологий и интернета в конце XX века, передача данных приобрела новый уровень значимости, став не только средством коммуникации, но и основой для развития цифровой экономики, научных исследований, медицинских технологий и многого другого. Сегодня мы живем в эпоху информационной революции, где доступ к быстрой и надежной передаче данных стал необходимостью. Беспроводные сети передачи данных занимают центральное место в этом контексте. Они обеспечивают высокоскоростной доступ к интернету и передачу данных без проводных подключений, что позволяет свободно перемещаться и оставаться подключенным к сети в любой точке. Это особенно важно в контексте мобильных устройств, таких как смартфоны, планшеты и ноутбуки, которые становятся все более распространенными и интегрируются в различные аспекты нашей жизни.

Хотя беспроводные сети имеют множество преимуществ перед проводными, у них все же есть недостатки. Одной из наиболее распространенных проблем, связанных с функционированием сетей, в частности, сетей Wi-Fi IEEE 802.11, является проблема скрытых узлов. Эта проблема возникает, когда два или более устройства в сети не могут напрямую обнаружить друг друга из-за помех или расстояния между ними, при этом они могут одновременно отправлять сигналы на третье устройство. Это приводит к коллизии при передаче данных, что может существенно снижать производительность сети. Решение проблемы скрытых узлов включает в себя использование различных алгоритмов доступа к среде и механизмов управления с целью минимизации влияния скрытых узлов на работу беспроводной сети. Один из эффективных методов решения этой проблемы заключается в использовании централизованного механизма управления, также известного как режима поллинга, при котором вместо того, чтобы сетевые узлы имели право проверять среду и самостоятельно передавать данные, базовая станция активно

попеременно опрашивает узлы сети в соответствии с заданным порядком опроса и предоставить им доступ к среде. Централизованное управление позволяет упростить администрирование сети, снизить вероятность конфликтов и сбоев, а также повысить производительность и качество обслуживания для всех устройств в сети. Этот механизм используется в корпоративных Wi-Fi сетях мобильных сетях (LTE, 5G) через управляющие узлы, а также в меш-сетях и сетях умного дома для координации устройств.

Для оценки характеристик производительности, таких как вероятность потери заявок, среднее время пребывания заявок, средняя длина очереди и другие, функционирование широкополосных беспроводных сетей с централизованным механизмом управления адекватно описывается «системами поллинга», исследование которых является разделом теории массового обслуживания. Несмотря на то, что системы поллинга интенсивно изучались в последние десятилетия, большая часть исследований была сфокусирована на индивидуальном обслуживании заявок в очередях. Однако, с расширением потребностей практического применения и быстрым развитием аппаратных вычислительных мощностей, системы поллинга с групповым обслуживанием, в которых базовая станция обслуживает заявки в абонентских станциях группами, начали привлекать внимание, особенно в области компьютерных сетей, таких как в TDMA сетях. Следовательно, в настоящее время исследование систем поллинга с групповым обслуживанием, а также разработка программного комплекса для оценки их производительности являются актуальной задачей.

Степень разработанности темы. Исследованию систем поллинга посвящено значительное количество научных статей и монографий российских ученных, таких как: Вишневский В.М., Дудин А.Н., Семенова О.В., Самуйлов К.Е., Моисеева С.П., Гайдамака Ю.В., Рыков В.В. и др., а также зарубежных ученных: H. Takagi, O.J. Boxma, S. Borst, U. Yechiali, M. Boon. Построение и исследование большинства моделей поллинга основано на потребностях их практического применения. Особенно в области компьютерных сетей и коммуникаций, где модели поллинга широко используются для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления, а также повышения их надежности и пропускной способности.

В данной работе рассматривается малоизученный тип систем поллинга — системы с групповым обслуживанием. Эти системы изучены лишь в

нескольких работах некоторых зарубежных ученых, таких как U. Yechiali, O.J. Boxma, T. Jiang. Пока что литературу по этой теме можно условно разделить на две категории. Первая категория предназначена для анализа моделей с фиксированным размером группы для обслуживания. Вторая категория связана с моделями с бесконечным размером группы.

По сравнению с предыдущими моделями, в данной работе рассматривается новая модель, в которой размер группы заранее не фиксируется, а задается его максимальное значение. Размер каждой отдельной группы будет зависеть от этого параметра, а также от количества заявок, оставшихся в очереди в момент начала ее обслуживания.

В рамках данной работе рассматривается математическая модель данного нового класса систем поллинга с групповым обслуживанием, далее разрабатываются численный метод, имитационная модель Монте-Карло и методы машинного обучения для исследования их характеристик производительности. Результаты этих исследований реализованы и объединены в программный комплекс, способствующий упрощению процесса исследования, а также позволяющий оценивать характеристик производительности систем широкополосных беспроводных сетей с централизованным механизмом управления.

Цель данной работы состоит в разработке математической модели и методов исследования систем группового поллинга, в разработке программного комплекса для расчета характеристик производительности таких систем, а также в применении модели полинга с групповым обслуживанием для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления.

Для достижения поставленной цели необходимо было решить следующие задачи:

1. Построение математической модели систем поллинга с групповым обслуживанием;

2. Разработка численного метода исследования систем циклического поллинга с групповым обслуживанием;

3. Разработка и валидации имитационной модели Монте-Карло систем поллинга с групповым обслуживанием;

4. Исследование систем циклического поллинга с групповым обслуживанием с помощью методов машинного обучения;

5. Разработка программного комплекса, реализующего вышеуказанные методы, для анализа характеристик производительности систем циклического поллинга с групповым обслуживанием;

6. Применение модели поллинга с групповым обслуживанием для оценки производительности протокола широкополосной беспроводной сети с централизованным механизмом управления на базе привязной высотной беспилотной платформы.

Научная новизна. Научная новизна данной диссертационной работы заключается в следующем:

1. Разработана математическая модель нового класса систем поллинга с групповым обслуживанием, которая не изучена в мировой литературе;

2. Разработан численный метод исследования систем циклического поллинга с групповым обслуживанием;

3. Разработана и проведена валидация имитационной модели Монте-Карло систем поллинга с групповым обслуживанием;

4. Исследованы модели циклического поллинга с групповым обслуживанием с помощью методов машинного обучения;

5. Разработан программный комплекс, реализующий разработанные методы, для анализа характеристик производительности систем циклического поллинга с групповым обслуживанием, который отсутствует в мировой литературе и практике;

Теоретическая и практическая значимость. Построена новая математическая модель систем поллинга с групповым обслуживанием. Также разработаны методы исследования и программный комплекс, позволяющий анализировать производительность таких систем. Полученные результаты могут быть эффективно использованы для оценки производительности широкополосных беспроводных сетей с централизованным механизмом управления, включая протокол беспроводной сети на базе привязной высотной беспилотной платформы.

Методология и методы исследования. Для решения задач, поставленных в диссертационной работе, применены методы теории вероятностей, теории случайных процессов, теории массового обслуживания и вычислительной математики. В работе также использованы численные методы, метод имитационного моделирования Монте-Карло и методы машинного обучения.

Основные положения, выносимые на защиту:

1. Математическая модель нового класса систем поллинга с групповым обслуживанием, которая не изучена в мировой литературе.

2. Математический численный метод, позволяющий вычислить характеристик производительности систем циклического поллинга с групповой, исчерпывающей и шлюзовой дисциплинами обслуживания.

3. Имитационная модель систем поллинга с групповым обслуживани, позволяющая анализировать сложные случаи работы и сравнивать результаты с математическим методом;

4. Анализ скорости работы численного алгоритма и имитационной модели, обосновывающий использование методов машинного обучения;

5. Алгоритм генерации набора данных на основе результатов имитационного моделирования, позволяющий анализировать систем циклического поллинга с групповой, исчерпывающей и шлюзовой дисциплинами обслуживания методами машинного обучения;

6. Программный комплекс, реализующий разработанные методы, и позволяющий оценивать производительность широкополосных беспроводных сетей с централизованным механизмом управления;

Достоверность полученных результатов подтверждается корректным использованием известного математического подхода исследования систем поллинга, корректностью численного алгоритма и совпадением с результатами имитационного моделирования.

Соответствие паспорту специальности. Содержание данной диссертации соответствует следующим пунктам паспорта специальности 1.2.2. Математическое моделирование, численные методы и комплексы программ:

- п. 2. Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий.

- п. 3. Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента.

- п. 5. Разработка новых математических методов и алгоритмов валидации математических моделей объектов на основе данных натурного эксперимента или на основе анализа математических моделей.

- п. 6. Разработка систем компьютерного и имитационного моделирования, алгоритмов и методов имитационного моделирования на основе анализа математических моделей (технические науки).

- п. 7. Качественные или аналитические методы исследования математических моделей (технические науки)

Апробация работы. Основные результаты исследования по теме диссертации были доложены и обсуждены на следующих конференциях:

1. XXVI Международная научная конференция «Распределенные компьютерные и телекоммуникационные сети: управление, вычисление, связь» (DCCN-2023), Москва, 2023 г.

2. X Международная конференция «Инжиниринг & Телекоммуникации — En&T-2023», Москва, 2023 г.

3. 66-я Всероссийская научная конференция МФТИ, Москва, 2024 г.

4. XIV Всероссийское совещание по проблемам управления, Москва, 2024 г.

Личный вклад. Все результаты, представленные в данной диссертации, были получены автором самостоятельно и под непосредственным руководством научного руководителя. Во всех совместных публикациях автор нес основную ответственность за анализ задач, разработку и реализацию алгоритмов, а также за интерпретацию результатов.

Публикации. Основные результаты по теме диссертации изложены в 6 научных публикациях. Из них 2 статьи опубликованы в научных журналах, входящих в категорию К1 собственного перечня журналов МФТИ, 1 статья — в журнале, индексируемом Scopus, 1 публикация — в форме свидетельства о государственной регистрации программ для ЭВМ, и 2 — в тезисах докладов.

Объем и структура работы. Диссертация включает введение, 4 глав, заключение и 3 приложений. Общий объем работы составляет 162 страницы, включая 46 рисунков и 17 таблиц. В списке литературы приведены 72 источника.

Первая глава содержит описание основной математической модели систем поллинга и их классификации, представлен обзор работ по теме систем поллинга, их методов исследования и применений. Также изложена математическая модель нового класса систем поллинга с групповым обслуживанием.

Во второй главе рассмотрены системы циклического поллинга с групповым обслуживанием с двумя вариантами дисциплины обслуживания

— исчерпывающая и шлюзовая. Для исследования таких систем рассмотрены их математические модели, сформулирован численный метод для расчета характеристик производительности, построена и проведена валидация имитационной модели путем сравнения с результатами математического численного метода. Далее проведен анализ скорости работы имитационной модели и численного алгоритма, который закладывает основу применения машинного обучения, и проведено исследование этих систем с использованием методов машинного обучения.

В третьей главе представлена реализация вышеупомянутых методов в комплексе программного обеспечения, используемого для расчета производительности системы циклического группового поллинга, включая блок графического пользовательского интерфейса и блок вычисления результатов. Модуль имитационного моделирования написан на языке C++ и NED на платформе OMNeT++, а другие модули написаны на языке Python. В этой главе также описан алгоритм генерации данных для обучения и тестирования моделей машинного обучения c помощью использования модули имитационного моделирования.

В четвертой главе проведено численное сравнение традиционной модели поллинга с моделью поллинга с групповым обслуживанием, а также представлено применение модели поллинга с групповым обслуживанием для оценки производительности беспроводной сети с централизованным механизмом управления на базе привязной высотной беспилотной платформы.

В заключении приведены основные результаты исследования, полученные в данной диссертационной работе.

Глава 1. Системы поллинга. Основные понятия

Система поллинга (англ. polling system) представляет собой тип системы массового обслуживания, включающий несколько очередей и один общий обслуживающий элемент, называемый сервером. Проектирование, оптимизация структуры и оценка производительности широкополосных беспроводных сетей с централизованным управлением могут быть выполнены с помощью анализа систем поллинга [1].

В данной главе представлено описание основной математической модели систем поллинга и их классификации, а также обзор существующих исследований таких систем. Кроме того, изложена математическая модель нового класса систем поллинга с групповым обслуживанием.

1.1 Основная модель поллинга

Рассмотрим основную модель, которая является объектом исследования во многих работах по системам поллинга. Эта система состоит из одного сервера и N очередей, где N ^ 2.

Обозначим очереди в системе как Q^, где г = 1, N. Количество мест для ожидания в каждой очереди может быть либо бесконечным, либо конечным, и

обозначается как ^ (^ = 1, то) для очереди Qi. Каждая очередь Qi получает собственный поток заявок, который является простейшим (стационарным пуассоновским) с параметром Л^.

Процесс работы системы описывается следующим образом. Сервер подключается к каждой очереди в соответствии с установленным правилом, называемым порядком опроса. Время, которое сервер затрачивает на подключение к очереди , называется временем переключения к Qi.

Наиболее распространенным порядком опроса является циклический опрос, при котором сервер последовательно опрашивает очереди от первой до последней ), а затем возвращается к Время, необходимое серверу для опроса всех очередей от до QN, называется циклом.

На практике чаще всего информацию о количестве заявок в очереди сервер узнает только в момент завершения подключения к этой очереди и готовности начать обслуживание. Такой момент называется моментом опроса, или моментом поллинга.

После завершения соединения, если очередь пуста, сервер отключится и начнет подключаться к к следующей очереди. В противном случае, сервер начинает обслуживать заявки в очереди в соответствии с дисциплиной обслуживания, которая определяет количество заявок, обрабатываемых сервером за одно посещение очереди.

Времена обслуживания заявок в Q^ независимы и имеют одинаковое распределение с функцией распределения В О, среднее время обслуживания Ь{ = /0° 1(!Вг(1), второй момент 6(2) и преобразование Лапласа-Стилтьеса (ПЛС) Вг(х) = /°=0 еГ^дъВ,,(£), % = 1, N. Предполагается, что потоки заявок и времена обслуживания независимы. Время переключения сервера к очереди Q^ имеет функцию распределения 3(), среднее значение второй момент й(2) и ПЛС Йг(2) и ПЛС §г(х), г = Т^Ы [2].

На рисунке 1.1 показан пример модели поллинга с циклическим порядком опроса.

Рисунок 1.1 — Модель поллинга с циклическим порядком опроса

Вероятность того, что сервер обслуживает очередь Q^ в произвольный момент времени, называется загрузкой очереди и обозначается р^, где р^ =

Л» 5».

N N

в =

%=1 %=1

Обозначим через р = ^^ р^ загрузку системы, а через й = ^^ Si первый

момент совокупной длительности переключения сервера за один цикл.

Для циклических систем поллинга среднее время цикла С определяется как сумма времени, затраченного сервером на обслуживание очередей, и времени, затраченного на переключение между очередями. Таким образом, С = рС + 8. Из этого следует С = з/(1 — р).

1.2 Классификация

Классификация систем поллинга подробно изложена в работах [3—5]. В общем виде можно выделить три основных критерия для классификации таких систем, которые приведены ниже.

Прежде всего, системы поллинга различаются по количеству очередей: на дискретные системы (с конечным или счетным числом очередей) и непрерывные системы (в иных случаях).

Следующий критерий для классификации систем поллинга — это порядок опроса. В системе с N (Ы ^ 2) очередями, обозначенными как Q1 до QN, порядок опроса классифицируется следующим образом:

1. Циклический: сервер подключается к очередям и обслуживает их последовательно, начиная с Q1 и заканчивая QN, после чего вновь возвращается к Q1.

2. Адаптивный динамический: сервер функционирует по принципу циклического опроса, но с дополнительной особенностью: в текущем цикле он игнорирует очереди, которые были пустыми в предыдущем. Пропущенные очереди будут проверены снова через определенное количество циклов, как правило, через один цикл.

3. Периодический: cервер обслуживает очередь по заданной таблице опроса, содержащей все номера очередей. Например, в случае таблицы опроса Т размера М(М ^ N): Т = (Т(1),Т(2),...,Т(М)), Т(г) е [1,...,М}, г = 1,И, сервер запрашивает очереди в порядке

Ят(1),Ят(2), Ят(М),Ят(1),Ят(2), Ят(М), ...

4. Случайный: cервер выбирает следующую очередь для обслуживания (например, очередь Q{) случайным образом, независимо от номера предыдущей очереди с вероятностью pi, г = 1, N, ¿1 Pi = 1. Другим вариантом является марковский случайный порядок опроса (Markovian random polling), при котором вероятность того, что сервер обслужит Qj после обслуживания Qi, равна pij, i,j = 1,N, Ylf= i Pij = 1, i = 1,N.

5. Приоритетный: каждая очередь имеет свой уровень приоритета, и сервер обслуживает их в порядке убывания приоритета. Очереди с более низким приоритетом обрабатываются только после того, как все очереди с более высоким приоритетом станут пустыми.

Третий критерий классификации систем поллинга — дисциплина обслуживания заявок, которая делится на несколько основных типов:

1. Исчерпывающая: сервер завершает обслуживание очереди только тогда, когда в ней не остается заявок. Если в процессе обслуживания в очередь поступают новые заявки, они также будут обслужены в этом посещении сервера.

2. Шлюзовая: сервер обслуживает только те заявки, которые находились в очереди на момент ее опроса; заявки, поступившие после этого времени, ожидают следующего посещения сервера.

3. Т-ограниченная: время, затраченное на обслуживание очереди за одно посещение сервера, ограничено значением Т.

4. Другие типы: /-ограниченная, /-уменьшающая, пороговая, случайная и т.д.

1.3 Обзор работ по теме систем поллинга, их методов исследования и

применений

Серьезное изучение системы поллинга началось в 1950-х годах XX века. Среди ключевых исследований отечественных и зарубежных ученых можно упомянуть работы, указанные в источниках [3—17]. ^ Takagi в своей исследовательской работе [6] синтезировал и систематизировал результаты исследований в этой области, проведенных с 1950-х до 1985 года. Результаты последующих исследований, охватывающих период с 1985 по 1995 годы, были

обобщены и представлены S. Borst в работе [4]. Далее, Вишневский В.М. обобщил исследования до конца 2010-х годов в своих публикациях [3; 7; 12]. В этом разделе будут рассмотрены важные работы в области исследования систем поллинга, опубликованные за последние 10 лет.

В работе [18] рассматривается математическая модель и методы исследования систем с адаптивным порядком опроса, в которых сервер динамически пропускает пустые очереди из предыдущего цикла, опрашивая их только в следующем цикле. Такой подход уменьшает время опроса очередей и улучшает производительность системы. Работа [19] исследует вопрос «справедливости» различных дисциплин обслуживания в системах поллинга. Несмотря на важность, аспект справедливости в системах поллинга не получил должного изучения. В рамках исследования рассматриваются пять дисциплин обслуживания с использованием правила «первым пришел - первым обслужен» в качестве метрики справедливости. Проведенный анализ и численные примеры предоставляют представление о относительной справедливости этих систем поллинга. Работа [20] рассматривает условие высокой загрузки в модели ^-ограниченного поллинга, в которой за цикл в очереди г можно обслужить не более к заявок. В работе [21] анализируется модель поллинга, в которой очереди являются последовательными с двумя станциями. Входящие потоки в данном исследования — независимые пуассоновские процессы. В работе [22] представлена новая модель приоритетного поллинга для повышения эффективности обслуживания в системах с различными приоритетами заявок. Система включает в себя N «обычных» очередей и 1 «приоритетную» очередь. Дисциплины обслуживания для каждой очереди также различны. Числовой анализ в работе показывает, что новая приоритетная модель повышает эффективность обслуживания заявок и подходит для практического применения.

Для исследования систем поллинга традиционно используются математические методы на основе теории массового обслуживания, такие как метод анализа средних [8; 9; 11; 23], метод производящих функций [24—26] и другие. Эти методы обобщены в работе [27]. Для исследования сложных моделей, таких как модели с коррелированными входными потоками [28], часто используется метод имитационного моделирования Монте-Карло. В работе [29] рассматривается имитационная модель систем поллинга с двумя вариантами дисциплины обслуживания: исчерпывающая и шлюзовая. Данная модель построена с использованием среды OMNeT++. В работе [30] рассмотрена

имитационная модель циклических систем с несколькими серверами, а в работе [31] — с резервированием ресурсов.

В последнее десятилетие, в связи с быстрым развитием области искусственного интеллекта, начали появляться работы, в которых применяются методы машинного обучения для исследования систем поллинга. В работах [32; 33] исследуются системы поллинга M/M/1 с использованием методом нейронной сети для оценки их производительности. В работе [34] также исследуется система MAP/M/1 для предсказания среднего времени пребывания заявок. В работе [35] применяется трехуровневая нейронная сеть с использованием алгоритма обратного распространения ошибки для прогнозирования и анализа производительности асимметричной системы поллинга с двумя приоритетами. Полученные результаты демонстрируют эффективность модели в предсказании производительности системы. Алгоритм обратного распространения ошибки представляет собой новый подход к исследованию систем поллинга.

Системы поллинга широко применяются во многих областях, особенно в телекоммуникациях и компьютерных сетях. В [36] используется модель поллинга с механизмом дуплексного разделения времени для разработки единой системы управления в глобальных навигационных спутниковых системах с целью улучшения взаимодействия данных. Работа [37] представляет новый алгоритм быстрого поллинга для беспроводных mesh-сетей в системах узкополосного Интернета вещей. Цель данного алгоритма заключается в минимизации времени опроса, необходимого центру управления и сбора данных для получения ответов от всех удаленных телеметрических устройств. Оценка производительности алгоритма быстрого поллинга с интервалами поднесущих 6.25 кГц, 12.5 кГц, 25 кГц и 50 кГц демонстрирует значительные улучшения эффективности. Системы поллинга также применяются в сфере медицинского мониторинга, как представлено в работе [38], для оценки беспроводных нательных компьютерных сетей. Эти сети являются современными системами мониторинга, использующими беспроводные технологии для прогнозирования и диагностики заболеваний.

Список литературы диссертационного исследования кандидат наук Нгуен Ван Хиеу, 2024 год

/ / / /

/ / /

- Исчерпывающая / / / / / /

---шлюзовая / / * /

/ / / /

/ / / /

/ / / / / / / /

/ / / / / А / / / /

/ / / / / / / / / / //

>7 //

/

10

11

12 13

-1од (е,™*)

14

15

Рисунок 2.12 — Зависимость времени моделирования от значения точности

вычислений ¿тах

2.2.3 Валидация имитационной модели с использованием результатов

аналитического расчета

Для верификации правильности работы имитационной модели, в данном разделе проводится сравнительный анализ с результатами, полученными математическим численным методом.

Случай исчерпывающего обслуживания

Во-первых, рассмотрим системы поллинга с групповым обслуживанием, которые имеют исчерпывающую дисциплину обслуживания и ограниченное число мест для ожидания в очередях. Потоки обслуживания и переключения подчиняются экспоненциальному распределению со средними значениями Ьг = 0.01 секунд и = 0.001 секунд соответственно. Размер группы кг = 2 для каждого Qi, г = 1,И. Численные результаты для системы с двумя очередями показаны в таблице 1 со средними интенсивностями поступления Ах = 30 и \2 = 60.

Таблица 1 — Сравнение результатов при исчерпывающем обслуживании, N = 2

Характеристики N = 3 N = 20

А 8 А, % А 8 А, %

Ьх 0,6404 0,6416 0,19 0,8032 0,8037 0,06

Ь2 0,9942 0,9946 0,04 1,3101 1,3096 0,04

Р1овв! 0,0566 0,0572 1,06 0,0 0,0 0,0

Р10вв2 0,1275 0,1276 0,08 0,0 0,0 0,0

Ае 1 28,303 28,318 0,05 30,000 29,995 0,02

Ае 2 52,352 52,317 0,07 60,000 60,013 0,02

V! 0,0226 0,0227 0,44 0,0268 0,0268 0,0

0,0190 0,0190 0,0 0,0218 0,0218 0,0

Р1 0,2365 0,2370 0,21 0,2372 0,2372 0,0

Р2 0,4238 0,4234 0,09 0,4474 0,4475 0,02

Р 0,6603 0,6604 0,02 0,6846 0,6847 0,01

V 0,0203 0,0203 0,0 0,0235 0,0235 0,0

С 0,0059 0,0059 0,0 0,0063 0,0063 0,0

Столбец «А» показывает аналитические результаты, полученные с использованием численного метода, представленного в раздела 2.1, а столбец «8» представляет результаты, полученные с помощью имитационной модели. Результаты для системы с 3 очередями показаны в таблице 2, где Лх = 20, Л2 = 30 и Лз = 40.

Таблица 2 — Сравнение результатов при исчерпывающем обслуживании, N = 3

Характеристики N. = 3 N. = 20

А 8 А, % А 8 А, %

Ьх 0,5013 0,5007 0,12 0,5705 0,5687 0,32

Ь2 0,6844 0,6835 0,13 0,8069 0,8066 0,04

Ь 0,8277 0,8275 0,02 1,0025 1,0009 0,16

Р1овв! 0,0336 0,0336 0,0 0,0 0,0 0,0

Р10вв2 0,0643 0,0640 0,47 0,0 0,0 0,0

Р10ввз 0,0920 0,0924 0,43 0,0 0,0 0,0

Ле 1 19,328 19,328 0,0 20,000 20,003 0,02

Л е 2 28,071 28,049 0,08 30,000 30,016 0,05

Л 3 36,321 36,321 0,0 40,000 39,936 0,16

V! 0,0259 0,0259 0,0 0,0285 0,0284 0,35

0,0244 0,0244 0,0 0,0269 0,0269 0,0

Уз 0,0228 0,0228 0,0 0,0251 0,0251 0,0

Р1 0,1624 0,1623 0,06 0,1623 0,1623 0,0

Р2 0,2301 0,2300 0,04 0,2338 0,2343 0,21

Рз 0,2932 0,2929 0,10 0,3033 0,3027 0,20

Р 0,6856 0,6853 0,04 0,6993 0,6992 0,01

V 0,0241 0,0240 0,41 0,0265 0,0264 0,38

С 0,0095 0,0095 0,0 0,0100 0,0100 0,0

Видно, что независимо от значений числа мест для ожидания в очередях характеристики производительности системы, полученные методом имитационного моделирования, близко соответствуют результатам, полученным путем численного решения системы уравнений равновесия для нахождения стационарных вероятностей состояний, с погрешностью не более 2% (столбец «А»).

Случай шлюзового обслуживания

Рассмотрим систему, состоящую из двух очередей в случаях низкой и высокой загрузки. Дисциплина обслуживания — шлюзовая. Среднее время обслуживания Ь1 = Ь2 = 0,01 секунд, среднее время переключения = й2 = 0,001 секунд. Размер группы к1 = к2 = 2. Количество мест для ожидания N1 = = 20. Результаты представлены в таблице 3.

Таблица 3 — Сравнение результатов при шлюзовом обслуживании, N = 2

Характеристики Л1 = 20, Л2 = 30 Л1 = 80, Л2 = 100

A S А, % A S А, %

Д 0,3535 0,3525 0,28 6,6923 6,6829 0,14

Ь2 0,5357 0,5359 0,04 8,4561 8,4492 0,08

Р1овв1 0,0 0,0 0,0 0,0134 0,0133 0,75

Р1овв2 0,0 0,0 0,0 0,0364 0,0363 0,27

К 20,000 19,978 0,11 78,925 78,905 0,03

Ле2 30,000 29,994 0,02 96,361 96,331 0,03

VI 0,0177 0,0176 0,56 0,0848 0,0847 0,12

У2 0,0179 0,0179 0,0 0,0878 0,0877 0,11

Р1 0,1796 0,1791 0,28 0,4346 0,4344 0,05

Р2 0,2602 0,2603 0,04 0,5223 0,5224 0,02

Р 0,4398 0,4395 0,07 0,9569 0,9568 0,01

V 0,0178 0,0178 0,0 0,0864 0,0864 0,0

с 0,0036 0,0036 0,0 0,0464 0,0464 0,0

Заметно, что при повышенной загрузке системы вероятность потери будет увеличиваться, так как заявки чаще теряются при поступлении. Увеличение числа мест для ожидания приведет к тому, что система будет функционировать подобно системе с бесконечным числом мест ожидания. Однако следует отметить, что увеличение ^ также приведет к росту числа состояний системы, что, в свою очередь, увеличит вычислительную нагрузку.

В таблице 4 представлены результаты для системы, состоящей из трех очередей, в которой первые две очереди имеют одинаковую интенсивность входного потока Л1 = Л2, в случаях низкой и высокой нагрузки. Среднее время обслуживания Ь^ = 0.01 секунд, среднее время переключения б г = 0.001 секунд, количество мест для ожидания ^ = 10, г = 1,3. Размер группы к1 = 1,^2 = 2, кз = 3.

Таблица 4 — Сравнение результатов при шлюзовом обслуживании, N = 3

Характеристики N. = 3 N. = 20

А 8 А, % А 8 А, %

Ьг 0,1814 0,1818 0,22 4,8834 4,8913 0,16

Ь2 0,1752 0,175 0,11 4,2175 4,2175 0,0

Ь 0,3496 0,3496 0,0 5,1582 5,169 0,21

Р1овв! 0,0 0,0 0,0 0,0744 0,0738 0,81

Р1овв2 0,0 0,0 0,0 0,0717 0,0724 0,98

Р10ввз 0,0 0,0 0,0 0,1620 0,1619 0,06

Ае 1 10,000 10,007 0,07 46,279 46,226 0,11

Ае 2 10,000 9,9968 0,03 46,416 46,301 0,25

Ае 3 20,000 20,004 0,02 58,661 58,650 0,02

V! 0,0181 0,0182 0,55 0,1055 0,1058 0,28

0,0175 0,0175 0,0 0,0909 0,0911 0,22

Уз 0,0175 0,0175 0,0 0,0879 0,0881 0,23

Р1 0,1000 0,1003 0,30 0,4628 0,4631 0,06

Р2 0,0940 0,0938 0,21 0,2566 0,2560 0,23

Рз 0,1767 0,1767 0,0 0,2413 0,2418 0,21

Р 0,3707 0,3708 0,03 0,9608 0,9610 0,02

V 0,0177 0,0177 0,0 0,0972 0,0964 0,82

С 0,0048 0,0048 0,0 0,0765 0,0768 0,39

Легко видеть, что относительная погрешность между результатами, полученными двумя методами, очень мала, менее 1%. Отсюда можем сделать вывод, что представленная имитационная модель Монте-Карло для исследования систем поллинга с групповым обслуживанием и оценки их характеристик производительности работает корректно.

2.3 Анализ времени, необходимого для расчета результатов математическим

и имитационным методами

В данном разделе анализируем скорость расчета характеристик производительности систем циклического поллинга с групповым обслуживанием с использованием математического и имитационного методов, описанных в разделе 2.1 и 2.2.

Математический метод включает в себя использование численных алгоритмов для решения системы уравнений равновесия, нахождения стационарных вероятностей состояний и, следовательно, расчета характеристик производительности системы, как описано в разделе 2.1.3 и 2.1.4. Скорость расчета этим методом сильно зависит от количества уравнений системы уравнений равновесия (2.9), то есть числа состояний системы поллинга. Количество состояний системы пропорционально количеству очередей Ж, количеству мест для ожидания Д; и размеру группы к{.

Зависимость времени расчета результатов от количества состояний системы показана на рисунке 2.13.

3000 2500 2000

ГО

н си 3" и СО

1500

СЕ £

си о. ш

1000 500

0 20000 40000 60000 80000 100000 120000 140000

Количество состояний системы

Рисунок 2.13 — Зависимость времени расчета результатов от количества состояний системы с использованием математического метода

Видно, что в случае 2 очередей, количество мест для ожидания Д; = 20, размера группы к,, = 5, время, затрачиваемое на расчет результатов, довольно

мало — 1,5 секунда в случае исчерпывающей дисциплины обслуживания (количество состояний 4662) и 5 секунд в случае шлюзовой дисциплины (количество состояний — 9702). Однако это время быстро увеличивается с увеличением числа состояний системы. Например, если количество очередей N увеличивается до 3, а другие параметры остаются прежними, время расчета увеличивается до 1 часа в случае исчерпывающего обслуживания и более 4 часов в случае шлюзового обслуживания.

Для имитационных моделей время моделирования не зависит от количества состояний системы, а от загрузки системы р. Эта зависимость показана на рисунках 2.14 и 2.15 для случаев исчерпывающего и шлюзового обслуживания, соответственно.

7000

6000

у 5000 к

X

fo

g 4000

а.

s

^

tu

I 3000 or

s

0)

ш 2000 1000

• • t

• г *

• *

1..

> • *1*

41:41 J111(9 * |

0.0 0.1 0.2 0.3 0.4 0.5

Загрузка системы р

0.6

0.7

0.3

Рисунок 2.14 — Зависимость времени моделирования от загрузки системы р при

случае исчерпывающего обслуживания

Из этих рисунков видно, что время моделирования относительно быстро уменьшается при высокой загрузке системы (от 5 минут до нескольких секунд при загрузке более 20%). Однако при постепенном снижении загрузки системы время моделирования быстро увеличивается, превышая 2 часа за каждое моделирование.

В практических системах с централизованным механизмом управления, в частности системах Wi-Fi, исходные данные обычно являются неизвестными. Для проверки многих вариантов исходных данных, нужны многократные расчеты характеристик производительности. Поэтому даже если время,

8000

6000

g 4000

о

£

m

2000

• • •

• •

•С

'ilKifcti:.*

0.0

0.2

0.4

Загрузка системы р

0.6

0.8

Рисунок 2.15 — Зависимости времени моделирования от загрузки системы р при

случае шлюзового обслуживания

необходимое для расчета — одна-две минута, то из-за большого количества расчетов и моделирования, оно превращает в большое время. Этот недостаток у численного и имитационного методов преодолевается методами машинного обучения, где расчет результатов практически мгновенен, от миллисекунд до нескольких секунд, и стабилен, независимо от значения входных параметров.

В следующем разделе рассмотрим применение машинного обучения для исследования систем циклического поллинга с групповым обслуживанием.

2.4 Исследование систем циклического поллинга с групповым обслуживанием методами машинного обучения

Машинное обучение — это область искусственного интеллекта, которая изучает методы и алгоритмы, позволяющие компьютерам учиться и делать выводы из данных, не явно программированных для конкретной задачи. В отличие от традиционного программирования, где разработчик явно задает шаги решения задачи, в машинном обучении модель обучается на основе данных и делает предсказания на основе полученного опыта.

Основные задачи машинного обучения включают в себя:

- Классификация: Задача отнесения объектов к определенным классам на основе их признаков.

- Регрессия: Предсказание значений непрерывной переменной.

- Кластеризация: Группировка объектов на основе их сходства таким образом, чтобы объекты в одной группе были более похожи друг на друга, чем на объекты из других групп.

- Обнаружение аномалий: Идентификация необычных или аномальных объектов, которые могут отличаться от большинства данных.

- Обработка естественного языка: Задачи анализа и работы с текстовыми данными, такими как распознавание речи, анализ тональности текста, машинный перевод и др.

- Рекомендательные системы: Предсказание предпочтений пользователей и рекомендация товаров, фильмов, музыки и т.д.

Процесс обучения и предсказания в машинном обучении включает несколько ключевых этапов:

1. Подготовка данных: Этот этап включает сбор, очистку и предобработку данных. Данные должны быть подготовлены к тому, чтобы модель могла извлекать из них закономерности.

2. Выбор модели: На этом этапе выбирается тип модели машинного обучения, который наилучшим образом подходит для решения конкретной задачи.

3. Обучение модели: В этом шаге модель «обучается» на подготовленных данных. Это включает подстройку параметров модели таким образом, чтобы минимизировать ошибку на обучающих и проверочных данных.

4. Оценка модели: После завершения обучения модель оценивается на тестовом наборе данных, который не использовался в процессе обучения. Это позволяет оценить качество модели и ее способность обобщаться на новые данные.

5. Настройка гиперпараметров: В процессе оценки модели может потребоваться настройка гиперпараметров, таких как скорость обучения, количество скрытых слоев в нейронной сети и т.д., для достижения лучших результатов.

6. Предсказание: После успешной оценки модели она может быть использована для прогнозирования новых данных, которые не были использованы в обучающем наборе.

Для оценки точности обучения и предсказания моделей машинного обучения, широко используются следующие функции математической статистики:

- MSE = ^ ЫУг — Vi)2 — среднеквадратичная ошибка,

- MAE = ^ Y1 Г=1 \Уг — Уг\ — средняя абсолютная ошибка,

RMSE = J lYh ЫУг — У) — корень из среднеквадратичной ошибки,

п

- В2 = 1 — — коэффициент детерминации,

¿-^г=1 \Уг У)

где у, и у, обозначают фактическое и предсказанное значения соответственно, а У = ПЕП=1 У, — среднее фактическое значение.

В машинном обучении существует множество моделей и методов решения задач. Каждый из этих методов имеет свои преимущества и недостатки в зависимости от конкретной задачи и характеристик данных. Выбор подходящего метода часто зависит от специфики данных, размера выборки, степени нелинейности взаимосвязей и требований к скорости работы модели.

В данном исследовании использованы 2 модели на основе деревьев — дерево решений и градиентный бустинг, а также модель многослойного персептрона, которая является классическим алгоритмом нейронных сетей для предсказания среднего времени пребывания заявок V в системах циклического поллинга с групповым обслуживанием в двух случаях дисциплины — исчерпывающей и шлюзовой.

2.4.1 Подготовка данных

В машинном обучении сбор и подготовка данных играют ключевую роль, определяя качество и эффективность моделей. Основные типы наборов данных включают обучающий, проверочный и тестовый. Обучающий набор используется для тренировки модели на различных примерах, что позволяет ей выявлять закономерности в данных. Проверочный набор необходим для тонкой настройки параметров модели и оценки ее обобщающей способности, помогая предотвратить переобучение. Тестовый набор используется для окончательной оценки производительности модели на новых данных, не участвовавших в

обучении, что подтверждает ее способность к обобщению на новые задачи и обстоятельства.

Для каждой системы, исчерпывающей и шлюзовой, собирается отдельный набор данных, каждый из них состоит из 32400 точек, сгенерированных моделью имитационного моделирования. Эти наборы разделяются на три части: обучающий набор, проверочный набор и тестовый набор, с соотношениями 70%, 20% и 10% соответственно.

Диапазон значений входных параметров показан в таблице 5.

Таблица 5 — Диапазон значений входных параметров

Входные параметры Диапазон

Число очередей N 2 — 5

Число мест для ожидания Д; 2 — 10

Размер группы Ъ, 2 — 10

Среднее время обслуживания 0,001 — 0,01

Среднее время переключения 0,001 — 0,01

Интенсивность входящих потоков Л^ Зависит от остальных параметров

При различных наборов входных параметров, значение Л^, необходимое для покрытия значений загрузки системы р от низкого до высокого, также различаются. Количество входных параметров для каждого различного числа очередей N равно 5 Ж +1. Поскольку максимальное значение N равно 5, каждый набор данных имеет 26 значений входных параметров и 1 выходной параметр, который представляет собой среднее время пребывания заявок в системе V. Если N меньше 5, пустые ячейки в наборе данных будут заполнены значением 0.

Алгоритм генерации данных более подробно описан в разделе 3.3.3 главы

3.

2.4.2 Модель дерева решений

Одной из наиболее широко используемых моделей для решения задач как классификации, так и регрессии, является модель дерева решений. Она работает путем разбиения обучающих данных на подмножества и последующего

построения дерева, где каждый узел представляет собой условие по одному из признаков, а каждое ребро (ветвь) соответствует результату этого условия.

В данной работе модель построена на языке Python с использованием библиотеки scikit-learn. В процессе обучения оптимальное значение максимальной глубины дерева для обеих систем равно 16. После обучения модель используется для прогнозирования результатов на тестовом наборе, результаты которого показаны на рисунке 2.16.

а) Исчерпывающая б) Шлюзовая

Рисунок 2.16 — Результат предсказания модели дерева решений на тестовом

наборе данных

Синяя линия функции у = х указывает на то, что предсказанный результат совпадает с результатом моделирования. Чем больше расстояние от точки до этой линии, тем больше ошибка прогнозирования. Показатели точности данной модели на тестовом наборе представлены в таблице 6.

Таблица 6 — Показатели точности модели дерева решений на тестовом наборе данных

Показатели Исчерпывающая Шлюзовая

MSE 1,47 • 10-7 3,53 • 10-7

MAE 0,0002 0,0003

RMSE 0,0004 0,006

R2 0,9993 0,9978

Из графиков 2.16 и таблицы 6 видно, что модель дерево решений дает очень хорошие результаты прогнозирования.

2.4.3 Модель градиентного бустинга

Рассмотрим мощный метод машинного обучения для решения задач как классификации, так и регрессии — градиентный бустинг. Основная идея этого метода заключается в последовательном добавлении новых деревьев к ансамблю, каждое из которых настраивается на остатки предыдущего дерева с целью минимизации функции потерь. В отличие от отдельного дерева решений, градиентный бустинг часто обладает более высокой точностью и устойчивостью к переобучению благодаря композиционному подходу и встроенной регуляризации.

Аналогично модели дерева решений, модель градиентного бустинга также построена на Python с использованием библиотеки scikit-learn. Оптимальное значение максимальной глубины дерева — 9. Результаты оценки модели на тестовом наборе после обучения представлены на рисунке 2.17.

0.02 0.04 0.06 0.08 0.10 0.02 0.04 0.06 0.08 0.10

Результаты имитационного моделирования Результаты имитационного моделирования

а) Исчерпывающая б) Шлюзовая

Рисунок 2.17 — Результат предсказания модели градиентного бустинга на

тестовом наборе данных

Показатели точности данной модели на тестовом наборе представлены в таблице 7.

Таблица 7 — Показатели точности модели градиентного бустинга на тестовом наборе данных

Показатели Исчерпывающая Шлюзовая

MSE 8,59 • 10-8 2,21 • 10-7

MAE 0,0002 0,0003

RMSE 0,0003 0,0005

R2 0,9996 0,9986

Замечено, что результаты прогнозирования с помощью модели градиентного бустинга немного лучше, чем с помощью модели дерева решений, как для исчерпывающей, так и для шлюзовой системы.

Дальше применим еще метод нейронной сети для исследования таких систем поллинга с групповым обслуживанием.

2.4.4 Модель многослойного персептрона

Нейронные сети представляют собой вычислительные модели, вдохновленные работой человеческого мозга. Они состоят из множества взаимосвязанных и взаимодействующих нейронов, организованных в слои. Один из классических типов нейронных сетей — многослойный персептрон (multilayer perceptron — MLP). Модель MLP состоит из нескольких слоев: входного, скрытых и выходного. Входной слой получает данные, скрытые слои выполняют вычисления, а выходной слой формирует окончательный результат. Каждый нейрон в модели MLP принимает входные данные, взвешивает их, применяет функцию активации и передает выход другим нейронам. Обучение модели MLP заключается в настройке весов связей между нейронами с целью минимизации ошибки на обучающих и проверочных данных, что позволяет сети обобщать и делать предсказания на новых данных.

Структура модели MLP представлена на рисунке 2.18.

В отличие от двух предыдущих моделей, при обучении которых не требуется выполнение предварительной обработки данных, для обучения

Input layer Hidden layer output layer

Рисунок 2.18 — Архитектура сети многослойного персептрона

нейронных сетей, в том числе для моделей многослойного персептрона MLP, стандартизация данных играет важную роль в подготовке данных. Этот процесс включает в себя нормализацию и центрирование данных, что помогает улучшить сходимость алгоритмов оптимизации и обучения сети.

Модель MLP в этом исследовании построена на Python с использованием библиотеки Pytorch, включает входной слой с 26 нейронами, 1 скрытый слой с 14 нейронами и выходной слой с 1 нейроном. В качестве функции активации используется ReLU: f (х) = шах(0,ж). Функция потерь — MSE. Набор данных стандартизирован с помощью StandardScaler в библиотеке scikit-learn. Алгоритм оптимизации — ADAM.

Процесс обучения модели MLP показан на рисунках 2.19 и 2.20. Очевидно, что по результатам обучения функция потерь постепенно снижается и сходится к нулю. Отсюда можно предсказать, что модель обучена правильно.

Результаты оценки модели MLP на тестовом наборе после обучения представлены на рисунках 2.21 и 2.22.

Показатели точности модели MLP на тестовом наборе представлены в таблице 8.

— ы - Вс учение лидация

L

О 1000 2000 3000 4000 5000 6000

эпоха

Рисунок 2.19 — Процесс обучения модели MLP. Исчерпывающее обслуживание

О 1000 2000 3000 4000 5000 6000 7000

эпоха

Рисунок 2.20 — Процесс обучения модели MLP. Шлюзовое обслуживание

Замечено, что в данной работе модель MLP дает результаты прогнозирования, которые не так хороши, как предыдущие две модели, как по дисперсии точек на графиках, так и по показателям точности.

Рисунок 2.21 — Результат предсказания модели MLP на тестовом наборе данных.

Исчерпывающее обслуживание

0.10

0.08

и 0.06 в tu о. с 2

га 0.04

0.02

0.00

• • 5 о • • •

• - •

¡Р «■

0.00

0.02 0.04 0.06 0.08

Результаты имитационного моделирования

0.10

Рисунок 2.22 — Результат предсказания модели MLP на тестовом наборе данных.

Шлюзовое обслуживание

Таблица 8 — Показатели точности модели MLP на тестовом наборе данных

Показатели Исчерпывающая Шлюзовая

MSE 4,24 • 10-6 4,26 • 10-6

MAE 0,0014 0,0014

RMSE 0,0021 0,0021

R2 0,9801 0,9730

2.4.5 Сравнение результатов

Для оптимизации времени обучения, предотвращения переобучения и повышения обобщающей способности, применена стратегия ранней остановки с параметром patience = 10. Основная идея заключается в том, чтобы прекратить процесс обучения модели, когда производительность на проверочном наборе данных перестает улучшаться.

Время обучения трех моделей представлено в таблице 9.

Таблица 9 — Время обучения моделей в секундах

Методы Исчерпывающая Шлюзовая

Дерево решений 4,3 6,2

Градиентный бустинг 66,8 92,4

Многослойный персептрон 23,6 27,1

Заметим, что время обучения модели дерева решений самое быстрое, а модели градиентного бустинга — самое медленное.

Далее используем эти три модели для прогнозирования среднего времени пребывания заявок в системе V при изменении загрузки системы р от низкой до высокой. Результаты представлены на рисунках 2.23 и 2.24.

и си

s

ф н

и S

(j

со X.

о ей сс го m се

гс сй J

ю

ш

Си

С

ф Q.

ой О)

ш

I

ф

о_

и

0.0 0.2 0.4 0.6 0.8

Загрузка системы р

Рисунок 2.23 — Сравнение результатов в системе с исчерпывающей

дисциплиной обслуживания

Загрузка системы р

Рисунок 2.24 — Сравнение результатов в системе с шлюзовой дисциплиной

обслуживания

Видно, что модели дерево решений и градиентного бустинга по-прежнему дают результаты прогнозирования с очень высокой точностью, практически совпадающие с результатами имитационного моделирования. Хотя модель MLP имеет относительно хорошие результаты обучения и тестирования, ее точность при применении к расчетам с новым набором данных не обеспечивает такой высокой точности, как две остальные модели.

Время, необходимое для каждого расчета, моделирования и предсказания с одним и тем же набором входных параметров, представлено в таблице 10.

Таблица 10 — Время расчета результатов в секундах

Методы Исчерпывающая Шлюзовая

Математиче ский 487 2892

Имитационное моделирование 31 68

Дерево решений 2,5 • 10-4 2,2 • 10-4

Градиентный бустинг 4,2 • 10-4 4,4 • 10-4

Многослойный персептрон 2,2 • 10-4 3,2 • 10-4

Заметим, что время расчета с использованием моделей машинного обучения очень быстрое, в тысячи и миллионы раз быстрее, чем с использованием математического численного метода и метода имитационного моделирования. Это очень важно в практических системах, требующих большого и непрерывного количества расчетов, как в системах Wi-Fi.

2.5 Вывод по второй главе

В данной главе изучены системы циклического поллинга с групповым исчерпывающим и шлюзовым обслуживаниями с помощью математического численного метода. Построена имитационная модель и решена проблема остановки моделирования вышеупомянутых систем. Проанализировано вычислительное время математического численного и имитационного методов, затем применены методы машинного обучения для исследования вышеупомянутых систем поллинга. Основные результаты исследований, представленные в этой главе, опубликованы в работах [48—51].

Глава 3. Программный комплекс для оценки характеристик

производительности систем циклического поллинга с групповым

обслуживанием

В данной главе рассмотрим реализацию всех методов исследования систем поллинга с групповым обслуживанием, представленных в главе 2, и объединим их в единый программный комплекс, который будет называться PoSys (от слова Polling Systems).

Программный комплекс PoSys предназначен для анализа и расчета характеристик производительности систем циклического поллинга с групповым обслуживанием тремя различными методами: математическим численным (также называемым аналитическим) методом, методом имитационного моделирования и методом машинного обучения. Дисциплина обслуживания могут быть исчерпывающими или шлюзовым. PoSys написан на языках Python, C++ и NED, в зависимости от каждого отдельного модуля, и работает в операционной системе Windows версии 7/10/11.

Дальше в данной главе более подробно рассмотрим структуру и принцип работы этого программного комплекса.

3.1 Архитектура программного комплекса

Общая концепция программного комплекса PoSys показана на рисунке 3.1. PoSys состоит из двух основных блоков: блока графического интерфейса пользователя (GUI) и блока вычисления результатов. Блок GUI получает необходимые входные параметры системы, затем на основе выбранного метода для расчета отправляет данные в соответствующий модуль в блоке вычисления результатов. После завершения процесса расчета результаты возвращаются в блок GUI для отображения в виде таблицы.

GUI программного комплекса PoSys изображен на рисунке 3.2.

Общая структура директории программного комплекса PoSys показана на рисунке 3.3.

Рисунок 3.1 — Общая концепция программного комплекса

S* PoSys

File Settings Help

Polling System Configuration

Method for Calculating Results

O Simulation ® Numerical Analysis O Machine Learning

Polling Order

® Cyclic

Service Discipline

® Exhaustive О Gated

Number of Queues 1

Unlimited Queue Capacities Qu eu e Ca pa citi es [zQ

Regular Service Batch Sizes

2,2

Mean Customer Arrival Rates 40, 50

Mean Customer Service Times 0.01,0.01

Mean Server Switchover Times 0.001, 0.001

Results

Clear

Default Config ► Run

1 Parameter Mean Ioss rateP_loss[1] Value 1,5319642902449172e-06 Л

2 Mean loss rate P_loss[2] 2,6985509756923415e-06

3 Mean effective arrival rate lambda_e[1] 39.99993872142839

4 Mean effective arrival rate lambda_e[2] 49.999865072451215

5 Mean queue length L[1] 0.9895334433653824

6 Mean queue length L[2] 1.1553484050020848

7 Mean customer sojourn time V[1] 0.02473837410744029

8 Mean customer sojourn time V[2] 0.02310703045554128

9 Mean customer waiting time W[1] 0.01473837410744029

10 Mean customer waiting time W[2] 0.013107030455541279

11 Queue traffic intensity ro[1] 0.3085773253742711

12 Queue traffic intensity ro[2] 0.37853857189911616

13 Total traffic intensity ro 0,6871158972733873

14 Mean customer sojourn time in the system V 0.0238396516375964

15 Mean cycletime C 0.0063921432331368105 V

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.