Повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания

Флорко, Андрей Борисович

Повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Флорко, Андрей Борисович

Флорко, Андрей Борисович
кандидат технических наук
2010

Специальность ВАК РФ05.13.01

Количество страниц 136

Флорко, Андрей Борисович. Повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Дубна. 2010. 136 с.

Оглавление диссертации кандидат технических наук Флорко, Андрей Борисович

ВВЕДЕНИЕ

ГЛАВА 1. ОБЗОР МСС, ПРОГРАММНЫХ АРХИТЕКТУР И МЕХАНИЗМОВ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНЫХ

РЕСУРСОВ

1.1 Информационные системы многоэтапной обработки информации

1.1.1 Требования отказоустойчивости и масштабируемости в современных информационных системах

1.1.2 Отказоустойчивость в SCADA системах

1.1.3 Масштабируемость в системах потоковой обработки информации

1.2 Технологические аппаратные тренды в создании масштабируемых информационных систем

1.2.1 Мульти-ядерные системы

1.2.2 Мультипроцессорные системы

1.2.3 Кластеры

1.3 Обзор SCADA систем - типичных представителей ИС массового обслуживания

1.3.1 Функциональная структура SCADA

1.3.2 Особенности SCADA как процесса управления

1.3.3 Основные требования к диспетчерским системам управления

1.3.4 Области применения SCADA-систем

1.4 Современные программные архитектуры для построения масштабируемых ИС

1 А. 1 Потоковый параллелизм

1.4.2 Фиксированный пул потоков

1.4.3 Недостатки классических решений

1.4.4 Событийная архитектура и адаптивный механизм [9]

1.4.5 Проблемы существующих механизмов

ГЛАВА 2. МЕХАНИЗМ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ПОСТРОЕНИЯ ОТКАЗОУСТОЙЧИВЫХ,

МАСШТАБИРУЕМЫХ ИС

2.1 Математическая модель МСС на основе обмена сообщениями

2.2 Схема работы предлагаемого механизма

2.3 Алгоритм определения числа системных потоков, назначаемых компоненте

2.4 Алгоритм определения временного интервала приостановки обработки сообщений компонент

ГЛАВА 3. СРАВНИТЕЛЬНЫЙ АНАЛИЗ МЕХАНИЗМОВ РАСПРЕДЕЛЕНИЯ ВЫЧИСЛИТЕЛЬНЫХ РЕСУРСОВ МСС В СЦЕНАРИЯХ ПИКОВЫХ НАГРУЗОК

3.1 Гипотетический сервер сбора и обработки информации

3.2 Особенности тестирования

3.3 Зависимость времени первого отказа от интенсивности потока заявок

3.4 Зависимость времени первого отказа при изменении вероятностей появления пакетов различных типов

3.5 Зависимость времени первого отказа от длины очередей компонент

3.6 Зависимость времени первого отказа для SCADA сервера, формирующего команды измерительному оборудованию

3.7 Детальный анализ поведения ИС с применением различных механизмов распределения ресурсов

ГЛАВА 4. SCADA СИСТЕМА JACINTH - АПРОБАЦИЯ ПРЕДЛОЖЕННОГО МЕХАНИЗМА

4.1 Концептуальная архитектура многоэтапной событийной SCADA системы

4.2 Сценарии работы с иерархическим хранилищем данных

4.2.1 Интроспекция

4.2.2 Чтение данных

4.2.3 Обновление данных

4.2.4 Диаграмма классов

4.3 Пример реализации модуля Jacinth для контроллера измерительного оборудования

4.3.1 Кристалл-2С

4.3.2 Архитектура драйвера

4.4 Пример реализации SCADA проекта с использованием Jacinth

4.5 Тестирование SCADA проекта на основе Jacinth

4.5.1 Сценарий теста

4.5.2 Результаты тестирования

Введение диссертации (часть автореферата) на тему «Повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания»

Различные области человеческой деятельности требуют привлечения высокопроизводительных, отказоустойчивых и масштабируемых информационных систем (ИС) массового обслуживания, что обуславливает актуальность выбранной темы исследования. Спектр подобных систем самый широкий, от SCADA (Supervisory Control And Data Acquisition - диспетчерское управление и сбор данных) систем в жизненно-важных для человека областях (авиация, энергетика, транспорт) до web-сервисов и биржевых систем потоковой обработки информации.

Критически важным требованием для функционирования таких систем массового обслуживания как SCADA является максимально возможное время наработки на отказ (величина временного промежутка до первого отказа в обслуживании поступившего в систему запроса). Большое время работы системы до первого отказа позволяет оператору принимать более взвешенные управленческие решения при анализе возникшей в системе массового обслуживания ситуации (нередко аварийного характера).

ИС массового обслуживания также нередко внедряются в расчёте на возрастающую интенсивность потока заявок (например, рост числа посетителей с ростом популярности интернет ресурса) или с расчётом на многократное превышение штатной интенсивности заявок (биржевая паника, аварийная ситуация). Поэтому масштабируемость, способность системы линейно увеличивать производительность с увеличением аппаратных возможностей нередко выступает ещё одним важным требованием при разработке.

Одной из распространенных программных архитектур, используемых для построения масштабируемых ИС массового обслуживания, в перечисленных выше областях применения является архитектура, в которой ИС проектируется в виде событийной сети компонентов, взаимодействующих между собой при помощи обмена сообщениями. Как правило, сообщение возникает в системе благодаря внешнему событию (например, поступившей заявке), содержит необходимые данные для обработки, а сама обработка выполняется последовательно в несколько этапов компонентами системы.

Перераспределяя системные потоки между компонентами системы и назначая компонентам временные интервалы приостановки обработки сообщений, удаётся уменьшить среднее время обработки сообщений на некоторых компонентах за счёт увеличения среднего времени обработки на других компонентах сети, когда компоненты разделяют общие вычислительные ресурсы [1—4].

Анализ существующих механизмов распределения вычислительных ресурсов, применяемых при построении подобных многоэтапных событийных систем (МСС) массового обслуживания, показал, что существующие механизмы (механизм с фиксированным числом системных потоков1 у каждой из компонентов системы и адаптивный механизм [9]) не позволяют существенно увеличить время наработки системы на отказ.

Изложенные обстоятельства обуславливают актуальность разработки механизма распределения вычислительных ресурсов в МСС, ориентированного на увеличение времени первого отказа.

1 Под системными потоками подразумеваются потоки управления операционной системы (например, Windows), при помощи которых реализуется многозадачность, способность системы к параллельному исполнению программного кода.

Целью диссертационной работы является повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания за счёт нового механизма распределения вычислительных ресурсов, способного увеличить временной промежуток до первого отказа в обслуживании поступившего в систему запроса.

Достижение цели диссертационной работы осуществляется решением следующих задач.

• Исследование предметной области, связанной с проектированием, разработкой и использованием отказоустойчивых масштабируемых ИС массовой обработки информации.

• Создание математической модели МСС массового обслуживания на основе обмена сообщениями в условиях разделяемых компонентами системы вычислительных ресурсов.

• Разработка механизма распределения вычислительных ресурсов МСС, позволяющего повысить время наработки на отказ МСС в условиях пиковой нагрузки.

• Разработка ИС, основанной на предложенном в диссертации механизме, и сравнение её времени наработки на отказ с результатами, полученными для аналогичной ИС, основанной на существующих механизмах.

Предмет и методы исследования

Предметом исследования являются механизмы распределения вычислительных ресурсов МСС и используемые в них алгоритмы. Для решения поставленных исследовательских задач использовались методы системного анализа, методы и модели теории управления, а также модели теории очередей. Научная новизна

• Предложена математическая модель многоэтапной событийной системы, основанной на обмене сообщениями, в которой компоненты системы разделяют общие вычислительные ресурсы.

• Предложен новый механизм распределения вычислительных ресурсов МСС, ориентированный на увеличение времени наработки системы на отказ в условиях пиковых нагрузок.

• Впервые разработано специализированное программное обеспечение в виде библиотеки классов на языке программирования Java, которое может быть использовано для создания отказоустойчивых МСС в условиях пиковых нагрузок. Практическая значимость

Применение разработанного в диссертации механизма позволяет создавать МСС с большим временем наработки на отказ по сравнению с использованием существующих механизмов распределения вычислительных ресурсов, что особенно актуально для SCADA систем.

На основе разработанного в диссертации механизма создана и зарегистрирована в Роспатенте библиотека классов, которая представляет самостоятельный практический интерес с точки зрения использования при конструировании МСС потоковой обработки информации, поскольку позволяет создавать устойчивые к .пиковым нагрузкам МСС.

Апробация результатов работы

Основные результаты диссертации были представлены в виде докладов на XII и XIII конференциях студентов, аспирантов и молодых специалистов (г. Дубна 2005, 2006), IX и X конференции молодых учёных и специалистов ОИЯИ (г. Дубна 2005, 2006)

По результатам выполненных исследований опубликовано 7 печатных работ, получено свидетельство о государственной регистрации программы для ЭВМ в Роспатенте.

Построенная с использованием разработанного автором в диссертационной работе механизма отказоустойчивая масштабируемая ИС массовой обработки информации внедрена в Лаборатории Сетевых Технологий (г. Дубна).

Публикации и личный вклад

Диссертация основана на теоретических, методических и проектных исследованиях и разработках, выполненных автором. По теме диссертации опубликовано 7 печатных работ, из них 2 статьи в журнале из перечня ведущих рецензируемых научных журналов и изданий из перечня ВАК Министерства образования и науки РФ. Также получено свидетельство о регистрации программы для ЭВМ в Роспатенте.

В работах, выполненных в соавторстве, соискатель внёс определяющий вклад в разработку представленного в диссертации механизма распределения вычислительных ресурсов МСС потоковой обработки информации для повышения отказоустойчивости в условиях пиковых нагрузок. Автором также были разработаны все алгоритмы и программы, представленные в диссертации.

Объём и структура диссертации

Диссертация состоит из введения, 4 глав, заключения, списка

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Флорко, Андрей Борисович

Заключение

В итоге проведённых исследований был предложен новый механизм повышения отказоустойчивости информационных систем, основанных на обмене сообщениями, предполагающий перераспределение вычислительных ресурсов рабочей станции. При этом получены следующие основные результаты:

• Разработана математическая модель МСС для описания поведения информационных систем, исполняемых на одной рабочей станции с общими для всех компонентов вычислительными ресурсами и основанных на обмене сообщениями.

• Разработан новый механизм распределения вычислительных ресурсов МСС, основанный на перераспределении числа системных потоков и назначении времени приостановки обработки входящих сообщений на компонентах, для повышения отказоустойчивости МСС в сценариях пиковых нагрузок.

• Реализовано специализированное программное обеспечение в виде библиотеки классов, для создания отказоустойчивых МСС обработки информации на основе авторской модели и авторского механизма распределения вычислительных ресурсов, которое позволяет разрабатывать МСС с большим, по сравнению с существующими механизмами, временем наработки на отказ.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат технических наук Флорко, Андрей Борисович

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Обеспечение отказоустойчивости вычислительной системы с автоматическим распределением ресурсов2004 год, кандидат технических наук Градов, Евгений Сергеевич

Методология системного проектирования авионики с отказоустойчивыми свойствами2004 год, доктор технических наук Сабо, Юрий Иванович

Введение диссертации (часть автореферата) на тему «Повышение отказоустойчивости многоэтапных событийных информационных систем массового обслуживания»

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Оперативное управление распределением нагрузки в неоднородных информационных системах2005 год, кандидат технических наук Моисеев, Тимур Николаевич

Проблемы масштабируемости и неоднородности в архитектуре вычислительных суперсистем2000 год, доктор технических наук Анохин, Александр Васильевич

Методы построения пакетов прикладных программ для неоднородных многоядерных процессоров2012 год, кандидат технических наук Недоводеев, Константин Владимирович

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Флорко, Андрей Борисович