Алгоритм обнаружения аномалий в технологических сигналах на основе нейронной сети с архитектурой автоэнкодер тема диссертации и автореферата по ВАК РФ 00.00.00, кандидат наук Мурзагулов Дамир Альбертович
- Специальность ВАК РФ00.00.00
- Количество страниц 126
Оглавление диссертации кандидат наук Мурзагулов Дамир Альбертович
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1 ПРОБЛЕМА ОБНАРУЖЕНИЯ АНОМАЛИЙ В ТЕХНОЛОГИЧЕСКИХ СИГНАЛАХ
1.1 Особенности технологических данных
1.1.1 Предметная область
1.1.2 Технологические сигналы
1.2 Обнаружение аномалий в технологических сигналах
1.2.1 Постановка задачи
1.2.2 Оценка качества обнаружения аномалий
1.3 Методы обнаружения аномалий во временных рядах
1.3.1 Статистические подходы
1.3.2 Машинное обучение
1.3.3 Спектральные подходы
1.4 Выводы по первой главе
2 АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ОБНАРУЖЕНИЯ АНОМАЛИЙ
2.1 Подход к построению алгоритма обнаружения аномалий на основе преобразования Хуанга - Гильберта
2.2 Алгоритм обнаружения аномалий на основе нейронной сети с архитектурой автоэнкодер
2.3 Метрика оценки качества обнаружения аномалий в технологических сигналах
2.4 Выводы по второй главе
3 ВЫЧИСЛИТЕЛЬНЫЕ ЭКСПЕРИМЕНТЫ
3.1 Модели структурных аномалий в сигналах
3.2 Сравнительный анализ моделей обнаружения аномалий
3.3 Сравнительный анализ вейвлет преобразования и преобразования Хуанга
- Гильберта
3.4 Апробация подхода к обнаружению аномалий с преобразованием Хуанга
- Гильберта
3.5 Выводы по третьей главе
4 ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СИСТЕМЫ ОБНАРУЖЕНИЯ АНОМАЛИЙ В ТЕХНОЛОГИЧЕСКИХ СИГНАЛАХ
4.1 Технология обнаружения аномалий
4.2 Базовые функциональные требования к системе
4.3 Обобщенная архитектура системы
4.4 Выбор сред реализации программного обеспечения
4.5 Проектирование модуля анализа данных
4.6 Разработка прототипа системы
4.7 Выводы по четвертой главе
ЗАКЛЮЧЕНИЕ
СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ, СИМВОЛОВ, СОРАЩЕНИЙ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ
Приложение А Акт о внедрении в учебный процесс
Приложение Б Свидетельство о регистрации программы для ЭВМ
Приложение В Справка о внедрении на производство
Приложение Г Используемые в системе библиотеки Python
Приложение Д Описание набора данных
ВВЕДЕНИЕ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Интеллектуальная система мониторинга информационной безопасности промышленного Интернета вещей с использованием механизмов искусственных иммунных систем2023 год, кандидат наук Шамсутдинов Ринат Рустемович
Модели и методы комплексной оценки рисков безопасности объектов критической информационной инфраструктуры на основе интеллектуального анализа данных2022 год, доктор наук Вульфин Алексей Михайлович
Обнаружение аномалий и нейтрализация угроз в распределенных автоматизированных системах управления на основе мониторинга сетевых информационных потоков2024 год, кандидат наук Абрамова Таисия Вячеславовна
Выявление аномалий и классификация компьютерных атак в сети передачи данных на основе применения фрактального анализа и методов машинного обучения2023 год, кандидат наук Крибель Александр Михайлович
Алгоритмы обнаружения и обработки информации на основе экстремальной фильтрации в системах периметровой охраны2013 год, кандидат наук Зенов, Андрей Юрьевич
Введение диссертации (часть автореферата) на тему «Алгоритм обнаружения аномалий в технологических сигналах на основе нейронной сети с архитектурой автоэнкодер»
Актуальность работы
Активное развитие науки о данных открывает новые возможности для эволюции автоматизированных систем управления технологическими процессами (АСУ ТП) и позволяет создавать системы нового поколения с обширной аналитической функциональностью. Для производственных систем в современных условиях требуются не только сбор, обработка и хранение технологических данных, но и возможность автоматизированного интеллектуального анализа состояния процессов, объектов для прогнозирования внештатных ситуаций. Накопленные данные о протекании технологических процессов с учетом действий диспетчерского персонала, параметров среды, состояний агрегатов и характеристик исходного сырья могут содержать полезную информацию не только о текущем состоянии того или иного объекта, но и о начавшихся критических изменениях в технических характеристиках объекта управления и его потребительских свойствах. Особую ценность для анализа ситуации представляют технологические сигналы, поступающие с измерительных средств, так как именно они описывают состояние процессов и оборудования в реальном времени. Выявление в технологических сигналах нехарактерных, ранее не наблюдаемых признаков является приоритетной задачей для улучшения контроля технологических процессов и повышения качества обслуживания оборудования. В терминах анализа данных такая задача формулируется как задача обнаружения аномалий. Однако сейчас функциональность АСУ ТП в части работы с сигналами ограничена задачами визуализации, долговременного хранения и первичными проверками на достоверность сигналов. Подобные системы способны определить очевидные неисправности на уровне измерительных и преобразующих устройств, возникновение обрывов линий связи, выход параметров за пределы регламентных значений. Однако в производстве встречаются более сложные ситуации, где необходимо учитывать исторический и текущий опыт эксплуатации, регламентные режимы и переходные процессы, динамику изменений и корреляцию параметров.
Полноценный анализ технологической ситуации с учетом перечисленных сложностей проводится экспертным путем и в текущих условиях возложен на оперативный персонал, что требует высокой квалификации персонала и подразумевает под собой высокие операционные риски.
Степень разработанности темы исследования
Задача обнаружения аномалий в технологических сигналах является частью более широкой области - анализ временных рядов. Математическое обеспечение для исследований в области обнаружения аномалий в временных рядах различной природы представлено в работах E. J. Keogh, F. T. Liu, G. E. P. Box, G. Jenkins, V. N. Vapnik, A. Vaswani, L. Breiman, Zh. Zhou, M. M. Breunig, H.-P. Kriegel, S. Hochreiter, J. Schmidhuber и др. К основным инструментам анализа временных рядов относятся методы математической статистики и алгоритмы машинного обучения, включаю искусственные нейронные сети различной архитектуры. Существуют объективные причины, по которым внедрение методов интеллектуального анализа технологических сигналов, в том числе для обнаружения аномалий, происходит медленнее, чем, например, для финансовых или медицинских данных. Основная проблема обнаружения аномалий связана со сложностью разработки алгоритмического обеспечения анализа в силу нестационарной, многокомпонентной, уникальной природы технологических сигналов. Технологические сигналы содержат множество скрытых зависимостей, локально сосредоточенные информативные участки и различные искажения, что весьма затрудняет получение их аналитического описания. Отдельные аспекты анализа технологических сигналов исследованы в работах D. A. Clifton, J. Murphy, K. Grolingera, K. Worden, В. Г. Спицына, Е. В. Бурнаева, В. А. Холопова, М. В. Щербакова, Е. А. Парамонова, Н. А. Шаханова и многих других. Однако, внедрение существующих подходов к обнаружению аномалий на практике имеет ряд открытых вопросов. Отсутствие алгоритмов или их низкая адаптивность к нестационарным характеристикам сигнала приводит к большой доле пропусков аномалий и ложных срабатываний (ошибки первого и второго рода) и, соответственно, к снижению доверия к результатам такого алгоритма. При этом
отсутствуют комплексные подходы к оценке точности обнаружения аномалий, позволяющие определить достоверность и область применения алгоритмов.
Другая проблема внедрения методов обнаружения аномалий связана с отсутствием подходов к построению систем, способных хранить в себе сложные математические модели, алгоритмы анализа данных и в режиме реального времени взаимодействовать с системами управления для получения оперативных и исторических данных о состоянии процессов и объектов.
Таким образом, создание промышленных систем нового поколения с интеллектуальной аналитической функциональностью, в оперативном режиме предоставляющих достоверную информацию о наличии нештатных и критических изменений в работе оборудования без привлечения экспертной обработки данных, позволит сократить количество аварий и внеплановых ремонтов на производстве.
Целью диссертационной работы является разработка алгоритмического и программного обеспечения системы обнаружения аномалий в технологических сигналах. Для достижения поставленной цели необходимо последовательное решение следующих задач:
1. Комплексный анализ существующих подходов к построению систем анализа промышленных данных, а также исследование методов и алгоритмов обнаружения аномалий, применимых к технологическим сигналам.
2. Разработка концепции построения системы, включающей технологию обнаружения аномалий и архитектуру системы, которые позволяют учитывать ряд требований к интеграции системы с источниками технологических данных, быстродействию, точности, хранению и эксплуатации интеллектуальных моделей обнаружения аномалий.
3. Разработка алгоритмического обеспечения системы, включая модели машинного обучения для обнаружения аномалий со свойствами адаптивности и инвариантности к технологическим сигналам, а также способы апробации моделей на реальных данных и оценки их адекватности, позволяющих исследовать эффективность и область применимости моделей в широких пределах.
4. Создание программного обеспечения прототипа системы обнаружения
аномалий в виде самостоятельного приложения с минимально необходимой функциональностью для тестирования и апробации прототипа в реальных условиях.
Методы исследований
В диссертационной работе использованы методы машинного обучения, искусственные нейронные сети, математическая статистика, системный анализ, спектральные методы.
Научную новизну диссертации представляют следующие результаты:
1. Алгоритм обнаружения аномалий в технологических сигналах на основе нейронной сети с архитектурой автоэнкодер, отличающийся применением механизма внимания для анализа амплитудного спектра сигнала и вычислением адаптивного порога обнаружения, что позволяет повысить точность обнаружения аномалий для нестационарных сигналов. При этом механизм внимания позволяет повысить качество восстановления сигнала в слое декодера нейронной сети за счет определения значимости компонентов спектра сигнала, а вычисление адаптивного порога сокращает долю ошибок первого рода.
2. Алгоритм генерации аномалий в технологических сигналах, отличающийся применением набора моделей для структурных изменений сигнала с контролируемой степенью изменения, а также интегральная метрика оценки качества обнаружения аномалий, что позволяет исследовать эффективность и область применимости существующих и перспективных алгоритмов.
Теоретическая и практическая значимость работы
Теоретическая значимость работы заключается в развитии подходов к обнаружению аномалий во временных рядах за счет применения искусственных нейронных сетей и спектральных преобразований ряда.
Практическая значимость заключается в том, что на основе результатов диссертационных исследований разработан самостоятельный программный прототип обнаружения аномалий в технологических сигналах, совместимый с современными и перспективными системами АСУ ТП. Прототип системы прошел промышленную апробацию в компании АО «Атомик Софт» в качестве нового
компонента «Альфа платформы» - инструментального программного обеспечения для реализации проектов промышленной автоматизации - от локальных до распределенных высоконадежных систем постоянного мониторинга и управления.
Результаты диссертационной работы внедрены в учебный процесс НИ ТГУ при подготовке магистров по направлению 02.04.02 «Фундаментальная информатика и информационные технологии» (программа «Разработка программного обеспечения в индустрии 4.0») в качестве основных учебно-методических разработок для лекционных и практических занятий.
Достоверность научных результатов подтверждается корректным применением математического аппарата, непротиворечивостью теоретических выкладок, вычислительными экспериментами и внедрением на производстве.
Личный вклад автора
Цель и задачи диссертации сформулированы совместно с научным руководителем А. В. Замятиным. Все основные научные результаты, выносимые на защиту и составляющие основное содержание диссертации, получены автором самостоятельно. В работах, опубликованных в соавторстве, личный вклад автора состоит в постановке задач и целей работы, разработке новых и модификации известных алгоритмов обнаружения аномалий, проведении вычислительного эксперимента.
Соответствие паспорту специальности
Диссертационная работа соответствует области исследования специальности 2.3.5 «Математическое и программное обеспечение вычислительных систем, комплексов и компьютерных сетей» по п. 4 «Интеллектуальные системы машинного обучения, управления базами данных и знаний, инструментальные средства разработки цифровых продуктов».
Основные положения, выносимую на защиту:
1. Алгоритм обнаружения аномалий в технологических сигналах на основе нейронной сети с архитектурой автоэнкодер, отличающийся применением механизма внимания для анализа амплитудного спектра сигнала и вычислением адаптивного порога обнаружения.
2. Алгоритм генерации аномалий в технологических сигналах, отличающийся применением набора моделей для структурных изменений сигнала с контролируемой степенью изменения.
3. Метрика оценки качества обнаружения аномалий в технологических сигналах, отличающаяся интегральным учетом ошибок первого и второго рода, момента обнаружения аномалии и ее длительности.
4. Архитектура программного обеспечения системы обнаружения аномалий в технологических сигналах, отличающаяся возможностью поддержки различных моделей машинного обучения с унифицированным интерфейсом и промышленных протоколов передачи данных.
Апробация работы
Научные и практические результаты обсуждались на конференциях и научных семинарах в 2018-2022 гг.: International Russian Automation Conference (Сочи, 2018), Международная научно-практической конференция молодых ученых (Тольятти, 2019), Machine Learning and Data Mining in Pattern Recognition (Нью-Йорк, 2019), Eighth International Conference on Risk Analysis and Design of Experiments (Вена, 2019), VIII Международная молодежная научная конференция «Математическое и программное обеспечение информационных, технических и экономических систем» (Томск, 2021).
Результаты исследования получены при реализации следующих научно-практических проектов:
- «Разработка методов и алгоритмов для автоматической идентификации аномалий в технологических сигналах», грант РФФИ «Аспиранты» №2 19-37-90124, 2019-2021 гг.;
- «Разработка программного прототипа интеллектуального модуля для анализа технологических сигналов», № 47/7701-21, 01.2021-12.2021 гг.;
- реализация мероприятия федерального проекта «Кадры для цифровой экономики» национальной программы «Цифровая экономика Российской Федерации»: создание и функционирование сети международных научно -методических центров для распространения лучших международных практик
подготовки, переподготовки и стажировки продвинутых кадров цифровой экономики в областях математики, информатики, технологий; Национальная программа «Цифровая экономика Российской Федерации», 12.2019-12.2021;
- «Адаптивные алгоритмы машинного обучения с контролируемой точностью в управлении технологическими процессами», № 8.1.62.2018, Государственная поддержка ведущих университетов Российской Федерации в целях повышения их конкурентной способности среди ведущих мировых научно-образовательных центров (5-100), 2018-2020 гг.
Публикации
По теме диссертационного исследования опубликовано 13 работ, в том числе 5 статей в журналах, включенных в Перечень рецензируемых научных изданий, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук (из них 1 статья в российском научном журнале, переводная версия которого входит в Web of Science); 2 статьи в сборниках материалов конференций, представленных в изданиях, входящих в Scopus; 1 статья в прочем научном журнале, 3 публикации в сборниках материалов международных научных и научно-практической конференций; получено 2 свидетельства о государственной регистрации программы для ЭВМ.
Структура и объем диссертации
Диссертационная работа изложена на 126 страницах печатного текста. Состоит из введения, четырёх разделов, заключения, списка условных обозначений, символов, сокращений, списка использованных источников и литературы, пяти приложений. Содержит 5 таблиц и 34 рисунка. Список литературы включает 135 источников, из них 90 на иностранном языке.
1 ПРОБЛЕМА ОБНАРУЖЕНИЯ АНОМАЛИЙ В ТЕХНОЛОГИЧЕСКИХ СИГНАЛАХ
Рассматриваются существующие научно-технические решения в области анализа технологических данных и, в частности, решения для обнаружения аномалий. Приведен обзор концептуальных подходов к построению современных программно-аналитических систем обработки технологических данных, включая системы прогнозной аналитики, промышленного интернета вещей и цифровых двойников. Представлен задел в области алгоритмов обнаружения аномалий в более обширной области, чем область технологических сигналов, - во временных рядах. Сформулированы выводы о дефицитах имеющегося задела и недостатках в построении современных систем индустриальной аналитики и перспективах их развития в части анализа данных. Сформулированы цель диссертационного исследования и задачи, решение которых позволит ее достичь.
1.1 Особенности технологических данных 1.1.1 Предметная область
На сегодняшний день в нашей стране и в мире большая часть промышленных процессов находится под автоматизированным или автоматическим контролем [35]. При этом происходит генерация огромного объема технологических и нетехнологических данных, которые собираются и архивируются на базе соответствующей ИТ-инфраструктуры. Накопленные данные о протекании технологических процессов с учетом действий диспетчерского персонала, параметров среды, состояний агрегатов и характеристик исходного сырья могут содержать полезную информацию не только о текущем состоянии того или иного агрегата, но и о начавшихся критических изменениях в технических характеристиках агрегата и его потребительских свойствах [20]. Именно выявление в подобных данных нехарактерных, ранее не
наблюдаемых признаков является приоритетной задачей для оптимизации технологических процессов, повышения качества обслуживания оборудования и перехода обслуживания к превентивному характеру. В терминах анализа данных такая задача формулируется как задача обнаружения аномалий. Учитывая новизну предметной области, не существует общепринятых, канонических определений для аномалий [59, 86, 89]. Поэтому приведем одно из наиболее удачных определений: «Аномалии - это закономерности в данных, которые не соответствуют четко определенному понятию «нормального» поведения» [68].
Выявление аномалий в данных в производственных условиях следует условно разделить на две категории:
- первичный анализ. Предполагает проверку достоверности показаний оборудования за счет средств самодиагностики АСУ ТП, контроль целостности цепей управления и измерения, а также реализацию аварийно-предупредительной сигнализации за счет порогового контроля параметров по заданным технологическим уставкам;
- экспертный анализ. Предполагает оценку поведения оборудования на основе показаний с учетом ретроспективного опыта эксплуатации, влияния технологических режимов и других узлов технологии, локальных и временных условий его эксплуатации.
Первичный анализ реализуется средствами АСУ ТП, которые обеспечивают также сбор, хранение, первичную обработку и визуализацию технологических данных. По сути, подобный анализ является частью мероприятий по обеспечению мер безопасности и противоаварийных защит на предприятии. Мероприятия в данном направлении строго регламентируются законодательными и нормативными актами, поэтому их техническая реализация отличается высокой надежностью, относительной простотой практического применения и однозначностью. Очевидным является то, что первичный анализ не способен покрыть весь спектр проблем анализа состояний объектов. К примеру, он не способен обнаруживать изменение динамики сигнала, учитывать исторические значения сигнала и зависимости от других параметров.
Экспертный анализ производится персоналом, отвечающим за эксплуатацию объекта с целью обеспечения не только безаварийной работы производства, но и оптимизации процессов, работы оборудования и узлов [42]. На основании такой экспертизы составляются планы ремонтов, обслуживания оборудования, выявляются узкие места производственного процесса. Однако подобный экспертный подход имеет существенные ограничения [20]:
- анализ ситуации проводится с существенной задержкой относительно режима реального времени;
- не анализируются многочисленные косвенные факторы, влияющие на состояние оборудования и прогнозирование критической ситуации априори;
- эксперт дополнительно использует лишь несложные методы традиционной математической статистики, область применения которых существенно ограничена известными законами распределения данных и их небольшим набором;
- требуется высокая квалификация эксперта, позволяющая анализировать неочевидные тренды, прогнозировать развитие ситуации исключительно с учетом своего практического, порой нетривиального опыта.
Поэтому все более актуальными становятся методы анализа данных, максимально исключающие человеческий фактор, но базирующиеся на использовании экспертного опыта и в значительной мере подменяющие собой человека-эксперта [40]. Однако в настоящий момент промышленная реализация подходов интеллектуального анализа находится в первичной фазе. Примерами систем, в которых имеются попытки реализации таких подходов, являются различные продукты IBM SPSS Modeler, IBM Predictive Insights, TIBCO Spotfire, SAP Predictive Maintenance and Service и др. [29]. Указанные системы рассчитаны на предоставление различных инструментов анализа данных для создания прогнозов, отчетов и рекомендаций. Такой подход требует тщательной проработки деталей бизнес-процессов каждого отдельного производства и высокой квалификации сотрудника для освоения инструментария. В связи с тем, что в открытом доступе нет информации о применяемых моделях и технологиях, комплексно, но вместе с тем достаточно детально оценить эффективность таких
инструментов, как правило, затруднительно.
Собственно обнаружение аномалий в разновременных сигналах реализовано главным образом веб-сервисами типа Saymon, Honeywell, Clarify.io, Microsoft Azure, DataRobot Automated Time Series, Anaomaly.io. Эти сервисы основаны на использовании ряда математических моделей для обнаружения аномалий во временных рядах произвольного происхождения. Однако рассматривать эти сервисы для интеграции в промышленные системы или сопряжения с ними крайне проблематично. Во-первых, они построены в «облачной» архитектуре, что требует их вывода за технологический контур предприятия, а это, как правило, является критическим ограничением для компании. Во-вторых, эти сервисы не специализируются на технологических данных и не учитывают в должной мере их многочисленные особенности. Наконец, в-третьих, сервисы позволяют анализировать только исторические (архивные) данные, что ограничивает их применение для оперативного анализа производственной ситуации.
Подводя итог, отметим, что на сегодняшний день количество реальных промышленных систем анализа технологических данных представлено лишь несколькими примерами, а их адаптация в конкретном случае существенно затруднена отсутствием в них должной универсальности. Кроме того, имеющиеся новые технологии и сервисы не предъявляют конкретных требований к системам, не описывают их архитектуру, необходимые детали построения алгоритмического и программного обеспечения. При этом основные ограничения существующих систем и подходов к анализу производственных данных сводятся к следующему [23, 36]:
- слабая интеграция с источниками технологических данных, которая препятствует применению результатов для оперативного анализа производственной ситуации;
- трудоемкий процесс внедрения, требующий сложной настройки программного обеспечения (ПО), анализа данных или его значительной доработки и адаптации под особенности конкретного предприятия;
- несовершенство математического аппарата, что приводит к низкой
адекватности прогнозов, сложно интерпретируемым результатам и снижению их практической ценности;
- размещение сервисов в «облаках» и сторонних центрах обработки данных (ЦОД), что делает невозможным их внедрение в локальную сетевую инфраструктуру предприятия из-за ограничений информационной безопасности. Большинство систем управления на промышленных предприятиях являются локальными, закрытыми системами, изолированными от сети Интернет (данный фактор требует дополнительных мер безопасности и учета специфики промышленных протоколов передачи данных);
- «недружественность» человеко-машинного интерфейса, затрудняющая прикладное использование на производстве штатным технологическим персоналом, т.к. в интерфейсе может разобраться исключительно высококвалифицированный ИТ-персонал или специалисты по анализу данных.
Отсутствие завершенных и комплексно апробированных решений в области анализа технологических данных, главным образом, связано со следующими обстоятельствами [21]:
- нестационарность технологических данных, обуславливающая сложность математического описания данных;
- сложность встраивания моделей анализа в существующие производственные системы;
- неоднородная структура данных (технологические сигналы, журналы событий и ремонтов оборудования и др.);
- уникальность каждого объекта управления (в отличие от биомедицинских и речевых данных, которые имеют обобщенные характерные признаки), требующая адаптивного похода для каждого случая;
- наличие дуализма аномальных ситуаций (они могут являться следствием интересного изменения тренда технологического сигнала, требующего анализа и объяснения, а могут быть следствием регламентных процедур, которые следует игнорировать);
- дисбаланс аномальных и нормальных данных в силу того, что
подавляющую часть времени технологические объекты функционируют в штатном режиме;
- дефицит системности в хранении технологических данных;
- низкое доверие к неинтерпретируемым методам анализа.
Разработка методов выявления аномалий в технологических данных за счет решений вышеуказанных сложностей позволит извлекать полезную информацию о технических характеристиках агрегатов на производстве, локализовать с высокой точностью область и причину неисправности оборудования, прогнозировать состояние объекта с учетом его ретроспективных характеристик и характеристик других смежных агрегатов. В итоге это позволит оптимизировать управление технологическим процессом и повысить технико-экономические показатели производства.
Наиболее существенная экономическая выгода от применения обнаружения аномалий в данных ожидается в области сопровождения технического обслуживания и ремонта (ТО и Р) сложного технологического оборудования, которая характеризуется существенными затратами на любых производственных предприятиях [26]. Применение системы обнаружения аномалий в технологических данных позволит решить следующие задачи, существенно и позитивно влияя на интегральные экономические показатели производства:
- значительно сократить время простоя оборудования;
- оптимизировать план мероприятий по техническому обслуживанию, а также уменьшить время внепланового техобслуживания;
- проводить углубленный анализ причин отказов оборудования;
- получить более полную информацию о технологическом процессе;
- повысить срок службы сложного технологического оборудования.
1.1.2 Технологические сигналы
В части анализа состояния технологических объектов основную информацию несут технологические сигналы, журналы событий оборудования,
включающие действия оператора, и журнал обслуживания оборудования, где фиксируются работы, связанные с плановыми осмотрами и ремонтами, и различные вспомогательные, неструктурированные данные. Обобщенная модель технологических данных представлена на рис. 1.1. В приведенной модели данных центральное место как в плане информативности, так и в плане высокой доступности занимают технологические сигналы (ТС). Информативность ТС определяется тем, что собственно сигналы характеризуют состояние объектов и их узлов, а при формировании перечня измерений акцент делается на те из них, которые влияют на работоспособность. Высокая доступность определяется тем, что на работе с сигналами строится большинство систем АСУ ТП, которые имеют оперативные и долговременные хранилища данных.
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Метод и алгоритмы анализа данных электроэнцефалографии для верификации субъекта2023 год, кандидат наук Светлаков Михаил Олегович
Совершенствование алгоритмического и программного обеспечения процессов обработки информационных сигналов систем мониторинга природных и техногенных объектов на основе статистического подхода2016 год, кандидат наук Хуссейн Шиабат Аль Хамд Могахед Хуссейн
Метод обнаружения информационных угроз безопасности передачи данных на основе анализа сетевой статистики2013 год, кандидат наук Гирик, Алексей Валерьевич
Анализ одного класса последовательностей биомедицинских изображений с доменной адаптацией нейросетевых моделей и обучением на основе условно-реальных данных2023 год, кандидат наук Давыдов Никита Сергеевич
Повышение эффективности производства кабельной продукции на основе управления с использованием экспертных подходов2022 год, кандидат наук Моногаров Олег Игоревич
Список литературы диссертационного исследования кандидат наук Мурзагулов Дамир Альбертович, 2024 год
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ
1. Айфичер, Э. Цифровая обработка сигналов. Практический подход / Э. Айфичер, Б. Джервис. - 2-е изд. - Москва : Вильямс, 2004. - 992 с.
2. Артамонов, Н. В. Введение в анализ временных рядов : учеб. пособие / Н. В. Артамонов, Е. А. Ивин, А. Н. Курбацкий, Д. Фантаццини. - Вологда : ВолНЦ РАН, 2021. - С. 10.
3. Бурнаев, Е. В. Модели, методы и алгоритмы предиктивной аналитики на многообразиях данных : дис. д-ра техн. наук : 05.13.18. - Москва, 2021. - 498 с.
4. Васильев, А. А. Применение современных технологий сбора и анализа данных для интегрированного контроля и анализа технологических и экономических параметров производства / А. А. Васильев, Е. А. Парамонов, Д. В. Зубов // Известия МГТУ «МАМИ». Сер. 4. Химическое машиностроение и инженерная экология. - 2013. - Т. 4, № 1(15). - С. 242-246.
5. Влияние гипергомоцистеинемии на мозговой кровоток, по данным вейвлет-анализа / В. В. Александрин, Б. П. Лузянин, А. В. Иванов, А. А. Кубатиев // Патологическая физиология и экспериментальная терапия. -2011. - №2 2. - С. 1318.
6. Григорьев, Д. С. Применение нейронной сети и дискретного вейвлет-преобразования для анализа и классификации электрокардиограмм / Д. С. Григорьев, В. Г. Спицын // Известия Томского политехнического университета. - 2012. - Т. 321, № 5. - С. 57-61.
7. Дуля, И. С. Применение методов глубокого обучения к задаче классификации временных рядов / И. С. Дуля, Д. А. Мурзагулов // Математическое и программное обеспечение информационных, технических и экономических систем : материалы VIII Международной молодежной научной конференции (Томск, 26-30 мая 2021 г.). - Томск : Изд-во Том. ун-та, 2021. - С. 32-37.
8. Замятин, А. В. Интеллектуальный анализ данных : учеб. пособие / А. В. Замятин. - Томск : Издательский Дом Томского государственного университета, 2020. - 194 с.
9. Интернет вещей в промышленности // SAYMON / РОССИННО. - 2017. -URL: https://saymon.mfo/iot_promyshlennost/ (дата обращения 19.01.2023).
10. Исследование структурных свойств алгоритма разложения Холецкого: от давно известных фактов до новых выводов / А. В. Фролов, В. В. Воеводин, И. Н. Коньшин, А. М. Теплов // Вестник Уфимского государственного авиационного технического университета. - 2015. - T. 19, № 4. - С. 149-162.
11. Киберфизические системы как технологии киберуправления (аналитический обзор) / В. И. Хаханов, В. И. Обризан, А. С. Мищенко, И. В. Филиппенко // Радиоэлектроника и информатика. - 2014. - № 1. - С. 39-45.
12. Классификация динамики локальных максимумов в вейвлет-спектрах электроэнцефалограмм / Я. А. Туровский, С. Д. Кургалин, А. Г. Семенов, А. В. Максимов // Вестник Тамбовского государственного технического университета. - 2013. - Т. 19, № 1. - С. 90-96.
13. Климков, К. С. Промышленный Интернет вещей и облачные технологии в современных SСADA-системах / К. С. Климков // Автоматизация в промышленности. - 2017. - № 7. - С. 22-24.
14. Кокорев, Д. С. Применение «Цифровых двойников» в производственных процессах / Д. С. Кокорев, Н. П. Посмаков // Colloquium-journal. - 2019. -№ 26(50). - С. 38-45.
15. Малла, С. Вейвлеты в обработки сигналов : пер. с англ. / С. Малла. -Москва : Мир, 2005. - 671 с.
16. Мальцев, В. А. Обнаружение аномалий в технологических сигналах с применением нейросетевой архитектуры типа автоэнкодер / В. А. Мальцев, Д. А. Мурзагулов, А. В. Замятин // Автоматизация в промышленности. - 2020. -№ 10. - С. 32-36.
17. Мальцев, В. А. Применение неконтролируемой классификации в задаче обнаружения аномалий в технологических сигналах / В. А. Мальцев, Д. А. Мурзагулов, А. В. Замятин // Прикладная математика и информатика: современные исследования в области естественных и технических наук : материалы V Международной научно-практической конференции (школы-
семинара) молодых ученых (22-24 апреля 2019 г.). - Тольятти : Качалин Александр Васильевич, 2019. - С. 408-412.
18. Мисриханов, А. М. Применение методов вейвлет-преобразования в электроэнергетике / А. М. Мисриханов // Автоматика и телемеханика. - 2006. -Вып. 5. - C. 5-23.
19. Москаленко, Т. А. Архитектуры промышленного интернета вещей / Т. А. Москаленко, Р. В. Киричек, А. С. Бородин // Информационные технологии и телекоммуникации. - 2017. - Т. 5, № 4. - С. 49-56.
20. Мурзагулов, Д. А. Адаптивные алгоритмы машинного обучения в управлении технологическими процессами / Д. А. Мурзагулов, А. В. Замятин // Автоматизация. Современные технологии. - 2018. - № 8. - С. 354-361.
21. Мурзагулов, Д. А. Обнаружение аномалий технологических сигналов с использованием ансамбля классификаторов и вейвлет-преобразований / Д. А. Мурзагулов, А. В. Замятин // Автоматизация процессов управления. - 2021. -№ 1. - С. 20-26.
22. Мурзагулов, Д. А. Подход к обнаружению аномалий в технологических сигналах с применением преобразования Гильберта - Хуанга / Д. А. Мурзагулов, А. В. Замятин, О. В. Романович // Автометрия. - 2021. - Т. 57, № 1. - С. 31-41.
23. Мурзагулов, Д. А. Программное обеспечение идентификации аномалий технологических сигналов / Д. А. Мурзагулов, С. В. Карев, А. В. Замятин // Автоматизация в промышленности. - 2023. - № 2. - С. 42-47.
24. Обобщенное среднее // MachineLearning.ru. - 2009. - URL: http://www.macЫneleammg.ru/wiki/mdex.php?titie=Обобщенное_среднее (дата обращения: 19.01.2023).
25. Орлов, Ю. Н. Нестационарные временные ряды: Методы прогнозирования с примерами анализа финансовых и сырьевых рынков / Ю. Н. Орлов, К. П. Осминин. - Москва : Либроком, 2020. - 381 с.
26. Парамонов, Е. А. Интегрированный контроль и анализ технологических и экономических характеристик производства / Е. А. Парамонов, А. А. Васильев, Д. В. Зубов // Математические методы в технике и технологиях - ММТТ-25 : сб.
трудов XXV Междунар. науч. конф. - Саратов : Саратов. гос. техн. ун-т, 2012. -С. 103-104.
27. Патент на полезную модель № 61441 Российская Федерация, МПК G06F 17/14 (2006.01). Устройство фильтрации особенностей изображения на основе непрерывного вейвлет-преобразования : № 2006137593/22 : заявл. 24.10.2006 : опубл. 27.02.2007 / А. Л. Жизняков, А. А. Фомин. - 6 с.
28. Подход к оценке качества обнаружения аномалий в технологических сигналах / С. В. Карев, А. А. Кошечкин, Д. А. Мурзагулов [и др.] // Автоматизация процессов управления. - 2022. - № 2. - С. 80-89.
29. Предикативная (предиктивная) аналитика Predictive Analytics // TADVISER. Государство. Бизнес. Технологии. - 2015. - URL: http s: // www.tadviser.ru/index. php/ Статья: Предикативная_аналитика_(предиктивная ,_прогнозная,_прогностическая)_Predictive_analytics (дата обращения 19.01.2023).
30. Руководство по PyQt5. - URL: https://pythonist.ru/rukovodstvo-po-pyqt5/ (дата обращения: 19.01.2023).
31. Ручай, А. Н. Модифицированный метод сегментации речевого сигнала на основе непрерывного вейвлет-преобразования / А. Н. Ручай // Доклады Томского государственного университета систем управления и радиоэлектроники. - 2012. -№ 2-1. - С. 189-192.
32. Толстихин, И. О. Неравенства концентрации вероятностной меры в трансдуктивном обучении и PAC-Байесовском анализе : автореф. дис. ... канд. физ.-техн. наук / И. О. Толстихин. - М., 2014. - 23 с.
33. Фильтрация речевого сигнала с помощью вейвлет-преобразования при решении задач распознавания речи / Н. Е. Балакирев, С. Ю. Гуснин, М. А. Малков, Л. М. Червяков // Известия Юго-Западного государственного университета. -2012. - № 5-2. - С. 44-50.
34. Хаща, О. Ю. Обзор методов сжатия при помощи вейвлет-преобразований / О. Ю. Хаща // 68-я научно-техническая конференция профессорско-преподавательского состава, ученых, аспирантов и студентов. Т. 1 / Одесская национальная академия связи им. А. С. Попова. - Одесса, 2013. - С. 29-31.
35. Хлебенских, Л. В. Автоматизация производства в современном мире / Л. В. Хлебенских, М. А. Зубкова, Т. Ю. Саукова // Молодой ученый. - 2017. -№ 16. - С. 308-311.
36. Холопов, В. А. Интеллектуальная система мониторинга выполнения машиностроительных технологических процессов / В. А. Холопов, Е. Н. Каширская, А. Г. Шмелева, Е. В. Курнасов // Проблемы машиностроения и надежности машин. -2019. - № 5. - С. 98-112.
37. Черепанов, Н. В. Проблемы внедрения технологии промышленного интернета вещей / Н. В. Черепанов // Инновации и инвестиции. - 2019. - № 10. -С. 160-163.
38. Черепанов, Н. В. Промышленный «Интернет вещей» на предприятии / Н. В. Черепанов // Инновации и инвестиции. - 2019. - № 10. - С. 151-154.
39. Что такое цифровой двойник и для чего он нужен? // Dassault Systèmes в России и СНГ. - 2018. - URL: https://blogs.3ds.com/russia/digital-twin/ (дата обращения: 20.01.2023).
40. Шаханов, Н. И. Прогнозирование состояния прокатного оборудования на основе анализа данных и машинного обучении / Н. И. Шаханов, Е. В. Ершов, О. В. Юдина, Л. Н. Виноградова // Современные информационные технологии. Теория и практика : материалы V Всероссийской научно-практической конференции (Череповец, 5 декабря 2019 г.) / под ред. Т. О. Петровой. - Череповец : Череповецкий государственный университет, 2020. - С. 112-115.
41. Шваб, К. Четвертая промышленная революция : пер. с англ. / К. Шваб. -М. : Эксмо, 2017. - 208 с.
42. Щербаков, М. В. Архитектура системы предсказательного технического обслуживания сложных многообъектных систем в концепции Индустрии 4.0 / М. В. Щербаков, К. Сай Ван // Программные продукты и системы. - 2020. - № 2. -С. 186-194.
43. Ястребов, И. П. О свойствах и применениях преобразования Гильберта -Хуанга / И. П. Ястребов // Проектирование и технология электронных средств. -2016. - № 1. - С. 26-33.
44. Winnum. Промышленный Интернет вещей. - URL : https://internal.winnum.io/internals/pages/auth/Login.aspx (дата обращения 19.01.2023).
45. Zyfra IIOT Platform / Платформа промышленного интернета вещей // Цифровой маркетплейс. - URL: https://platforms.su/platform/6161 (дата обращения 19.01.2023).
46. A comparative Study of Anomaly Detection Schemes in Network Intrusion Detection / A. Lazarevic, L. Ertoz, V. Kumar [et al.] // Proceedings of SIAM 2003 Conference on Data Mining. - SIAM, 2003. - P. 25-36.
47. A density-based algorithm for discovering clusters a density-based algorithm for discovering clusters in large spatial databases with noise / M. Ester, H.-P. Kriegel, J. Sander, X. Xu // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining, KDD'96. - AAAI Press, 1996. - P. 226-231.
48. A review of novelty detection / M. A. F. Pimentel, D. A. Clifton, L. Clifton, L. Tarassenko // Signal Processing. - 2014. - Vol. 99. - P. 215-249.
49. Algorithms for Anomaly Detection in Smart Building IoT Scenarios / F. Almaguer-Angeles, A. J. Murphy, L. Murphy, A. O. Portillo-Dominguez // 2019 IEEE 5th World Forum on Internet of Things (WF-IoT). - IEEE Xplore, 2019. - P. 491-495.
50. Algorithms for Hyper-parameter Optimization / J. Bergstra, R. Bardenet, Y. Bengio, B. Kegl // Proceedings of the 24th International Conference on Neural Information Processing Systems, NIPS'11. - Curran Associates Inc., 2011. - P. 25462554.
51. An ensemble learning framework for anomaly detection in building energy consumption / D. B. Araya, K. Grolingera, H. F. ElYamanya [et al.] // Energy and Buildings. - 2017. - Vol. 144. - P. 191-206.
52. An unsupervised training method for nonintrusive appliance load monitoring / O. Parson, S. Ghosh, M. Weal, A. Rogers // Artificial Intelligence. - 2014. - Vol. 217. -Article number 1. - 18 p. - URL: https://doi.org/10.1016/j.artint.2014.07.010 (access date: 20.01.2023).
53. Architecture and development of an Industrial Internet of Things framework
for realizing services in Industrial Product Service Systems / K. Alexopoulos, S. Koukas, N. Boli, D. Mourtzis // Procedia CIRP. - 2018. - Vol. 72. - P. 880-885.
54. Aspects of structural health and condition monitoring of offshore wind turbines / I. Antoniadou, N. Dervilis, E. Papatheou [et al.] // Philosophical Transactions of the Royal Society A. - 2015. - Vol. 373. - P. 1-14.
55. Attention Is All You Need / A. Vaswani, N. Shazeer [et al.] // ArXiv.org. -URL: https://arxiv.org/abs/1706.03762 (access date: 20.01.2023).
56. Automated novelty detection in industrial systems / D. A. Clifton, L. A. Clifton, P. R. Bannister, L. Tarassenko // Studies in Computational Intelligence. Advances of Computational Intelligence in Industrial Systems Studies in Computational Intelligence. - 2008. - Vol. 116. - P. 269-296.
57. Ba, J. Do Deep Nets Really Need to be Deep? / J. Ba, R. Caruana // Advances in Neural Information Processing Systems 27. - Curran Associates, 2014. - P. 26542662.
58. Back, A. D. FIR and IIR Synapses, a New Neural Network Architecture for Time Series Modeling / A. D. Back, A. C. Tsoi // Neural Computation. - Vol. 3, is. 3. -P. 375-385.
59. Barnett, V. Outliers in statistical data / V. Barnett, T. Lewis. - 3rd ed. -Chichester : John Wiley & Sons, 1994. - 608 p.
60. Behera, S. Comparative analysis of density-based outlier detection techniques on breast cancer data using hadoop and map reduce / S. Behera, R. Rani // 2016 International Conference on Inventive Computation Technologies (ICICT). - 2016. -Vol. 2. - Article number 55. - 4 p. - URL: https:// https://doi.org/10.1109/INVENTIVE.2016.7824883 (access date: 20.01.2023).
61. Box, G. E. P. Time Series Analysis, Forecasting and Control / G. E. P. Box, G. Jenkins. - San Francisco : Holden-Day, Inc., 1990. - 712 p.
62. Bradley, P. S. Refining Initial Points for K-Means Clustering / P. S. Bradley, U. M. Fayyad // Proceedings of the Fifteenth International Conference on Machine Learning, ICML '98. - San Francisco : Morgan Kaufmann Publishers, 1998. - P. 91-99.
63. Braei, M. Anomaly detection in univariate time-series: a survey on the state-
of-the-art / M. Braei, S. Wagner // ArXiv.org. - URL: https://arxiv.org/pdf/2004.00433.pdf (access date: 20.01.2023).
64. Breiman, L. Statistical Modeling: The Two Cultures / L. Breiman // Statistical Science. - 2001. - Vol. 16, is. 3. - P. 199-231.
65. Brown, R. G. Exponential Smoothing for Predicting Demand / R. G. Broun. -Cambridge : Little, 1956. - 352 p.
66. Caiado, J. A periodogram-based metric for time series classification / J. Caiado, N. Crato, D. Peña // Computational Statistics & Data Analysis. - 2006. -Vol. 50, is. 10. - P. 2668-2684.
67. Qelik, M. Anomaly detection in temperature data using dbscan algorithm / M. Qelik, F. Dadaser-Qelik, A. S. Dokuz // 2011 International Symposium on Innovations in Intelligent Systems and Applications. - 2011. - P. 91-95.
68. Chandola, V. Anomaly detection: A survey / V. Chandola, A. Banerjee, V. Kumar // ACM Computing Surveys. - 2009. - Vol. 41, is. 3. - Article number 15. -58 p. - URL: https://dl.acm.org/doi/10.1145/1541880.1541882 (access date: 10.01.2023).
69. Chauhan, S. Anomaly detection in ECG Time Signals via Deep Long Short-Term Memory Networks / S. Chauhan, L. Vig // 2015 IEEE International Conference on Data Science and Advanced Analytics (DSAA). - 2015. - Article number 101. - 7 p. -URL: https://doi.org/10.1109/DSAA.2015.7344872 (access date: 10.01.2023).
70. Chen, T. Xgboost: A scalable tree boosting system / T. Chen, C. Guestrin // KDD '16: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. - 2016. - P. 785-794.
71. Choosing Machine Learning Algorithms forAnomaly Detection in Smart Building IoT Scenarios / F. Almaguer-Angeles, J. Murphy, L. Murphy, A. O. Portillo-Dominguez // IEEE 5th World Forum on Internet of Things (WF-IoT). - IEEE, 2019. -P. 491-495.
72. Criteria for Classifying Forecasting Methods / T. Januschowski, J. Gasthaus, Y. Wang et al. // International Journal of Forecasting. - 2020. - Vol. 36, is. 1. - P. 167177.
73. Deep anomaly detection for time-series data in industrial iot: a communication-
efficient on-device federated learning approach / Y. Liu, S. Garg, J. Nie [et al.] // IEEE Internet of Things Journal. - 2020. - Vol. 8, is. 8. - P. 6348-6358.
74. DeepAnT: A Deep Learning Approach for Unsupervised Anomaly Detection in Time Series / M. Munir, S. A. Siddiqui, A. Dengel, S. Ahmed // IEEE Access. -2019. - Vol. 7. - P. 1991-2005.
75. Ding, Z. An anomaly detection approach based on isolation forest algorithm for streaming data using sliding window / Z. Ding, M. Fei // IFAC Proceedings Volumes. - 2013. - Vol. 46, is. 20. - P. 12-17.
76. Dunning T. Practical Machine Learning: A New Look at Anomaly Detection / E. Friedman, T. Dunning. - O'Reilly Media, 2014. - 66 p.
77. Eskin, E. Anomaly detection over noisy data using learned probability distributions / E. Eskin // Proceedings of the Seventeenth International Conference on Machine Learning, (ICML-2000), June 29-July 2, 2000, Stanford University. - San Francisco : Kaufmann, 2000. - P. 255-262.
78. Friedman, J. Additive logistic regression: a statistical view of boosting / J. Friedman, T. Hastie, R. Tibshirani // Annals of Statistics. - 2000. - Vol. 28, is. 2. -P. 337-407.
79. Fujimaki, R. Theoretical Analysis of Subsequence Time-Series Clustering from a Frequency-Analysis Viewpoint / R. Fujimaki, S. Hirose, T. Nakata // Proceedings of the 2008 SIAM International Conference on Data Mining (SDM), 2008. - P. 506-517.
80. Gavrin, S. Anomaly detection in process signals within machine learning and data augmentation approach / S. Gavrin, D. Murzagulov, A. Zamyatin // Proc. of the 15th Intern. Conference on Machine Learning and Data Mining in Pattern Recognition (MLDM 2019). New York, USA, 20-25 July 2019. - Leipzig : Ibai-publishing, 2019. -Vol. 2. - P. 585-598.
81. Gavrin, S. Detection of Change Point in Process Signals by Cascade Classification / S. Gavrin, D. Murzagulov, A. Zamyatin 2018 International Russian Automation Conference (RusAutoCon 2018), Sochi, 9-16 september 2018. - New York: IEEE, 2018. - Vol. 1-2. - P. 515-518.
82. Gensler, A. Novel Criteria to Measure Performance of Time Series
Segmentation Techniques / A. Gensler, B. Sick // Proceedings of the LWA 2014 Workshops: KDML, IR, FGWM, Aachen, Germany, 8-10 September 2014. - 2014. -P. 193-204.
83. Geometry from a time series / N. H. Packard, J. P. Crutchfield, J. D. Farmer, R. S. Shaw // Phys. Rev. Lett. - 1980. - Vol. 45. - P. 712-716.
84. Geramifard, O. Hidden Markov modelbased methods in condition monitoring of machinery systems : PhD Thesis / O. Geramifard. - Singapore : National University of Singapore, 2013. - 166 p.
85. Goldstein, M. A Comparative Evaluation of Unsupervised Anomaly Detection Algorithms for Multivariate Data / M. Goldstein, S. Uchida // PLOS ONE. - 2016. -Vol. 11, is. 4. - Article number 12. - 31 p. - URL: https://doi.org/10.1371/journal.pone.0152173 (access date: 10.01.2023).
86. Grubbs, F. E. Procedures for detecting outlying observations in samples / F. E. Grubbs // Technometrics. - 1969. - Vol. 11, is. 1. —Article number 1. - 21 p. -URL: https://doi.org/10.2307/1266761 (access date: 10.01.2023).
87. Haselsteiner, E. Using Time-Dependent Neural Networks for EEG Classification / E. Haselsteiner, G. Pfurtscheller // IEEE Transactions on Rehabilitation Engineering. - 2000. - Vol. 8, is. 4. - P. 457-463.
88. Hastie, T. The Elements of Statistical Learning: Data Mining, Inference and Prediction / T. Hastie, R. Tibshirani, J. Friedman. - 2 ed. - Springer, 2009. - 764 p.
89. Hawkins, D. M. Identification of Outliers / D. M. Hawkins. - London : Chapman and Hall, 1980. - 188 p. - (Monographs on Applied Probability and Statistics).
90. He, Z. Discovering cluster-based local outliers / Z. He, X. Xu, S. Deng // Pattern Recognition Letters. - 2003. - Vol. 24, is. 9. - P. 1641-1650.
91. Hochreiter, S. Long Short-Term Memory / S. Hochreiter, J. Schmidhuber // Neural Comput. - 1997. - Vol. 9, is. 8. - P. 1735-1780.
92. Homayouni, H. An Autocorrelation-based LSTM-Autoencoder for Anomaly Detection on Time-Series Data/H. Homayouni, S. Ghosh, I. Ray, S. Gondalia, J. Duggan and M. G. Kahn // 2020 IEEE International Conference on Big Data (Big Data). - Atlanta, 2020. - Pp. 5068-5077
93. Hyndman, R. J. Forecasting: Principles and Practice / R. J. Hyndman, G. Athanasopoulos. - OTexts, 2014. - 441 p.
94. Ide, T. Why Does Subsequence Time-Series Clustering Produce Sine Waves? / T. Ide // Knowledge Discovery in Databases / eds J. Furnkranz, T. Scheffer, M. Spiliopoulou. - Berlin Heidelberg : PKDD, 2006. - P. 211-222.
95. Incipient fault detection and diagnosis in turbine engines using hidden Markov models / S. Menon, O. Uluyol, K. Kim, E.O. Nwadiogbu // ASME Turbo Expo. -Atlanta, 2003. - P. 493-500.
96. Ioffe, S. Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift / S. Ioffe, C. Szegedy // Proceedings of the 32nd International Conference on Machine Learning, PMLR 37. - 2015. - P. 448-456.
97. Jason, R. Chen. Making Subsequence Time Series Clustering Meaningful / R. Jason // Proceedings of the Fifth IEEE International Conference on Data Mining, ICDM '05. - Washington : IEEE Computer Society, 2005. - P. 114-121.
98. Keogh, E. Clustering of Time-Series Subsequences is Meaningless: Implications for Previous and Future Research / E. Keogh, J. Lin // Knowledge and Information Systems. -2005. - Vol. 8, is. 2. - P. 154-177.
99. Krizhevsky, A. ImageNet Classification with Deep Convolutional Neural Networks / A. Krizhevsky, I. Sutskever, G. E. Hinton // Advances in Neural Information Processing Systems 25 (NIPS 2012) / eds. F. Pereira, C. J. Burges, L. Bottou, K.Q. Weinberger. - New York : Curran Associates, Inc., 2012. - P. 1097-1105.
100. Liu F.T. Isolation forest / F. T. Liu, K. M. Ting, Z. Zhou // ICDM '08: Proceedings of the 2008 Eighth IEEE International Conference on Data Mining. IEEE Computer Society. - IEEE, 2008. - P. 413-422.
101. Liu, F. T. Isolation-based anomaly detection / F. T. Liu, K. M. Ting, Z.H. Zhou // ACM Trans. Knowl. Discov. Data. - 2021. - Vol. 6, is. 1. - Article number 3. - 39 p. - URL: http://dx.doi.org/10.1145/2133360.2133363 (access date: 10.01.2023).
102. Luo, W. Remembering history with convolutional LSTM for anomaly detection / W. Luo, W. Liu and S. Gao // IEEE International Conference on Multimedia and Expo (ICME). - Hong Kong, 2017. - Pp. 439-444
103. LOF: Identifying Density-based Local Outliers / M. M. Breunig, H.-P. Kriegel, R. T. Ng, J. Sander // SIGMOD Rec. - 2000. - Vol. 29, is. 2. - P. 93-104.
104. Long Short Term Memory Networks for Anomaly Detection in Time Series / P. Malhotra, L. Vig, G. Shroff, P Agarwal // ESANN 2015 proceedings, European Symposium on Artificial Neural Networks, Computational Intelligence and Machine Learning. Bruges (Belgium), 22-24 April 2015. - P. 89-94.
105. Ma, J. Perkins. Time-series novelty detection using one-class support vector machines / J. Ma, S. Perkins // Proceedings of the International Joint Conference on Neural Networks. - 2003. - Vol. 3. - P. 1741-1745.
106. MacQueen, J. Some Methods for Classification and Analysis of Multivariate Observations / J. MacQueen // Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability. - Berkeley : University of California Press, 1967. - Vol. 1: Statistics. - P. 281-297.
107. Maleki, S. Unsupervised anomaly detection with LSTM autoencoders using statistical data-filtering / S. Maleki, Sa. Maleki, N.R. Jennings // Applied Soft Computing, 2021. - V. 108. - P. 115-131.
108. Marwala, T. Condition monitoring using computational intelligence methods: applications in mechanical and electrical systems / T. Marwala. - Springer, 2012. - 236 p.
109. Murzagulov, D. A. Approach to Detection of Anomalies of Process Signals Using Classification and Wavelet Transforms / D. A. Murzagulov, A. V. Zamyatin, P. M. Ostrast // 2018 International Russian Automation Conference (RusAutoCon 2018), Sochi, 9-16 september 2018. - New York : IEEE, 2018. - Vol. 1-2. - P. 492-495.
110. Nair, V. Rectified Linear Units Improve Restricted Boltzmann Machines / V. Nair, G. E. Hinton // Proceedings of the 27th International Conference on International Conference on Machine Learning, ICML'10. - Omnipress, 2010. - P. 807-814.
111. Network anomaly detection using one class support vector machine / Z. Rui, Z. Shaoyan, L. Yang, J. Jianmin // Proceedings of the International MultiConference of Engineers and Computer Scientist. - 2008. - Vol. 1. - Article number 4. - 4 p. - URL: https://doi.org/10.1109/MSN.2015.40 (access date: 10.01.2023).
112. Neural Machine Translation by Jointly Learning to Align and Translate / D.
Bahdanau, K. Cho, Y. Bengio // International Conference on Learning Representations, ICLR 2015. - San Diego. - 2015. - Article number 11. - 15 p. - URL: https://doi.org/10.48550/arXiv.1409.0473 (access date: 10.01.2023).
113. Noise Versus Outliers / C. M. Salgado, C. Azevedo, H. Proenca, S. M. Vieira // Secondary Analysis of Electronic Health Records / MIT Critical Data. - Springer International Publishing, Cham, 2016. - P. 163-183.
114. Object Detection with Deep Learning: A Review / Z.-Q. Zhao, P. Zheng, S. Xu, X. Wu // IEEE Transactions on Neural Networks and Learning Systems PP(99). -2019. - Vol. 30. - Article number 11. - 20 p. - URL: https://doi.org/10.1109/TNNLS.2018.2876865 (access date: 10.01.2023).
115. Oehmcke, S. Event Detection in Marine Time Series Data / S. Oehmcke, O. Zielinski, O. Kramer // KI 2015: Advances in Artificial Intelligence. - 2015. - P. 279286.
116. Ohsaki, M. Analysis of Subsequence Time-Series Clustering Based on Moving Average / M. Ohsaki, M. Nakase, S. Katagiri // 2009 Ninth IEEE International Conference on Data Mining. - 2009. - Vol. 12. - P. 902-907.
117. One Class Support Vector Machine for Anomaly Detection in the Communication Network Performance Data / R. Zhang, S. Zhang, S. Muthuraman, J. Jiang // Proceedings of the 5th Conference on Applied Electromagnetics, Wireless and Optical Communications, ELECTROSCIENCE'07 / WSEAS. - Stevens Point, 2007. -P. 31-37.
118. Outlier Detection for Temporal Data / M. Gupta, J. Gao, C. Aggarwal, J. Han. - Morgan and Claypool Publishers, 2014. - 110 p.
119. Ronneberger, O. U-Net: Convolutional Networks for Biomedical Image Segmentation / O. Ronneberger, P. Fischer, T. Brox // MICCAI 2015: Medical Image Computing and Computer-Assisted Intervention. - 2015. - P. 234-241.
120. Rousseeuw, P. J. Robust Regression and Outlier Detection / P. J. Rousseeuw, A. M. Leroy. - New York : John Wiley & Sons, 1987. - 341 p.
121. Sanfelice, R. G. Analysis and Design of Cyber-Physical Systems. A Hybrid Control Systems Approach / R. G. Sanfelice // Cyber-Physical Systems: From Theory to
Practice / D. Rawat, J. Rodrigues, I. Stojmenovic. - CRC Press, 2016. - Article number 1. - 30 p. - URL: https://hybrid.soe.ucsc.edu/sites/default/files/preprints/105.pdf (access date: 10.01.2023).
122. Scherer, D. Evaluation of Pooling Operations in Convolutional Architectures for Object Recognition / D. Scherer, A. Müller, S. Behnke // Proceedings of the 20th International Conference on Artificial Neural Networks (ICANN'10). - Berlin : SpringerVerlag, 2010. - P. 92-101.
123. Sharda, R. Connectionist Approach to Time Series Prediction: An Empirical Test / R. Sharda, R. B. Patil // Journal of Intelligent Manufacturing. - 1992. -Vol. 3, is. 5. - P. 317-323.
124. Support vector method for novelty detection / B. Schölkopf, R. Williamson, A. Smola [et al.] // Proceedings of the 12th International Conference on Neural Information Processing Systems (NIPS 1999). - Cambridge : MIT Press, 1999. - P. 582588.
125. Symbolic transient time-series analysis for fault detection in aircraft gas turbine engines / S. Sarkar, K. Mukherjee, S. Sarkar, A. Ray // Proceedings of the American Control Conference. - Montreal, 2012. - Article number 19.1 - 5 p. - URL: https://doi.org/10.1109/ACC.2012.6315253 (access date: 10.01.2023).
126. Tang, Z. Feedforward Neural Nets as Models for Time Series Forecasting / Z. Tang, P. Fishwick // INFORMS Journal on Computing. - 1993. - Vol. 5. - P. 374385.
127. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis / N. E. Huang, Z. Shen, S. R. Long [et al.] // Proceedings of the Royal Society A. - 1998. - Vol. 454. - P. 903-995.
128. Time Series Epenthesis: Clustering Time Series Streams Requires Ignoring Some Data / T. Rakthanmanon, E. J. Keogh, S. Lonardi, S. Evans // 2011 IEEE 11th International Conference on Data Mining. - 2011. - P. 547-556.
129. Time-Series Anomaly Detection Service at Microsoft / H. Ren, B. Xu. Y. Wang [et al.] // ArXiv.org. - URL: https://arxiv.org/abs/1906.03821 (access date: 20.01.2023).
130. Vapnik, V. N. A class of algorithms for pattern recognition learning / V. N. Vapnik, A. Ya Chervonenkis // Avtomat. i Telemekh. - 1964. - Vol. 25. - P. 937945.
131. Wu, H. Max-Pooling Dropout for Regularization of Convolutional Neural Networks / H. Wu, X. Gu // International Conference on Neural Information Processing. - 2015. - abs/1512.01400. - Article number 6 - 8 p. - URL: https://doi.org/10.48550/arXiv.1512.01400 (access date: 10.01.2023).
132. Yairi ,T. Fault Detection by Mining Association Rules from Housekeeping Data / T. Yairi, Y. Kato, K. Hori // Proceeding of the 6th International Symposium on Artificial Intelligence and Robotics & Automation in Space: i-SAIRAS 2001 / Canadian Space Agency. - 2001. - Article number AS012 - 8 p. - URL: https://robotics.estec.esa.int/i-SAIRAS/isairas2001/papers/Paper_AS012.pdf (access date: 10.01.2023).
133. Zhang, Y. Anomaly detection in premise energy consumption data / Y. Zhang, W. Chen, J. Black // 2011 IEEE Power and Energy Society General Meeting. -IEEE, 2011. - Article number 913 - 7 p. - URL: https://doi.org/10.1109/PES.2011.6039858 (access date: 10.01.2023).
134. Zhou, C. Anomaly Detection with Robust Deep Autoencoders / C. Zhou, R. C. Paffenroth // Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD '17. - New York, 2017. - P. 665-674.
135. Zolhavarieh, S. J. A Review of Subsequence Time Series Clustering / S. J. Zolhavarieh, S. Aghabozorgi, T. Wah // The Scientific World Journal. - 2014. -Article number 312521 - 19 p. - URL: https://doi.org/10.1155/2014/312521 (access date: 10.01.2023).
122
ПРИЛОЖЕНИЕ А АКТ О ВНЕДРЕНИИ В УЧЕБНЫЙ ПРОЦЕСС
123
ПРИЛОЖЕНИЕ Б СВИДЕТЕЛЬСТВО О РЕГИСТРАЦИИ ПРОГРАММЫ ДЛЯ ЭВМ
124
ПРИЛОЖЕНИЕ В СПРАВКА О ВНЕДРЕНИИ НА ПРОИЗВОДСТВО
э Атом и к Софт
АО «Атомик Софт»
634050 Томск, пр. Ленина, 60/1
Т+7 3822 281914 Ф +7 3822 469 122
info@automiq.ru www.automiq.ru
от 27.12.2023 № 215/1-12.2023
В диссертационный НИ ТГУ 2.3.01 634050, г. Томск, пр. Ленина, 36
Справка о внедрении
Настоящим подтверждаем, что результаты диссертационного исследования Мурзагулова Д.А. на тему: «Алгоритм обнаружения аномалий в технологических сигналах на основе нейронной сети с архитектурой автоэнкодер» обладают актуальностью, представляют практический интерес и используются компанией «Атомик Софт» для развития компонентов «Альфа платформы».
«Альфа платформа» - инструментальное программное обеспечение для реализации проектов промышленной автоматизации от локальных до распределённых, высоконадежных и многосерверных систем постоянного мониторинга и управления. Разработанный прототип системы обнаружения аномалий открывает возможности для реализации новой функциональности в составе «Альфа платформы» в части анализа технологических данных. Проведенные испытания прототипа системы обнаружения аномалий подтверждают высокую точность выявления не характерных, не желательных изменений в различных технологических сигналах.
На основе предложенной в работе архитектуры ПО и алгоритмического обеспечения, а именно - алгоритмов машинного обучения для обнаружения аномалий, планируется создание нового компонента «Альфа платформы», который позволит в оперативном режиме выявлять аварийные ситуации на производстве.
ВЕРНО
ВЕДУЩИЙ ДОКУМЕНТОВЕД
^^Лт^ш к.в.
Силкин К.А.
125
ПРИЛОЖЕНИЕ Г ИСПОЛЬЗУЕМЫЕ В СИСТЕМЕ БИБЛИОТЕКИ PYTHON
Формат записи {{Имя библиотеки }}=={{ версия}
absl-py==1.0.0 matrixprofile== 1.1.10 rsa==4.8
altgraph==0.17.2 msgpack==1.0.3 scikit-learn== 1.0.2
astunparse==1.6.3 msgpack-python==0.5.6 scipy==1.8.0
cachetools==5.0.0 nose==1.3.7 six==1.16.0
certifi==2021.10.8 numba==0.55.1 sortedcontainers==2.4.0
chardet==4.0.0 numpy==1.21.0 SQLAlchemy== 1.4.32
charset-normalizer==2.0.12 oauthlib==3.2.0 statsmodels==0.13.2
click==8.0.4 opt-einsum==3.3.0 stumpy==1.10.2
cloudpickle==2.0.0 packaging==21.3 tblib==1.7.0
cycler==0.11.0 pandas==1.4.1 tensorboard==2.8.0
dask==2022.2.1 partd==1.2.0 tensorboard-data-server==0.6.1
distributed==2022.2.1 patsy==0.5.2 tensorboard-plugin-wit==1.8.1
gast==0.5.3 Pillow==9.0.1 tensorflow==2.8.0
google-auth==2.6.0 pkg_resources==0.0.0 tensorflow-io-gcs-
google-auth-oauthlib==0.4.6 protobuf==3.11.2 typing_extensions==4.1. 1
google-pasta==0.2.0 psutil==5.9.0 xgboost==1.5.2
greenlet==1.1.2 pyasn1==0.4.8 zipp==3.7.0
grpcio==1.44.0 pyasn1 -modules==0.2.8 pyhht==3.1.0
h5py==3.6.0 pyinstaller==4.10 pytz—2021.3
HeapDict==1.0.1 pyinstaller-hooks- PyYAML==6.0
importlib-metadata==4.11.3 pyodbc==4.0.32 requests-oauthlib==1.3.1
ipaddress==1.0.23 pyparsing==3.0.7 Markdown==3.3.6
Jinja2==3.0.3 PyQt5==5.15.6 MarkupSafe==2.1.0
joblib==1.1.0 PyQt5-Qt5==5.15.2 matplotlib==3.5.1
keras==2.8.0 PyQt5-sip==12.9.1 pytho n-dateutil==2.8.2
Keras-Preprocessing==1.1.2 PyQtChart==5.15.5 PyQtChart-Qt5==5.15.2
126
ПРИЛОЖЕНИЕ Д ОПИСАНИЕ НАБОРА ДАННЫХ
Таблица Д.1 - Описание набора данных
Номер сигнала Технологический параметр Единицы измерения Обучающий фрагмент Тестовый фрагмент
ц шт шах ц шт шах
1 Давление на входе насосного агрегата №1 МПа 0.37 0.11 0.48 0.35 0.01 2.85
2 Давление на входе насосного агрегата №2 МПа 0.44 0.12 0.56 0.47 0.01 2.77
3 Давление на выходе насосного агрегата №1 МПа 1.31 0.01 3.41 1.28 0.01 3.53
4 Вибрация подшипников на насосном агрегате №1 мм/с 0.74 0.01 1.87 0.79 0.01 4.01
5 Вибрация подшипников на насосном агрегате №2 мм/с 0.62 0.01 1.82 0.55 0.01 3.66
6 Температура нефти в сепарационной емкости °С 46.9 5.13 65.12 43.03 3.32 72.44
7 Уровень в сепарационной емкости м 3.64 1.06 3.87 3.59 1.01 4.01
8 Расход газа в путевом подогревателе нм3/ч 9.37 1.20 11.93 10.27 0.01 15.56
9 Давление на выходе насосного агрегата №2 МПа 1.32 0.01 3.46 1.78 0.01 3.50
10 Уровень в резервуаре нефти м 10.22 1.20 12.12 9.89 0.98 11.34
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.