Синтез моделей и методов автоматизированной диагностики высоковольтного оборудования электрических станций и подстанций тема диссертации и автореферата по ВАК РФ 00.00.00, доктор наук Хальясмаа Александра Ильмаровна
- Специальность ВАК РФ00.00.00
- Количество страниц 360
Оглавление диссертации доктор наук Хальясмаа Александра Ильмаровна
ВЕДЕНИЕ
1 ПОДХОДЫ К УПРАВЛЕНИЮ СОСТОЯНИЕМ ВЫСОКОВОЛЬТНОГО ОБОРУДОВАНИЯ
1.1 Хроматографический анализ масла
1.2 Инфракрасный контроль
1.3 Ультрафиолетовый контроль
1.4 Системы управления и прогнозирования жизненного цикла оборудования
1.4.1 Планово-предупредительные ремонты оборудования и обслуживание по фактическому состоянию
1.4.2 Индекс технического состояния оборудования
1.4.3Автоматизированные системы управления жизненным циклом оборудования
1.4.4 Отраслевые решения
Выводы по главе
2 АВТОМАТИЗИРОВАННАЯ СИСТЕМА ТЕХНИЧЕСКОГО ДИАГНОСТИРОВАНИЯ ВЫСОКОВОЛЬТНОГО ОБОРУДОВАНИЯ ЭЛЕКТРИЧЕСКИХ СТАНЦИЙ И ПОДСТАНЦИЙ
2.1 Постановка задачи повышения информационной наблюдаемости
2.2 Беспилотные воздушные суда
2.3 Инспекционные роботехнические комплексы
2.4 Полезная нагрузка роботехнических комплексов
2.5 Выбор методов диагностики для анализа состояния ОРУ электрических станций и подстанций
2.6 Выбор робототехнического комплекса воздушного типа и бортовой диагностической аппаратуры для диагностики ОРУ электрических станций и подстанций
2.7 Выбор робототехнического комплекса наземного типа и бортовой диагностической аппаратуры для диагностики ОРУ электрических станций и подстанций
2.8 Разработка архитектуры автоматизированной системы технического диагностирования высоковольтного оборудована
Выводы по главе
3 РАЗРАБОТКА НОВОГО МЕТОДА ОПРЕДЕЛЕНИЯ ТЕКУЩЕГО СОСТОЯНИЯ ВЫСОКОВОЛЬТНОГО ОБОРУДОВАНИЯ
3.1 Постановка задачи разработки метода классификации состояний
3.2 Виды технического состояния высоковольтного оборудования
3.3 Особенности применения алгоритмов машинного обучения в задачах электроэнергетики
Метод классификации состояния высоковольтного оборудования
3.4 Разработка алгоритма классификации состояний высоковольтного оборудования
Выводы по главе
4 НОВЫЕ МЕТОДЫ АВТОМАТИЗИРОВАННОГО СБОРА, ОБРАБОТКИ И АНАЛИЗА ГРАФИЧЕСКИХ ДАННЫХ В ВИДИМОМ, ИК- И УФ-СПЕКТРАХ
4.1. Постановка задачи автоматизированного сбора данных и обработки мультиспектральных результатов диагностики состояния высоковольтного оборудования
4.2. Разработанный алгоритм технического диагностирования состояния внешней изоляции оборудования в автоматизированном режиме
4.3. Унифицированный метод обработки ИК-, УФ- или мультиспектральных изображений
4.4. Метод обработки радиометрических данных ИК-контроля в графическом формате
4.5. Метод обработки радиометрических данных УФ-контроля в графическом формате
4.6. Метод совмещения и сшивания изображений
4.7. Особенности обработки изображений в различных спектрах
Выводы по главе
5 РЕЗУЛЬТАТЫ ВНЕДРЕНИЯ РАЗРАБОТАННЫХ МЕТОДОВ И МОДЕЛЕЙ АВТОМАТИЗИРОВАННОЙ ДИАГНОСТИКИ ВЫСОКОВОЛЬТНОГО ОБОРУДОВАНИЯ
5.1 Апробация разработанного метода определения текущего состояния измерительных трансформаторов тока
5.2 Апробация разработанного метода определения текущего состояния силовых трансформаторов
5.3 Анализ радиометрических данных ИК-контроля на основе разработанного метода обнаружения дефектов высоковольтного оборудования
5.4 Анализ радиометрических данных УФ-контроля на основе разработанного метода обнаружения дефектов высоковольтного оборудования
5.5 Обнаружение поверхностных частичных разрядов на основе разработанного алгоритма автоматизированного УФ-контроля состояния внешней изоляции
Выводы по главе
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А Акты о внедрении результатов диссертационной работы
ПРИЛОЖЕНИЕ Б Патенты на изобретения
ПРИЛОЖЕНИЕ В Свидетельсва о регистрации программ для ЭВМ
Рекомендованный список диссертаций по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Методология и аппаратно-программный комплекс дистанционного диагностирования высоковольтных изоляторов в процессе эксплуатации на основе анализа характеристик частичных разрядов2023 год, доктор наук Иванов Дмитрий Алексеевич
Совершенствование методов диагностирования изоляции силовых трансформаторов системы тягового электроснабжения с применением мобильных технических средств2022 год, кандидат наук Волчанина Мария Андреевна
Анализ процессов образования и распространения электромагнитных излучений высоковольтного электроэнергетического оборудования2002 год, кандидат технических наук Петрунько, Наталья Николаевна
Разработка системы многоаспектной оценки технического состояния и обслуживания высоковольтного маслонаполненного электрооборудования2009 год, доктор технических наук Давиденко, Ирина Васильевна
Методика диагностирования силовых трансформаторов на основе оперативного контроля частичных разрядов2011 год, кандидат технических наук Мостовой, Сергей Евгеньевич
Введение диссертации (часть автореферата) на тему «Синтез моделей и методов автоматизированной диагностики высоковольтного оборудования электрических станций и подстанций»
ВЕДЕНИЕ
Актуальность темы исследования. Современные тенденции цифровизации экономики и энергетики формируют энергетическую систему нового поколения, где фиксируется постоянный рост объема данных, что позволяет характеризовать части энергосистемы как условно наблюдаемые. Но большие данные естественным образом формируются только для новых элементов энергосистемы. Остальные -по-прежнему остаются слабо наблюдаемыми из-за недостатка систем мониторинга и инструментов, позволяющих оценить сложность взаимосвязи процессов производства, передачи и распределения электрической энергии, и экономической неэффективности установки измерительных устройств для каждой единицы оборудования.
Если рассматривать высоковольтное оборудование электрической станции/подстанции в качестве системы и учесть, что каждая единица оборудования - это совокупность элементов, связанных физическими процессами, то текущим техническим состоянием оборудования является система диагностических параметров и их значений в определенный момент времени. Каждая единица оборудования является сложной технической системой и состоит из множества элементов, в которых протекают взаимосвязанные процессы различной природы, что затрудняет определение текущего технического состояния высоковольтного оборудования. Управление сложной технической системой предполагает определение ее текущего технического состояния, всех ее подсистем и элементов, а также прогнозирование их изменений и управление техническим состоянием как отдельных единиц оборудования на станциях/подстанциях и его основных узлов, так и состоянием станции/подстанции в целом.
Проблема повышения точности определения текущего технического состояния оборудования и прогнозирования его изменения тесно связана с проблемой недостаточного объема ретроспективных и текущих диагностических данных. Поэтому большинство электроэнергетических предприятий используют стратегию планово-предупредительного технического обслуживания и ремонта с
периодическим контролем, установленном в нормативно-технической документации, независимо от технического состояния оборудования. Такая стратегия приводит к необоснованному увеличению трудоемкости технического обслуживания и ремонтов оборудования (ТОиР) или, наоборот, - к несвоевременному обнаружению дефекта или неисправности.
Поэтому в мировой электроэнергетике в 90-х годах была сформулирована научно-техническая проблема перехода к ТОиР по фактическому техническому состоянию, поиску решения которой посвящено большое число научных и отраслевых работ.
ТОиР по фактическому состоянию основывается на трех основных этапах: анализе ретроспективы диагностических параметров, определении их текущих значений и прогнозировании их изменения. При этом на каждом из этапов диагностическая информация должна обладать свойствами достоверности, объективности, полноты и актуальности.
Для решения данной проблемы необходимы новые подходы к созданию технологий сбора и анализа больших данных, с помощью которых будет возможным не только повысить точность определения текущего технического состояния оборудования, но и извлекать практические знания и корректно обобщать их путем выявления неявных закономерностей изменения диагностических параметров и причинно-следственных связей как на уровне элементов оборудования, его структуры и состава, так и взаимного влияния технического состояния единиц оборудования.
Интеллектуальные программно-аппаратные комплексы как единая взаимодействующая система физических (робототехнических комплексов) и вычислительных компонентов (программного обеспечения) являются перспективным инструментом для сбора и анализа больших данных в задачах управления состоянием оборудования. Использование алгоритмов машинного обучения в таких системах способно обеспечить устойчивость к выбросам, возможность анализа фрагментированных данных, работу с разнотипными данными и автоматическое обучение системы. Поэтому программно-аппаратные
комплексы являются эффективным автоматизированным инструментом повышения точности определения технического состояния высоковольтного оборудования и снижения аварийности на электроэнергетических объектах.
Представленные исследования соответствуют направлению Стратегии НТР РФ: «Переход к передовым цифровым, интеллектуальным производственным технологиям, роботизированным системам, новым материалам и способам конструирования, создание систем обработки больших объемов данных, машинного обучения и искусственного интеллекта».
Таким образом создание научно-методической базы автоматизированной диагностики высоковольтного оборудования открытых распределительных устройств (ОРУ) электрических станций и подстанций является актуальным направлением исследований и позволяет обеспечить возможность перехода к его обслуживанию по фактическому техническому состоянию.
Степень разработанности темы. Основы диагностики технических систем представлены трудами И. Л. Биргера, В. В. Клюева, П. П. Пархоменко и др. В электроэнергетике в развитие диагностических систем внесли существенный вклад отечественные ученые: П. М. Сви, Ю. Н. Львов, А. Г. Овсянников, В. Н. Осотов, В. С. Поляков, А. И. Таджибаев, А. Н. Назарычев, А. Ю. Хренников, И. В. Давиденко,
B. М. Левин, С. М. Коробейников, В. А. Русов, Н. В. Киншт, А. З. Славинский, Л. А. Дарьян, В. Г. Гольштейн, В. П. Вдовико, В. Я. Ушаков, В. З. Манусов, Н. И. Воропай, Л. Л. Владимирский, А. Е. Монастырский, Ю. Д. Виницкий,
C. П. Высогорец, М. Ю. Львов, Д. А. Андреев, Ю. А. Лавров, В. Н. Рябченко,
A. В. Шунтов, Р. С. Арбузов, Н. Н. Петрунько, В. В. Смекалов, С. В. Живодерников,
B. К. Козлов, А. З. Шайхуллин, В. А. Лавринович.
Научные достижения вышеупомянутых ученых в части создания методологических основ ТОиР электросетевого оборудования в значительной степени способствовали обеспечению надежности функционирования электроэнергетических систем. Однако в условиях цифровизации энергетики и перехода к обслуживанию оборудования по фактическому состоянию возрастает потребность в использовании современных технологий и подходов, способных
оптимизировать процессы сбора и анализа диагностических данных, повысить точность определения состояния оборудования под рабочим напряжением, а также качество прогнозирования его изменения.
Цели и задачи работы.
Целью работы является создание научно-методической базы автоматизированной диагностики высоковольтного оборудования открытых распределительных устройств электрических станций и подстанций, позволяющей уменьшить продолжительность технического диагностирования, повысить его достоверность и полноту, и обеспечить возможность перехода к обслуживанию по фактическому техническому состоянию.
Для достижения поставленной цели по созданию научно-методической базы автоматизированной диагностики высоковольтного оборудования открытых распределительных устройств электрических станций и подстанций поставлены и решены следующие задачи:
1. Проанализировать современные подходы к определению технического состояния высоковольтного оборудования электрических станций и подстанций, созданию систем мониторинга и диагностики, и определить перспективы внедрения технологий автоматизированного сбора и обработки данных.
2. Сформировать требования к совместно используемым роботизированным комплексам воздушного и наземного типов, их бортовой диагностической аппаратуре и разработать архитектуру автоматизированной системы технического диагностирования для сбора и обработки данных неразрушающего контроля высоковольтного оборудования электрических станций и подстанций.
3. Разработать математическую модель адаптивной системы поддержки принятия решений для определения текущего технического состояния высоковольтного оборудования в условиях неопределенности с использованием программно-аппаратных комплексов.
4. Разработать метод обработки и анализа данных, полученных различными методами неразрушающего контроля, с учетом их неполноты и неоднородности на основе алгоритмов машинного обучения для определения текущего технического
состояния высоковольтного оборудования.
5. Разработать алгоритм технического диагностирования состояния внешней изоляции высоковольтного оборудования с помощью ультрафиолетовой (УФ-) камеры промышленного исполнения, робототехнического комплекса и метод автоматической обработки и анализа данных для повышения точности обнаружения поверхностных частичных разрядов.
6. Сформировать требования к составу и качеству радиометрических данных инфракрасного (ИК) и УФ-контроля, разработать метод их обработки и анализа на основе алгоритмов компьютерного зрения для обнаружения дефектов высоковольтного оборудования.
7. Проанализировать возможность совместного автоматизированного сбора, обработки и анализа графических данных в видимом, ИК- и УФ-спектрах для технического диагностирования состояния внешней изоляции высоковольтного оборудования ОРУ.
8. Выполнить апробацию предложенных методов и моделей автоматизированной диагностики высоковольтного оборудования для реальных электрических станций и подстанций и верифицировать полученные результаты.
Объектом исследования является высоковольтное оборудование электрических станций и подстанций.
Предметом исследования являются методы определения текущего технического состояния высоковольтного оборудования открытых распределительных устройств электрических станций и подстанций.
Научная новизна:
1. Введено и обосновано новое понятие - информационная наблюдаемость технического состояния оборудования, которое позволяет на основе анализа вклада в объединенное пространство информационных признаков каждого из диагностических параметров, полученных различными методами неразрушающего контроля, оценить полноту и качество диагностических данных.
2. Предложены новая архитектура и состав автоматизированной системы технического диагностирования высоковольтного оборудования электрических
станций и подстанций под рабочим напряжением на основе взаимодействующих беспилотных робототехнических комплексов и распределенного программного обеспечения, позволяющие уменьшить продолжительность технического диагностирования, повысить его достоверность и полноту, и обеспечить повторяемость процедуры сбора диагностических данных.
3. Разработана математическая модель адаптивной системы поддержки принятия решений для определения технического состояния высоковольтного оборудования на основе моделей машинного обучения, отличающаяся способностью к самообучению за счет использования предложенных подсистемы формирования знаний и базы прецедентов.
4. Разработан метод определения текущего технического состояния высоковольтного оборудования на основе многоуровневой совместной обработки различных данных неразрушающего контроля с помощью ансамблевых моделей машинного обучения, позволяющий определять наиболее значимые диагностические параметры и интерпретировать их значимость.
5. Обоснована и экспериментально доказана перспективность метода совместного автоматизированного сбора, обработки и анализа графических данных в видимом, ИК- и УФ-спектрах для технического диагностирования состояния внешней изоляции высоковольтного оборудования ОРУ, который позволяет повысить точность обнаружения дефектов, а также объем и достоверность базы прецедентов адаптивной системы поддержки принятия решений.
6. Предложен новый алгоритм технического диагностирования состояния внешней изоляции высоковольтного оборудования с помощью УФ-камеры промышленного исполнения и робототехнического комплекса, а также метод компьютерного зрения с пространственно-временной фильтрацией шумов радиометрических данных, позволяющий повысить точность обнаружения поверхностных частичных разрядов в автоматическом режиме.
7. Разработан новый метод автоматизированного распознавания графических образов высоковольтного оборудования и локализации его дефектов с помощью оригинальных алгоритмов компьютерного зрения, основанных на дескрипторах,
позволяющих извлекать, оптимизировать и анализировать признаки из радиометрических данных ИК- и УФ-контроля.
Теоретическая и практическая значимость работы.
Теоретическая значимость работы. Обоснованы применение информационной наблюдаемости технического состояния оборудования для оценки полноты и качества диагностических данных, полученных различными методами неразрушающего контроля, а также метод ее количественной оценки на основе энтропии Шеннона и визуального анализа с помощью диаграммы площади данных.
Применительно к проблематике диссертации выполнен синтез моделей и методов автоматизированной диагностики высоковольтного оборудования, включая беспилотные робототехнические комплексы, модели машинного обучения и методы автоматизированной обработки и анализа данных, в результате которого разработаны архитектура и состав автоматизированной системы технического диагностирования высоковольтного оборудования электрических станций и подстанций под рабочим напряжением, а также математическая модель адаптивной системы поддержки принятия решений для определения его технического состояния.
Доказана перспективность совместного автоматизированного сбора, обработки и анализа графических данных в видимом, ИК- и УФ-спектрах для повышения точности обнаружения дефектов внешней изоляции высоковольтного оборудования, расширяющая границы применимости технического диагностирования высоковольтного оборудования ОРУ с использованием радиометрических данных ИК- и УФ-контроля.
Проведена модернизация существующих способов УФ-контроля технического состояния высоковольтного оборудования, позволившая разработать новый алгоритм технического диагностирования состояния его внешней изоляции на основе использования УФ-камеры промышленного исполнения, робототехнического комплекса и метода компьютерного зрения с пространственно-временной фильтрацией шумов радиометрических данных.
Для решения задач диссертационной работы результативно использованы методы компьютерного зрения и принципы технического диагностирования высоковольтного оборудования, что позволило разработать новый метод и алгоритмы автоматизированного распознавания графических образов высоковольтного оборудования и локализации его дефектов на основе радиометрических данных ИК- и УФ-контроля.
Практическая значимость результатов работы.
Решена актуальная проблема синтеза моделей и методов автоматизированной диагностики высоковольтного оборудования электрических станций и подстанций и выполнено расширение границ применимости цифровых технологий и методов искусственного интеллекта, направленных на обеспечение возможности перехода к обслуживанию по фактическому техническому состоянию. Разработаны и внедрены:
- способ диагностики технического состояния высоковольтного оборудования ОРУ электрических станций и подстанций, реализованный с помощью ИК- и УФ-контроля, путем сравнения полученных изображений с эталонными при помощи алгоритмов компьютерного зрения для определения технического состояния оборудования [1];
- программы распознавания образов технического состояния силовых высоковольтных трансформаторов и измерительных трансформаторов тока и напряжения на основе ансамблевых моделей машинного обучения, позволяющие автоматически определять их текущее техническое состояние [2, 3];
- способ автоматизированной предварительной оценки технического состояния высоковольтного оборудования ОРУ, реализуемый дистанционно, используемый для принятия экспертного решения по его ремонту или замене [4, 5];
- программа предварительной обработки и визуализации диагностических данных высоковольтных силовых трансформаторов, используемая для анализа информационной наблюдаемости состояния оборудования [6];
- автоматизированный алгоритм УФ-контроля технического состояния внешней изоляции высоковольтного оборудования электрических станций и подстанций для обнаружения поверхностных частичных разрядов.
Методология и методы исследования. В работе использовались методы математического и компьютерного моделирования, сбора и анализа данных различной физической природы, машинного обучения и компьютерного зрения, экспериментальные исследования.
Положения, выносимые на защиту:
1. Анализ информационной наблюдаемости технического состояния позволяет оценить полноту и качество совокупной выборки диагностических данных, полученных различными методами неразрушающего контроля, для определения текущего технического состояния высоковольтного оборудования на основе моделей машинного обучения.
2. Автоматизированная система технического диагностирования высоковольтного оборудования электрических станций и подстанций под рабочим напряжением на основе взаимодействующих беспилотных робототехнических комплексов и распределенного программного обеспечения позволяет уменьшить время продолжительности технического диагностирования, повысить его достоверность и полноту, и обеспечить повторяемость процедуры сбора диагностических данных.
3. Ансамблевые модели машинного обучения на основе деревьев решений и двухитерационной процедуры обработки данных обеспечивают выбор наиболее значимых диагностических параметров с учетом их объема и полноты при минимальных потерях информативности для повышения точности и робастности метода определения текущего технического состояния высоковольтного оборудования.
4. Адаптивная система поддержки принятия решений для определения технического состояния высоковольтного оборудования способна анализировать совокупность диагностических данных, полученных различными методами
неразрушающего контроля, и самообучаться за счет использования предложенных подсистемы формирования знаний и базы прецедентов.
5. Метод совместного автоматизированного сбора, обработки и анализа графических данных в видимом, ИК- и УФ-спектрах для технического диагностирования состояния внешней изоляции высоковольтного оборудования ОРУ позволяет повысить точность обнаружения дефектов, а также объем и достоверность базы прецедентов адаптивной системы поддержки принятия решений.
6. Алгоритм технического диагностирования состояния внешней изоляции высоковольтного оборудования с помощью УФ-камеры промышленного исполнения и робототехнического комплекса, а также метод компьютерного зрения с пространственно-временной фильтрацией шумов радиометрических данных повышают точность обнаружения поверхностных частичных разрядов в автоматическом режиме.
7. Метод автоматизированного распознавания графических образов высоковольтного оборудования и локализации его дефектов и оригинальные алгоритмы компьютерного зрения, основанные на дескрипторах, позволяют извлекать, оптимизировать и анализировать признаки из радиометрических данных ИК- и УФ-контроля.
Соответствие диссертации паспорту научной специальности. Диссертационная работа соответствует следующим направлениям исследований паспорта специальности 2.4.3. Электроэнергетика:
6 - Разработка физических и цифровых методов и средств измерения, диагностики и мониторинга состояния изоляции электроустановок высокого напряжения»;
13 - Разработка методов обработки сигналов для мониторинга и диагностики состояния электрооборудования электроустановок;
20 - Разработка методов использования информационных и телекоммуникационных технологий и систем, искусственного интеллекта в электроэнергетике, включая проблемы разработки и применения информационно-
измерительных, геоинформационных и управляющих систем для оперативного и ретроспективного мониторинга, анализа, прогнозирования и управления электропотреблением, режимами, надежностью, уровнем потерь энергии и качеством электроэнергии.
Степень достоверности и апробация работы. Результаты диссертационной работы получены при корректном и обоснованном применении методов математического и компьютерного моделирования, сбора и анализа данных различной физической природы, машинного обучения и компьютерного зрения и подтверждаются согласованностью с результатами, полученными на основе эмпирических выводов и экспертных оценок.
Положения диссертационной работы докладывались и обсуждались на 8 международных научно-технических конференциях, а именно: 21st International Symposium on Electrical Apparatus and Technologies, SIELA 2020 (Бургас, Болгария); International Multi-Conference on Engineering, Computer and Information Sciences, SIBIRCON 2019 (Новосибирск, Россия); 16th Conference on Electrical Machines, Drives and Power Systems, ELMA 2019 (Варна, Болгария); Conference of Russian Young Researchers in Electrical and Electronic Engineering, ElConRus 2019 (Санкт-Петербург, Россия); International Conference on Software Engineering and Service Sciences, ICSESS 2018 (Пекин, Китай); Conference of Russian Young Researchers in Electrical and Electronic Engineering, ElConRus 2018 (Санкт-Петербург, Россия); 8th International Conference on Energy and Environment: Energy Saved Today is Asset for Future, CIEM 2017 (Бухарест, Румыния); 57th International Scientific Conference on Power and Electrical Engineering of Riga Technical University, RTUCON 2016 (Рига, Латвия).
Основные результаты работы внедрены в 4 организациях в рамках 3 НИР и 3 НИОКР, что подтверждается актами внедрения от ФГАОУ ВО «УрФУ имени первого Президента России Б.Н. Ельцина», АО «Интер РАО - Электрогенерация», ООО «Система», ФГБОУ ВО «МИРЭА -Российский технологический университет». В актах отмечается возможность обнаружения дефектов оборудования на ранних стадиях их развития, повышение точности их
идентификации, обеспечение перехода на отечественное программное обеспечение и повышение надежности функционирования высоковольтного оборудования.
Результаты проведенных в диссертационной работе исследований используются в ФГАОУ ВО «УрФУ имени первого Президента России Б.Н. Ельцина» в учебных курсах «Диагностика электрооборудования», «Техника и электрофизика высоких напряжений», «Машинное обучение в энергетике» и в ФГБОУ ВО «Новосибирский государственный технический университет» в учебных курсах «Машинное обучение в задачах технической диагностики и управления», «Цифровизация в электроэнергетике».
Часть работ по диссертации выполнена в рамках стипендии Президента РФ (СП-2551.2016.1), грантов российского фонда фундаментальных исследований (РФФИ, № 16-38-00310, № 20-010-00911), российского научного фонда (РНФ, № 18-79-00201), фонда содействия инновациям (ФСИ, № 529ГС1/9674), конкурсной части государственного задания (FEUZ-2022-0030), № 4.80 в рамках проекта «Академическое превосходство» портфеля проектов «Научные проекты развития» программы «Приоритет 2030» Уральского федерального университета.
Публикации. По теме диссертационной работы опубликовано 34 работы, в том числе 11 статей в рецензируемых научных журналах и изданиях, определенных ВАК РФ для докторских диссертаций, 2 монографии, 1 учебное пособие, 14 статей в журналах и материалах конференций, входящих в международные базы Scopus и Web of Science, результаты работы защищены двумя патентами РФ на изобретение и четырьмя свидетельствами о регистрации программ для ЭВМ.
Структура и объем работы. Диссертационная работа содержит введение, пять глав, заключение, список литературы и приложения. Общий объем работы составляет 360 страниц, 201 рисунок, 27 таблиц и включает 255 библиографических наименований.
1 ПОДХОДЫ К УПРАВЛЕНИЮ СОСТОЯНИЕМ ВЫСОКОВОЛЬТНОГО ОБОРУДОВАНИЯ
Данная глава посвящена анализу подходов к управлению состоянием высоковольтного электросетевого оборудования, системам мониторинга и диагностики, а также прогнозированию его жизненного цикла, включая прогнозирование остаточного ресурса, подробно описанным автором диссертационной работы в [7]. На основании данных производителей систем мониторинга и диагностики проанализированы современные подходы и тенденции в данной области с точки зрения обеспечения надежности работы оборудования, превентивного диагностирования состояния, снижения затрат, оптимизации ТОиР, управления производственными активами энергетических компаний, а также математические методы обработки данных и сигналов в этих системах.
Техническое диагностирование - это аппарат мероприятий, который позволяет изучать и устанавливать признаки неисправности (работоспособности) оборудования, устанавливать методы и средства, при помощи которых дается заключение (ставится диагноз) о наличии (отсутствии) неисправности (дефектов). Другими словами, техническая диагностика позволяет дать оценку состояния исследуемого объекта. Техническая диагностика направлена в основном на поиск и анализ внутренних причин неисправности оборудования, при этом наружные причины определяются визуально [8].
Согласно [9] техническая диагностика определяется как «область знаний, охватывающая теорию, методы и средства определения технического состояния объектов», объект, состояние которого определяется, называется объектом диагностирования (ОД), а процесс исследования ОД - диагностированием.
Основной целью технической диагностики является, в первую очередь, распознавание состояния технической системы в условиях ограниченной информации и, как следствие, повышение надежности и достоверности оценки остаточного ресурса системы (оборудования).
Похожие диссертационные работы по специальности «Другие cпециальности», 00.00.00 шифр ВАК
Исследование и совершенствование метода электромагнитного контроля электроэнергетического оборудования, находящегося под рабочим напряжением2021 год, кандидат наук Игнатьев Николай Игоревич
Повышение эффективности функционирования высоковольтных мехатронных модулей на основе диагностики технического состояния2014 год, кандидат наук Ярошенко, Игорь Владимирович
Развитие методов принятия решений в автоматизированных системах мониторинга и диагностики объектов инфраструктуры железнодорожного транспорта2013 год, кандидат наук Лила, Владимир Борисович
Исследование диагностических и манипуляционно-исполнительных компонентов мехатронного комплекса дистанционного мониторинга высоковольтного оборудования2017 год, кандидат наук Чебрякова, Юлия Сергеевна
Методики и средства диагностики и контроля отдельных показателей качества тяговых трансформаторов и электрических машин подвижного состава2000 год, кандидат технических наук Гоголев, Григорий Александрович
Список литературы диссертационного исследования доктор наук Хальясмаа Александра Ильмаровна, 2024 год
Выбор источников данных
Могут быть выбраны нерелевантные источники данных, так что данные могут быть изначально некорректными. На этом этапе нужно понимать, что выбор источников данных полностью зависит от специалиста еще на этапе проектирования автоматизированной системы, поэтому очень важно, чтобы такие системы были разработаны совместно специалистами в области науки о данных и энергетиками. Такие ошибки могут привести к ложным корреляциям и таким зависимостям параметров, которых на самом деле может и не существовать [201]. Например, когда для распознавания силовых трансформаторов 220 кВ используются данные о дефектах силовых трансформаторов 35 кВ. Основной задачей машинного обучения является обобщение данных, поэтому машина ищет закономерности исключительно в тех данных, которые выбрал разработчик.
Важным аспектом в такой ситуации является изначальная корректность данных, здесь не идет речь про выбросы и частные ошибки в данных, а скорее, о случаях плохих («отравленных») данных, когда, например, все в ту же исходную
выборку по трансформаторам попадают данные с заведомо дефектных (например, еще с завода-изготовителя) трансформаторов и в этой выборке число таких трансформаторов образует целый кластер. Также появление «отравленных» данных может быть умышленным, например, в результате кибератак, что тоже является вполне реальной проблемой. Поэтому для автоматизированных систем, функционирующих на стратегических высоковольтных объектах, таких как станции и подстанции, нужно обеспечивать еще и безопасность передачи данных. Итогом ошибок на этом этапе при условии превалирования «отравленных» данных может быть полностью некорректная работа системы и неадекватное обобщение данных моделями.
Предобработка данных
Предобработка данных является неотъемлемым условием применения алгоритмов машинного обучения и может включать в себя следующие процедуры: извлечение признаков, преобразование признаков, анализ взаимодействия признаков, заполнение пропусков, фильтрация и т. д., что описано автором диссертации в работе [202]. И снова от разработчика на этапе проектирования системы зависит объем и очередность необходимых этапов обработки данных, а на этапах разработки и тестирования - валидация разработанных решений.
При выборе релевантных источников данных отсутствие их предобработки скорее приведет к низкой точности разработанной модели и низкой скорости работы такой системы, чем к систематическим ошибкам (при условии, что не стоит задача работы системы в реальном времени). Например, в рамках авторских исследований было выявлено, что отсутствие процесса предобработки данных из релевантных источников в среднем снижает точность полученного результата для задачи прогнозирования генерации фотоэлектрических станций на 20-25 %.
Принципы формирования выборок
Еще одним из важных этапов на стадии сбора, анализа и подготовки данных является выбор способа формирования и принципа деления данных на обучающую, валидационную и тестовую выборки. Принято считать, что от объема обучающей
выборки во многом зависит точность работы алгоритма [203]. Такое утверждение не всегда корректно, так как большой объем обучающей выборки еще не гарантирует обеспечение баланса внутри нее. Например, для задачи классификации разбалансировка по классам (отсутствие данных определенных классов или кратное превалирование количества экземпляров одного класса над другим) может в конечном счете свести на нет всю работу системы, так как корректно обобщать входные данные алгоритм будет не способен. Аналогичные проблемы связаны и с формированием тестовой и валидационных выборок. Такие проблемы можно в общем случае решить либо с помощью процедуры нормализации, либо с помощью добавления или исключения обучающих данных и т. д., как представлено автором работы в [204].
Разбалансировка в обучающей и тестовой выборках практически всегда свойственна для задачи распознавания дефектов высоковольтного оборудования вне зависимости от вида оборудования. Очевидно, что в генеральной совокупности в таких задачах будут превалировать параметры, характеризующие бездефектное состояние оборудования или, в худшем случае, определенные виды дефектов могут и вовсе отсутствовать, что продемонстрировано автором в работах [205, 206].
Если формировать обучающую и тестовую выборки в соответствии с общепринятым утверждением, что вероятность появления определенного вида дефекта в обучающей выборке равна вероятности появления данных дефектов в генеральной совокупности, то это приведет к тому, что система будет хорошо распознавать бездефектное состояние и скорее всего редкие дефекты будет считать за «выбросы» в измерениях. Таким образом, выбор процесса формирования и принципов деления данных на обучающие, тестовые и валидационные выборки должен быть отдельной задачей для разработчика интеллектуальных систем.
На этапе планирования сбора данных необходимо: 1) четко определять условия, в которых требуется, чтобы модель работала, и согласовывать их с заказчиком; 2) собирать данные так, чтобы в выборке были представлены все требуемые условия в достаточном для обучения и тестирования объеме и качестве;
3) понимать, что должны быть представлены не только все условия, но и комбинации условий, в случае их взаимного влияния.
Чтобы избежать описанных негативных эффектов, связанных с ошибками предобработки данных, необходимо: 1) до начала обучения модели выполнить анализ данных с использованием статистических методов обнаружения выбросов и экспертного анализа результатов визуализации данных; 2) на этапе оценки модели проводить отдельный анализ больших ошибок на валидационной выборке, поскольку такие ошибки могут быть связаны с искажениями входных данных или искажениями разметки данных.
Ошибки моделирования и тестирования
Общие ошибки
Одной из фундаментальных ошибок применения алгоритмов машинного обучения для конкретной задачи электроэнергетики является отсутствие обоснования их использования. Несмотря на эффективность данного математического аппарата, разработчики интеллектуальных систем должны предварительно убедиться в реальной необходимости применения алгоритмов машинного обучения, а именно - четко определить категорию задачи с точки зрения ее математической постановки, достаточности данных для ее корректной реализации, а также убедиться в неэффективности использования традиционных аналитических детерминированных подходов обработки и анализа данных.
Алгоритмы машинного обучения обычно стоит использовать в задачах с так называемыми большими данными (Big Data). Но есть алгоритмы машинного обучения, которые могут быть действительно эффективными и для небольшого объема данных, но для каждой конкретной задачи и каждого отдельного алгоритма необходимо дополнительно определять минимально требуемый и достаточный объем данных для реализации корректной обобщающей способности алгоритма.
Одной из главных проблем при моделировании в электроэнергетике интеллектуальных систем с помощью алгоритмов машинного обучения является
корректная постановка задачи машинного обучения и отнесения ее к одной из наиболее распространенных категорий задач:
- регрессии - определение (прогнозирование) непрерывной зависимой переменной (или нескольких переменных) из ряда независимых переменных (например, прогнозирование генерации электрических станций или потребления электрической энергии [207]);
- классификации - разделение (или упорядочивание) объектов по заранее известным классам (например, анализ технического состояния и определение принадлежности к одному из состояний электроэнергетического оборудования по показателям его функционирования [208-210]);
- кластеризации - разделение объектов на группы (кластеры) в зависимости от их схожести при условии, что перечень кластеров заранее четко не задан и определяется в процессе работы алгоритмов, в том числе одной из подзадач кластеризации является определение наличия связи внутри кластеров (например, идентификация различных видов дефектов в высоковольтном оборудовании на основе различных данных технического диагностирования [211, 212]);
Задача регрессии, как и задача классификации, являются задачами обучения с учителем и реализуются для заранее размеченных данных. Задача кластеризации является задачей обучения без учителя.
Каждая из категорий имеет свои особенности, области применения, преимущества и недостатки. Зачастую исследователи используют простой перебор методов в поиске решения для анализируемых задач и чаще всего этот перебор основан на экспертном мнении и личном опыте разработчиков, и обоснование необходимости применения тех или иных алгоритмов выглядит не всегда убедительно.
Также стоит сразу же разделять задачи по необходимому времени ее решения и требуемому времени обучения модели машинного обучения:
- оперативная задача, требующая большого (заранее определенного) объема высокого качества данных и малого времени обучения модели, и предполагающая функционирование в онлайн-режиме или близкого к темпу
реального процесса. Например, задача оперативного планирования баланса мощности в энергосистеме с целью обеспечения баланса мощности (номинального уровня частоты), определения требуемого резерва мощности с учетом вероятности нарушения баланса мощности, где исходными данными являются нагрузка (оперативный прогноз потребления), выработка на выбранном интервале упреждения на электрических станциях, оперативный прогноз ВИЭ, электросетевые ограничения [214]. Решение таких задач при их практическом отраслевом внедрении всегда сопряжено с необходимостью формирования инфраструктуры для их корректной реализации: необходимости гибкого хранилища данных и мощных распределенных вычислений;
- среднесрочная задача, требующая достаточного объема данных для получения результата хорошей точности в разумное время. Например, задачи диагностики состояния оборудования с целью выявления развивающихся дефектов, где исходными данными являются данные о текущем техническом состоянии оборудования и его элементов [214, 215]. В таком случае речь не идет о системах онлайн-мониторинга;
- долгосрочная задача, основные требования в которой предъявляются к увеличению точности при сокращении времени обучения в условиях ограниченности данных (либо небольшого объема данных, либо большого объема данных недостаточно высокого качества). Например, задача разработки схемы и программы развития энергосистемы с целью разработки мероприятий по обеспечению надежного электроснабжения субъектов, где исходными данными являются общие данные об энергосистеме, нагрузке, генерации, данные о предполагаемом развитии сети, изменении электропотребления, долгосрочные балансы мощности и электрической энергии и др. [216, 217]. Обычно это так называемый класс систем-советчиков или систем поддержки принятия решений.
Частные ошибки
Частные ошибки обычно являются следствием математической или программной неосведомленности (неопытности) разработчиков. Чаще всего
ошибки связаны со следующими процессами:
- выбор способа обучения модели (с учителем, без учителя, с подкреплением);
- выбор критериев качества модели (выбор метрики);
- анализ ошибок в результате работы алгоритмов и их интерпретация;
- адаптация или дообучение системы в случае появления новых объектов.
Для корректной оценки результатов необходимо: 1) выбирать и
интерпретировать показатели качества модели исходя их того, для какой задачи будет использоваться модель; 2) понимать, что ошибка означает по существу, не согласно математическим, а согласно физическим и экономическим критериям.
Чтобы избежать ошибочного выбора неподходящей модели и алгоритм обучения следует: 1) понимать особенности задачи и характер изменений целевой величины; 2) понимать математическую природу моделей и принципы работы алгоритмов их обучения; 3) проводить анализ не только показателей качества модели, но и сопоставление ее выхода с требуемым.
Метод классификации состояния высоковольтного оборудования
На основе описанного выше подхода в работе предложен новый алгоритм классификации состояний высоковольтного оборудования при использования большого числа параметров (признаков), полученных из различных источников: показатели физико-химического анализа масла; результаты хроматографического анализа; результаты тепловизионной диагностики; различных параметров состояний отдельных элементов и подсистем. Всего можно насчитать более шестидесяти различных параметров, например, для силового трансформатора 110 кВ. Но из-за того, что параметры относятся к различным процедурам диагностики, далеко не для всех элементов выборки будут присутствовать значения всех параметров. Кроме того, если число параметров велико, то повышается риск переобучения модели из-за выделения ложных зависимостей. Поэтому в рассматриваемой задаче необходимо особое внимание
уделять этапу предобработки данных, иначе не удастся создать корректные выборки для обучения, валидации и тестирования моделей.
3.4 Разработка алгоритма классификации состояний высоковольтного
оборудования
На Рисунке 88 показаны этапы разработанного алгоритма классификации состояния высоковольтного оборудования. Его особенность заключается в итерационной предварительной обработке данных, которая выполняется для повышения информационной наблюдаемости за счет сохранения баланса между сокращением объема выборки данных путем исключения столбцов (признаков) или строк (экземпляров) и восстановлением пропущенных и искаженных значений.
Число итераций цикла предобработки данных зависит от качества и объема выборки данных, как правило, достаточно двух итераций. На Рисунках 89-90 приведен алгоритм первой итерации предобработки данных.
Ниже дано более подробное словесное описание алгоритма, в котором используются обозначения: В - исходная выборка данных; сШГОм>(А, Ь) - удаление из матрицы А строк с номерами из вектора Ь; сЫсО1(А, Ь) - удаление из матрицы А столбцов с номерами Ь; пи, ши - число строк и столбцов в матрице соответственно.
В процессе предобработки используется визуализация выборки силовых трансформаторов не как физических, а как информационных объектов в пространстве данных (параметров), используемых в виде диаграммы площади данных. Создание такой диаграммы позволяет графически оценить степень информационной наблюдаемости разрабатываемой модели оборудования и с точки зрения данных по отдельным узлам оборудования, и с точки зрения вклада каждого параметра в информационную наблюдаемость трансформатора как единой технологической единицы.
Рисунок 88 - Укрупненный алгоритм классификации состояний высоковольтного оборудования
Начало
О
Удаление столбцов с заведомо неинформативными признаками
А
Синтаксический анализ, выявление и исправление ошибок формата
Замена ошибок формата, не поддающихся исправлению на «]Ча№>
А
Подсчет количества пропусков по столбцам. си
Удаление столбцов с большим числом пропусков
А~
Подсчет количества пропусков по строками. со
Удаление строке большим числом пропусков
_А__
Объединение близких состояний с малым числом записей в выборке
~рГ
Заполнение пропусков
_А__
Удаление пропусков, которые не удалось заполнить
А
Удаление выбросов
_А__
Изменение распределения признаков (логарифмирование)
А
Оценка значимости признаков
Ао
Рисунок 89 - Блок-схема алгоритма предобработки данных
О
о
о
о
Начало
Рисунок 90 - Блок-схема алгоритма шага 6 «Заполнение пропусков»
Начальная предобработка
Исходные данные, например, о состоянии силовых трансформаторов представляют собой частично структурированные данные и содержат ошибки в формате данных, такие как лишние символы, разные символы для десятичного разделителя (точки и запятые), лишние пробелы и прочее. Большая часть таких значений может быть преобразована в числа. Значения, которые не удалось преобразовать, заменяются на - специальное обозначение для неизвестных значений. Начальная предобработка состоит из двух шагов.
Шаг 1. Удаление из выборки столбцов и1 с заведомо неинформативными для классификации технического состояния признаками, такими как идентификатор трансформатора в выборке данных, диспетчерское наименование, а также
одинаковых для всей выборки данных значений (например, класс напряжения, если выборка представлена трансформаторами одного класса напряжения):
Д ^ спгсо1 (Д,щ). (38)
Шаг 2. Синтаксический анализ, выявление и исправление ошибок в формате данных:
А ^ р(Д). (39)
На этом шаге большая часть операций выполняется автоматически, к ним относятся замена десятичных разделителей, удаление лишних пробелов, преобразование значений, которые невозможно преобразовать в числа, в и т. п.
Обработка пропусков и выбросов
Пропущенные значения признаков в общем случае можно восстанавливать или удалять. В случае удаления также есть два варианта:
- удалять признак, по которому есть пропуски, то есть удалять столбец;
- удалять запись с пропусками, то есть удалять строку.
В рассматриваемой задаче ни одна из трех стратегий (восстановление, удаление признака, удаление записи) в чистом виде не может быть применена. Восстановление всегда вносит некоторую погрешность в выборку, отчасти превращает ее из реальной в смоделированную (синтетическую), что снижает релевантность выборки и достоверность полученных на ней результатов.
Если просто исключить строки и столбцы, которые содержат пропуски, то велика вероятность, что исходный набор уменьшится кратно, и построение модели для классификации технического состояния оборудования окажется невозможным по причине малого объема данных как для обучения модели, так и для ее валидации. Удаление может слишком сильно сократить объем выборки по одному или нескольким классам, так что данных окажется недостаточно для обучения модели. В данной работе предложен смешанный подход для обеспечения баланса сокращения объема выборки и ее соответствия исходным данным. После этого к оставшимся пропускам применяется процедура восстановления.
Кроме того, если учесть весь жизненный цикл высоковольтного оборудования, становится ясно, что в выборке число экземпляров (например, силовых трансформаторов) в хорошем и удовлетворительном состояниях будет всегда в разы превышать число экземпляров в плохом и, тем более аварийном состояниях. Поэтому важно на всех этапах построения модели учитывать наличие необходимого минимального числа записей по каждому классу. В случае недостаточного количества обученная модель не сможет выполнить обобщение признаков для этого класса.
Для описания рассеяния данных используется межквартильный размах IQR:
IRQ = Q3 - Q1, (40)
где Q3 - третий квартиль, верхний выборочный квартиль; Q1 - первый квартиль, нижний выборочный квартиль. После чего исключают значения ниже внутренней нижней и выше внутренней верхней границы соответственно с числом межквартильных размахов равным к = 1,5 (ниже Q1 - 1,5IQR и выше Q3 + 1,5IQR соответственно).
Шаг 3. Удаление столбцов с большим числом пропусков.
3.1. Определение бинарной матрицы, в которой единицы показывают, какие значения в D2 являются пропусками (NaN):
Dg 3^ (D2= NaN). (41)
3.2. Подсчет пропусков по столбцам:
CGi^l^Dgz пЛ = 1,...т2 (42)
3.3. Определение уровня отсечения Thcoi путем анализа информационной наблюдаемости технического состояния на основе диаграммы данных и выражением (19) при различных уровнях отсечения. Также выполняется визуализация числа пропусков по каждому признаку для принятия решения о значении уровня отсечения Thcoi. При этом используются диаграмма площади данных (пример которой приведен в главе 5 с результатами апробации описанного метода).
3.4. Определение номеров столбцов, которые содержат слишком много пропущенных значений и должны быть удалены:
Щ ^ (СО > Тксо1), (43)
где и3 - бинарный вектор, число элементов которого равно числу признаков в выборке данных.
3.5. 03 ^ сШСы(02, и3) - удаление столбцов с большим числом пропусков:
Дз ^ сшы(Д2,из). (44)
Шаг 4. Удаление строк с большим числом пропусков.
4.1. Определение бинарной матрицы, в которой единицы показывают, какие значения в 03 являются пропусками:
Д 4 (Д = МаМ). (45)
4.2. Подсчет пропусков по строкам:
I m
RGt <--XD84ij,i = 1
J=1
mn - " (46)
4.3. Визуализация числа пропусков по каждому признаку для принятия решения о значении уровня отсечения Throw. При этом используются диаграмма площади данных и оценка информационной наблюдаемости в соответствии с выражением (19).
4.4. Определение номеров строк, которые содержат много пропущенных значений и должны быть удалены:
u, ^ (RG > Throw), (47)
где u4 - бинарный вектор, число элементов которого равно числу признаков в выборке данных.
4.5. Удаление строк с большим числом пропусков:
D4 ^ cutrow(D3,u4). (48)
Шаг 5. Объединение классов.
5.1. Визуализация распределения числа записей (экземпляров) в выборке данных по классам для принятия решения.
5.2. Объединение классов близких состояний:
Dj (D4,ThJoin). (49)
Шаг 6. Заполнение пропусков.
Цикл по всем строкам выборки i = 1, ... n5. Если i-я строка содержит хотя бы одно пропущенное значение, то оно заменяется медианой данного признака среди объектов того же типа (например, марки трансформатора) и того же класса (технического состояния).
Если 3j,D5ij = NaN,j = 1, ..., W5,M=D5 | (object_type(M) = = object_type(A i)
AND class(M) = class(D5 ) ), D6 / ^ median(M) (50)
Шаг 7. Возможны ситуации, когда пропущенные значения не удается заполнить на шаге 6 из-за того, что в выборке нет нужных данных, то есть отсутствуют значения признака для определенного типа объекта и его состояния. Поэтому нужно убрать строки с оставшимися пропусками.
7.1. Определение бинарной матрицы, в которой единицы показывают, какие значения в D6 являются пропусками NaN:
Dg7 ^ (D6= NaN). (51)
7.2. Подсчет пропусков по строкам:
1 m
RGi ^ m £ Dg 7j ,1=1'-' n6- (52)
7.3. Определение номеров строк, которые содержат хотя бы одно пропущенное значение и должны быть удалены:
u7 ^ (RG < 0), (53)
где u7 - бинарный вектор, число элементов которого равно числу признаков в выборке данных.
7.4. Удаление строк:
D7 ^ cutmw(D6,u7). (54)
Шаг 8. Удаление выбросов.
8.1. Визуализация распределения данных по каждому признаку.
8.2. Определение номеров удаляемых строк, содержащих выбросы, где blower, bupper - векторы граничных значений по каждому признаку, определенных с помощью анализа информационной наблюдаемости технического состояния:
Щ ^ (D7 < bhwer ИЛИD7 > bUpper ), (55)
где u8 - бинарный вектор, число элементов которого равно числу признаков в выборке данных.
8.3. Удаление строк:
D8 ^ CUtrow (D7 ' U8)- (56)
Преобразование признаков и анализ из значимости
Монотонное преобразование признаков критично для одних алгоритмов и не оказывает влияния на другие, поэтому в данном случае было необходимо проанализировать распределения значений признаков. С помощью диаграммы «ящик с усами» (box-and-whiskers) можно компактно представить одномерное распределение вероятностей в графической форме. По полученным графикам можно оценить коэффициент асимметрии распределения. Значительная доля алгоритмов машинного обучения делает предположение о нормальном распределении данных; при наличии асимметрии распределения величины рекомендуется применить логарифмическое преобразование, поскольку на данных с искривленным распределением возможно ухудшение предсказательных способностей алгоритма.
Дополнительное повышение качества выборки с точки зрения эффективности обучения моделей может быть достигнуто за счет анализа коллинеарности признаков и исключения избыточных признаков. Анализ проводится с использованием коэффициента корреляции Спирмена. Для двух признаков (столбцов) из выборки a1, a2 он рассчитывается следующим образом:
f. n
(57)
р =
где и - ранг /-го элемента в ряду значений а1; - ранг /-го элемента в ряду значений а2; к - количество значений (длина рядов выборки а1, а2). Если два признака имеют
модуль коэффициента корреляции |р| близкий к 1, то один из признаков исключается из выборки.
Можно определить избыточные или неинформативные признаки с помощью:
- анализа коллинеарности (корреляции) признаков на основе матрицы коэффициентов корреляции Спирмена (взаимной корреляции признаков) в соответствии с выражением (55);
- анализа коэффициентов корреляции Спирмена для признаков по отношению к образу состояния;
- предварительного построения нескольких моделей машинного обучения, которые в процессе обучения оценивают важность признаков.
Анализ коллинеарности и значимости признаков
Шаг 9. Изменение распределения признаков.
9.1. Определяется вектор номеров признаков для преобразования Т.
9.2. Выполнение преобразования:
Д, ^ 1ОВ(£>8?/ +е)] еГ,г = 1,...,у = (58)
где е - малое число (0,0001), прибавляемое для исключения ошибки взятия логарифма от нуля.
Шаг 10. Оценка значимости признаков с помощью корреляционного анализа и построения классифицирующей модели на базе ансамбля деревьев решений.
10.1. Построение матрицы коэффициентов взаимной корреляции признаков на основе выражения (55):
С ^ согг(Д9). (59)
10.2. Выбор признаков, которые можно исключить с учетом высокой взаимной корреляции, вектора и10.
10.3. Построение классификатора ф(Д9), дающего вектор значимости признаков V, проверка, что признаки из вектора и10 действительно могут быть исключены без потери точности классификации.
10.4. Удаление выбранных по результатам корреляционного анализа признаков:
Д10 ^ СШсо1(Щ10)- (60)
Вторая итерация алгоритма
Особенность используемого в данной работе подхода заключается в инерционности процесса предобработки данных и построения моделей. После выполнения анализа коллинеарности и после построения моделей, а также получения оценки значимости признаков принимается решение об исключении избыточных или неинформативных признаков. При этом на этапе удаления пропущенных значений какие-то записи могли быть устранены из-за пропусков именно по этим признакам. Поэтому после исключения избыточных и неинформативных признаков следует пересмотреть значение порога ТИгом, для каждого из классов, таким образом в выборку могут вернуться некоторые записи, удаленные ранее.
Далее эти записи будут учтены и для восстановления оставшихся пропусков, анализа коллинеарности и обучения моделей. Такой прием может существенно повысить количество записей в используемой для обучения выборке, поскольку не будут удалены записи, имеющие пропуски по признакам, которые на самом деле являются избыточными или неинформативными.
Вторая итерация отличается тем, что в ней не выполняются шаги 1-2 и начальной выборкой принимается выборка, полученная по результатам первой итерации (Ао).
Двухитерационная процедура позволяет после начальной предобработки данных определить признаки, которые могут быть исключены из-за низкой значимости для классификации технического состояния. Исключение этих признаков позволяет на второй итерации уже повторно не исключать из выборки строки с ошибками, пропусками и выбросами по этим признакам, что существенно повышает информационную наблюдаемость технического состояния, как показано в расчетном примере в пятой главе. Таким образом решаются две задачи: с большей вероятностью исключить именно неинформативные признаки; снизить количество строк и столбцов, которые будут удалены из исходного набора диагностических
данных.
Двухитерационная процедура решает две задачи:
- с большей вероятностью исключить именно бесполезные (неинформативные) признаки;
- снизить количество строк и столбцов, которые будут удалены из исходного набора данных.
Используемые модели и алгоритмы машинного обучения В качестве базовой модели машинного обучения в данной работе был использован ансамбль деревьев решений. Помимо полученных экспериментальных подтверждений эффективности данного метода в рассматриваемой задаче, его выбор обосновывается следующими факторами:
- необязательность нормализации признаков, приведения их к одной численной шкале;
- способность деревьев решений обрабатывать как численные, так и категориальные признаки, что важно в задачах классификации технического состояния высоковольтного оборудования электрических станций и подстанций;
- отсутствие необходимости формирования начальных предположений о распределении классов в пространстве признаков и структуре классификатора;
- выбор наиболее значимых признаков, который выполняется для каждого нового ветвления, что затем позволяет после завершения обучения дерева решений оценить значимость признаков по выборке в целом;
- устойчивость деревьев решений к выбросам (несмотря на исключение выбросов на этапе предобработки данных, убрать их на этом этапе полностью, как правило, невозможно);
- высокая скорость обучения модели, что позволяет многократно проводить вычислительные эксперименты с различными гиперпараметрами;
- принципиальная нелинейность, заложенная в модель, позволяет строить сложные многопараметрические зависимости, основанные на системе логических правил;
- возможность управлять балансом смещения-разброса, предотвращая переобучения деревьев за счет ограничения глубины деревьев и установления минимального количества экземпляров на каждом листе;
- масштабируемость, так как деревья решений могут быстро обрабатывать большие объемы данных;
- возможность проводить интерактивное и поэтапное обучение, обновляя модель новыми данными без необходимости перестраивать всю модель;
- малое число настраиваемых гиперпараметров относительно нейросетевых моделей;
- возможность построения корректного классификатора на несбалансированных наборах данных, что особенно актуально в задачах классификации технического состояния оборудования.
Однако, обобщающей способности одного дерева в рассматриваемой задаче недостаточно, поэтому необходимо использовать ансамбли деревьев. При этом все указанные преимущества сохраняются. Снижается скорость обучения, но не критично, добавляется несколько гиперпараметров, требующих настройки, что также не создает проблем благодаря используемым алгоритмам автоматического подбора гиперпараметеров.
Эффективным алгоритмом построения ансамбля является бустинг, то есть последовательное создание и добавление в ансамбль моделей, каждая из которых стремится снизить текущую ошибку ансамбля. При обучении с учителем на наборе данных D = {(х,, у,) : Xi eRn, у, ансамбль из k решающих деревьев будет иметь вид:
k
у = F (X ) = £ wJfJ (^), (61)
]=1
где у/ - выходное значение (предсказание) модели; _Дх) - отдельное решающее дерево ансамбля; w - вес дерева, задающий его значимость при объединении результатов всех деревьев; к - число деревьев.
Поскольку заранее выбрать наиболее подходящий алгоритм построения ансамбля невозможно, в данном методе используются различные алгоритмы бустинга, такие как: адаптивный бустинг (АёаВооБ1:), экстремальный градиентный бустинг (ховооб1:), категориальный бустинг (Са1ВооБ1:). Как и для большинства эвристических методов, для ансамблевых алгоритмов и построения деревьев решений необходима настройка параметров, основными из которых являются глубина дерева и число деревьев. Настройка этих параметров вручную очень трудозатратна, поэтому использован подход случайного поиска, проводящий перебор заданного числа случайно сгенерированных в заданном диапазоне значений параметров.
Решаемая задача классификации является несбалансированной и многоклассовой. Несбалансированной она является не только по количеству элементов разных классов, но и по важности ошибок. Поэтому вначале создается классификатор СА для разделения «неудовлетворительное»/«удовлетворительное» и «хорошее» состояния. Затем создается второй классификатор Св для разделения «хорошее»/«удовлетворительное» состояния среди объектов, для которых СА не предсказал состояние «неудовлетворительное». После обучения обоих классификаторов метод классификации технического состояния можно записать следующим образом:
1) применить СА;
2) если выход СА - «неудовлетворительное», то результат -
«неудовлетворительное»;
3) иначе применить СВ;
4) использовать выход Св как результат.
В рассматриваемой задаче из-за разной значимости ошибок и несбалансированности выборки необходимо использовать следующие метрики:
точность классификации (РРУ), полноту (TPR) и гармоническое среднее между точностью и полнотой (Р^меру):
TP
PPV =-, (62)
TP + FP v У
Tp
TPR =-, (63)
TP + FN
^ „ PPV • TPR
^ = 2-, (64)
1 PPV + TPR У ;
где ТР - количество истинно-положительных исходов; РР - количество ложно-
положительных исходов; РN - количество ложно-отрицательных исходов.
Результаты применения разработанного метода представлены в пятой главе.
Выводы по главе 3
В рамках данной главы продемонстрировано, что задача эффективного и
надежного функционирования высоковольтного оборудования является задачей в многомерном пространстве, состоящей из ряда слабо формализуемых подзадач в условиях неопределенности, поэтому требуется принципиально новый подход как к сбору и обработке данных, так и к созданию новых моделей на базе универсальных аппроксиматоров, параметры которых могут быть получены с помощью машинного обучения.
Формализованы возможные ошибки создания автоматизированных систем на базе машинного обучения и условно разделены в зависимости от этапов реализации программного обеспечения в контексте электроэнергетических задач на каждой из стадий: сбора, анализа и подготовки данных; моделирования и тестирования, а также промышленной эксплуатации.
Рассмотренные примеры ошибок обосновывают необходимость тесного взаимодействия специалистов в области анализа данных со специалистами в электроэнергетике на всех этапах создания интеллектуальных систем. На каждом этапе необходимо как полное понимание специфики решаемой задачи и рассматриваемого объекта, так и глубокое понимание принципов работы математических моделей, алгоритмов и статистических показателей. Недостаток
как первого, так и второго с высокой вероятностью приведут к увеличению трудозатрат на создание интеллектуальной системы или снижению показателей качества работы модели на этапе ее эксплуатации.
При разработке автоматизированных систем технического диагностирования на основе моделей машинного обучения необходимо учесть вышеописанные возможные ошибки на стадии сбора, анализа и подготовки данных; на стадиях моделирования, тестирования и промышленной эксплуатации. Также сформированы рекомендации для выявления ошибок и снижения их влияния.
Для повышения эффективности работы автоматизированных систем технического диагностирования предложен новый метод определения текущего состояния высоковольтного оборудования при использования большого числа параметров (признаков), полученных на основе различных методов неразрушающего контроля.
Показано, что необходимо особое внимание уделять этапу предобработки данных для формирования корректных выборок для обучения, валидации и тестирования моделей. Стандартные процедуры очистки и предобработки данных в таких задачах приводят к слишком сильному сокращению объема данных, поскольку отношение числа строк, содержащих те или иные пропуски, выбросы, ошибки формата и т. д. к общему числу строк в выборке может быть больше 75 %.
Особенностью разработанного метода является двухитерационная процедура исключения малоинформативных записей и признаков для обеспечения баланса сокращения объема выборки и ее соответствия исходным данным. Двухитерационная процедура позволяет после начальной предобработки данных определить признаки, которые могут быть исключены из-за низкой значимости для классификации технического состояния. Исключение этих признаков позволяет на второй итерации уже повторно не исключать из выборки строки с ошибками, пропусками и выбросами по этим признакам, что существенно повышает информационную наблюдаемость технического состояния, как показано в расчетном примере в пятой главе. Таким образом решаются две задачи: с большей вероятностью исключить именно неинформативные признаки; снизить количество
строк и столбцов, которые будут удалены из исходного набора диагностических данных.
Разработанный метод определения текущего технического состояния высоковольтного оборудования на основе ансамблевых алгоритмов машинного обучения и предварительной обработки данных, полученных различными методами неразрушающего контроля, учитывающий их неполноту и неоднородность, дает возможность определять наиболее значимые диагностические параметры и интерпретировать их значимость.
4 НОВЫЕ МЕТОДЫ АВТОМАТИЗИРОВАННОГО СБОРА,
ОБРАБОТКИ И АНАЛИЗА ГРАФИЧЕСКИХ ДАННЫХ В ВИДИМОМ,
ИК- И УФ-СПЕКТРАХ
Данная глава посвящена разработке новых методов автоматизированного сбора, обработки и анализа графических данных в видимом, ИК- и УФ-спектрах для технического диагностирования технического состояния высоковольтного оборудования ОРУ на основе алгоритмов компьютерного зрения.
4.1. Постановка задачи автоматизированного сбора данных и обработки мультиспектральных результатов диагностики состояния высоковольтного оборудования
Результаты диагностики состояния высоковольтного оборудования в виде изображений в видимом, ИК- и УФ-спектрах можно использовать как большие данные при условии наличия инструмента их автоматизированного сбора и алгоритмов их корректной обработки на основе компьютерного зрения.
В области диагностики оборудования компьютерное зрение находится на начальной стадии развития из-за отсутствия в открытом доступе больших наборов данных, специфики изображений в ИК-, УФ-спектрах и влияния параметров ИК- и УФ-камер на характеристики изображений.
В рамках исследования была разработана методика автоматизированного УФ-контроля состояния внешней изоляции оборудования ОРУ в автоматизированном режиме с помощью робототехнического комплекса и УФ-камеры промышленного исполнения (с синхронизацией УФ- и видимых каналов).
Также в работе предложен новый унифицированный метод обработки ИК-, УФ-изображений для распознавания образов дефектов и их локализации. Показано, что совместное использование ИК- и УФ-контроля вместе с обработкой изображений в видимом спектре при автоматизированном сборе большого объема данных повышает их эффективность.
В ходе исследования сформулированы особенности ИК-изображений,
которые важны при автоматизированной диагностике высоковольтного оборудования с применением роботизированных комплексов.
4.2. Разработанный алгоритм технического диагностирования состояния внешней изоляции оборудования в автоматизированном режиме
В рамках данного исследования разработан новый алгоритм технического диагностирования технического состояния внешней изоляции высоковольтного оборудования с помощью УФ-камеры промышленного исполнения (с синхронизацией УФ- и видимого канала) и робототехнического комплекса, а также метод компьютерного зрения с пространственно-временной фильтрацией шумов радиометрических данных, позволяющий повысить точность обнаружения поверхностных частичных разрядов в автоматическом режиме.
1. Выбор условий проведения диагностики.
1.1. Проверка соответствия условий окружающей среды допустимым значениям для проведения диагностики. Ракурсы съемки должны покрывать все измерения и различные углы обзора внешней изоляции оборудования и выбираются в зависимости от поля зрения УФ-камеры, от точек пролегания маршрутов мобильной роботизированной платформы по территории ОРУ с использованием разработанной для этого геопривязанной ЭЭ-модели объекта и спутниковых снимков, а также видеоряда, полученного с помощью специализированных камер с углом съемки 360°. Каждая единица оборудования должна быть обследована в соответствии со следующими разработанными в рамках данного исследования правилами:
- влажность воздуха не менее 45 %, отсутствие осадков, скорость ветра до 2 м/с и положительная температура воздуха;
- минимальное попадание прямых солнечных лучей в объектив камеры при проведении диагностики в дневное время;
- минимальное попадание в кадр других объектов с целью уменьшения их влияния на радиометрические данные;
- использование не менее двух различных ракурсов съемки для каждой единицы оборудования;
- максимальное отношение площади изображения диагностируемого объекта к площади кадра;
- покрытие ракурсами всех измерений объекта контроля;
- максимальное попадание плоскости объекта в кадр.
1.2. Выбор расстояния между робототехническим комплексом с УФ-камерой и объектом контроля. В связи с большим числом оборудования на ОРУ и необходимостью обеспечения минимального времени автоматизированной диагностики процесс делится на маршруты в соответствии с компоновкой ОРУ при выполнении требований п. 1.1 данного метода. Автоматизированная диагностика осуществима по следующим маршрутам:
- с автомобильных дорог и проездов на ОРУ;
- под порталами вдоль систем шин ОРУ;
- в стесненных условиях с учетом фактического расположения объектов кабельного хозяйства ОРУ.
Расстояние между робототехническим комплексом с УФ-камерой и объектом контроля определяется в зависимости от оптических параметров камеры и выбранных ракурсов.
1.3. Выбор спектрального диапазона и угла обзора. Спектральный диапазон промышленной УФ-камеры выбирается в зависимости от требуемых условий проведения диагностики и обеспечения работы в дневное или ночное время. При корректно выбранно м диапазоне современные светофильтры и электронно-оптические преобразователи способны усиливать соотношение сигнал-шум. Угол обзора должен быть не менее 8° х 6°.
1.4. Выбор коэффициента усиления. Так как до сих пор отсутствует единое мнение о граничных значениях интенсивности частичных разрядов в изоляции, полученных с помощью УФ-контроля, то разрядная активность (расположение и площадь) на снимке является важным диагностическом признаком для локализации
возможных дефектов. Именно поэтому обосновано использование алгоритмов компьютерного зрения.
Коэффициент усиления (КУ) определяет чувствительность к детектируемым поверхностным частичным разрядам. От значения КУ зависит картина разрядной активности, поэтому выбор КУ является важным этапом в решении задачи повышения точности диагностирования поверхностных частичных разрядов.
Выбор коэффициента усиления соответствует алгоритму:
1. Проведение испытаний с различными КУ с шагом не более 5 % от рабочего диапазона УФ-камеры для каждого вида диагностируемого оборудования;
2. Выбор минимального КУ из проанализированных на шаге 1, достаточного для обнаружения дефекта для каждого вида диагностируемого оборудования.
За счет использования УФ-камеры промышленного исполнения возможно реализовать адаптивную настройку КУ автоматически для каждого вида диагностируемого оборудования во время движения роботизированного комплекса по маршруту.
2. Формирование картины разрядной активности.
Формирование изображения в видимом спектре наложением на него радиометрической картины разрядной активности состоит из этапов очистки для повышения соотношения сигнал-шум и при необходимости объединения изображений для единицы оборудования.
2.1. Локализация разрядной активности. Для локализации разрядной активности необходимо выделение области кадра с диагностируемым оборудованием. Основной особенностью является необходимость агрегирования набора кадров из видеоряда, т. е. выделение разрядной активности на каждом кадре с последующим её усреднением. Локализация разрядной активности соответствует алгоритму:
2.1.1. Получение видеоряда с диагностируемым оборудованием при неподвижной УФ-камере, при этом п - число кадров в видеоряде.
2.1.2. Выделение первого кадра из видеоряда.
2.1.3. Выделение на первом кадре области R, в которой находится диагностируемое оборудование, путем определения прямоугольника, в который вписан искомый объект, с наибольшим возможным отношением площади перекрытия объектов к их объединенной площади на изображении.
2.1.4. Создание нулевой матрицы пикселей D, размерность которой равна размерности области R.
2.1.5. Сложение всех кадров (Ui, i = 1, n):
D = Ui + D. (65)
2.1.6. Усреднение изображения объекта мониторинга D:
D = D / n. (66)
2.1.7 Создание изображения V как результата визуального выделения цветом, однозначно отличающимся от поверхности диагностируемого оборудования, на изображении D пикселей, имеющих значения интенсивности УФ-излучения выше порога Ьуф.
2.2. Совмещение изображений и формирование картины разрядной активности. Из-за узкого угла обзора УФ-камеры и удаленности диагностируемого оборудования от точек съемки формирование общей картины его разрядной активности происходит с помощью:
- объединения в одно изображение кадров с различных ракурсов из общей точки съемки, но различных углах тангажа камеры;
- сохранения серии разрядных картин, снятых с разных ракурсов.
В результате п. 2.1 и п. 2.2 получается m изображений Vj (j = 1?m).
Совмещение изображений Vj (j = 1, m -1) соответствует алгоритму:
2.2.1. Определение от 10 до 20 ключевых точек с помощью алгоритмов компьютерного зрения: детектора углов Харриса, ускоренного робастного
алгоритма выделения признаков (SURF) на каждом изображении Vj, j = 1, m -1.
2.2.2. Определение четырех общих ключевых точек на каждой паре
изображений У), у+ь у = 1, т -1 в соответствии с алгоритмами выбора пар
совмещаемых точек Д. Лоу и линейной регрессии с отсечением выбросов (ЯАКБАС). Описания указанных алгоритмов приведены ниже в данной главе.
2.2.5. Поочередное наложение изображений у, у+1, у = 1,т, друг на друга.
3. Обнаружение дефекта. Сложность локализации дефекта заключается в унификации условий проведения диагностики для различных видов оборудования, а сложность определения его критичности состоит в том, что более 80 % обнаруженных поверхностных разрядов описывают работоспособное техническое состояние диагностируемого оборудования. Обнаружение дефекта базируется на анализе полученной в п. 2 картины разрядной активности с помощью алгоритмов компьютерного зрения с пространственно-временной фильтрацией шумов в радиометрических данных.
Возможные виды дефектов: трещины, сколы и пробой изоляции, нарушение армировочного шва или заделки, обрывы, набросы, загрязнение поверхности изоляции.
Несмотря на то, что УФ-контроль не относится к основным методам диагностирования, регламентированным национальными стандартами, он обеспечивает бесконтактное диагностирование под нагрузкой и позволяет выявлять важную группу дефектов внешней изоляции высоковольтного оборудования.
Предложенный автоматизированный алгоритм УФ-контроля имеет следующие преимущества: возможность проведения контроля в дневное и ночное время суток; возможность его дистанционной реализации; уменьшение продолжительности контроля за счет автоматической настройки оптических параметров УФ-камеры, адаптивного выбора значений КУ для различных видов оборудования; повышение точности обнаружения частичных разрядов за счет пространственно-временной фильтрации шумов радиометрических данных на основе алгоритмов компьютерного зрения.
4.3. Унифицированный метод обработки ИК-, УФ- или мультиспектральных изображений
Из приведенных выше особенностей ИК- и УФ-контроля с точки зрения обработки их результатов в графическом формате совместно с изображениями в видимом спектре возникает необходимость создания унифицированного метода обработки графических изображений в различных спектральных диапазонах, с учетом возможного наложения отдельных частей изображения друг на друга.
Так как в данной работе внедрение результатов проводилось на ОРУ-220 кВ, то отдельно потребовалось создание метода сбора графических данных для получения снимков высоковольтного оборудования ОРУ-220 кВ в различных спектрах (вне зависимости от класса напряжения реализация такого алгоритма потребуется для любого ОРУ или объектах на станции).
В настоящей работе предложен следующий метод сбора данных:
1) определение с помощью разработанной 3D-модели электрической станции или подстанции необходимых точек съемки и ракурсов исходя из особенностей УФ-снимков как узкоформатных, детализированных и поэтому более требовательных к точным ракурсам;
2) верификация определенных на шаге 1 точек и ракурсов на предмет пригодности и полноты для получения ИК-снимков с этих же точек, при таком же направлении камеры, но с увеличенным углом обзора; при необходимости определение дополнительных точек и ракурсов;
3) разработка алгоритма сшивания и совмещения снимков для их последующей обработки алгоритмами компьютерного зрения и машинного обучения.
Для обработки графических данных алгоритмами компьютерного зрения и машинного обучения в работе предложен новый унифицированный метод обработки ИК-, УФ- или мультиспектральных изображений для распознавания образов дефектов и их локализации [218] (Рисунок 91).
Рисунок 91 -Этапы метода автоматизированного распознавания графических образов высоковольтного оборудования и локализации его дефектов
На Рисунке 91 выделены следующие этапы: 1 - преобразование размера и вырезание предопределенной области изображения, 2 - снижение шума с помощью фильтрации, 3 - повышение качества изображения, 4 - сегментация изображения, 5 - выделение области интереса, 6 - применение дескрипторов, 7 - применение алгоритмов машинного обучения для распознавания образов.
Этап 1. Преобразование размера и вырезание предопределенной области интереса. Область интереса - выбранная часть изображения, которая представляет интерес с точки зрения диагностики. Этап важен для распознавания образов оборудования, которое удалено или труднодоступно. При этом для диагностики должна быть известна точка, на которой находился роботизированный комплекс и ориентация камеры во время сбора данных. На этапе 1 для выделения области интереса еще не используются алгоритмы компьютерного зрения. Вместо этого выполняется учет точки в пространстве, в которой находится камера (координаты роботизированного комплекса с учетом расположения камеры на нем), ее ориентация и положение диагностируемого объекта (точки интереса). Для распознавания объектов, к которым невозможно приблизиться, например, из-за влияния электромагнитных полей или конструктивных пространственных
особенностей ОРУ, появляется возможность существенно сократить объем обрабатываемых на следующих этапах данных за счет определения области интереса на снимке.
Например, на Рисунке 92 показан снимок в ИК-спектре, при этом несмотря на погрешность позиционирования беспилотного воздушного судна с диагностической аппаратурой, диагностируемые элементы гибких связей будут занимать определенную область, выделенную на Рисунке 92, что позволит не обрабатывать данные за пределами этой области. На Рисунке 93 приведен аналогичный пример для снимка при наложении УФ-спектра и видимого спектра.
Рисунок 92 - Пример снимка в ИК-спектре с выделенной областью интереса с учетом погрешности позиционирования ИК-камеры в пространстве
Но для реализации этого подхода в алгоритм обработки графических данных необходимо добавлять использование сведений о маршрутах роботизированных комплексов и 3Э-моделях объектов (например, ОРУ-220 кВ станции). Таким образом, возникает задача обработки не просто графических данных, а гибридных графических и пространственных данных, что также отличает разработанный в рамках данного диссертационного исследования метод.
Рисунок 93 - Пример снимка в УФ- и видимом спектрах с выделенной областью интереса с учетом погрешности позиционирования УФ-камеры в пространстве
Необходимо отметить, что при этом не происходит обрезание изображения, вместо этого пиксели матрицы изображения за пределами области интереса заполняются нулями. Это необходимо, чтобы последующие этапы работали с единообразной по форме и размеру матрицей пикселей (тензором).
Кроме того, на первом этапе выполняются вспомогательные, но необходимые преобразования цветовой схемы. Так, если на входе не термограмма (матрица температур), а ИК-изображение, полученное в цвете, то необходимо выполнить преобразование цветов:
It = Cirr -IRR] + Сто • Iir[G] + Сш • Iir[B] + Ciro, (67)
где IT - графическое представление радиограммы ИК-контроля c тремя каналами (R, О, B) из-за цветовой визуализации; С - вектор коэффициентов, который задает перевод из цветовой шкалы термограммы как трехцветного изображения в температуры, их значения зависят от используемого способа формирования термограммы и шкалы температур на ней.
Для изображений в видимом диапазоне цвет не является полезной составляющей для распознавания образов изображений, поэтому целесообразно выполнить перевод изображения в оттенки серого:
¡об = 0,299 •1яон[Я] + 0,587 • Ыв[0] + 0,144 • ¡яов[В]. (68)
Этап 2. Снижение шума с помощью фильтрации. Использует усредняющие фильтры и алгоритмы фильтрации, сохраняющие границы объектов диагностирования. При этом на изображениях очень важны геометрические характеристики (признаки) объектов для последующего автоматического алгоритма распознавания образов, поэтому принципиально важно, чтобы фильтрация не приводила к слишком сильному «размытию», которое характерно для фильтра Гаусса [219] и подобных сглаживающих шумы фильтров при высокой степени сглаживания. Поэтому, помимо усредняющих фильтров, в работе предложено использовать и билатеральный (двухсторонний) фильтр [220], сохраняющий границы объектов, который основан на двойном применении фильтра Гаусса: первый фильтр сглаживает шумы обычным образом при средневзвешенной фильтрации, но второй фильтр используется для определения весов первого.
В итоге на веса фильтра влияет не только расположение пикселей (Евклидово расстояние), но и разница в их интенсивности. Так что для усреднения в большей степени используются те пиксели, интенсивность которых аналогична центральному. За счет этого происходит сохранение краев объектов, ведь пиксели на краях будут иметь большую вариацию интенсивности с соседними.
Фильтр Гаусса применяется путем свертки изображения с фильтром:
1св[х,У] = 1сб[*,У] * С(х,у) = Е^-^Е^-^'сЛ* + +7] • ОДУ), (69)
С(х,у)=—е- 2«2 , (70)
где w, И - ширина и высота изображения в пикселях; к - размер (ширина и высота) окна фильтра в пикселях; а - среднеквадратическое отклонение, влияющее на степень сглаживания.
Этап 3. Повышение качества изображения. Необходим для более устойчивой работы последующих алгоритмов компьютерного зрения за счет нормализации данных. Происходит повышение качества изображения с точки зрения точности последующих этапов. Кроме алгоритмов снижения шума, использованных на этапе 2, применяются методы повышения резкости, контрастности и других свойств изображения, упрощающих их дальнейшую обработку. Эти методы могут существенно повысить качество детектирования объектов, но для ИК-изображений искажают температуры намного сильнее, чем сглаживание шумов. Это необходимо учитывать при итоговом принятии решений, обращаясь к температуре по изначальной термограмме. Для УФ-изображений такая проблема не возникает, если рассматривать снимок в УФ-диапазоне только для анализа разрядной активности объекта мониторинга.
Этап 4 Сегментация изображения. Разделение изображения на связные группы пикселей, удовлетворяющих критерию однородности, например, для выявления областей локального нагрева на ИК-изображениях и локализации разрядной активности на УФ-изображениях. Происходит выявление области интереса на снимках: области повышенных температур на ИК-изображениях или локализации поверхностных частичных разрядов на УФ-изображениях. Выделение требуемых частей: как правило, выделяются либо границы, либо наоборот, области (сегменты). Сегментация ИК-изображения наиболее подходит для локализации областей повышенных температур, но не для распознавания самих объектов целиком, так как менее нагретые участки при сегментации могут быть отделены от более нагретых и не отнесены к объекту. Для УФ-изображений сегментация позволяет локализовать поверхностные частичные разряды на снимке.
Этап 5. Выделение области интереса. Позволяет отсечь области изображения, не представляющие интереса, для сокращения времени на обработку изображения и снижения риска ложноположительных ошибок обнаружения дефектов. В отличие от подобной операции на этапе 1, на этапе 5 выделение области интереса основано не просто на данных о положении камеры и объекта мониторинга в пространстве, но и на обработке данных. Для ИК-изображения
можно отбросить участки с температурой ниже порога участка, причем в этом отношении ИК-изображения удобнее, чем изображения видимого спектра, где отдельные участки фона, например, листва, могут оказаться очень близкими к искомым объектам в пространстве признаков из-за высокой вариативности. Для изображения в УФ-диапазоне интерес представляют только яркие участки, связанные с поверхностными частичными разрядами.
Этап 6. Применение дескрипторов. Дескриптор - вектор признаков, содержащий значимые для распознавания образов оборудования данные по локальной области изображения. Выполняется преобразование пространства признаков с использованием гистограмм ориентированных градиентов (HOG-дескриптор) [221]. Этап необходим, так как яркость группы пикселей не является признаком для дальнейшей обработки. Это позволяет выполнить извлечение значимых признаков и снизить размерность данных. Выбор именно гистограммы направленных градиентов обусловлен геометрическими особенностями образов высоковольтного оборудования на снимках, образующими определенные паттерны именно за счет направленности линий, созданных краями объектов, в частности ребрами изоляторов. Принципиальная схема реализации такого метода приведена на Рисунке 94.
Этап 7. Применение алгоритмов машинного обучения для распознавания образов оборудования. Позволяет решить проблему высокой вариативности графических данных за счет применения разработанного алгоритма кластеризации областей изображения на основе машинного обучения без учителя для непосредственного распознавания образов высоковольтного оборудования и локализации его дефектов. На выбор метода влияет специфика задачи, разрешение и другие показатели качества изображения, объем и состав обучающей выборки, технические ограничения системы, на которой будет внедрено решение (объем памяти, число операций в секунду, возможность применять графические процессоры и т. д.).
Рисунок 94 - Преобразование изображения в пространство признаков на основе
дескрипторов
4.4. Метод обработки радиометрических данных ИК-контроля в
графическом формате
Приведенная унифицированная методика позволяет создавать методы и реализовывать алгоритмическое и программное обеспечения на основе представленных этапов 1-7, выбирая и настраивая детали их реализации в зависимости от состава входных данных, их параметров, решаемых задач и специфики объектов.
Разработан новый гибридный алгоритм распознавания образов высоковольтного оборудования электрических станций и подстанций, с использованием алгоритмов классического компьютерного зрения для выделения геометрических признаков (декомпозиции и анализа) и машинного обучения для
итогового распознавания образов в трансформированном пространстве признаков (синтез).
Выделение признаков, позволяющих распознать образ оборудования, может быть выполнено с помощью детектора границ Кэнни с дополнительным определением углов наклона линий, а поиск областей с преобладанием линий одной ориентации можно реализовать путем сегментации в пространстве полученных границ со значениями углов в каждой точке границы. Опора алгоритма на выделение геометрических признаков, в том числе ребер изоляторов, имеет следующие достоинства: инвариантность к повороту изображения; инвариантность к размеру изображения (до тех пор, пока различимы ребра); инвариантность к яркости и резкости изображения (до тех пор, пока различимы ребра) устойчивость к низкочастотному шуму; интерпретируемость алгоритма и его промежуточных результатов.
Укрупненно алгоритм в виде потоков данных и операций над ними показан на Рисунках 95-98.
Этапы алгоритма приведены ниже.
1. Предобработка и формирование признаков.
1.1. Перевод термограммы в матрицу температур согласно выражению (68).
1.2. Перевод изображения в видимом диапазоне в оттенки серого согласно выражению (65).
1.3. Для устранения мелких дефектов применяется фильтр Гаусса путем свертки изображения с фильтром согласно выражениям (69), (70).
1.4. Применение фильтра Собеля для последующего вычисления углов линий по следующим выражениям:
1бх[*,У] = 1св[х,У] * Сх = Я=-1Е)=-11св[х + Ь.У+Я • Л (71)
Ы*,У] = 1св[х,У] * Су = Е^Е^/св^ + ь,У +]] • £у(и), (72)
Сх =
-1 0 1 -2 0 2 -1 0 1
(73)
Рисунок 95 - Общий укрупненный алгоритм обработки изображений
Gy -
-1 - -1
0 0 0
. 1 КЗ 1
(74)
1.5. Определение углов наклона линий. С помощью полученных фильтром Собеля матриц горизонтальных и вертикальных градиентов можно определить углы градиента в каждой точке изображения:
ISA - atan2(ISx,ISY). (75)
Кроме того, здесь же определяются магнитуды градиентов, необходимые для следующего шага.
¡SM - V& + & . (76)
Оператор Кэнни позволяет обнаруживать границы объектов и их элементов на изображении и выделять их тонкими (толщиной в один пиксель линиями).
!СА- 'Т [^1 х ''1 х 2]
Рисунок 96 - Алгоритм предобработки изображений
1.6. Применение оператора Кэнни для детектирования границ.
Алгоритм Кэнни включает в себя шаги:
1) сглаживание изображения;
2) поиск углов и магнитуд градиентов;
3) подавление не-максимумов, который оставляет только локальные максимумы в качестве границ;
4) применение двойной пороговой фильтрации (если магнитуда градиента выше верхнего порога, он считается частью сильной границы, если ниже - не относящимся к границе, остальные пиксели относятся к промежуточным слабым границам; уточнение пикселей слабых границ (если пиксель из слабой границы
соприкасается с сильной границей, то он относится к сильной границе, иначе подавляется, то есть не относится к границе).
Рисунок 97 - Алгоритм разбиения на блоки и сегментации В данном случае шаги 1, 2 уже выполнены ранее, их результат - матрицы ISA
и Ism.
Хотя оператор Кэнни является одним из наиболее универсальных алгоритмов выделения границ, его результаты зависят от яркости и контрастности изображения. Простой алгоритм определения значений порогов предложен ниже [222]:
lowerthr = max(0; 0,66v), (77)
upperthr = min(255; 1,3v), (78)
Рисунок 98 - Алгоритм совмещения изображений различных спектров, анализа температур и визуализации результатов
где v - медианная яркость исходного изображения. В данной работе медианное значение заменено на среднее, по результатам экспериментального анализа:
v = Vs. (79)
1.7. Определение углов тонких границ. Если использовать найденные углы всех пикселей Isa, то на изображении остается слишком много данных. Еще одной особенностью является нулевой угол, поскольку нулевое значение угла принимают все пиксели фона с нулевым значением магнитуды градиента. Поэтому углы используются только для пикселей, которые отнесены к границам IC(x, y) Ф 0. Кроме того, углы п, 0, 2п или п/2, 3п/2 относятся к одному виду линий, но имеют далекие значения.
Использован следующий алгоритм преобразования значений углов.
Первым шагом делается переход от диапазона 0-2п в диапазон 0-п:
lsA,[x,y]=\'SA[X,I
IsA[x,y] - к, ISA[x,y] > П SA[x,y], Isa ^ к
(80)
В результате, например, угол 270° становится углом 90°, то есть линии, ориентированные преимущественно горизонтально (градиенты вертикальные вверх или вниз) получают близкие значения углов.
Далее необходимо привести линии, направленные преимущественно вертикально (горизонтальные градиенты) к близким углам. Например, угол 175° не должен сильно отличатся от угла 0°. Для этого используется вторая часть преобразования углов, перевод из диапазона 0-п в диапазон 0-7п/8:
IsA**[x,y] —
7п
7п
Isa*У]-~, 1SA*[Х,у] > —
7п
IsA*[x,y], Isa* — 7Т
Данные преобразования показаны на Рисунке 99.
(81)
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.