Методы и алгоритмы интеллектуальной системы распознавания схем железнодорожной автоматики и телемеханики тема диссертации и автореферата по ВАК РФ 05.13.06, кандидат наук Ковалев, Роман Александрович
- Специальность ВАК РФ05.13.06
- Количество страниц 0
Оглавление диссертации кандидат наук Ковалев, Роман Александрович
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. Анализ существующих подходов и решений по переводу принципиальных электрических схем(ПЭС) в электронный вид
1.1. Исследование существующих видов представления ПЭС и постановка задачи перевода в отраслевой формат
1.2. Исследование способов перевода ПЭС в электронный вид и анализ известных методов теории распознавания образов
1.3. Исследование затрат на перевод ПЭС и оценка необходимой скорости перевода в электронный вид
1.4. Постановка задач диссертации
2. Обработка и подготовка к распознаванию различных видов представления ПЭС
2.1. Описание источников и форматов представлений ПЭС ЖАТ для распознавания
2.2. Предобработка исходных изображений. Методы перевода исходных изображений в промежуточный формат
2.3. Поиск точек соединения
2.4. Выводы по разделу
3. Разработка методов и алгоритмов распознавания ПЭС ЖАТ
3.1. Разработка шаблонов элементов ПЭС ЖАТ
3.2. Разработка алгоритма распознавания элементов ПЭС ЖАТ методом шаблонов
3.3. Разработка алгоритма построения связной структуры ПЭС
3.4. Разработка алгоритма поиска блоков
3.5. Выводы по разделу
4. Методы выделения текстовых фрагментов ПЭС
4.1. Классификация графических примитивов по геометрическим параметрам и использование данной информации для распознавания текстовой составляющей ПЭС
4.2. Алгоритм выделения и идентификации текстовых данных ПЭС
4.3. Дополнение шаблона информацией об атрибутах
4.4. Выводы по разделу
5. Разработка программного комплекса распознавания ПЭС и анализ результатов его работы
5.1. Разработка структурной схемы АРМ-РПС
5.2. Разработка программного обеспечения
5.3. Оценка эффективности применения АРМ-РПС
5.4. Выводы по разделу
Заключение
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
СПИСОК ЛИТЕРАТУРЫ
ПРИЛОЖЕНИЕ А. Свидетельства о регистрации программы ЭВМ
ПРИЛОЖЕНИЕ Б. Пример ПЭС первой тестовой группы и результат её распознавания
ПРИЛОЖЕНИЕ В. Пример ПЭС второй тестовой группы и результат её распознавания
ПРИЛОЖЕНИЕ Г. Пример ПЭС третьей тестовой группы и результат её распознавания
Рекомендованный список диссертаций по специальности «Автоматизация и управление технологическими процессами и производствами (по отраслям)», 05.13.06 шифр ВАК
Методы построения специализированных векторизаторов для конструкторской документации электронных средств2010 год, кандидат технических наук Темнов, Кирилл Анатольевич
Синтез объектной нейросетевой модели распознавания образов и её применение в задачах железнодорожной автоматики2013 год, кандидат наук Зуев, Денис Владимирович
Методы, алгоритмы и программные средства построения автоадаптивных шрифтов для аппаратно-программных комплексов обработки и создания неформатных электронных документов2014 год, кандидат наук Чередниченко, Игорь Николаевич
Алгоритмы обработки и анализа символов вейвлет-преобразованием, методом главных компонент и нейронными сетями2014 год, кандидат наук Фан Нгок Хоанг
Анализ и моделирование структуры растровых изображений рукописных математических формул с целью их автоматического распознавания2014 год, кандидат наук Сапаров, Алексей Юрьевич
Введение диссертации (часть автореферата) на тему «Методы и алгоритмы интеллектуальной системы распознавания схем железнодорожной автоматики и телемеханики»
ВВЕДЕНИЕ
Актуальность проблемы. В условиях современного развития компьютерной техники и возможностей программного обеспечения тяжело представить создание технической документации (ТД) вручную на листах бумаги. Однако остаётся необходимость поддерживать, а в некоторых случаях и изменять, системы из недалёкого прошлого, когда ТД создавалась с помощью линеек и карандашей, а типовые схемные решения перерисовывались вручную. Перенос одного проекта в САПР занимает существенное количество человеко-часов и сопровождается внесением ошибок обусловленных человеческим фактором. А пересчёт времени переноса одного проекта на всё множество ТД, хранящихся в данный момент на полках и в виде сканированных документов, способно дать приблизительное представление о реальных трудозатрата перехода на электронный документооборот хозяйства автоматики и телемеханики (АТ). Помочь в этом процессе могут современные методы автоматизации. Одним из наиболее эффективных можно назвать процесс автоматизированного распознавания графики и составления документов на его основе.
Степень разработанности темы. Вопросам создания систем распознавания графики посвящено множество исследований. Существует несколько основных методов распознавания и большое число их модификаций. Точные алгоритмические методы, основанные на анализе контуров изображений, поиске ключевых характеристик изображений и сравнение параметров, вычисляемых по заданным на изображении функциям были исследованы в работах следующих авторов: Ч. Бэббидж, Дж. Вейценбаум, Н. Винер, В. Глушков, Дж. Маккарти, М. Мински, А. Ньюэлл, С. Пейперт, Д. Перл, Г. Поспелов, Д. Поспелов, Ф. Розенблатт, Г. Саймон, П. Уинстон, В. Финн, Н. Хомский, К. Шеннон. Совместно с алгоритмическими методами развивались методы, основанные на использовании нейронных сетей, основным отличием которых является процесс обучения классифицирующего звена системы распознавания вместо описания точного алгоритма. Методы, основанные на нейросетевых моделях, исследованы в научных работах следующих авторов: Ян Лекун, Йошуа Бенджио, Дж. Хинтон, А. Крижевский, И. Сатскевер, М. Цилер, Р. Фергюс, Э. Циссерман, К. Симонян, К. Сегеди, Кайминг Хи, А. Карпати.
Для распознавания изображений предлагается большое число методов и классификаторов, которые не решают задачу создания документа с изначально неизвестной структурой связанных элементов на основе результатов распознавания отдельных частей. В данном случае идёт речь о последовательности процессов сегментации, классификации и поиска логических связей частей распознаваемого документа. Как правило решается задача
поиска на изображении заранее изученных объектов и их дальнейшая классификация. В простом случае метод решает только задачу классификации нормализованных графических объектов. Не известно метода, позволяющего восстановить структуру распознанных объектов документа сложной формы, которую имеет принципиальная электрическая схема (ПЭС) железнодорожной автоматики и телемеханики (ЖАТ). ПЭС ЖАТ относится к классу электрических схем, определение которой из ГОСТ 2.701-2008 приведено ниже.
Электрическая схема - это документ, содержащий в виде условных изображений или обозначений составные части изделия, действующие при помощи электрической энергии, и их взаимосвязи.
Было обнаружено, что реальные изображения элементов ПЭС зачастую отличаются от современных стандартов. Особенно явно это выражено на схемах старых проектов систем ЖАТ, создаваемых вручную, многим из которых уже больше 30 лет. Для успешного распознавания схемной документации требуется учитывать специфику ЖАТ, а именно возраст ТД, состояние носителя, изменения ГОСТ и правил выполнения схемной документации, а также влияния разных проектных институтов и их внутренних стандартов на создание ТД.
Объект исследования. Схемная ТД ЖАТ.
Предмет исследования. Автоматизированное создание электронной объектной модели ПЭС ЖАТ на основании её изображения.
Цель диссертационной работы. Разработка алгоритмов распознавания ПЭС ЖАТ и создание интеллектуальной системы распознавания ПЭС ЖАТ, применения которой возможно при текущем развитии и структуре хозяйства автоматики и телемеханики.
Методы исследований. В ходе исследования использовались методы теории распознавания образов; теория графов; теории вероятностей и математической статистики; методы обработки Больших данных.
В ходе анализа существующих методов была учтена возможность комплексного анализа распознаваемого элемента. Это требование вызвано необходимостью получить в качестве результата не просто классифицированный элемент, но и способ его связи с другими элементами, то есть возможность определения взаимосвязей внутри документа, а также создания его модели. Автором были изучены различные подходы из теории распознавания образов применительно к распознаванию документации ЖАТ, выделены их сильные и слабые стороны и разработан комплексный метод распознавания, учитывающий специфику объекта.
Основные положения, выносимые на защиту:
1. Алгоритм распознавания элементов ПЭС с выделением полюсов и настройкой по метаинформации конкретного распознаваемого элемента ПЭС.
2. Модель шаблона распознавания, включающую описание ключевых графических характеристик элемента ПЭС и специальную метаинформации, используемую алгоритмом распознавания для обработки данного шаблона.
3. Метод идентификации и выделения текстовых выражений ПЭС с возможностью применения систем распознавания символов.
4. Подход к распознаванию ПЭС ЖАТ с применением узкоспециализированных методов для распознавания: блоков, точек пересечения проводов, структуры электрических соединителей ПЭС.
5. Структурная схема системы распознавания ПЭС ЖАТ.
Научная новизна. Предложена новая модель шаблона распознавания, формализующая графическое описание элемента ПЭС, точек соединения с другими элементами ПЭС и расположение текстовых атрибутов, которая позволяет влиять на алгоритм распознавания без переобучения и изменения его описания.
Разработан метод поиска текстовых выражений ПЭС и их классификации в соответствии с атрибутами элементов ПЭС с применением методов кластерного анализа.
Спроектирована структурная схема системы распознавания ПЭС ЖАТ, описывающая полный цикл перевода ТД из исходного изображения растрового формата в электронную объектную модель, которая содержит данные о базисе элементов ПЭС распознаваемого изображения, их электрических связях, точках монтажа и прочих типовых параметрах.
Теоретическая значимость работы. Результаты исследования могут применяться для в системах распознавания изображений сложно-структурированных документов, состоящих из типовых объектов. Разработанный алгоритм распознавания шаблонов и предложенная модель шаблона могут быть использованы в системах, где необходимо приведения различных объектов или отличающихся изображений одного объекта к одному стандарту, что возможно без переобучения или изменения алгоритма распознавания путём объединения групп шаблонов.
Практическая значимость работы. Разработанная программная реализация системы распознавания ПЭС может быть использована для увеличения эффективности перевода ТД в электронный формат ОФТД, официально принятый «ОАО» РЖД.
Относительно простое и интуитивно понятное описание элемента ПЭС в виде набора шаблонов может быть использовано непосредственно оператором распознавания для расширения системы распознавания и анализа результатов её работы, что даёт возможность децентрализованного развития системы распознавания.
Достоверность основных положений диссертационной работы подтверждается аналитическими исследованиями и результатами применения программной реализации разработанных алгоритмов в составе системы распознавания ПЭС ЖАТ.
Публикации по теме работы. По теме диссертации опубликовано 9 научных работ, в том числе 5 в изданиях из перечня ВАК. По теме диссертации зарегистрированы 2 программы для ЭВМ (Приложение А).
Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, четырёх приложений и списка источников из 50 наименования. Во введении обоснована актуальность темы диссертации, сформулирована цель работы, определены научная новизна и значимость полученных результатов, а также положения, выносимые на защиту. В первой главе проведен анализ существующих исследований в области распознавания образов, в том числе анализ возможности использования подходов теории искусственного интеллекта применительно к задаче распознавания ПЭС ЖАТ. Сформулированы характерные особенности ПЭС ЖАТ и её отличия от блоков текста с точки зрения теория распознавания образов. Обозначены нерешённые проблемы связанные с изменением и дополнением систем распознавания, основанных на известных алгоритмах распознавания для случаев специфичных изображений элементов ПЭС ЖАТ. Проведён анализ затрат перевода ТД в электронный вид с использованием текущих средств автоматизации и сделан вывод о необходимости оптимизации процесса перевода ТД. Сформулированы основные задачи диссертации. Во второй главе описаны имеющиеся форматы представления ТД, выбран и обоснован целевой электронный формат ТД для использования в качестве результата распознавания. Рассмотрены основные критерии качества, применяемые к распознаваемому изображению и предложены некоторые методы улучшения исходного качества путём предобработки изображения. Предложено использование промежуточного векторного формата для использования в задаче распознавания элементов и структуры соединителей ПЭС. Рассмотрены точки соединения проводов как отдельный вид элементов ПЭС для решения задачи распознавания. В третьей главе впервые предложена модель шаблона описания элемента ПЭС с учётом его графического описания и специальной метаинформации, необходимой для его распознавания. Разработан алгоритм распознавания шаблонов. Разработан алгоритм построения связной структуры ПЭС на основе результатов распознавания элементов и точек пересечения проводов. Применена теория графов для построения структуры графических элементов промежуточного формата распознаваемой ПЭС, но основании которой решена проблема поиска блоков ПЭС. Разработано описание блоков ПЭС на основании последовательности ¿-образных переходов, которые описывают углы блока. В четвертой главе использованы методы кластерного анализа для решения задачи поиска символов текста ПЭС. Разработан алгоритм составления текстовых выражений ПЭС и предложено дополнение шаблона элемента ПЭС информацией и расположении текстовых атрибутов распознаваемого элемента. В пятой главе представлены экспериментальные результаты проведенных исследований, описаны практические выводы. Описаны детали
построения прототипа автоматизированного рабочего места распознавания принципиальных электрических схем (АРМ-РПС) и предложена структурная схема системы распознавания ПЭС ЖАТ. В заключении приведены полученные в ходе выполнения работы результаты, а также определены перспективы дальнейшей разработки темы диссертации.
1. Анализ существующих подходов и решений по переводу принципиальных электрических схем(ПЭС) в электронный вид
1.1. Исследование существующих видов представления ПЭС и постановка задачи перевода в отраслевой формат
Согласно инструкции по ведению технической документации(ТД) на устройства СЦБ [1] и инструкции на устройства проводной и радио связи, а также пассажирской автоматики [2], техническая документация на действующие системы должна храниться в печатном виде в нескольких копиях. Все изменения в технической документации вносятся в бумажный оригинал и фиксируются с помощью штампов и подписей причастных должностных лиц. ПЭС, как и прочая ТД, попадает под принятую технологию хранения. Изменение ТД должно одновременно сопровождаться внесением соответствующих изменений во все взаимосвязанные документы. Копия технического документа должна быть идентична оригинальному документу. При этом не сложно заметить, что бумажные носители мало пригодны для реализации эффективного документооборота. Их основными недостатками является:
- низкая скорость доступа к информации и её поиска;
- невозможность одновременной работы с одним набором ТД удалённо из нескольких
мест;
- необходимость удалённо согласовывать и проверять актуальность внесённых правок во всех копиях документации;
- необходимость хранения нескольких копий бумажной документации(на рабочем месте, контрольные экземпляры, архив).
При этом до сих пор основным способом работы с ТД является использование бумажных копий. Требуется хранить 3 экземпляра документации в бумажном виде, по экземпляру на ШЧ, службу и архив, а также вести долгий и затратный процесс при необходимости внесения изменений в ТД. Это приводит к большим экономическим тратам.
Не первый год в сфере РЖД проводятся попытки перевода ТД в электронный вид. Электронное представление ТД позволяет реализовать гибкий и быстрый доступ к данным, удобное хранение и возможность внесения изменений без потери качества документа, а при использовании специальных средств разграничения доступа, таких как электронная подпись, электронный формат может обеспечить высокую безопасность и защищённость от
несанкционированного или случайного внесения некорректных изменений. Однако, необходимо различать разные способы электронного представления документов.
На данный момент имеется большое число сканированных документов печатной ТД. Формат такого представления представляет собой растровую графику, которая, хоть и более удобна с точки зрения хранения и передачи, но не позволяет воспользоваться всей мощностью автоматизированных систем проектирования и современных систем ведения документооборота. Растровое изображение — изображение, представляющее собой сетку пикселей — цветных точек (обычно прямоугольных) на мониторе, бумаге и других отображающих устройствах.
Некоторые возможные автоматизации, которые не могут быть применены к такому формату представления документов, приведены ниже:
• упрощённое внесение изменений за счёт использования элементного базиса специализированных систем проектирования;
• возможность автоматизированной сверки и согласования информации внутри одного или нескольких документов;
• возможность отмены изменений и ведение истории;
• возможность синтеза дополнительной информации и использование результатов синтеза для экспертизы;
• поиск и проверка корректности структурных связей элементов в документе;
• поиск типовых решений и проверка на соответствие указаниям.
Более предпочтительным преставлением может служить электронное представление ТД в формате векторной графики.
Векторная графика - способ представления объектов и изображений (формат описания) в компьютерной графике, основанный на математическом описании элементарных геометрических объектов, обычно называемых примитивами, таких как: точки, линии, сплайны, кривые Безье, круги и окружности, многоугольники.
Существенное отличие от растрового представления заключается в упрощённом внесении изменений, за счёт более простого механизма редактирования графики и текста. Такое представление часто используется для наглядного представления информации САПР и её передачи в случаях, когда нет необходимости производить дополнительную работу, связанную с изменением документа. Однако такой формат также не позволяет эффективно реализовать более сложные процессы, такие как описанные выше автоматизации, так как для их реализации недостаточно иметь только графическую составляющую документа.
Ещё одним используемым представлением являются объектные форматы, совмещающие в себе графическую часть и специальную метаинформацию(СМ).
Объектный формат - формат описания документа, состоящий из параметрического описания элементов чертежа и их связей.
Параметрическое описание элемента - описание модели элемента, в состав которой входит графическое изображение и набор параметров модели, специфичных для данного элемента.
Объектный формат способен описать абстракции вида "электрический элемент", "атрибут элемента", "электрическая связь", "штамп", "блок ПЭС" и прочие понятия ТД в виде связанного фрагмента информации, который может быть использован для построения модели описываемого объекта. Объектный формат описывает не просто графическое изображение схемы, но является её моделью, которая содержит данные о используемых элементах, их электрических параметрах, соединении. Такое представление является наиболее полной моделью схемы и может быть использовано для моделирования работы электрической схемы.
Использование объектных форматов в современных системах проектирования является устоявшейся практикой, при этом не существует единого стандарта, используемого различными компаниями - разработчиками САПР.
Текущая ситуация такова, что в России на железных дорогах используются сразу несколько форматов электронного представления документов различных информационных систем создания и ведения ТД. Наиболее популярными являются:
• форматы растровой графики - PNG/JPEG/TIFFи прочие;
• формат векторной графики - SVG;
• закрытые объектные форматы DXF и DWG, используемые информационный системой(ИС) АШоСАОот Autodesk;
• набор векторных форматов Microsoft -VSD/VSS/VST/VDX/VSX/VTX/VSL/VSDX/VSDM и прочие форматы ИС, не предназначенных специально для ведения ТД ЖАТ, но способные при использовании дополнительных надстроек описывать специфику ТД ЖАТ;
• объектные форматы специализированных систем проектирования, таких как разработанный в ПГУПС графический редактор схем автоматики(ГРАС)[3] или формат САПР устройств ЖАТ ОАО "Росжелдорпроект" КАСПР;
• объектные форматы специально разработанные для унификации представления ТД, такие как ОФТД-СЦБ, разработанный для представления ТД СЦБ РЖД, являющийся форматом АРМ ВТД(ПТД)[4].
Такое разнообразие форматов привело к тому, что усилия потраченные на перевод документации в электронный вид не решили поставленной задачи перехода на электронный документооборот в полной мере. Исправить ситуацию позволит использование унифицированного набора форматов ТД и создание конверторов для данного набора. В распоряжении ОАО "РЖД"[5] указывается возможность использования двух редактируемых форматов: ОФТД и КАСПР. На данный момент для формата КАСПР разработан конвертер в формат ОФТД.
В данной работе ставится задача перевода имеющейся на РЖД схемной ТД по системам ЖАТ в ОФТД, как принятый ОАО "РЖД" формат представления ТД.
Формат ОФТД - объектный отраслевой формат технической документации, основанный на представлении в виде XML, описывающий элементы ЖАТ, их связи и параметры.
Распознавание изображений ПЭС из растрового формата в формат ОФТД является основной задачей, поставленной в данном исследовании. Это решит проблему унификации схемной ТД в РЖД и позволит использовать все возможности современных средств ведения ТД, такие как:
• моделирование электрических схем;
• анализ структурных соединений и поиск типовых проектных решений;
• анализ несвязанных элементов и "висящих" выводов;
• сверка с другими видами ТД внутри проекта(монтажные карточки).
Документ в формате ОФТД содержит информацию о составе и структуре определённой схемы ЖАТ. Данные о видах элементов и их возможные параметры задаются в специальных библиотеках, составленных вручную для используемого базиса элементов. На данный момент существует библиотеки для всех основных элементов ПЭС и база данных коллективного пользования (БДКП) "Оборудование", содержащая возможные параметры элементов ЖАТ.
БДКП "Оборудование" - база данных параметров электрических элементов системы АСУ-Ш.
Используя формат ОФТД, специальные библиотеки и БДКП можно создавать унифицированную схемную документацию ЖАТ. Пример фрагмента библиотеки реле приведён на Рисунке 1.1.
Рисунок 1.1. Фрагмент библиотеки элементов типа Реле.
1.2. Исследование способов перевода ПЭС в электронный вид и анализ известных методов теории распознавания образов
Проблема перевода бумажных документов в электронный вид не является новой и существует множество исследований в этой области. ТД, в том числе ПЭС, можно отнести к печатным текстовым документам со сложной внутренней структурой. Анализ известных способов перевода бумажных документов в электронный вид является неотъемлемой частью процесса создания новой системы перевода ТД. В данном разделе будут освещены наиболее известные и практически значимые идеи в этой сфере.
Методы распознавания статической графики, к которой относятся символы различных алфавитов, численные значения, знаки пунктуации и прочая условные обозначения, решают задачу разделения входного набора на классы по существенным признакам.
Рассмотрим, к примеру, двухполюсник на Рисунке 1.2. С точки зрения теории распознавания простой двухполюсник, если он имеет своё уникальное изображение, можно выделить в отдельный класс многими методами, как математически точными, так и вероятностными. Однако, чтобы отнести его к общему классу двухполюсников, в который входят и другие элементы, к примеру конденсатор на Рисунке 1.3, необходимо провести дополнительный анализа, основанный на информации о структуре элемента не представленной графически. Это первая сложность при решении задачи распознавания образов применительно к ПЭС. Сформулировать её можно следующим образом - элементы ПЭС содержат информацию, не выраженную графически, которая требует дополнительного анализа. Печатные символы, в отличии от элементов ПЭС, нет необходимости разделять на отдельные классы по принципу связи с другими символами, а рукописный символы текста при распознавании условно можно считать двухполюсниками, т.е. соединёнными с соседними символами двумя связями.
Важность разделения по принципу количества полюсов(в дальнейшем точек соединения) становится очевидной при рассмотрении не отдельных элементов ПЭС, а их соединений. К примеру, рассмотрим текстовые выражения, состоящее из нескольких символов-букв на Рисунке 1.4.
На Рисунке 1.4 каждый символ-буква находится внутри окружности, которая связанна с другими окружностями закрашенными точками. Сложно представить ситуацию, когда какой-либо символ выражения содержит больше двух точек соединения (Рисунок 1.5.), однако такое
возможно, но при решении задач распознавания текста обычно является частным случаем нестандартного составления выражений или составных символов и анализируется отдельными методами.
Фрагмент ПЭС на Рисунке 1.6 показывает важность определения точек соединения элементов. На Рисунке 1.6 элементы ПЭС выделены зелёным цветом. Структура фрагмента такова, что, в отличие от текстовых выражений, нельзя последовательно связать каждый следующий элемент ПЭС с одним предыдущем. Последовательность связей не является существенной, так как неважно какой элемент идёт первый в цепочке, а какой последний. Это делает затруднительным семантический анализ распознаваемой структуры.
нь
Рисунок 1.2. Двухполюсник 1.
Рисунок 1.3. Двухполюсник 2.
Рисунок 1.4. Текстовые выражения.
Рисунок 1.5. Ошибочная связь текстовых выражений.
Рисунок 1.6. Фрагмент ПЭС.
С точки зрения теории распознавания образов, графический объект, которым является изображение ПЭС, можно рассматривать как функцию /(х, у)на плоскости. Функция f выражает в каждой точке изображения его определённую характеристику. Если переводить изображения ПЭС в монохромный вид, то такой характеристикой выступает яркость точки изображения в количественном отношении, а если рассматривать частный случай - бинарное изображение, то функция / может быть равна 1 для закрашенной точки или 0 для фона. В этом описании изображение ПЭС идентично изображению текста. Однако, существенным является
содержимое ПЭС и, как было показано выше, его отличие от блоков текста. Структурные связи внутри ПЭС и влияние расположения элементов ПЭС на расположение прочей информации, такой как атрибуты элементов ПЭС, сводит ПЭС к сложно структурированной графической структуре. После выделения отдельного элемента ПЭС, безусловно, его функция /(х,у) может быть использована для его классификации любым из известных для распознавания образов методом, к примеру с помощью сравнения функции f с заранее заданными функциями, исследованием свойств контура элемента или с использованием искусственных нейронных сетей. Таким образом, при распознавании будем рассматривать изображение ПЭС как структуру типовых элементов со свободными связями.
Определение 2. Распознавание ПЭС - процесс извлечения типовых элементов ПЭС, электрических связей и текстовых данных из изображения ПЭС.
Основными особенностями схемной документации хозяйства ЖАТ является:
• разнообразие начертаний элементов ПЭС, вызванное продолжительным периодом ввода в эксплуатацию систем автоматики, переходом от ручного создания схемной документации к электронному способу, сменной ГОСТ и вводом новых правил создания чертежей, а также участием в создании проектов ЖАТ множества проектных институтов;
Похожие диссертационные работы по специальности «Автоматизация и управление технологическими процессами и производствами (по отраслям)», 05.13.06 шифр ВАК
Методология семантического анализа и поиска графической информации2018 год, доктор наук Кучуганов Александр Валерьевич
Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения2010 год, кандидат физико-математических наук Сорокин, Андрей Игоревич
Методика распознавания древнерусских скорописных текстов2011 год, кандидат технических наук Зеленцов, Иван Анатольевич
Численные методы детектирования и исправления геометрических искажений в изображениях текстовых документов2010 год, кандидат физико-математических наук Масалович, Антон Андреевич
Устройство распознавания изображений текстовых знаков по энтропийным характеристикам2004 год, кандидат технических наук Бородин, Михаил Владимирович
Список литературы диссертационного исследования кандидат наук Ковалев, Роман Александрович, 2018 год
СПИСОК ЛИТЕРАТУРЫ
1. Инструкция по ведению технической документации железнодорожной автоматики и телемеханики // Распоряжение ОАО "РЖД" № 2080р -2015.
2. Инструкция по содержанию технической документации на устройства проводной связи, радио связи и пассажирской автоматики // ЦШ/1- М: Транспорт- 1999.
3. Василенко М.Н., Трохов В.Г., Марфин М.И. АРМ по ведению технической документации // АСИ №4- 1999.-C. 32-34.
4. Трохов В.Г., Кожевников А.В., Салихов С.В., Погребняк А.Б. Формат хранения и структура данных АРМ ВТД(ПТД) // АИиС №3-2002.-C 16-19.
5. Об утверждении графических форматов технической документации на устройства железнодорожной автоматики и телемеханики // Распоряжение ОАО "РЖД" № 1299р -2013.
6. Хайкин С. Нейронные сети: полный курс 2-е изд. // М.: Вильямс, 2006. — 1104 с. — ISBN 0-13-273350-1.
7. Каллан Р. Основные концепции нейронных сетей // М.: Вильямс, 2001 -288 c. — ISBN 5-8459-0210-Х.
8. J. J. Hopfield. Neural networks and physical systems with emergent collective computational abilities // Proceedings of National Academy of Sciences, 1982, С. vol. 79 №. 8, 2554—2558.
9. Y. LeCun, B. Boser, J. S. Denker, D. Henderson, R. E. Howard, W. Hubbard and L. D. Jackel: Backpropagation Applied to Handwritten Zip Code Recognition // Neural Computation 1(4), 1989, 541-551.
10. Hastie, Trevor, Robert Tibshirani, Friedman, Jerome (2009). The Elements of Statistical Learning: Data mining, Inference, and Prediction. New York: Springer. pp. 485-586. ISBN 978-0387-84857-0.
11. Wong R. Y., Hall E. L. Scene Matching with Invariant Moments // Computer Graphics and Image Processing. — 1978. — Vol. 9, No 8. —16-24.
12. Paula Viola, Mickael Jones. Rapid object detection using a boosted cascade of simple features // Conference on Computer Vision and Pattern Recognition, 2001
13. Mayank Chauha and Mukesh Sakle. Study & Analysis of Different Face Detection Techniques // International Journal of Computer Science and Information Technologies, Vol. 5 (2), 2014, 1615-1618.
14. Monali Chaudhari, Shanta sondur, Gauresh Vanjare. A review on Face Detection and study of Viola Jones method // International Journal of Computer Trends and Technology (IJCTT), 2015, 5859.
15. Zhou, Zhihua. On the doubt about margin explanation of boosting (PDF) // Artificial Intelligence Journal. 203(2013): arXiv:1009.3613, 1-18.
16. Roberts L.G. Machine perception of three-dimensional solids. // MIT Lincoln Laboratory, Technical Report No 315, May 22, 1963.
17. Sobel I.E. Camera Models and Machine Perception. // Ph.D. Thesis. Palo Alto, Calif., Stanford University, 1970.
18. Anil K. Jain. Fundamentals of digital image processing. 1st edition // ISBN 0-12-336165-9, 351-352.
19. Canny J. A Computational Approach for Edge Detection // IEEE Trans. Pattern An. Machine Intelligence, 1986, vol. 8, no. 6, 679-698.
20. Anil K. Jain. Fundamentals of digital image processing. 1st edition // ISBN 0-12-336165-9, 357-362.
21. Richard O. Duda, Peter E. Hart, David G. Stork. Pattern classification(2nd edition) // Wiley, New York, 2001, ISBN 0-471-05669-3.
22. R. Brunelli. Template Matching Techniques in Computer Vision: Theory and Practice // Wiley, 2009, ISBN 978-0-470-51706-2.
23. Janne Koljonen, Jarmo T. Alander. Genetic algorithm for optimizing fuzzy image pattern matching // Department of Electrical Engineering and Automation, University of Vaasa P.O. Box 700, FIN-65101, Vaasa, Finland, 2006.
24. Ожигин Денис, NANOCAD 4.5: РАСТРОВОЕ РЕДАКТИРОВАНИЕ // САПР И ГРАФИКА Издательство: КомпьютерПресс (Москва) ISSN: 1560-4640
25. БурсианЕ.Ю. Методы и средства распознавания технологических карт систем железнодорожной автоматики// заседание диссертационного совета Д218.008.02ПГУПС- 2009.
26.Maher Ahmed, Rabab Kreidieh Ward. An expert system for general symbol recognition. // Pattern Recognition 33 journal, 1999.
27. A. Hamada. A new system for the analysis of schematic diagrams. In Proceedings of the Second International Conference on Document Analysis and Recognition. // IEEE Comput. Soc. Press ICDAR'93, 1993.,369-372.
28. Погребняк А.Б.Методы и технологии построения специализированного информационного обеспечения систем железнодорожной автоматики. // заседание диссертационного совета Д218.008.02ПГУПС-19.06.2003 г.
29. Тележенко Т.А. Методы и алгоритмы сокращения ошибок проектов железнодорожной автоматики и телемеханики. // заседание диссертационного совета Д218.008.02ПГУПС-13.11.2009 г.
30. Володина О. СЕТЕВЫЕ СОВЕЩАНИЯ В САНКТ-ПЕТЕРБУРГЕ // АСИ, Российские железные дороги (Москва), ISSN: 0005-2329, 2012г. N 1, 46-47
31. Aleksas Riskus, Giedrius Liutkus. An Improved Algorithm for the Approximation of a Cubic Bezier Curve and its Application for Approximating Quadratic Bezier //ISSN 1392-124X, 2013.
32. T. Y. Zhang, C. Y. Suen.A Fast Parallel Algorithm for Thinning Digital Pattern.// Communications of the ACM Volume 27 Issue 3, 1984., 236-239.
33. Stratonovich, R.L. On the theory of optimal non-linear filtering of random functions. // Theory of Probability and its Applications, 1959., 223—225.
34. Kalman, R.E. A new approach to linear filtering and prediction problems. //Journal of Basic Engineering 82 (1), 1960., 35—45.
35. Cleveland, William S. Robust Locally Weighted Regression and Smoothing Scatterplots. // Journal of the American Statistical Association. 74 (368), 1979., 829-836.
36. Nobuyuki Otsu. A threshold selection method from gray-level histograms. // IEEE Trans. VOL. SMC-9, NO. 1,1979., 62-66.
37. D. Bradley, G. Roth. Adaptive Thresholding Using the Integral Image. // Journal of Graphics Tools. Volume 12, Issue 2., 2007.
38. Webster's New Word Dictionary of Computer Terms, 4th Ed, Prentice Hall, 1992.
39. Дж. Макконелл, Основы современных алгоритмов, М.: «Техносфера», 2004, С. 10-11.
40. Don Lancaster. Approximating a Circle or an Ellipse Using Four Bezier Cubic Splines. // Synergetics Box 809, Thatcher, AZ 85552, 2005.
41. Зуев Д.В., Седых Д.В., Салихов С В., Ковалев Р.А. ВЕКТОРИЗАТОР РАСТРОВЫХ ЧЕРТЕЖЕЙ (РАСТЕРГРАФ) // Программы для ЭВМ. Базы данных. Топологии интегральных микросхем. 2016. № 11. С. 1.
42. Hoshen, J.; Kopelman, R. Percolation and cluster distribution. I. Cluster multiple labeling technique and critical concentration algorithm // Physical Review(B): 14 (8), 1976, 3438-3445
43. S. Edelman. Computational theories of object recognition. //University of Sussex Falmer, Brighton BN1 9QH, UK. 1997., 4-8.
44. ГОСТ 2.701-84. ЕСКД. Схемы. Виды и типы. Общие требования к выполнению. // М.:Изд-во стандартов, 1984.,15.
45. Itoh, Koichi, Ohno, Yoshio. A curve fitting algorithm for character fonts. // Electronic Publishing6 (3), 1993, 195-205.
46. Василенко М.Н., Ковалев Р.А. Метод выделения структуры принципиальной электрической схемы железнодорожной автоматики и телемеханики при распознавании печатной документации // Автоматика на транспорте. 2017. Т. 3. № 1, 88-97.
47. ГОСТ 2.702-75 // УДК 755.43:621, 3.062:006.354, переиздание(октябрь 1986 г.) с изменениями №1, 2, утверждёнными в феврале 1980 г., августе 1985 г. (ИУС №4-80, 11-85), 1819
48. Зуев Д.В.Синтез объектной нейросетевой модели распознавания образов и её применение в задачах железнодорожной автоматики //Диссертационная работа на соискание степени кандидата технических наук, ПГУПС,2013.
49. T. Landauer, P. W. Foltz, D. Laham. Introduction to Latent Semantic Analysis. // Discourse Processes 25, 1998., 259-284.
50. M. Ester, Hans-Peter Kriegel, Jörg Sander, Xiaowei Xu. A density-based algorithm for discovering clusters in large spatial databases with noise. // Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD-96). AAAI Press, 1996., 226-231.
51. Василенко М.Н., Ковалев Р.А. Методы выделения текстовых выражений принципиальных электрических схем железнодорожной автоматики и телемеханики // Автоматика на транспорте. 2016. Т. 2. № 4, 540-551.
52. Матушев А.А., Седых Д.В. Распознавание структуры монтажных схем жат // Автоматика, Связь, Информатика. 10 номер, 2015, 4-7.
53. Василенко М.Н., Белоусов А.В., Ковалев Р.А. Автоматизация синтеза и редактирования таблицы зависимости положения стрелок и сигналов // Автоматика, связь, информатика. 2014. № 6. С. 9-12.
54. Ковалёв Р.А. Описание алгоритма поиска маршрутов при синтезе таблиц взаимозависимостей по схематическому плану станции // Известия Петербургского университета путей сообщения. 2014. № 4 (41). С. 40-44.
55. Гордон М.А., Ковалев Р.А., Седых Д.В. Технология автоматизированного синтеза таблицы зависимости положения стрелок и показаний светофоров // В сборнике: Транспортные интеллектуальные системы 2017. С. 261-268.
56. Василенко М.Н., Гордон М.А., Ковалев Р.А., Седых Д.В. Автоматизация составления таблиц маршрутов // Автоматика, связь, информатика. 2017. № 5. С. 16-20.
57. Василенко М.Н., Ковалев Р.А. Метод выделения структуры принципиальной электрической схемы железнодорожной автоматики и телемеханики при распознавании печатной документации // Автоматика на транспорте. 2017. Т. 3. № 1. С. 88-97.
58. Василенко М.Н., Гордон М.А., Ковалев Р.А., Седых Д.В. Автоматический синтез таблиц дополнительного замыкания стрелок, контактной сети и проверки негабаритностей // Вестник Ростовского государственного университета путей сообщения. 2017. № 3. С. 53-60.
59. Василенко М.Н., Гордон М.А., Ковалев Р.А., Седых Д.В. Автоматизация составления дополнительных таблиц зависимости // Автоматика, связь, информатика. 2017. № 8. С. 5-9.
ПРИЛОЖЕНИЕ А. Свидетельства о регистрации программы ЭВМ.
РОССИЙСКАЯ ФЕДЕРАЦИЯ
RU 2016613648
ФЕДЕРАЛЬНАЯ СЛУЖБА ПО ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ
ГОСУДАРСТВЕННАЯ РЕГИСТРАЦИЯ ПРОГРАММЫ ДЛЯ ЭВМ
Номер регистрации (свидетельства): 2016613648
Дата регистрации: 01.04.2016
Номер и дата поступления заявки: 2016611068 12.02.2016
Дата публикации: 20.04.2016
Авторы:
Зуев Денис Владимирович (ЕШ), Салихов Сергей Вакильевич (1Ш), Ковалев Роман Александрович (ИЦ)
11равообладатель:
Открытое акционерное общество «Российские железные дороги» (К11)
Название программы для ЭВМ:
Модуль распознавания принципиальных электрических схем Реферат:
Программа предназначена для автоматизированного перевода в электронный вид монтажной документации на устройства железнодорожной автоматики и телемеханики с бумажных носителей или растровых изображений и используется в «Аппаратно-программном комплексе автоматизированного рабочего места по переводу принципиальных и монтажных схем в электронный вид». Объектами автоматизации являются отделы технической документации дистанции СЦБ, а также отдельные рабочие места лиц, занимающихся переносом монтажной технической документации из бумажного вида в электронный. Программа обеспечивает выполнение следующих функций: сканирование монтажной схемы; адаптацию принципиальной электрической схемы для распознавания; интерактивное задание опций и метрик распознавания; автоматическое распознавание элементов и надписей принципиальных электрических схем; интерактивную сверку результата распознавания с оригиналом и внесение коррективов; выгрузку результата распознавания в ОФ-ТД СЦБ.
Тин реализующей ЭВМ: IBM РС-совмест. ПК
Язык программирования: С# 3.5
Вид и версия операционной системы: Windows XP/Vista/7/8 Объем программы для ЭВМ: 20,89 Мб
ПРИЛОЖЕНИЕ Б. Пример ПЭС первой тестовой группы и результат её распознавания.
НЕ УКАЗАН НОМЕР ТРОИНИКА И МОНТАЖНЫЙ АДРЕС
СПБ
63-144 4ВЖ
23-75 113ПК
14Ш29
СПБ
22
16Ш-24
72-172 2НСН2
~4р-г
51
71Б5-4
42
■<- т- с^
¿¿¿г
со со см 21-118 XXX
НВ1ИП
52
53
71
23-143
719ПК
"1_Г
72
73
23-53 11113ПК
52 -1-
СМБ
21-141 17КС
21-114 17КПШ
2^4
51 42
"1
41
53
23-75 113ПК
23-135 ВПК
©=
НМШТ-1800 72_ 71
23-143 719ПК
23-53
Г-. со Ш X
21-148
11113ПК "" 11КС
СМБ
6Ш-15
НМШМ1-700
СМБ
22-111 нлопви
НМШМ2-1500
х х
82
11-25 481
1_Г
22
X
22-112 ндпви
СПБ
81
22-111 НЛОПВИ
¡2Т
.7з
СПБ
21-114 17КПИ
43-11
217 2П
П-62
СМБ
51-93 1БКПИ
2 4
НМШТ-1800 72_ 71
ТЛ
53-36 1531
СПБ
"7 Т ^ I
CD M" СО I СМ CM СМ СМ XXX СМ -=г СМ
см ^г см
12
'11
53-37 М15ВС
22
'21
М15ВС
22-33 15ПК
43ВП
СМБ
61
41
«э-
42
43
21
22
22-113 45ВП
СМБ
21
22
см со сп
со
со <м (М
см Т 1
L см
(М (М
см
217 1П
П-62
42-11
217 ЗП
П-62
42-13
217 БП
П-62
СМБ
ОТСУТСТВУЮТ МОНТАЖНЫЕ АДРЕСА М19ВС М170С М17ВС М15ВС 44ВП 41ВП 43ВП
Чертеж заимстован с чертежа инв No- 28-98 Ш4-8
РП 2
ПРИЛОЖЕНИЕ В. Пример ПЭС второй тестовой группы и результат её распознавания.
ПРИЛОЖЕНИЕ Г. Пример ПЭС третьей тестовой группы и результат её распознавания.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.