Анализ контурных изображений с использованием формализма оптики спиральных пучков тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат наук Кишкин Сергей Александрович
- Специальность ВАК РФ05.13.18
- Количество страниц 116
Оглавление диссертации кандидат наук Кишкин Сергей Александрович
ВВЕДЕНИЕ
ГЛАВА 1. Обзор предметной области исследований - теории распознавания образов. Основные понятия теории спиральных пучков света
1.1 Значение, роль и место теории распознавания образов, машинного зрения и контурного анализа в иерархии научных дисциплин. Общая структурная схема системы распознавания изображений
1.2 Основные понятия теории спиральных пучков света
Выводы
ГЛАВА 2. Построение математической модели процесса распознавания
контура границы объекта на основе формализма оптики спиральных пучков
света
2.1 Формализация процедур контурного анализа
2.1.1 Способы задания контуров как объектов на плоскости
2.1.2 Метрика на множестве контуров. Разграничение контуров на эталонные и подвергаемые распознаванию
2.1.3 Классические сложности контурного анализа
2.2 Математический аппарат спиральных пучков света
2.2.1 Интегральное преобразование спиральных пучков
2.2.2 Способы представления комплексной амплитуды спирального пучка
2.2.3 Влияние выбора начальной точки на контуре, сдвига контура и его поворота в плоскости распознавания на спиральный пучок
2.2.4 Взаимный масштаб контуров, условие квантования спиральных пучков и их детализация
2.2.5 Функция перекрытия интенсивностей спиральных пучков. Перенормировка базиса
2.3 Постановка и решение задачи распознавания контура объекта
2.3.1 Сравнение двух контуров при отсутствии на них шумовых дефектов
2.3.2 Введение в рассмотрение «шумов» - деформаций контура. Поведение нулей комплексной амплитуды и коэффициентов разложения по базису
2.3.3 Сравнение двух контуров при наличии шумовых дефектов
2.3.4 Процесс распознавания - поиска по множеству эталонных контуров. Элементы теории принятия решений
Выводы
ГЛАВА 3. Разработка численных методов для реализации предложенной математической модели на средствах вычислительной техники
3.1 Способы представления спиральных пучков света с точки зрения средств вычислительной техники. Выработка допущений и ограничений
3.2 Оценка затрат вычислительных ресурсов предложенного способа
3.3 Переход от комплексных амплитуд к коэффициентам разложения спиральных
пучков света
3.3.1 Получение явных выражений для коэффициентов разложения
3.3.2 Корректность перехода от рядов к суммам. Эмпирический критерий количества коэффициентов разложения
3.3.3 Функция перекрытия интенсивностей при изложении в терминах коэффициентов разложения
3.3.4 Развитие предложенного подхода по распознаванию контуров посредством формализма спиральных пучков света
Выводы
ГЛАВА 4. Разработка программного комплекса распознавания контурных изображений
4.1 Требования, выдвигаемые к разрабатываемому комплексу. Обоснование выбора инструментов. Структура проекта
4.2 Особенности применения комплексной арифметики языка С++
4.3 Использование технологии ОрепСЬ для задействования ресурсов высокопроизводительных комплексов гетерогенных вычислений
4.4 Результаты разработки программного комплекса. Замеры производительности
Выводы
ГЛАВА 5. Обзор сравнительных достоинств и недостатков разработанного
метода распознавания
5.1 Анализ с использованием Фурье-дескрипторов
5.2 Анализ с использованием корреляционных функций
5.3 Анализ с использованием нейронных сетей
Выводы
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Многомерный гиперкомплексный контурный анализ и его приложения к обработке изображений и сигналов2004 год, доктор физико-математических наук Леухин, Анатолий Николаевич
Методы и алгоритмы селекции контурных изображений деталей машин2021 год, кандидат наук Торопчин Дмитрий Анатольевич
Распознавание видеоизображений объектов заданной формы на основе анализа их контуров2014 год, кандидат наук Охотников, Сергей Аркадьевич
Обнаружение и анализ объектов на бинарных изображениях с использованием модификаций расстояния Хаусдорфа и полигональной аппроксимации контуров2009 год, кандидат технических наук Хмелёв, Ростислав Викторович
Синтез и анализ систем распознавания изображений групповых точечных объектов с оценкой их потенциальной помехоустойчивости2007 год, доктор технических наук Роженцов, Алексей Аркадьевич
Введение диссертации (часть автореферата) на тему «Анализ контурных изображений с использованием формализма оптики спиральных пучков»
ВВЕДЕНИЕ
Актуальность темы: Тематика распознавания образов - не нова, поскольку была впервые затронута в 50-х годах XX века при возникновении задач машинного обучения. Тем не менее, за почти 70-летнюю историю, до настоящего времени не появилось единой строгой теории распознавания образов. Прежде всего это связано с крайне большим разнообразием прикладных задач, возникающих на современном этапе развития средств вычислительной техники. Это приводит к созданию разрозненных методов распознавания, каждый из которых отвечает лишь узкому классу задач. Вполне вероятно, что в будущем будет создана общая теория распознавания образов, но на настоящий момент ее развитие идет путем накопления самых разных подходов, поэтому разработка новых методов распознавания является актуальной задачей.
Объект исследования: Процедуры машинного зрения, используемые для обработки изображений и видеопотоков на средствах вычислительной техники.
Предмет исследования: Математические модели, численные методы и программные решения в области контурного анализа, применяемые для реализации процедур машинного зрения.
Цель исследования: Расширение границ контурного анализа за счет введения в рассмотрение новых способов обработки информации, представленной в графической форме.
Главная задача исследования: Разработка метода анализа контурных изображений на основе формализма оптики спиральных пучков, а также его программно-аппаратная реализация на средствах вычислительной техники.
Частные задачи исследования:
1. Анализ существующих решений в области распознавания образов, машинного зрения и контурного анализа. Изучение аппарата оптики спиральных пучков света на предмет возможности развития нового прикладного направления - обработки графических данных в рамках контурного анализа.
2. Построение математической модели процесса сравнения контуров границ объектов на основе формализма оптики спиральных пучков света.
3. Разработка численных методов, позволяющих реализовать предложенную математическую модель на средствах вычислительной техники.
4. Разработка программного комплекса распознавания контурных изображений на языке С/С++/ОрепСЬ.
5. Проведение сравнительного анализа с известными методами контурного анализа на качественном уровне.
Теоретической и методологической основой диссертационной работы являются разработки отечественных и зарубежных ученых в области распознавания образов, машинного зрения, контурного анализа. К таковым можно отнести В.Н. Вапника, А.Я. Червоненкиса, Ю.В. Визильтера, Я.А. Фурмана, Р.Л. Косгрифа, Д. Марра, Р. Гонсалеса, Р. Вудса, Ж. Понса, Д.А. Форсайта. Неоценимую роль при изучении физической картины мира сыграли работы В.Г. Волостникова, Е.Г. Абрамочкина, М.А. Леонтовича, В.А. Фока, Б.Я. Зельдовича, М.В. Ная, Дж.Ф. Берри, а при математическом изложении полученных результатов - фундаментальные монографии Г.М. Фихтенгольца, А.Н. Колмогорова, М.А. Лаврентьева, Б.В. Шабата.
Информационную базу составляют монографические работы, материалы научно-технических конференций, объекты интеллектуальной собственности, статьи в периодических изданиях и научных сборниках по исследуемой проблеме.
Научная новизна работы состоит в решении задач по получению нового метода анализа контурных изображений, за счет введения в рассмотрение формализма оптики спиральных пучков света.
Основные положения, выносимые на защиту:
- математическая модель процедуры сравнения контуров, позволяющая определять их меру схожести с использованием формализма оптики спиральных пучков света;
- численные методы, позволяющие реализовать процедуру сравнения контуров с использованием существующих средств вычислительной техники;
- разработанный программный комплекс распознавания контурных изображений, демонстрирующий работоспособность предлагаемого метода распознавания на модельных задачах и возможность его реализации в существующих системах машинного зрения;
Практическая значимость и реализация результатов работы:
- результаты работы реализованы в виде программно-аппаратного комплекса распознавания контурных изображений на базе портативной персональной ЭВМ, на что получено свидетельство о государственной регистрации программы для ЭВМ (см. приложение А);
- практическая значимость работы состоит в возможности переноса полученных разработок с модельной задачи распознавания на случай реально существующих прикладных систем машинного зрения;
Апробация работы: Основные положения и результаты диссертационной работы представлялись и докладывались на следующих научно-практических конференциях и семинарах:
I - III, VI Международные конференции по фотонике и информационной оптике: Научно-исследовательский ядерный университет «МИФИ» (2012-2014, 2017 гг.);
X - XVI Всероссийские молодежные Самарские конкурсы-конференции научных работ по оптике и лазерной физике: Самарский филиал Физического института им. П.Н. Лебедева РАН (2012-2018 гг.);
XIV, XV Школы молодых ученых «Актуальные проблемы физики»: Физический институт им. П.Н. Лебедева РАН (2012, 2014 гг.);
V, VI Всероссийские молодежные конференции по фундаментальным и инновационным вопросам современной физики: Физический институт им. П.Н. Лебедева РАН (2013, 2015 гг.);
2013 International Conference on Advanced Optoelectronics and Lasers: Sudak, Ukraine (2013 г.);
20th International Conference on Applied Physics of Condensed Matter: Slovak Republic (2014 г.);
10th International Conference on Photonics of Nano- and Bio-Structures: Vladivostok, Russia (2015 г.);
XV Всероссийская школа-семинар «Волны-2015» им. А.П. Сухорукова: Московский государственный университет (2015 г.);
V Международная конференция и молодежная школа «Информационные технологии и нанотехнологии»: Самарский национальный исследовательский университет им. академика С.П. Королева (2019 г.);
Optics and Photonics International Congress: Yokohama, Japan (2019 г.)
Достоверность результатов работы обеспечивается выбором математического аппарата для решения задачи распознавания изображений и последующим его корректным применением; строго формализованными доказательствами работоспособности предлагаемого метода; данными, полученными в ходе разработки и применения программно-аппаратного комплекса распознавания контурных изображений, а также сравнением с аналогичными результатами, полученными другими авторами.
Публикации. По теме диссертации опубликовано 24 печатных работы: 9 работ (4 тезиса и 5 статьей) в рецензируемых изданиях, из которых 1 работа попадает в перечень журналов, рекомендованных ВАК, 8 индексируется в
Scopus, из них 4 - в Web of Science; 15 работ (тезисов и статей) в нерецензируемых изданиях (сборниках по результатам работы конференций). Полный список трудов приведен в приложении Б.
Объем и структура диссертации. Диссертационная работа состоит из введения, 5 глав, заключения, списка использованных источников и
4 приложений. Содержит 104 стр. машинописного текста, 37 рисунков и
5 таблиц. Библиография включает 62 наименования на 3 стр. Приложения на 9 стр.
Личный вклад. Автором самостоятельно предложена математическая модель процедуры сравнения контуров на основе формализма оптики спиральных пучков света; разработаны численные методы для реализации предложенной процедуры на средствах вычислительной техники; написана часть исходных кодов в программно-аппаратном комплексе распознавания контурных изображений, отвечающая за вычислительные модули приложения; произведен сравнительный анализ с существующими методами контурного анализа.
ГЛАВА 1. ОБЗОР ПРЕДМЕТНОЙ ОБЛАСТИ ИССЛЕДОВАНИЙ -ТЕОРИИ РАСПОЗНАВАНИЯ ОБРАЗОВ. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ СПИРАЛЬНЫХ ПУЧКОВ СВЕТА
В настоящей главе дается обзор предметной области исследований, затрагивающей теорию распознаванию образов, техническое зрение и контурный анализ. Описывается общая структурная схема системы распознавания объекта на изображении, выделяются ее ключевые элементы. Рассматривается один из разделов когерентной оптики - теория спиральных пучков света, на математическом формализме которых строится новый метод анализа контурных изображений.
1.1 Значение, роль и место теории распознавания образов, машинного зрения и контурного анализа в иерархии научных дисциплин. Общая структурная схема системы распознавания изображений
Теория распознавания образов как отрасль научного знания появилась в начале 50-х годов ХХ-го века с развитием первых средств вычислительной техники (СВТ). На это указывают В.Н. Вапник и А.Я. Червоненкис в своей монографии [1] и говорят, что весьма важной является задача конструирования машин, способных обучаться классификации ситуаций также, как это делают живые существа. Они же отмечают, что такое широкое понимание проблемы привело к возникновению различных направлений исследования: одна группа ученых считала главным построение модели восприятия, другая видела свою цель в разработке прикладной области - в создании конкретных алгоритмов обучения распознаванию образов для решения практических задач, третьи же искали новые математические аспекты проблемы обучения. Начало исследований в указанной области было весьма обнадеживающим, были построены первые примитивные модели восприятия, решены некоторые практические задачи распознавания образов, которые ранее не удавалось разрешить другими методами, в рамках теории алгоритмов были доказаны первые формализованные теоремы об алгоритмах обучения.
Интерес к теоретической части научной дисциплины распознавания образов возник тогда, когда практическая составляющая не была в состоянии предложить решение для ряда конкретных задач. От теории стали ждать новых принципов, которые позволили бы строить более эффективные алгоритмы обучения. Для построения теории необходимо было найти формальную схему, в которую
можно было бы вложить задачу обучения распознавания образов. Существует две диаметрально противоположные точки зрения построения системы обучения: одни исследователи придерживаются мнения, что используя априорные сведения о свойствах образов, можно найти такое их описание, при котором отыскание принципа классификации не составляло бы труда; другие же считают, что выбор системы описания является внешним моментом в постановке задачи и основная проблема состоит в отыскании правила классификации среди заданного множества возможных правил.
По существу, различные точки зрения на постановку задачи распознавания образов определяется ответом на вопрос: возможны ли единые принципы построения адекватного описания образов различной природы или же конструирование языка описания есть каждый раз задача специалистов конкретных областей знаний? [1, с. 11]. Если да, то выявление этих принципов должно составить основное направление исследования задачи распознавания образов. Если же нет, то задача обучения распознаванию образов сводится к задаче минимизации среднего риска в специальном классе решающих правил и может рассматриваться как одно из направлений прикладной статистики. Ответа на этот вопрос нет до настоящего времени, поэтому выбор постановки задачи является пока что «вопросом веры». Как отмечают авторы [1, с. 11], большинство исследователей придерживаются второй точки зрения. К середине 60-х годов ХХ-го века появилась общая теория распознавания образов на основе минимизации среднего риска, которая при своих достоинствах имела также и недостатки. Оказалось, что предложенный общий принцип построения алгоритма является чересчур широким, и что множество конкретных алгоритмов обучения ничуть не лучше существующих решений для многих задач распознавания. Это связано с тем, что для получения решений использовались конструктивные методы минимизации среднего риска из теории статистических решений, которые по своей природе являются асимптотически-оптимальными, в то время как на практике приходится сталкиваться с конечными выборками ограниченного объема. Поэтому в рамках теории распознавания образов стоит задача разработать не асимптотически-оптимальную, а конечно-оптимальную теорию. У данного направления существует важная проблема: при известной необходимости создания конечно-оптимальных алгоритмов все попытки математиков построить такую теорию наталкивались на значительные трудности [1, с. 13].
Как было отмечено ранее, разработка общих методов теории распознавания образов сопряжена с рядом сложностей, поэтому часть исследователей переходит к рассмотрению более узкой предметной области - обработке изображений. Эта область относится к направлению, которое согласно [2, с. 10], можно называть обобщающим понятием «искусственное машинное зрение». В него входят инженерные технологии, методы и алгоритмы, связанные с задачей интерпретации сцены наблюдения по ее двумерным проекциям (изображениям), а также практическое использование результатов этой интерпретации. Если рассматривать человека как самую совершенную из известных систем управления, то можно усмотреть аналогию с последними достижениями в механике, электронике, радиотехнике, вычислительных архитектурах и платформах. Так, современные сенсоры по своим возможностям далеко превосходят человеческий глаз, как по разрешающей способности, так и по ширине спектрального диапазона. Вычислительные ресурсы демонстрируют непрекращающийся рост, производительность ЭВМ даже в пользовательском сегменте измеряется в единицах терафлопс - триллионах операций с числами с плавающей точкой в секунду. Достижения промышленности позволяют конструировать сложные аппараты, предназначенные для изучения пространства Солнечной системы за пределами нашей планеты. В то же время, существует отставание в технологиях понимания сцен и изображений, вполне возможно оно и является определяющим фактором, сдерживающим развитие сложных систем управления.
Как утверждается в [2, с. 11], зрение является наиболее информативным каналом восприятия окружающей действительности и объем информации, поступающий от органов зрения (объем видеопотока), на порядки превосходит объемы данных от других органов чувств. При этом, отмечается, что другая сторона этого факта - колоссальная избыточность изображений. Обосновывая сложность задачи понимания изображений, в [2, С. 11-12] приводятся три соображения. Во-первых, изображения обладают чрезвычайно широким разнообразием яркостно-геометрических свойств, которое не имеет жесткой причинной взаимосвязи и не вытекает из действия каких-либо физических законов, которые позволили бы упростить модельное описание сцены наблюдения. Разрабатываются новые математические и информационные подходы к описанию содержимого изображений с использованием формально сконструированных структур. К таковым можно отнести морфологии Серра, Пытьева, теорию фракталов. Во-вторых, изображениям присуща колоссальная
изменчивость, причиной которой являются десятки различных факторов: отклонения формы и размеров, различные виды искажений и шумов, загораживания объектов интереса, вызванные трехмерностью природы сцены -все это выдвигает требование устойчивости работы алгоритмов в трудных условиях. К методикам, призванным справляться с указанной сложностью, относятся преобразование Хафа, оценивание на основе ранговых статистик. В-третьих, необходимо принимать в расчет информационную поддержку процесса понимания сцен, а именно, система управления, желающая что-то понять, должна обладать существенной базой знаний об окружающем мире. А организация такой базы, ее наполнение, актуализация - ряд сложных задач, с которыми сознание человека справляется на протяжении многих годов.
Наиболее продуктивным представляется [2, с. 12] так называемый модельный подход, в рамках которого производится сведение более общей проблемы «понимания изображений» к простой и ясной проблеме обнаружения и распознавания по одному или нескольким изображениям объектов, удовлетворяющих некоторому заранее известному модельному описанию. Решение задачи автоматического выделения сложных объектов открывает перед системами машинного зрения огромное число потенциальных областей применения, таких как промышленная инспекция и контроль качества, робототехника, навигация и транспортировка, дистанционное зондирование, медицина и биомеханика, инженерный труд, автоматизация проектирования, новые технологии обработки документов, биометрия и множество других.
По результатам длительного изучения механизмов зрительного восприятия человека Д. Марр предложил к рассмотрению так называемую модульную парадигму [3, С. 111-116], согласно которой обработка изображений должна опираться на несколько последовательных уровней восходящей информации: от растровых изображений (неструктурированная форма) до векторно-атрибутивного представления (структурированная форма). Исходя из этого, в области машинного зрения принято выделять следующие основные этапы обработки данных: предобработка изображений, сегментация, выделение геометрической структуры, определение относительной структуры и семантики. Связанные с этими этапами уровни обработки называются, соответственно, обработкой нижнего уровня, среднего уровня и высокого уровня. Область алгоритмов нижнего уровня (к которым относятся, например, фильтрация простых шумов и гистограммная обработка) может считаться хорошо проработанной и достаточно изученной. За последний десяток лет достигнут
значительный прогресс среди алгоритмов среднего уровня (к вопросам сегментации относятся проблемы сопоставления точек и фрагментов изображений, выделение признаков внутри малых фрагментов, выделение простых яркостно-геометрических структур). Методы же обработки высокого уровня, которые непосредственно относятся к «пониманию» изображений, по-прежнему представляют интерес и до конца не изучены научным сообществом. В настоящее время известно [2, с. 13] несколько основных алгоритмических подходов и математических формализмов, используемых при разработке практических систем анализа изображений: гистограммные преобразования, анализ проекций, линейная и нелинейная фильтрация изображений, яркостная и текстурная сегментация, корреляционное обнаружение и согласованная фильтрация, морфологический подход Пытьева, математическая морфология Серра, метод «нормализации фона», преобразование Хафа, структурно-лингвистический подход и ряд других.
Значительный вклад в разработку методов и алгоритмов обработки изображений и машинного зрения внесли работы Л.П. Ярославского, П.А. Бакута, В.К. Баклицкого, В.Г. Лабуица, В.Л. Левшина, Ю.П. Пытьева, Ж. Серра, Р. Харалика, Е. Девиса, У. Гренандера, К. Ту и многие другие. За последние десятилетия было создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях реализованы упомянутые подходы и парадигмы. Однако единого математического формализма и единой общепризнанной методики разработки алгоритмов анализа изображений по-прежнему не существует, и, следовательно, наука об обработке изображений все еще находится в развитии, переживая период роста [2, с. 14].
При решении задач машинного зрения, хорошо себя зарекомендовали подходы, базирующиеся на строгих теоретических проработках, например, использующие формализм теории сигналов, но применяющие упрощенные модели изображений объектов, не связанные со значительной потерей информации [4, с. 12]. Один из таких подходов заключается в отказе от обработки каждой точки изображения и переходе к обработке лишь его контуров. Контуры являются областями с высокой концентрацией информации, слабо зависящей от цвета и яркости. Они устойчивы к смене типа датчика, формирующего изображение, к частотному диапазону, в котором он работает, не зависят от времени суток и года. Другие характеристики изображения при этом значительно варьируются. Контур целиком определяет форму изображения и содержит всю необходимую информацию для распознавания изображения по их
формам. Такой подход позволяет не рассматривать внутренние точки изображения и тем самым значительно сократить объем обрабатываемой информации за счет перехода от анализа функции двух переменных к функции одной переменной. Следствием этого является возможность обеспечения работы системы обработки в режиме времени, близком к реальному. Но даже в тех задачах, где нельзя пренебречь обработкой внутренних точек, методы контурного анализа дополняют другие и поэтому безусловно полезны [4, с. 13].
Совершенствуя датчики и увеличивая объем запоминающих устройств, можно сформировать слабо искаженные шумами многоэлементные изображения. При этом задачи распознавания облегчается, но основные трудности не устраняются. Они вызваны влиянием на математическое описание изображения случайных переносов, поворотов и изменения масштаба. Методы контурного анализа в большей степени, чем пространственные методы, дают возможность использовать модели, инвариантные к таким преобразованиям.
В рамках контурного анализа выделяют несколько методов, каждый из которых предлагает свой способ обработки и распознавания контуров. К наиболее известным работам можно отнести: цикл работ по спектральному анализу с использованием Фурье-преобразования, впервые предложенный к рассмотрению Р.Л. Косгрифом и обобщенный в [5], цикл работ по корреляционному анализу с использованием идей теории сигналов, предложенный к рассмотрению Я.А. Фурманом и обобщенный в [4], а также семейство циклов работ по нейронным сетям, где конкретного автора привести не представляется возможным (но следует отметить У. Мак-Каллока и У.Питтса, А.Н. Колмогорова и В.И. Арнольда, А.И. Галушкина).
Анализ предметной области показал, что не существует единого способа задания системы распознавания графических образов, поэтому к рассмотрению предлагается приведенная на рисунке 1. 1 графическая схема построения такой системы, на которую будет опираться настоящая работа в дальнейшем:
Рисунок 1.1 - Структурная схема системы распознавания изображений
Так, до принятия итогового решения о распознавании реального физического объекта проходит несколько стадий цифровой обработки. Сначала искомый объект регистрируется при помощи средств графической фиксации (например, ПЗС-матрицей). Впоследствии, на полученном цифровом изображении выделяется ряд информационно-значимых признаков, например, строятся гистограммы распределения цвета, вычисляются геометрические размеры (высота, ширина и т.д.), формируется набор контуров границ объекта. После этого происходит анализ полученных данных: так, для каждого отдельно взятого выделенного контура производится сравнение со всей базой эталонов, в результате чего ему, при помощи системы руководящих правил, ставится в соответствие один (или несколько) из наилучших в некотором смысле эталонов. Далее, осуществляется принятие решений, сначала формируются частные решения для каждого отдельно взятого контура, а потом - принимается общее решение, в том числе, с учетом анализа других выделенных признаков, по возможности производится оценка достоверности такого решения.
Легко видеть, что «качество» принятого итогового решения существенно зависит от всех четырех стадий процесса распознавания реального физического объекта. Так, на стадии регистрации изображений вся ответственность ложится на фиксирующую аппаратуру: съемка, например, может осуществляться на фотокамеру мобильного телефона, а может - на ПЗС-матрицу космического спутника. Понятно, что эти две системы обладают совершенно разными характеристиками, что приведет к получению различных результатов распознавания для одного и того же физического объекта. Аналогично, на стадии выделения существенен как сам набор выделяемых информационно-значимых признаков, так и способы их выделения. Например, выделение контуров может осуществляться при помощи фильтров Собеля, а может - при помощи граничного детектора Кэнни. Анализ полученных данных существенно зависит от их типа, от выбора способа обработки, которые задаются системой руководящих правил. Так, в случае анализа контуров могут использоваться нейронные сети, а могут - корреляционные функции, их применение будет давать разные результаты. Немалую роль на этом этапе играет и процесс формирования базы эталонов, с одной стороны, чтобы распознавать большее количество объектов - эталонов должно быть как можно больше, в то же время базу требуется минимизировать с целью достижения требований по оперативности функционирования всей системы в целом. Выработка частных решений и общего итогового решения описываются в рамках теории принятия
решений, которая в значительной степени опирается на теорию вероятностей, математическую статистику и теорию операций. Существенную роль играет набор решающих критериев, на основании которого могут выбираться различные стратегии-принципы: максимума правдоподобия, максимума апостериорной вероятности, минимума Баесова риска.
Понятно, что оценка всей системы распознавания является многофакторной и функционально зависит от характеристик всех узлов, входящих в ее состав. Зачастую ответить на вопрос «А во сколько раз одна система распознавания лучше другой?» - не представляется возможным, поскольку у каждой системы распознавания объектов существуют свои границы применимости, которые естественным образом появляются в ходе построения такой системы, исходя из поставленных перед ней задач.
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Методы, алгоритмы и программный комплекс обработки изображений на основе нейронечеткого и нейросетевого моделирования2024 год, кандидат наук Назаров Максим Андреевич
Системы распознавания плоских и объемных изображений по их форме на основе контурного анализа2009 год, доктор технических наук Хафизов, Ринат Гафиятуллович
Различение расположенных на подстилающей поверхности трехмерных объектов на основе кватернионных моделей2013 год, кандидат наук Ерусланов, Руслан Валентинович
Разработка и исследование алгоритмов распознавания изображений на основе определения экстремальных признаков замкнутых контуров с помощью сортировки2008 год, кандидат технических наук Рюмин, Олег Германович
Теория и методы морфологического анализа изображений2008 год, доктор физико-математических наук Визильтер, Юрий Валентинович
Список литературы диссертационного исследования кандидат наук Кишкин Сергей Александрович, 2020 год
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов (статистические проблемы обучения). - М.: Наука, 1974. - 416 с.
2. Визильтер Ю.В., Желтов С.Ю., Бондаренко А.В., Ососков М.В., Моржин А.В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий.
- М.: Физматкнига, 2010. - 672 с.
3. Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов: Пер. с англ. - М.: Радио и связь, 1987. - 400 с.
4. Фурман Я.А., Кревецкий А.В., Передреев А.К., Роженцов А.А., Хафизов Р.Г., Егошина И.Л., Леухин А.Н. Введение в контурный анализ; приложения к обработке изображений и сигналов. - 2-е изд. - М.: Физматлит, 2003. - 592 с.
5. Cosgriff R.L. Identification of Shape, Ohio State University Research Foundation, Columbus, Ohio, Report 820-11, ASTIA AD-25-4792, December, 1960.
6. Abramochkin E., Volostnikov V. Spiral-type beams // Optics Communications, Vol. 102, 1993. pp. 336-350.
7. Абрамочкин Е.Г., Волостников В.Г. Спиральные пучки света // Успехи физических наук, Т. 174, № 12, 2004. С. 1274-1300.
8. Абрамочкин Е.Г., Волостников В.Г. Современная оптика гауссовых пучков.
- М.: Физматлит, 2010. - 184 с.
9. Волостников В.Г. Методы анализа и синтеза когерентных световых полей.
- М.: Физматлит, 2014. - 256 с.
10. Леонтович М.А. Об одном методе решения задач распространения радиоволн по поверхности земли // Известия АН СССР, серия физическая, Т. 8, 1944. С. 16-22.
11. Леонтович М.А., Фок В.А. Исследования по распространению радиоволн // ЖЭТФ, Т. 16, № 7, 1946. С. 557-573.
12. Berry M.V., Nye J.F. Dislocations in wave trains // Dislocations in wave trains (Proc. Royal Soc. (London), Vol. A336, 1974. pp. 165-190.
13. Abramochkin E., Volosnikov V. Relationship between 2D intensity and phase in a Fresnel diffraction zone // Optics Communications, Vol. 74, No. 3-4, 1989. pp. 144-148.
14. Баранова Н.Б., Зельдович Б.Я. Дислокации поверхностей волнового фронта и нули амплитуды // ЖЭТФ, Т. 80, 1981. С. 1789-1797.
15. Гонсалес Р., Вудс Р. Цифровая обработка изображений [перевод с английского под редакцией Чочиа П.А.]. - М.: Техносфера, 2005. - 1072 с.
16. Форсайт Д.А., Понс Ж. Компьютерное зрение. Современный подход. : Пер. с англ. - М.: Издательский дом «Вильямс», 2004. - 928 с.
17. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления В 3 т., Т. I / Пред. и прим. А.А.Флоринского. - 8-е изд. - М.: Физматлит, 2003. - 680 с.
18. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления В 3 т., Т. III / Пред. и прим. А.А.Флоринского. - 8-е изд. - М.: Физматлит, 2003. - 728 с.
19. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа.
- М.: «Наука», 1976. - 543 с.
20. Лавреньтев М.А., Шабат Б.В. Методы теории функций комплексного переменного.
- М.: «Наука», 1973. - 736 с.
21. Кишкин С.А. Анализ плоских контуров посредством оптики спиральных пучков света в задачах обработки изображений: Дипломная работа. - Самара. 2015. - 69 с.
22. Курош А.Г. Курс высшей алгебры: Учебник. - СПб.: Издательство «Лань», 2008. - 432 с.
23. Ллексеев В.Б. Теорема Лбеля в задачах и решениях. - М.: МЦНМО, 2001. - 192 с.
24. Трухаев Р.И. Методы исследования процессов принятия решений в условиях неопределенности. - Ленинград: ВМОЛУЛ, 1972. - 428 с.
25. Тарасенко С.Л. Формализованная методология исследования специальной техники.
- М.: ЛО "Красная звезда", 2017. - 368 с.
26. Петросян Л.Л., Зенкевич Н.Л., Семина Е.Л. Теория игр: учебное пособие для университетов. - М.: Высшая школа, Книжный дом «Университет», 1998. - 304 с.
27. Ван дер Варден Б.Л. Математическая статистика. - М.: Издательство иностранной литературы, 1960. - 434 с.
28. Хорошевский В.Г. Лрхитектура вычислительных систем: Учеб. Пособие. - 2-е изд.
- М.: Изд-во МГТУ им. Н.Э. Баумана, 2008. - 520 с.
29. 754-2008 - IEEE Standard for Floating-Point Arithmetic // IEEE.org. URL: https://ieeexplore.ieee.org/servlet/opac?punumber=4610933
30. Зюко Л.Г., Кловский Д.Д., Назаров М.В., Финк Л.М. Теория передачи сигналов: Учебник для вузов. - М.: Связь, 1980. - 288 с.
31. Фихтенгольц Г.М. Курс дифференциального и интегрального исчисления В 3 т., Т. II / Пред. и прим. Л.Л.Флоринского. - 8-е изд. - М.: Физматлит, 2003. - 846 с.
32. Касперски К. Война миров: Лссемблер против Си. // https://www.evilfingers.com/publications/research_RU/asm-vs-c.pdf.
33. Горелик Л.М. Эволюция языка программирования Фортран (1957-2007) и перспективы его развития // Вычислительные методы и программирование, Т. 9, 2008. С. 53-71.
34. Netlib Repository at UTK and ORNL [Электронный ресурс] URL: netlib.org
35. Open MPI: Open Source High Performance Computing [Электронный ресурс] URL: https://www.open-mpi.org/
36. CUDA Zone [Электронный ресурс] URL: https://developer.nvidia.com/cuda-zone
37. OpenCL Overview [Электронный ресурс] URL: https://www.khronos.org/opencl
38. Open Source Computer Vision Library [Электронный ресурс] URL: https://opencv.org/
39. The GTK+ Project [Электронный ресурс] URL: https://www.gtk.org/
40. Qt: Cross-platform software development for embedded & desktop [Электронный ресурс] URL: https://www.qt.io/
41. Шлее М. Qt 5.3. Профессиональное программирование на C++. - СПб.: БХВ-Петербург, 2015. - 928 с.
42. Ллексеев Е.Р., Злобин Г.Г., Костюк Д.Л., Чеснокова О.В., Чмыхало Л.С. Программирование на языке С++ в среде Qt Creator. - М.: ALT Linux, 2015. - 448 с.
43. Саммерфилд М. Qt. Профессиональное программирование. Разработка кроссплатформенных приложений на С++. - Пер. с англ. - СПб.: Символ-Плюс, 2011.
- 560 с.
44. ISO/IEC 9899:1999 Programming languages - C [Электронный ресурс] URL: https://www.iso.org/standard/29237.html
45. MinGW: Minimalist GNU for Windows [Электронный ресурс] URL: http://mingw.org
46. GCC, the GNU Compiler Collection [Электронный ресурс] URL: https://gcc.gnu.org/
47. Lockless >> Articles >> Complex Multiplication [Электронный ресурс] URL: https://locklessinc.com/articles/complex_multiplication/
48. Таненбаум Э., Бос Х. Современные операционные системы. - 4-е изд. - СПб.: Питер, 2015.
- 1120 с.
49. Chuanpeng L., Chen D., Kai S. Quantifying The Cost of Context Switch URL: https://www.usenix.org/legacy/events/expcs07/papers/2-li.pdf
50. Kronos Group: Connecting Software to Silicon [Электронный ресурс] URL: https://www.khronos.org/
51. The OpenCL Specification URL: https://www.khronos.org/registry/OpenCL/specs/2.2/pdf/ OpenCL_API.pdf
52. Techpowerup [Электронный ресурс] URL: https://www.techpowerup.com/
53. Авиация России [Электронный ресурс] URL: http://komotoz.ru/photo/aviaciya/ voennaya_aviaciya_rossii.php
54. Person E., Fu K. Shape discrimination Using Fourier Descriptors // IEEE Transactions, Man and Cybernetics, Vol. SMC-7, No. 3, 1977. pp. 170-179.
55. Zhang D., Lu G. A Comparison of Shape Retrieval Using Fourier Descriptors and Short-time Fourier Descriptors URL: https://link.springer.com/chapter/10.1007/3-540-45453-5_111
56. Воронцов К.В. Обзор современных исследований по проблеме качества обучения алгоритмов // Таврический вестник информатики и математики, № 1, 2004. С. 5-24.
57. McCulloch W.S., Pitts W. A logical calculus of the ideas immanent in nervous activity // The bulletin of mathematical biophysics, Vol. 5, No. 4, 1943. pp. 115-133.
58. Hecht-Nielsen R. Kolmogorovs mapping neural network existence theorem // IEEE First Annual International Conference on Neural Networks. San Diego., Vol. 3, 1987. pp. 11-13.
59. Хабаров С.П. Интеллектуальные информационные системы (конспект лекций) URL: http://www.habarov.spb.ru/new_es/exp_sys/ai_11.pdf
60. Андреев В.В., Журавлев М.С. Распознавание рукописных символов с применением нейросетевой технологии // Прикладная информатика, Т. 20, № 2, 2009. С. 115-121.
61. Распознавание 330 млн лиц на скорости 400 фото/сек [Электронный ресурс] URL: https://habr.com/ru/company/odnoklassniki/blog/350566/
62. Галушкин А.И. Нейронные сети: основы теории. - М.: Горячая линия-Телеком, 2012. - 496 с.
Список научных трудов
2012
1. К.Н. Афанасьев, С.А. Кишкин. Фазовые голограммы для формирования спиральных пучков света // Сборник научных трудов научной сессии МИФИ-2012. Научно-техническая конференция-семинар по фотонике и информационной оптике. М.:МИФИ, 2012. - С. 223-224.
2. К.Н. Афанасьев, С.А. Кишкин. Формирование спиральных пучков при помощи фазовых голограмм // Известия Самарского научного центра РАН, 2012.
- Том 14 номер 4 С. 184-188.
3. В.Г. Волостников, С.А. Кишкин. Спиральные пучки как инструмент в распознавании контурных изображений // Сборник конкурсных докладов X Всероссийского молодежного Самарского конкурса-конференции научных работ по оптике и лазерной физике, Самара, 7-11 ноября 2012. - C. 319-326.
4. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Распознавание контурных изображений при помощи световых полей специального вида // Сборник научных трудов XIV Школы молодых ученых «Актуальные проблемы физики», 11-15 ноября 2012. - С. 107-108.
2013
5. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Новый метод обработки контурных изображений на основе формализма спиральных пучков света // Квантовая электроника, 43, №7. - С. 646-650. (V.G. Volostnikov, S.A. Kishkin, S.P. Kotova, "New method of contour image processing based on the formalism of spiral light beams", QUANTUM ELECTRON, 2013, 43 (7), P. 646-650).
6. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Спиральные пучки света в задачах распознавания изображений. Новые результаты // XI Всероссийский молодежный Самарский конкурс-конференция научных работ по оптике и лазерной физике: сборник конкурсных докладов (Самара, 6-10 ноября 2013 г.) - Москва: Федеральное государственное бюджетное учреждение науки Физический институт им. П. Н. Лебедева Российской академии наук, 2013. - 351с. ISBN 978-5-902622-25-3.
7. В.Г. Волостников, С.А. Кишкин, С.П. Котова, Оптика спиральных пучков в задачах распознавания изображений. Достигнутые результаты // Сборник трудов V Всероссийской молодежной конференции по фундаментальным и инновационным вопросам современной физики, 10-15 ноября 2013 года, Москва, ФИАН [Текст]: программа и тезисы докладов. - Москва: ФИАН, 2013. - 210 с.
8. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Контурный анализ с использованием оптики спиральных пучков: результаты численного моделирования. Развитие метода // II Всероссийская конференция по фотонике и информационной оптике: Сборник научных трудов. М.: НИЯУ МИФИ, 2013. - С.148-149.
9. Volostnikov V., Kishkin S., Kotova S. Spiral beams: New Results and Application // Proceedings of Conference on Advanced Optoelectronics and Lasers (CAOL'2013), 8-14 September, 2013, Sudak Ukraine. - P.263-264.
2014
10. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Контурный анализ и современная оптика гауссовых пучков // Компьютерная оптика. - 2014. - Т.38, №3.
- С. 476-481.
11. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Спиральные пучки света в задачах распознавания изображений. Учет шумов и деформаций // XII Всероссийский молодежный Самарский конкурс-конференция научных работ по оптике и лазерной физике: сборник конкурсных докладов (Самара, 12-15 ноября 2014 г.). - Москва: Федеральное государственное бюджетное учреждение науки Физический институт им. П.Н. Лебедева Российской академии наук, 2014. - C. 232-239
12. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Контурный анализ с использованием оптики спиральных пучков: результаты численного моделирования, развитие метода // Сборник научных трудов научной сессии НИЯУ МИФИ-2014. III Всероссийская конференция по фотонике и информационной оптике. - С. 152-153.
13. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Оптика спиральных пучков в задачах распознавания изображений. Учет шумов, деформации кривой // Сборник научных трудов XV Школы молодых ученых «Актуальные проблемы физики», 16-20 ноября 2014. - С. 130-131.
14. Volostnikov V., Kotova S. and Kishkin S. Spiral light beams: characteristics and applications // J. Phys.: Conf. Ser. - 2014. - V.536. - 012001 doi:10.1088/1742-6596/536/1/012001
2015
15. С.А. Кишкин, В.Г. Волостников, С.П. Котова Когерентные световые поля специального вида в прикладных задачах распознавания контурных изображений // Физика и применение микроволн: тр. XV Всероссийской школы-семинара «Волны-2015» им. А.П. Сухорукова. Секция 6: Когерентные и нелинейные волновые явления, 1-6 июня 2015, г. Можайск, Моск. обл. - М.: МГУ, 2015. - С.34-35.
16. Кишкин С.А. Распознавание контурных изображений посредством спиральных пучков света в автоматизированных системах управления различного назначения // XIII Всероссийский молодежный Самарский конкурс-конференция научных работ по оптике и лазерной физике: сборник конкурсных докладов (Самара, 11-14 ноября 2015 г.). -Москва: Федеральное государственное бюджетное учреждение науки Физический институт им. П.Н. Лебедева Российской академии наук, 2015. - С. 214-220.
2016
17. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Распознавание графических образов с использованием методов когерентной оптики // XIV Всероссийский молодежный Самарский конкурс-конференция научных работ по оптике и лазерной физике: сборник конкурсных докладов (Самара, 08-12 ноября 2016 г.). - Москва: Федеральное государственное бюджетное учреждение науки Физический институт им. П.Н. Лебедева Российской академии наук, 2016. - С. 76-82.
2017
18. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Прикладные вопросы распознавания контурных изображений при помощи спиральных пучков света // XV Всероссийский молодежный Самарский конкурс-конференция научных работ по оптике и лазерной физике: сборник конкурсных докладов (Самара, 14-18 ноября 2017 г.). - Москва: Федеральное государственное бюджетное учреждение науки Физический институт им. П.Н. Лебедева Российской академии наук, 2017. - С. 113-120.
19. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Когерентная оптика как инструмент для решения задачи распознавания контурных изображений // Сборник
научных трудов научной сессии НИЯУ МИФИ-2017. VI Всероссийская конференция по фотонике и информационной оптике. - С. 606-607.
20. Sergey A. Kishkin, Svetlana P. Kotova, Vladimir G. Volostnikov Spiral Light Beams and Contour Image Processing // Physics Procedia 86C (2017) pp. 131-135.
2018
21. В.Г. Волостников, С.А. Кишкин, С.П. Котова. Анализ контурных изображений с помощью оптики спиральных пучков // Квантовая электроника, Т. 48, №3 (2018), С. 268-274. (V.G. Volostnikov, S.A. Kishkin, S.P. Kotova, "Analysis of contour images using optics of spiral beams", QUANTUM ELECTRON, 2018, 48 (3), P. 268-274. https://doi.org/10.1070/QEL16553).
2019
22. В.Г. Волостников, С.А. Кишкин, С.П. Котова, М.С. Русакова. «Исследование возможности применения математического формализма спиральных пучков света для анализа кардиограмм» // Квант. электроника, 2019, 49 (1), С. 83-88. (V.G. Volostnikov, S.A. Kishkin, S.P. Kotova, M.S. Rusakova, "On the feasibility of using the spiral beam formalism for analysis of cardiograms", QUANTUM ELECTRON, 2019, 49 (1), P. 83-88. https://doi.org/10.1070/QEL16920).
23. K.V. Efimova, S.A. Kishkin, S.P. Kotova, N.N. Losevsky, D.V. Prokopova, S.A. Samagin Two techniques for experimental generation of spiral light beams //Proceedings Volume 11141, Optical Manipulation and Structured Materials Conference; 1114101 (2019) https://doi.org/10.1117/12.2535563 р. 167-168.
24. К.В. Ефимова, С.А. Кишкин, С.П. Котова, Д.В. Прокопова. Разработка аппаратно-программного комплекса для построения спиральных пучков света// V международная конференция и молодежная школа «Информационные технологии и нанотехнологии»: сборник трудов (Самара, 21-24 мая 2019 г.) - Самара: Самарский национальный исследовательский университет им. академика С.П. Королева, 2019 -С. 358-361.
Сводная таблица публикаций в рецензируемых изданиях
№ п/п № п/с Тип работы Входит в перечень ВАК Индексируется в Scopus Индексируется в Web of Science
1. 2 статья +
2. 5 статья + +
3. 9 тезисы +
4. 10 статья + +
5. 14 тезисы +
6. 20 тезисы +
7. 21 статья + +
8. 22 статья + +
9. 23 тезисы +
Приложение В
В настоящем приложении приведены контуры границ самолетов, выделенные при помощи граничного детектора Кэнни из изображений, заимствованных с сайта любителей авиации:
http://komotoz.ru/photo/aviaciya/voennaya_aviaciya_rossii.php Все исходные изображения, а также изображения выделенных контуров имеют формат 1920x1080 пикселей и выглядят следующим образом:
Вклеить диск с ПО
Расчет рассылки
Экз. №
№ п/п Куда направлен
1 Авторский экземпляр
2 Самарский филиал ФИАН
3 Библиотека МИРЭА-РТУ
4 Ведущая организация
5 Оппонент №1
6 Оппонент №2
7 22 кафедра 2 факультета КВВУ
8 Петлеванный А.А.
9 Аверкиев С.В.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.