Модель и методы распознавания объектов на изображениях в виде скалярных полей тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Чечель, Андрей Олегович
- Специальность ВАК РФ05.13.01
- Количество страниц 145
Оглавление диссертации кандидат наук Чечель, Андрей Олегович
Оглавление
Введение
Актуальность исследования
Общая характеристика работы
Структура диссертации и взаимосвязь отдельных глав
1. Состояние вопроса по проблематике распознавания изображений
1.1. Детерминистские методы распознавания
1.1.1. Решающие функции
1.1.2. Метод потенциальных функций
1.1.3. Функции расстояния
1.1.4. Методы выявления кластеров
1.2. Статистические методы распознавания
1.2.1. Последовательные процедуры распознавания
1.3. Структурные методы распознавания
1.3.1. Синтаксическое распознавание
1.4. Сегментация изображения
1.4.1. Сегментация на основе анализа пикселей
1.4.2. Сегментация на основе анализа контуров
1.4.3. Сегментация на основе анализа областей
1.5. Вывод
2. Распознавание объектов на изображениях в виде скалярных полей
2.1. Представление изображений в виде скалярных полей
2.2. Выделение контуров фрагментов в полевой модели
2.3. Модель графических объектов на изображениях в виде скалярных полей
2.4. Статический метод идентификации объектов
2.4.1. Идентификация объекта без искажений
2.4.2. Идентификация искаженного объекта
2.5. Обработка на ранней стадии: детектирование изломов
2.6. Алгоритм объединения цепных кодов
2.7. Механизм идентификации в задачах распознавания текста
2.8. Динамический метод локализации объектов
3. Практическая реализация системы распознавания объектов
3.1. Введение в платформу .NET Framework
3.2. Построение системы распознавания в платформе .NET Framework
3.3. Разработка модулей системы распознавания
3.3.1. Модуль ввода и обработки изображений
3.3.2. Модуль ввода видеосигнала
3.3.3. Сериализатор объектов
3.3.4. Система работы с неуправляемой памятью
3.3.5. Многопоточный обработчик подзадач
3.3.6. Детектор кромок
3.3.7. Подсистема распознавания
3.3.8. Подсистема видео трекинга объектов
3.3.9. Система построения шаблонов
3.3.10. Пользовательский интерфейс
Заключение
Список литературы
Приложение 1. XML схема сериализации данных (алгоритм ChSerializer)
Приложение 2. Области, охваченные цепными кодами
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Методы и реализация комплексного подхода к распознаванию графической информации с интеллектуальной поддержкой2013 год, кандидат наук Шичкин, Дмитрий Александрович
Методы, алгоритмы и программные средства построения автоадаптивных шрифтов для аппаратно-программных комплексов обработки и создания неформатных электронных документов2014 год, кандидат наук Чередниченко, Игорь Николаевич
Моделирование процесса идентификации графических объектов2011 год, кандидат технических наук Курушин, Даниил Сергеевич
Идентификация с детальной оценкой состояния объектов и их массового количества системами компьютерного зрения2018 год, кандидат наук Остапов Дмитрий Сергеевич
Система идентификации антропогенных объектов по тепловизионным аэрофотоснимкам на основе контурного анализа2022 год, кандидат наук Агафонова Регина Ренатовна
Введение диссертации (часть автореферата) на тему «Модель и методы распознавания объектов на изображениях в виде скалярных полей»
Введение
Диссертационная работа посвящена исследованию процессов распознавания графических объектов. Предлагается использовать концепцию представления графической информации в виде скалярных полей (полевой модели) для построения систем распознавания, использующих анализ структурной составляющей обрабатываемых фрагментов. Такой подход позволяет повысить помехоустойчивость системы распознавания. В диссертационной работе созданы модель и методы идентификации искаженных графических объектов, исследованы способы повышения производительности процесса распознавания. Результаты использованы в разработке программной системы, выполняющей идентификацию объектов, классификацию символьной информации, видеотрекинг объектов.
Актуальность исследования
Системы распознавания графической информации являются важными компонентами вычислительных устройств, применяемых в различных областях гражданской и военной техники. Такие системы позволяют многократно упростить решение повседневных задач, связанных с обработкой графической информации. Повышенный спрос на автоматизацию рутинных процессов способствует созданию новых методов, а также совершенствованию существующих подходов. С развитием информационных технологий появилась возможность реализовывать аппаратно-программные комплексы, выполняющие анализ информации на новом качественном уровне. Речь идет о визуальной информации, обработка которой ранее была доступна только живым организмам. В результате образовалось новое направление в сфере цифровой обработки сигналов - цифровая обработка изображений [1].
Задача распознавания объектов представляет собой одно из перспективных направлений цифровой обработки изображений. Проблема распознавания волнует человечество со времен древнегреческих философов, задававшихся вопросом,
почему возможно распознавание тех или иных графических образов, узнавание людей, предметов и т.д. Данной теме посвящено много научных трудов, затрагивающих философские [2], психологические [3] и нейрофизиологические вопросы [4]. В наши дни актуальность вопроса повышается, философские рассуждения и теоретические исследования получают практическую реализацию: в медицинском оборудовании, портативных устройствах, автоматических системах контроля, в сфере робототехники. В научном сообществе не прекращается поток публикаций, предлагающих новые алгоритмы и методы для распознавания образов. Тем не менее, несмотря на проделанный труд, не существует универсального подхода к решению данной проблемы. Предлагаемые решения не могут считаться совершенными, а совокупность недостатков и ограничений каждой конкретной системы диктует условия ее использования. В ряде случаев эти ограничения обуславливаются обратно пропорциональной зависимостью между скоростью обработки и качеством получаемых результатов. Этот факт побуждает проводить новые исследования и создавать системы распознавания графической информации, реализующие весь потенциал аппаратного обеспечения в полной мере.
Большое влияние на формирование алгоритмической базы для систем распознавания оказали работы таких ученых, как Ф. Розенблатт, Г. Фримен, К.С. Фу, Р. Гонсалес, Я.А. Фурман. На данный момент предложен ряд подходов к распознаванию образов [5] [6]. Среди них можно выделить методы, основанные на теории принятий решений (использование классификаторов, нейронных сетей), структурные методы, алгоритмы, использующие сегментацию и кластеризацию, а также методы контурного анализа. Последний подход сочетает в себе двоякую характеристику: с одной стороны, задача построения контуров графических объектов может быть решена достаточно эффективно, но вместе с этим, методы контурного анализа являются достаточно сложными в реализации, что обуславливается большим объемом информации, подвергающейся морфологическому анализу. В моделях, реализующих контурный анализ, контур - это не абстрактная единица информации, а вполне осмысленная, имеющая
логическое значение конструкция, адекватно представляющая графический объект (или его часть) в изображении. Данное обстоятельство является одной из главных причин проявленного научного интереса автора диссертационной работы к изучению и исследованию путей реализации программной системы, основанной на применении анализа структурной составляющей графических объектов в задачах идентификации и распознавания визуальной информации.
Общая характеристика работы
Цель диссертационного исследования - улучшение характеристик идентификации объектов на основе представления изображений в виде скалярных полей.
Для достижения цели исследования в диссертационной работе были поставлены и решены следующие задачи:
- разработка модели графического объекта на основе разложения изображения на «высокочастотную» и «низкочастотную» составляющие;
- разработка статического метода идентификации объектов на изображениях в виде скалярных полей;
- разработка динамического метода локализации объектов для применения в системах обработки видеосигнала;
- программная реализация предложенного подхода, получение экспериментальных оценок, сравнение результатов с известными подходами.
Объектом исследования в данной диссертационной работе являются изображения и содержащиеся на них графические объекты.
Предмет исследования - распознавание объектов на основе классификаторов, модели представления графической информации, методы и алгоритмы сегментации, морфологическая обработка, методы обработки видеоряда, видеотрекинг объектов.
Методы исследования базируются на системном анализе, теории множеств, теории вероятностей, интегральном и дифференциальном вычислении, методах цифровой обработки сигналов, системного программирования, параллельной обработки данных. Кроме того, методологической базой исследования послужили работы Болтова Ю.Ф., Красильникова H.H., Гонсалеса Р., Фу К., Фурмана Я.А., а также концепция графического интерпретатора на основе полевой модели, разработанная на кафедре ЦВТиИ Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича.
Научная новизна исследования диссертационной работы обуславливается следующими факторами:
- предложена модель представления графических объектов в виде совокупности сигнатур контуров, отличающаяся высокой скоростью обработки и устойчивостью к наличию искажений;
- разработан статический метод идентификации объектов на изображениях, представленных в виде скалярных полей;
- предложен алгоритм определения смещения начальных точек цепных кодов, позволяющий сократить требуемую вычислительную мощность для процедуры вычисления коэффициента подобия двух контуров;
- разработан динамический метод локализации для систем обработки видеосигнала, позволяющий выполнять видеотрекинг объектов в режиме реального времени.
Практическая значимость работы выражается в следующем:
- разработанные алгоритмы и программное обеспечение могут быть использованы для решения задач идентификации в составе медицинского оборудования, дактилоскопических систем, программно-аппаратных комплексов слежения и регистрации объектов;
- предложен метод идентификации символьной информации в рамках разработанного программного обеспечения для применения в системах оптического распознавания символов;
- выполнена программная реализация системы видеотрекинга объектов, в основе которой лежит структурный анализ, построенный на концепции представления изображений в виде скалярных полей.
Внедрение результатов. Основные результаты получены автором на кафедре ЦВТиИ Санкт-Петербургского государственного университета телекоммуникаций им. проф. М.А. Бонч-Бруевича, в научно-исследовательской работе «Обработка графической информации на основе полевой модели для телекоммуникационных приложений. Концепция, математические построения, алгоритмы и программные оболочки» (гос. per. № 01201067398, 2010 г).
Разработанная программа «ChRecognizer» имеет свидетельство о государственной регистрации (№ 2013614251, 25.04.2013 г.).
Разработанные алгоритмы обработки видеосигнала и распознавания графических объектов использованы в системе обработки видеоконференций и докладов ООО «ЭПАМ Систэмз» (акт внедрения от 23.05.2013).
Положения, выносимые на защиту:
- модель графического объекта на основе одномерных функций сигнатур
контура;
- статический метод идентификации графических объектов на изображениях, представленных в виде скалярных полей;
- алгоритм определения смещения начальных точек цепных кодов для задачи определения подобия контуров;
- динамический метод локализации графических объектов для задач обработки видеосигнала.
Апробация работы: научные положения и практические результаты диссертационной работы докладывались и обсуждались на четырех
всероссийских и международных научно-технических конференциях: 18-й Международной научно-технической конференции «Современное телевидение» (Москва, 2010); 19-й Международной научно-технической конференции «Современное телевидение и радиоэлектроника» (Москва, 2011); 20-й Международной научно-технической конференции «Современное телевидение и радиоэлектроника» (Москва, 2012); 64-й Международной научно-технической и научно-методической конференции «Актуальные проблемы
инфотелекоммуникаций в науке и образовании» (СПб, 2012); а также на: 62-й научно-технической конференции профессорско-преподавательского состава научных сотрудников и аспирантов СПбГУТ (СПб, 2010); 63-й научно-технической конференции профессорско-преподавательского состава научных сотрудников и аспирантов СПбГУТ (СПб, 2011).
Публикации: материалы, отражающие основное содержание работы, опубликованы в трех статьях в изданиях, рекомендованных ВАК Министерства образования и науки РФ, а также в восьми статьях в других научных журналах и сборниках трудов российских и международных конференций. Разработанная программа «ChRecognizer» имеет свидетельство о государственной регистрации.
Структура диссертации и взаимосвязь отдельных глав
Диссертационная работа состоит из введения, трех разделов, заключения, списка литературы (98 наименований) и двух приложений. Диссертационная работа содержит 145 страниц, включая 6 таблиц и 48 рисунков.
Во введении обозначается актуальность выбранной темы исследования, научная новизна и практическая значимость. Приводятся основные характеристики диссертационной работы с обозначением цели, задач исследования. В качестве подтверждения достоверности полученных результатов приводятся сведения об апробации работы, актах внедрения, публикациях автора.
Первая глава посвящена анализу состояния вопроса в сфере распознавания изображений. В ней рассматривается современный уровень развития методов и
алгоритмов, использующихся для задач идентификации и классификации зрительной информации. Вводится разделение на три основных категории: детерминистские, статистические и структурные методы. Для каждой из категорий рассматриваются использующиеся в ней подходы и алгоритмы для решения задач идентификации графических объектов. Также в первой главе рассматриваются современные методы сегментации изображения, входящие в состав большинства систем распознавания. Описываются подходы, связанные с анализом пикселей, контуров и областей. В конце главы приводится заключение об эффективности рассмотренных алгоритмов и их практическом применении. Отмечается, что методы, базирующиеся на контурном анализе, чувствительны к качеству изображения, наличию шумов и искажений, а также требуют больших вычислительных мощностей. В качестве развития таких методов предлагается использовать разработанный поход к распознаванию графической информации с представлением ее в виде скалярных полей, что позволяет нивелировать ряд недостатков систем, использующих анализ структурной информации.
Вторая глава диссертационной работы посвящена детальному рассмотрению предложенного подхода к распознаванию объектов путем обработки графической информации на основе ее представления в виде скалярных полей. В данной главе описывается логическая структура системы распознавания. Вводится понятие модель графического объекта, описывается механизм разделения изображения на «высокочастотную» и «низкочастотную» составляющую. Подобное разделение позволяет построить геометрическую маску изображения и перейти от обработки в плоскости к анализу линейных объектов, представляющих кромки фрагментов изображения. В главе излагается метод статической идентификации объекта путем анализа полученных линейных объектов, описываются подходы для уменьшения чувствительности к помехам. Приводятся сравнительные результаты генерируемых цепных кодов в зависимости от типа изображения и применения того или иного алгоритма компенсации искажений. В данной главе также рассматриваются вопросы снижения вычислительной нагрузки. Отмечается возможность применения
разработанных подходов для задач распознавания объектов, символьной информации, а также задач обработки динамических сцен, таких как видеотрекинг. Изложенная информация служит для построения математической модели системы распознавания графической информации, использующей анализ структурной составляющей объектов. Излагается метод динамической локализации объекта. Приводятся замеры производительности для задачи видеотрекинга сигнала высокой четкости.
В третьей главе описывается практическая реализация системы распознавания. Рассматриваются основные возможности выбранной платформы для реализации созданных подходов. Уделяется внимание методам доступа к изображению и его пикселям. Приводятся сравнительные результаты эффективности рассмотренных подходов, обосновывается оптимальный выбор. Рассматриваются архитектурные вопросы, связанные с построением системы распознавания объектов и ее отдельных модулей.
В заключении приводятся сформулированные научные результаты, полученные в ходе диссертационной работы. Намечены направления дальнейших исследований.
1. Состояние вопроса по проблематике распознавания
изображений
Трудно представить такое направление инженерной деятельности, развитие которого за последние полвека можно было бы сравнить с развитием вычислительной техники, включающим: постоянно повышающуюся производительность процессоров в сочетании с миниатюризацией компонентной базы; уменьшенное энергопотребление, являющееся определяющим параметром при проектировании мобильных устройств; применение сенсорных дисплеев, коммуникационных чипов, фото и видеокамер в мультимедийных устройствах. На разрабатываемые аппаратные комплексы и персональные устройства возлагается все больше функций, в том числе и функции, присущие только живым существам - слух и зрение [7].
Несмотря на значительный прогресс в сфере вычислительной техники, развитие методов обработки визуальной информации представляется сравнительно скромным. Однако, в виду тенденции к совершенствованию и автоматизации многих рутинных задач, системы машинного зрения становятся, как никогда, востребованы. Алгоритмы распознавания графической информации внедряются в состав экспертных систем, позволяющих выполнять обработку \ поиск \ фильтрацию информации в массивах изображений по указанным признакам. Кроме того, методы распознавания нашли применение в устройствах автоматизированного ввода: сканерах, фото и видео устройствах, факс-модемах. Причем функция распознавания символьной информации получила наибольшее распространение, что обуславливает достойный уровень развития методов классификации символьной информации [8].
В целом, развитие средств углубленного анализа изображений на текущий момент не позволяет удовлетворить запросы современных потребителей. Методы углубленного анализа применимы в промышленности и в сфере робототехники, они позволяют проектировать станки, которые могут быть легко
перепрограммированы на выполнение новых операций, и автоматизированные машины, способные самостоятельно ориентироваться в пространстве, например, выполняя погрузочные работы. Стоит отметить, что определенные успехи в данном направлении есть, но они сводятся к решению типовых задач, таких как распознавания лица человека, жестов или движущихся предметов. Универсальных методов, сравнимых по функциональности с возможностями человека до сих пор не найдено. Дополнительный интерес вопросу придает тот факт, что распознавание визуальной информации относится к процессу восприятия, который у человека проходит в большей степени подсознательно. Различные попытки самоанализа не приводят к ожидаемым результатам ввиду неполноты теории восприятия [9]. С другой стороны этот факт не помешал решить менее сложные задачи такие, как классификация объектов в обработке символьной информации.
На данный момент существует ряд подходов к построению систем распознавания объектов. Всех их объединяют общие этапы процесса распознавания. Первый этап заключается в представлении информации, сюда можно отнести математические модели изображений и отдельных образов, способы кодирования и обработки. Как правило, модели несут в себе информацию как о необходимых для дальнейшего распознавания признаках, так и побочную (излишнюю) информацию. На втором этапе из полученной информации выделяется минимальный набор признаков, достаточный для принятия решения. Выбор признаков является одной из самых важных задач, так как результат отражается напрямую на качестве системы распознавания в целом. На заключительном этапе по имеющимся наборам признаков выполняется идентификация и классификация при помощи оптимальных решающих процедур [10] [11]. Стоит отметить, что многие из современных методов позволяют производить коррекцию коэффициентов, используемых в процессе выполнения решающих процедур, таким образом, что при неверном конечном результате классификатора система самообучается с тем, чтобы в следующий раз не допустить ошибку по обработке рассматриваемого объекта (или класса объектов).
В общем случае, методы распознавания объектов могут быть подразделены на следующие категории [12] [13]:
- Детерминистские методы
- Статистические методы
- Структурные (лингвистические) методы
Однако приведенное деление на категории нужно считать условным, так как часто встречаются алгоритмы, использующие одновременно методы разных категорий [14].
1.1. Детерминистские методы распознавания
Основное отличие детерминистских методов заключается в оперировании формализованными алгоритмами, критериями подобия, признаками объектов, математическими моделями изображений.
1.1.1. Решающие функции. Главная задача системы распознавания -принятие решения о принадлежности рассматриваемого образа к определенному классу. Под образом здесь (и далее по тексту) понимается объект, представленный на изображении. Один из возможных подходов заключается во введении решающих функций, задача которых провести грань между всевозможными образами так, чтобы получить однозначное разделение их на классы [15]. Процесс построения решающих функций требует наличие выборки образов с соответствующим набором признаков. Выборка должна максимально полно описывать все гипотетически возможные объекты классов. По исходным данным строятся решающие функции, которые способны сопоставить любой образ, в том числе и не входящий в обучающую выборку, с его классом. На Рисунке 1.1 изображено представление двухмерной линейной решающей функции для двух классов образов и \У2.
Х2 4
О
С
С
Рисунок 1.1 - Пример решающей функции для разделения образов на два класса В общем виде уравнение решающей функции задается формулой:
N
Вектор образа - это набор признаков, однозначно описывающих образ. При подстановке в формулу (1.1) любого образа, относящегося к классу \У[ значением функции (1{х) будет положительное число, для любых образов класса XV2 значение функции будет отрицательным. Этот факт позволяет принять функцию в качестве решающей функции в задаче классификации образов. Сложность подхода, использующего решающие функции, в первую очередь обуславливается видом функции, так как классы образов не всегда могут быть отделены друг от друга линейно (отсюда и сложность расчета коэффициентов). В дополнение к этому, если число классов больше двух, то необходимо построить систему решающих функций, совокупность значений которых однозначно
¿=1
где х - вектор образа, аI - коэффициенты,
Х[ - переменные, соответствующие вектору образа х
классифицируют образ. Корректность определения коэффициентов решающих функций зависит от доступного набора образов, для которого производятся расчеты.
В качестве примера построения системы линейных решающих правил можно привести математическую модель персептрона, разработанную Фрэнком Розенблаттом в 1957 году [16]. Эта модель стала одной из первых моделей искусственных нейронных сетей, применяемых для распознавания образов. Основное достоинство нейронных сетей перед традиционными алгоритмами -возможность обучения, суть которого в нахождении коэффициентов связей между нейронами для некоторого ограниченного набора образов [17]. Каждый нейрон вычисляет взвешенную сумму элементов входного сигнала и пропускает результат через пороговую функцию в соответствии со значением коэффициента а0. Выходной сигнал принимает два значения 1 или 0, указывая к которому из двух классов принадлежит образ. Таким образом, персептрон, состоящий из одного нейрона, разделяет гиперплоскостью всю решающую область на две. Схема однослойного персептрона изображена на Рисунке 1.2.
a^ а2 ап
Рисунок 1.2 - Упрощенная схема элементарного персептрона
Принцип работы персептрона заключается в следующем: допустим, есть некоторая обучающая выборка образов, принадлежащих двум классам А и В. Классу А соответствует значение 1 на выходе персептрона, классу В
соответственно 0. В процессе обучения, с каждым новым образом выполняется подстройка коэффициентов % ... ап по следующим правилам:
- значение коэффициента щ остается прежним, если образ принадлежит классу А и значение функции /¿(х) > 0, или образ принадлежит классу В и значение функции /¿(х) < 0;
- значение коэффициента щ увеличивается согласно формуле: щ = щ + с(где с > 0), если образ принадлежит классу А и значение функции
Ш < 0;
- значение коэффициента щ уменьшается согласно формуле: а^ = щ — СХ1 (где с > 0), если образ принадлежит классу В и значение функции
Ж*) £ о-
Можно сделать вывод о том, что в том случае, когда образ был распознан, коэффициент сохраняет свое значение, иначе коэффициент подстраивается таким образом, чтобы для текущего образа и его класса значение функции было правильным. Далее сигналы вида /¿(х) = а^ поступают в сумматор, где происходит их поэлементное сложение. Результат сложения передается на вход компаратора, который сравнивает полученное значение с константой а0 и, в зависимости больше оно или нет, выдает 1 или 0 на выходе.
1.1.2. Метод потенциальных функций. В случае потенциальных функций обучение классификатора производится не пошаговой коррекцией значений весов, а последовательным накоплением значения потенциала, который играет роль решающей функции. Метод основывается на идее нарастания потенциала при приближении образа к некоторому классу [18]. Геометрическая интерпретация такого подхода описывает кластеры образов при помощи холмов и возвышенностей, разделенных долинами - областями, где потенциал достигает своего минимального значения. Существует два основных подхода построения потенциальных функций. Первый подход предполагает фиксированный вид решающей функции, из-за чего процесс обучения такого классификатора схож с процедурой обучения персептрона. Во втором подходе увеличение
классификационной мощности решающих функций реализуется в процессе обучения, что приводит к большим вычислительным нагрузкам при наличии достаточно большого объема рассматриваемых образов.
1.1.3. Функции расстояния. Классификаторы, использующие принцип расстояния, основаны на том, что принадлежность образа некоторому классу можно вычислить на интуитивном уровне, оценив его месторасположение в евклидовом пространстве. Такие классификаторы применяются к образам, имеющим кластеризационные свойства, что дает основание получить верный результат при использовании критерия минимума расстояния в качестве основного критерия. Существует несколько принципов оценки принадлежности образа к кластеру [19].
Первый принцип характеризуется единственностью эталона. В случае, когда образы любого рассматриваемого класса подвержены группировке вокруг некоторого типичного образа (Рисунок 1.3) - этот образ принимается в качестве эталонного для данного класса [20]. Как правило, в данной ситуации реальный образ действительно единственен, а совокупность образов, подвергающихся классификации, образована путем искажения изначального образа, добавления различного рода помех, например, из-за несовершенного оборудования, обеспечивающего ввод изображения в систему. Векторы образов для одного класса, сгруппированного вокруг единственного эталона, очень схожи между собой, что делает принцип минимального расстояния достаточно эффективным для задачи классификации.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Гибридные методы и алгоритмы для интеллектуальных систем классификации сложноструктурируемых изображений2013 год, доктор технических наук Томакова, Римма Александровна
Разработка и исследование алгоритмов распознавания изображений на основе определения экстремальных признаков замкнутых контуров с помощью сортировки2008 год, кандидат технических наук Рюмин, Олег Германович
Методы, модели и алгоритмы анализа и классификации растровых изображений рентгенограмм грудной клетки2016 год, кандидат наук Дюдин Михаил Валерьевич
Алгоритмы распознавания рукописных символов в условиях малой обучающей выборки2017 год, кандидат наук Хаустов Павел Александрович
Методы распознавания изображений лиц на основе инвариантов к аффинным и яркостным преобразованиям2018 год, кандидат наук Нгуен Зуй Тхань
Список литературы диссертационного исследования кандидат наук Чечель, Андрей Олегович, 2013 год
Список литературы
1. Ray Liu , К. J. Pattern Recognition and Image Preprocessing (2nd edition) / K. J. Ray Liu. — New York : Marcel Dekker Inc., 2002. — 698 p.
2. Бонгард , M.M. Проблема узнавания / M.M. Бонгард. — M. : Наука, 1967. — 320 с.
3. Солсо , Р. Когнитивная психология / Р. Солсо. — СПб. : Питер, 2006. — 589 с.
4. Хакен , Г. Принципы работы головного мозга: Синергетический подход к активности мозга, поведению и когнитивной деятельности / Г. Хакен. — М. : Per Se, 2001, —353 с.
5. Яне , Б. Цифровая обработка изображений / Б. Яне. — М. : Техносфера, 2007.
— 584 с.
6. Bow , S.-Т. Pattern Recognition and Image Preprocessing (2nd edition) / S.-T. Bow.
— Boca Raton : CRC Press, 2002. — 720 p.
7. Визильтер , Ю.В. Обработка и анализ изображений в задачах машинного зрения: Курс лекций и практических занятий / Ю.В. Визильтер, Ю.С. Желтов, A.B. Бондаренко, М.В. Ососков, A.B. Моржин. — М. : Физматкнига, 2010. — 672 с.
8. Фисенко , В.Т. Компьютерная обработка и распознавание изображений: учеб. пособие / В.Т. Фисенко, Т.Ю. Фисенко. — СПб. : СПбГУ ИТМО, 2008. — 192 с.
9. Величковский , Б.М. Когнитивная наука: Основы психологии познания / Б.М. Величковский. — М. : Академия, 2006. — Т. 1 : 448 с.
10. Горелик , A.JI. Селекция и распознавание на основе локационной информации / A.J1. Горелик, Ю.Л. Барабаш, О.В. Кривошеев, С.С. Эпштейн. — М. : Радио и связь, 1990. —240 с.
11. Хо , Ю. Об алгоритмах классификации образов. Введение и обзор / Ю. Хо, А. Агравала // Труды Института инженеров по электротехнике и радиоэлектронике. — М.: Советское радио, 1968. — №56-12. — С. 5-19.
12. Анисимов , Б.В. Распознавание и цифровая обработка изображений: Учебное пособие для студентов вузов / Б.В. Анисимов, В.Д. Курганов, В.К. Злобин. — М.: Высш. шк., 1983. — 295 с.
13. Нильсон , Н. Обучающиеся машины / Н. Нильсон. — М.: Мир, 1967. — 176 с.
14. Фу , К. Структурные методы в распознавании образов / К. Фу. — М. : Мир, 1977, —320 с.
15. Дуда , Р. Распознавание образов и анализ сцен / Р. Дуда, П. Харт. — М. : Мир, 1976. —511 с.
16. Krose , В. An Introduction to Neural Network (8th edition) / B. Krose, P. Smagt. — Amsterdam : University of Amsterdam, 1996. — 135 p.
17. Брилюк , Д.В. Распознавание человека по изображению лица нейросетевыми методами / Д.В. Брилюк, В.В. Старовойтов. — Минск : Институт техн. кибернетики HAH Беларуси, 2002. — 54 с.
18. Файн , B.C. Опознавание изображений (основы непрерывно-групповой теории и ее приложения) / B.C. Файн. — М. : Наука, 1970. — 299 с.
19. Гонсалес , Р. Принципы распознавания образов / Р. Гонсалес, Дж. Ту. — М. : Мир, 1978. —413 с.
20. Голубев , A.C. О распознавании образов методом ближайшего элемента в условиях единичного эталона / A.C. Голубев, М.Ю. Звягин // Материалы XIV международной заочной научно-практической конференции. — Новосибирск : Сибирская ассоциация консультантов, 2012. — С. 14-19.
21. Загоруйко , Н.Г. Прикладные методы анализа данных и знаний / Н.Г. Загоруйко. — Новосибирск : ИМ СО РАН, 2010. — 270 с.
22. Форсайт , Д.А. Компьютерное зрение. Современный подход / Д.А. Форсайт, Ж. Понс. — М.: Издательский дом "Вильяме", 2004. — 928 с.
23. Geoffrey , H.B. Isodata, a novel method of data analysis and pattern classification / H.B. Geoffrey, D.J. Hall. — Menlo park : Stanford research institute, 1965. — 73 p.
24. Фукунага , К. Введение в статистическую теорию распознавания образов / К. Фукунага. — М : Наука, 1979. — 368 с.
25. Патрик , Э.А. Основы теории распознавания образов / Э.А. Патрик. — М. : Сов. радио, 1980. — 408 с.
26. Вальд , А. Последовательный анализ / А. Вальд, Б.А. Севастянов. — М. : Физматлит, 1960. — 328 с.
27. Бутаков , Е.А. Обработка изображений на ЭВМ / Е.А. Бутаков, В.И. Островский, И.Л. Фадеев. — М. : Радио и связь, 1987. — 240 с.
28. Быков , P.E. Цифровое преобразование изображений: Учебное пособие для вузов / P.E. Быков, Р. Фрайер, К.В. Иванов, A.A. Манцветов. — М. : Горячая линия-Телеком, 2003. — 228 с.
29. Гонсалес , Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс. — М. : Техносфера, 2005. — 1072 с.
30. Пратт , У. Цифровая обработка изображений / У. Пратт. — М. : Мир, 1982. — 312 с.
31. Красильников , H.H. Цифровая обработка 2D- и 3D- изображений / H.H. Красильников. — СПб.: БХВ-Петербург, 2011. — 608 с.
32. Morel, J.M. Variational methods in image segmentation / J.M. Morel. — Boston : Birkhauser, 1995. — 249 p.
33. Сойфер , В.А. Методы компьютерной обработки изображений / В.А. Сойфер.
— М.: Физматлит, 2003. — 784 с.
34. Красильников , Н.Н. Цифровая обработка изображений / Н.Н. Красильников.
— М.: Вузовская книга, 2001. — 320 с.
35. Freeman , Н. One the digital-computer classification of geometric line pattern / H. Freeman // Proc. Nat. Electron. Conf.. — 1962. — № 18. — P. 312-324.
36. Фу , К. Робототехника / К. Фу, Р. Гонсалес, К. Ли. — М.: Мир, 1989. — 624 с.
37. Шапиро , JT. Компьютерное зрение / J1. Шапиро, Дж. Стокман. — М. : БИНОМ, 2006. — 752 с.
38. Cramariuc , В. Clustering based region growing algorithm for color image segmentation / B. Cramariuc, M. Gabbouj, J. Astola // Proceedings of the 13th International Conference on Digital Signal Processing. — 1997. — P. 857-860.
39. Tremeau , A. A region growing and merging algorithm to color segmentation / A. Tremeau, N. Borel // Pattern Recognition. — 1997. — № 30-7. — P. 1191-1203.
40. Burt, P.J. Multiresolution image processing and analysis: the pyramid as a structure for efficient computation / P.J. Burt, A. Rosenfeld // Springer Series in Information Sciences. — New York : Springer, 1984. — № 12. — P. 6-35.
41. Чочиа , П.А. Пирамидальный алгоритм сегментации изображений / П.А. Чочиа // Информационные процессы. — М. : Институт проблем передачи информации им. А.А. Харкевича РАН, 2010. — № 10-1. — С. 23-35.
42. Burt, P.J. Segmentation and estimation of image region properties through cooperative hierarchical computation / P.J. Burt, Т.Н. Hong, A. Rosenfeld // IEEE Trans. SMC. — 1981. — № 11. — P. 802-809.
43. Pietikainen , M. Image segmentation by texture using pyramid node linking / M. Pietikainen, A. Rosenfield // SMC. — Defense Technical Information Center, 1981. — № 11. —P. 822-825.
44. Фурман , Я.А. Цифровые методы обработки и распознавания бинарных изображений / Я.А. Фурман, А.Н. Юрьев, В.В. Яншин. — Красноярск : Изд-во Краснояр. ун-та, 1992. — 248 с.
45. Ярославский , Л.П. Введение в цифровую обработку изображений / Л.П. Ярославский. — М.: Сов. радио, 1979. — 312 с.
46. Болтов , Ю.Ф. Сжатие графической информации на основе её представления в виде полевой структуры / Ю. Ф. Болтов // Телекоммуникации. — М. : Наука и технологии, 2008. — № 12. — С. 30-35.
47. Болтов , Ю.Ф. Сжатие рисованных изображений на основе их представления в виде полевой структуры / Ю. Ф. Болтов // Телекоммуникации. — М. : Наука и технологии, 2009. — № 1. — С. 30-36.
48. Болтов , Ю.Ф. Интерпретатор графической информации в полевой модели: построение и возможности. Часть 1 / Ю.Ф. Болтов, А.О. Чечель // Телекоммуникации. — М. : Наука и технологии, 2012. — № 8. — С. 6-14.
49. Болтов , Ю.Ф. Сглаживание изображений на основе решения краевой задач / Ю. Ф. Болтов, И. А. Волков // Телекоммуникации. — М. : Наука и технологии, 2010. —№5. —С. 24-33.
50. Болтов , Ю.Ф. Выделение контуров изображений на основе функции Грина / Ю. Ф. Болтов // Телекоммуникации. — М. : Наука и технологии, 2009. — № 5. — С. 27-32.
51. Болтов , Ю.Ф. Интерпретатор графической информации в полевой модели: построение и возможности. Часть 2 / Ю.Ф. Болтов, А.О. Чечель // Телекоммуникации. — М. : Наука и технологии, 2012. — № 11. — С. 6-11.
52. Болтов , Ю.Ф. Обработка визуальной информации на основе ее представления в виде скалярных или векторных полей / Ю.Ф. Болтов. — СПб : СПбГУТ, 2010. — 184 с.
53. Фурман , Я.А. Введение в контурный анализ / Я.А. Фурман, A.B. Кревецкий, А.К. Передреев, A.A. Роженцов, Р.Г. Хафизов, И.Л. Егошина, А.Н. Леухин. — М. : Физматлит, 2003. — 592 с.
54. Чечель , А.О. Распознавание образов на основе представления графической информации в виде полевых структур / А.О. Чечель, B.C. Чистов // Труды учебных заведений связи. — СПб.: ГОУВПО СПбГУТ, 2009. — № 181. — С. 6470.
55. Чечель , А.О. Анализ статических сцен с применением концепции полевых структур: Математическая модель / А.О. Чечель, B.C. Чистов // Современное телевидение. Труды 18-й Международной научно-технической конференции. — М. : ФГУП "МКБ Электрон", 2010. — С. 206-209.
56. Чечель , А.О. Анализ статических сцен с применением концепции полевых структур: Экспериментальная модель / А.О. Чечель, B.C. Чистов // Современное телевидение. Труды 18-й Международной научно-технической конференции. — М.: ФГУП "МКБ Электрон", 2010. — С. 209-212.
57. Чечель , А.О. Модель идентификации образов в черно-белых изображениях, представленных в виде полевых структур / А.О. Чечель // 62-я научно-техническая конференция профессорско-преподавательского состава научных сотрудников и аспирантов: материалы. — СПб. : ГОУВПО СПбГУТ, 2010. — С. 88-90.
58. Чечель , А.О. Идентификация сложных объектов в цветных изображениях / А.О. Чечель // 63-я научно-техническая конференция профессорско-преподавательского состава научных сотрудников и аспирантов. — СПб. : ГОУВПО СПбГУТ, 2011. — С. 206-207.
59. Rice , S.V. Optical character recognition: an illustrated guide to the frontier / S.V. Rice, G. Nagy, T.A. Nartker // The Springer International Series in Engineering and Computer Science. — Kluwer Academic Publishers, 1999. — P. 57-60.
60. Graves , A. Offline handwriting recognition with multidimensional recurrent neural networks / A. Graves, J. Schmidhuber // Advances in Neural Information Processing Systems 22. — Vancouver : Neural Information Processing Systems (NIPS) Foundation, 2009. — P. 545-552.
61. Plamondon , R. On-line and off-line handwriting recognition: a comprehensive survey / R. Plamondon, S.N. Srihari // IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2000. — №22-1. — P. 63-84.
62. Чечель , А.О. Классификация графических объектов посредством представления их в виде полевых структур / А.О. Чечель // Современное телевидение и радиоэлектроника. Труды 19-й Международной научно-технической конференции. —М. : ФГУП "МКБ Электрон", 2011. — С. 165-168.
63. Ebert, D.S. Texturing and Modeling: A Procedural Approach (3rd edition) / D.S. Ebert, F.K. Musgrave, D. Peachey, K. Perlin, S. Worley. — San Francisco : Morgan Kaufmann Publishers, 2003. — 687 p.
64. Perlin , K. Implementing Improved Perlin Noise / K. Perlin, R. Fernando // GPU Gems. — Addison-Wesley, 2004. — P. 73-85.
65. Perlin , K. An Image Synthesizer / K. Perlin // Computer Graphics. — New York : ACM, 1985. — № 19-3. — P. 287-296.
66. Foley , J.D. Computer Graphics: Principles and Practice in С / J.D. Foley , A. Dam, S.K. Feiner, J.F. Hughes. — Addison-Wesley, 1996. — 1175 p.
67. Чечель , А.О. Свидетельство о государственной регистрации программы для ЭВМ № 2013614251 / А.О. Чечель // "ChRecognizer", Российская Федерация, заявка № 2013611942 от 14.03.2013, опубл. 25.04.2013.
68. ABBYY FineReader Engine. — URL: http://www.abbyy.ru/finereader-engine/ (дата обращения: 15.06.2013).
69. SimpleOCR - freeware OCR software and royalty free OCR engine. — URL: http://www.simpleocr.com/ (дата обращения: 15.06.2013).
70. VietOCR .NET. — URL: http://vietocr.sourceforge.net/ (дата обращения: 15.06.2013).
71. Приложение Microsoft Office Document Imaging. — URL: http://office.microsoft.com/ru-ru/help/HP001077103.aspx (дата обращения: 15.06.2013).
72. Чечель , A.O. Локализация в видео потоке объектов, представленных полевыми структурами / А.О. Чечель // Международная научно-техническая и научно-методическая конференция «Актуальные проблемы инфотелекоммуникаций в науке и образовании». № 64. 20-24 февраля 2012 года : материалы. — СПб. : Издательство СПбГУТ, 2012. — С. 208-209.
73. Mihaylova , L. Object tracking by particle filtering techniques in video sequences / L. Mihaylova, P. Brasnett, N. Canagarajan, D. Bull // Advances and Challenges in Multisensor Data and Information. — Netherlands : IOS Press, 2007. — № 8. — P. 260-268.
74. Kang , S. Real-time video tracking using PTZ cameras / S. Kang, J. Paik, A. Koschan, B. Abidi, M.A. Abidi // Sixth International Conference on Quality Control by Artificial Vision. — Gatlinburg : TN, 2003. — № 5132. — P. 103-111.
75. Isard , M. Condensation - conditional density propagation for visual tracking / M. Isard, A. Blake // International Journal of Computer Vision. — New York : Springer, 1998. — №29-1. — P. 5-28.
76. Tomasi, C. Detection and tracking of point features / C. Tomasi, T. Kanade // School of Computer Science. — Carnegie Mellon University, 1991. — P. 1-20.
77. Roh , M.-C. Accurate object contour tracking based on boundary edge selection / M.-C. Roh, T.-Y. Kim, J. Park, S.-W. Lee // Pattern Recognition. — 2007. — № 40. — P. 931-943.
78. Yilmaz , A. Object tracking: A survey / A. Yilmaz, O. Javed, M. Shah // ACM Computing Surveys. — 2006. — № 38-4. — P. 1-45.
79. Zhong , Y. Object tracking using deformable templates / Y. Zhong, A.K. Jain, M.-P. Dubuisson-Jolly // The IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2000. — № 22-5. — P. 544-549.
80. Jain , A.K. Object matching using deformable templates / A.K. Jain, Y. Zhong, S. Lakshmanan // The IEEE Transactions on Pattern Analysis and Machine Intelligence. — 1996. — № 18-3. — P. 267-278.
81. Paragios , N. Geodesic active contours and level sets for the detection and tracking of moving objects / N. Paragios, R. Deriche // The IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2000. — № 22-3. — P. 266-280.
82. Fu , Y. Tracking visible boundary of objects using occlusion adaptive motion snake / Y. Fu, A.T. Erdem, A.M. Tekalp // The IEEE Transactions on Pattern Analysis and Machine Intelligence. — 2000. — № 9-12. — P. 2051-2060.
83. Nguyen , H.T. Tracking nonparameterized object contours in video / H.T. Nguyen, M. Worring, R. Boomgaard, A.W.M. Smeulders // IEEE Transactions on Image Processing. — 2002. — № 11-9. —P. 1081-1091.
84. Чечель , А.О. Тренинг графических объектов, представленных в виде полевых структур / А.О. Чечель // Современное телевидение и радиоэлектроника. Труды 20-й Международной научно-технической конференции. — М. : ФГУП "МКБ Электрон", 2012. — С. 130-133.
85. .NET Framework. — URL: http://msdn.microsoft.com/en-US/vstudio/aa496123.aspx (дата обращения: 15.06.2013).
86. Bitmap - класс (System.Drawing). — URL: http://msdn.microsoft.com/ru-ru/library/system.drawing.bitmap.aspx (дата обращения: 15.06.2013).
87. Чечель , A.O. Захват и покадровая обработка видеосигнала в среде .Net / А.О. Чечель // RSDN Magazine. — М.: К-Пресс, 2012. — № 2. — С. 59-66.
88. Video Capture (Windows). — URL: http://msdn.microsoft.com/en-us/library/windows/desktop/dd757692.aspx (дата обращения: 15.06.2013).
89. Pesce , M.D. Programming Microsoft DirectShow for Digital Video and Television / M.D. Pesce. — Redmond : Microsoft Press, 2003. — 414 p.
90. DirectShowNet library. — URL: http://directshownet.sourceforge.net/ (дата обращения: 15.06.2013).
91. Polinger , A. Developing Microsoft Media Foundation Applications / A. Polinger. — Sebastopol: O'Reilly Media, 2011. — 386 p.
92. Media Foundation .Net. — URL: http://mfnet.sourceforge.net/ (дата обращения: 15.06.2013).
93. Использование класса XmlSerializer. — URL: http://msdn.microsoft.com/ru-ru/library/ms733901.aspx (дата обращения: 15.06.2013).
94. BinaryFormatter Class. — URL: http://msdn.microsoft.com/en-us/library/system.mntime.serialization.formatters.binary.binaryformatter(v=vs.llO).asp x (дата обращения: 15.06.2013).
95. DataContractSerializer Class. — URL: http://msdn.microsoft.com/ru-ru/library/system.runtime.serialization.datacontractserializer.aspx (дата обращения: 15.06.2013).
96. Parallel Programming in the .NET Framework. — URL:
http://msdn.microsoft.com/en-us/library/dd460693.aspx (дата обращения: 15.06.2013).
97. Modeling Texturing and, A Procedural Approach Second Edition, Ebert D. et al AP Professional, 1998c Cambridge.
98. Павлидис , Т. Алгоритмы машинной графики и обработки изображений / Т. Павлидис. — М.: Радио и связь, 1986. — 394 с.
Приложение 1. ХМЬ схема сериализации данных (алгоритм СЬ^епаНгег)
<?хт1 уег5л.оп="1.0" encoding="utf-8" ?> <Р11е>
<5ег1аПгег\/ег51.оп Туре="ЕхрЕ^е11™ег5есГ /> <Content> <С1аБ51> <Р1е1с11>
<Р1е1сИ_С1а55МешЬег1 /> <Р1е1с11_С1а55МетЬег2 /> <Р1е]^1_С1а55МетЬе^ /> </Р1е1с11>
<Пе1д2 /> />
</С1аБ51> <С1аБ52 /> <С1а5БМ /> </Сог^егг1:> <Header /> <Headeг>
<0р11опБ Туре="ЕхрВу1е">
<SepializeInheгitedTypes Туре="Вз.1:_0" /> </0р1:з.оп5> <DataStгuctuгe>
<ClassesCount Type="ExpByte" Condition="SeгializeInheгitedTypes=l,, /> <С1Э551>
<FieldsCount Type="ExpByte" /> <Р1е1д1>
<FieldID Туре="ЕхрВу1е" /> <FieldSize Туре="ЕхрВу1е" /> </Fieldl> <Field2 /> ^е]^ /> </С1а5Б1>
<! --Сог^л.1:з.оп: SenializeInheгitedTypes=l--> <С1аБ52 /> <!--ВаБе с1а5Б of С1а55[1]--> <С1аБ5Ы /> <!--ВаБе с1а5Б of С1а55[М-1]--> </DataStгuctupe> </Headeг>
<HeadeгSize Type="ExpByteInveгsed,, /> </Рз.1е>
Приложение 2. Области, охваченные цепными кодами
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.