Разработка и исследование метода и алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста тема диссертации и автореферата по ВАК РФ 05.13.17, кандидат наук Ефимов Никита Олегович
- Специальность ВАК РФ05.13.17
- Количество страниц 164
Оглавление диссертации кандидат наук Ефимов Никита Олегович
ВВЕДЕНИЕ
ГЛАВА 1 МЕТОДЫ АНАЛИЗА СКАНИРОВАННОГО РУКОПИСНОГО ТЕКСТА
1.1 Проблемы формирования цифровых изображений сканированного рукописного текста
1.2 Сегментация цифровых изображений рукописных документов
1.2.1 Метод сегментации слов, основанный на использовании яркости цифрового изображения
1.2.2 Метод сегментации, основанный на использовании связных точек
1.2.3 Метод сегментации, основанный на использовании диаграмм Вороного
1.3 Методы распознавания рукописного текста
1.3.1 Методы распознавания изображений
1.3.1.1 Пространственная корреляция
1.3.1.2 Сопоставление изображений на основе особых точек
1.3.2 Шаблонные методы распознавания символов рукописного текста
1.3.3 Структурные методы распознавания символов рукописного текста
1.3.4 Признаковые методы распознавания символов рукописного текста
1.3.5 Метод структурно-пятенных эталонов
1.3.6 Выводы подраздела
1.4 Основы субполосного анализа изображений с позиций прецедентной идентификации
1.5 Задачи исследования
ГЛАВА 2 ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ПРЕЦЕДЕНТНОЙ ИДЕНТИФИКАЦИИ ФРАГМЕНТОВ РУКОПИСНОГО ТЕКСТА
2.1 Субполосные свойства фрагментов изображений рукописного текста
2.1.1 Разбиение области определения трансформанты Фурье на подобласти пространственных частот
2.1.2 Части и доли энергии цифровых изображений рукописного текста в заданных подобластях пространственных частот
2.1.3 Исследование субполосных свойств фрагментов сканированного рукописного текста
2.2 Разработка субполосной меры близости фрагментов сканированного рукописного текста и исследование ее свойств
2.3 Основные результаты и выводы главы
ГЛАВА 3 КОМПЬЮТЕРНАЯ ОБРАБОТКА СКАНИРОВАННОГО РУКОПИСНОГО ТЕКСТА НА ОСНОВЕ СУБПОЛОСНОГО АНАЛИЗА В ЗАДАЧАХ ПРЕЦЕДЕНТНОЙ ИДЕНТИФИКАЦИИ
3.1 Методика компьютерной сегментации слов сканированного рукописного текста, на основе субполосного анализа
3.1.1 Разработка методики и алгоритма компьютерной сегментации слов сканированного
рукописного текста, на основе субполосного анализа
3.1.2 Проверка работоспособности разработанного алгоритма компьютерной сегментации слов сканированного рукописного текста
3.2 Методика обучения по заданному прецеденту, для определения критической области субполосной решающей функции
3.3 Метод и алгоритм субполосной прецедентной идентификации фрагментов сканированного рукописного текста
3.3.1 Разработка метода и алгоритма субполосной прецедентной идентификации фрагментов сканированного рукописного текста
3.3.2 Проверка работоспособности разработанного алгоритма и результаты сравнительных экспериментальных исследований
3.4 Алгоритм обнаружения значимых изменений почерка на основе субполосной меры близости
3.5 Основные результаты и выводы главы
ГЛАВА 4 РАЗРАБОТКА ПРОТОТИПА ПРОГРАММНОЙ РЕАЛИЗАЦИИ ИНФОРМАЦИОННОЙ ТЕХНОЛОГИИ ПРЕЦЕДЕНТНОЙ ИДЕНТИФИКАЦИИ ФРАГМЕНТОВ СКАНИРОВАННОГО РУКОПИСНОГО ТЕКСТА
4.1 Архитектура прототипа программной реализации информационной технологии прецедентной идентификации фрагментов сканированного рукописного текста
4.2 Интерфейс прототипа программной реализации информационной технологии прецедентной идентификации фрагментов сканированного рукописного текста
4.3 Проверка работоспособности прототипа программной реализации информационной технологии прецедентной идентификации фрагментов сканированного рукописного текста
4.4 Основные результаты и выводы главы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
Рекомендованный список диссертаций по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
ПРЕЦЕДЕНТНОЕ РАСПОЗНАВАНИЕ ФРАГМЕНТОВ ИЗОБРАЖЕНИЙ ЗЕМНОЙ ПОВЕРХНОСТИ2016 год, кандидат наук Лихошерстный Алексей Юрьевич
Обработка и распознавание рукописного текста в системах электронного документооборота2008 год, кандидат технических наук Горошкин, Антон Николаевич
Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения2010 год, кандидат физико-математических наук Сорокин, Андрей Игоревич
Моделирование процесса идентификации графических объектов2011 год, кандидат технических наук Курушин, Даниил Сергеевич
Алгоритмы фильтрации изображений в квазидвумерных конечных базисах2014 год, кандидат наук Упакова, Анастасия Геннадьевна
Введение диссертации (часть автореферата) на тему «Разработка и исследование метода и алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста»
ВВЕДЕНИЕ
Актуальность темы исследования. Письменность является одной из устоявшихся и распространенных форм информационного обмена. Количество дошедших до наших времен рукописных текстов на различных языках не поддается исчислению. К примеру, Российский государственный архив древних текстов содержит более 3млн документов, за хронологический период XI- XX века.
Рукописные документы подвергаются анализу с различных точек зрения. Одним из направлений такого анализа является исследование рукописей одного и того же автора на предмет частотного анализа используемых им слов. Кроме того, с позиций информационно-аналитических систем безопасности можно отметить необходимость обнаружения фальсификации фрагментов, например, подписей, в том числе и в печатных документах, поиска ключевых слов, обозначающих определенную направленность письменных сообщений и т.д.
С развитием компьютерной техники для работы с текстовыми документами используется их представление в цифровой форме. Для этого бумажный носитель подвергают процедурам сканирования и сохранения полученных данных в память компьютера в формате цифрового изображения.
Поэтому, разработка информационной технологии компьютерного поиска в документе рукописных фрагментов, представляющих интерес с некоторой точки зрения, является актуальной задачей.
В настоящей работе задача поиска фрагментов сформулирована следующим образом: на изображении документа выделяется фрагмент сплошного рукописного текста, например, слово или подпись, необходимо в других частях документа найти фрагменты, идентичные заданному.
В соответствии со сложившейся терминологией такой поиск естественно называть прецедентной идентификацией фрагментов текста. При этом рассматриваются два класса фрагментов: идентичные заданному и все остальные.
Отметим, что на свойства изображений сканированного текста оказывают влияние многие факторы, среди которых различие аппаратных средств (собственные шумы, разрешение сканера), состояние носителя текста (качество бумаги, различные пятна, заломы, качество чернил и пр.), индивидуальные особенности почерка и т.д.
Поэтому, адекватным для прецедентной идентификации фрагментов рукописного текста представляется использование статистических решений, включая определение признакового пространства, решающей функции и обучение, с целью определения границ критической области.
Степень разработанности темы исследования. Поставленная задача относится к классу задач обработки цифровых изображений и распознавания образов, существенный вклад в исследование которых внесли российские: Ю. И. Журавлев, В. А. Сойфер, В. Н. Вапник, Н. Н. Красильников, Е. Г. Жиляков, А. Е. Лепский, А. Г. Броневича А. Ю. Червоненкис, и др. и зарубежные ученые: Р. Гонсалес, У. Прэтт, Б. Яне, К. Фу, Г. Шапиро, Дж. Ту, Р. Дуда и др.
В области распознавания изображений текста (в том числе и рукописного) стоит отметить вклад как зарубежных (J.Favata, A.Vinciarelli, J.Luettin, T.Plotz, G.Fink, J.Edwards), так и отечественных исследователей (В.Д.Козлов, Н.В.Котович, А.Н.Горошкин, Ю.В.Титов, А.И.Сорокин, И.А.Зеленцов).
Однако, в этих работах не затрагивается анализ цифровых изображений с позиций прецедентной идентификации рукописных фрагментов сканированного текста.
Существующие коммерческие системы обработки сканированного рукописного текста (A2iA, ParaScript, FineReader и др.) также не позволяют решить задачу в сформулированной постановке. Они ориентированы на перевод изображений рукописей в печатный текст и не приспособлены к вводу прецедента, обучению по единственному образцу и принятию решений на основе анализа слов. Все перечисленные продукты имеют закрытый программный код недоступный для модификации обычному пользователю.
Очевидно, что для построения эффективной системы идентификации следует адекватно учитывать свойства фрагментов рукописного текста. Их отличительной особенностью является квазипериодичность контуров символов в слове, что проявляется в высокой концентрации энергии в подобласти пространственных частот области определения трансформанты Фурье. Это свойство может быть адекватно учтено путем применения субполосного анализа, который предполагает разбиение области определения трансформанты Фурье на подобласти. При этом, появляется возможность в качестве меры близости сравниваемых фрагментов использовать локальные меры близости фрагментов трансформант Фурье в различных подобластях пространственных частот. Кроме того, следует учитывать широкополосность самих контуров.
Целью диссертационной работы является развитие методов компьютерной обработки цифровых изображений рукописного текста за счет разработки метода и алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста на основе адекватных субполосных представлений в области определения пространственного преобразования Фурье.
Для достижения поставленной цели были сформулированы и решены следующие задачи исследования:
1. Анализ адекватности методов обработки сканированного рукописного текста с позиций прецедентной идентификации его фрагментов.
2. Разработка субполосного метода сегментации сканированного рукописного текста на слова.
3. Разработка и исследование субполосной решающей функции для прецедентной идентификации фрагментов сканированного рукописного текста.
4. Разработка метода прецедентной идентификации фрагментов сканированного рукописного текста, включая методику обучения по единственному прецеденту для определения критической области решающей функции.
5. Разработка алгоритмов обработки цифровых изображений сканированного рукописного текста при прецедентной идентификации заданных фрагментов.
6. Исследование работоспособности алгоритмов прецедентной идентификации фрагментов рукописного текста на основе вычислительных экспериментов
Научную новизну работы составляет следующее:
1. Решающая функция на основе локальных субполосных мер близости, адекватно отображающих субполосные свойства контуров символов рукописных фрагментов
2. Методика обучения по заданному прецеденту, позволяющая определить критическую область решающей функции на основе многократной его имитации оператором.
3. Методика компьютерной сегментации слов сканированного рукописного, на основе субполосного анализа.
Теоретическая значимость работы определяется разработанной решающей функцией для проверки гипотез об идентичности сравниваемых фрагментов, на основе субполосных признаков.
Практическая значимость работы определяется возможностью применения разработанных методов и алгоритмов при обработке цифровых изображений рукописного текста.
Полученные в ходе диссертационного исследования результаты используются в Белгородском внедренческом центре «АннаСофт», а также в учебном процессе специалистов по направлению подготовки 11.05.04 «Информационно-аналитические системы безопасности» НИУ «БелГУ», что подтверждается соответствующими документами (Приложение А).
Объект исследований: методы компьютерного анализа цифровых изображений рукописного текста.
Предмет исследований: методы прецедентной идентификации фрагментов рукописного текста.
Методы диссертационного исследования. В работе использованы методы субполосного анализа и синтеза, статистического анализа, цифровой обработки изображений, линейной алгебры и вычислительных экспериментов.
Область исследований. Содержание диссертации соответствует следующим пунктам паспорта специальности 05.13.17 «Теоретические основы информатики» (технические науки): п.5. Разработка и исследование моделей и алгоритмов анализа данных, обнаружения закономерностей в данных и их извлечениях, разработка и исследование методов и алгоритмов анализа текста, устной речи и изображений; п.7. Разработка методов распознавания образов, фильтрации, распознавания и синтеза изображений, решающих правил. Моделирование формирования эмпирического знания.
Положения, выносимые на защиту:
1. Для адекватного учета свойств фрагментов рукописного текста в задаче прецедентной идентификации целесообразно использовать субполосные представления в области пространственных частот.
2. Метод прецедентной идентификации фрагментов сканированного рукописного текста на основе субполосной решающей функции
3.Алгоритмы обработки сканированного рукописного текста на основе субполосного анализа, включая сегментацию на слова, методику обучения и принятие решений.
4. Результаты вычислительных экспериментов, иллюстрирующие работоспособность алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста
Достоверность выводов и рекомендаций обусловлена корректностью применяемых математических преобразований, отсутствием противоречий с известными фактами теории и практики обработки цифровых изображений и распознавания образов, подтверждается и иллюстрируется результатами вычислительных экспериментов с реальными изображениями рукописного текста.
Связь с научными и инновационными программами.
Результаты диссертационного исследования были получены при выполнении - ГК № 14.581.21.0003 от 29.09.2014 г., уникальный идентификатор ПНИЭР КГМЕЕ158114Х0003
- Государственного задания НИУ «БелГУ» № 8.2201.2017/4.6
Апробация результатов диссертационного исследования.
Результаты диссертационного исследования обсуждались на следующих научно-технических конференциях и выставках: Всероссийская молодёжная конференция «Теория и практика системного анализа» (Белгород, 2012); Международная молодежная конференция «Прикладная математика, управление и информатика» (Белгород, 2012); III Международная научно-практической конференция студентов и аспирантов «Математика и ее приложения в современной науке и практике», (Курск, 2013); III Международная научно-техническая конференция «Современные направления развития информационно-коммуникационных технологий и средств управления» (Харьков, 2013); Международная научно-техническая конференция «Проблемы информатики и моделирования» (Харьков, 2013); XI Курчатовская молодежная научная школа (Москва, 2013); V международная научно-техническая конференция «Информатика, управление и искусственный интеллект» (Харьков, 2018); XII Курчатовская молодежная научная школа (Москва, 2014); «Первая молодёжная научно-практическая конференция с международным участием» (Белгород, 2017); «Молодёжный форум: прикладная математика. Математическое моделирование систем и механизмов» (Воронеж, 2017).
Публикации. По теме диссертационного исследования опубликовано 11 печатных работ (из них 5 - в журналах из списка ВАК), получен 1 патент и свидетельство о регистрации программы для ЭВМ (Приложение Б).
Личный вклад соискателя. Все изложенные в диссертации результаты исследования получены соискателем лично, либо при его непосредственном участии.
Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа изложена на 159 страницах основного текста, включающего 96 рисунков, 10 таблиц, список литературных источников из 117 наименований, а также 2 приложения.
ГЛАВА 1 МЕТОДЫ АНАЛИЗА СКАНИРОВАННОГО РУКОПИСНОГО
ТЕКСТА
1.1 Проблемы формирования цифровых изображений сканированного
рукописного текста
Сканирование - процесс создания цифровой копии расположенного на плоском носителе (чаще всего бумаге) изображения, как правило заключается в освещении оригинала и дальнейшем цифровом кодировании аналогового сигнала яркости. Устройство, выполняющее подобное преобразование, называется сканером.
Сканер - оптоэлектронный прибор, который состоит из следующих основных компонентов: источник света, оптическая система, фотоприемник, механизм перемещения фотоприемника (или оптической системы) относительно оригинала.
При сканировании текстовый оригинал освещается источником света. Темные области поглощают больше света, чем светлые, отраженный (или преломленный) свет оптической системой направляется на фотоприемник, который преобразует интенсивность принимаемого света в соответствующее значение напряжения.
Фотоприемник обычно реализуется по одной из трех технологий:
• фотоэлектронный умножитель (ФЭУ или photomultiplier tube - РМТ)
• прибор с зарядовой связью (ПЗС или charge-coupled device - CCD)
• контактный сенсор изображения (contact image sensor - CIS)
ФЭУ - технология датчиков высокопроизводительных цветных барабанных сканеров, которые используются для подготовки матриц цветной полиграфии. Оригинал изображения закрепляется на цилиндрическом барабане, который начинает вращаться. Каретка с датчиками и осветителями перемещаются вдоль изображения. Управление разрешением или размером изображения происходит
через изменение скорости движения каретки, оптической силу линз и радиуса барабана. ФЭУ-сканеры имеют два источника освещения, один для сканирования в отраженном свете, другой - для прозрачных оригиналов. Свет подсветки расщепляется на три луча, которые проходят через светофильтры (красный, зеленый и синий), а затем попадают на трубку фотоумножителя, где световая энергия преобразуется в электрический сигнал. ФЭУ-сканеры имеют намного более высокую светочувствительность и более низкий уровень шума, чем сканеры ПЗС, и, следовательно, способны к хорошей передаче тонов, будучи менее восприимчивыми к ошибкам в преломлении или фокусировке света [63]. Схема барабанного сканера представлена на рисунке 1.1.
Прибор с зарядовой связью (ПЗС, CCD) — это твердотельный электронный фотоприемник, состоящий из набора миниатюрных фоточувствительных элементов, которые формируют электрический заряд, пропорциональный интенсивности падающего на них света, и конструктивно выполняются в виде матриц или линеек. Датчик настольного сканера, как правило, имеет массив (линейку) из тысяч элементов ПЗС, размещенных на подвижной каретке. Для сканирования цветных изображений светочувствительные элементы объединены в
Дихроичный фильтр зеленого
Направление распространения света в призме
Направление перемещения оптической системы и ФЭУ
Оптическая система
Рисунок 1.1 - Принципиальная схема барабанного сканера
три линейки. Каждая линейка имеет свой светофильтр (красный, синий и зеленый), благодаря чему воспринимает одну цветовую составляющую света. Отраженный свет лампы сканера, пройдя светофильтры, направляется на массив ПЗС через систему зеркал и линз. Схема ПЗС сканера представлена на рисунке 1.2.
Рисунок 1.2 - Принципиальная схема ПЗС-сканера
Контактный сенсор (CIS). Данная технология сканирования основана на том, что светочувствительные сенсоры принимают световой поток, отраженный от поверхности оригинала, непосредственно, без промежуточной системы зеркал и линз. Последовательность работы сканеров такого типа аналогична сканерам ПЗС: считывается информация об одной линии изображения, затем каретка сдвигается и сканируется следующая линия. В CIS-сканерах линейка светочувствительных элементов имеет ширину рабочего поля сканирования. При этом располагается она максимально близко к сканируемой поверхности, отсюда и слово «контактный» в аббревиатуре. Каждая сканируемая линия освещается последовательно тремя линейками светодиодов - красного, синего и зеленого свечения. Отраженный свет
попадает через микролинзы на светочувствительные элементы. Информация о цветовых составляющих изображения преобразуется в цифровой код. Схема и отличия CIS сканера от CCD представлены на рисунке 1.3.
Рисунок 1.3 - Схема построения сканеров CCD и CIS
В качестве основных технические параметры сканеров можно выделить:
1. разрешение (разрешающая способность);
2. глубина цвета;
3. порог чувствительности;
4. динамический диапазон оптических плотностей;
5. коэффициент увеличения.
Разрешение — I величина, характеризующая количество считываемых элементов изображения на единицу длины. Обычно размерность этой величины указывают в точках на дюйм. Различают физическое (аппаратное) разрешение и интерполяционное разрешение сканера.
Глубина цвета — максимальное количество бит, которые сканер может назначить при оцифровывании точки. При сканировании считывается аналоговый сигнал, характеризующий значение оптической плотности изображения. Аналоговый сигнал (рисунок 1.4а) подвергается процедурам дискретизации (рисунок 1.4б) и квантования по уровню (рисунок 1.4в). Преобразование аналогового сигнала в цифровую форму дает ошибку округления, составляющую половину веса младшего разряда, называемую шумами квантования.
Рисунок 1.4 — Сигнал, характеризующий распределение оптической плотности в точках (х) линии сканирования; а) аналоговый сигнал; б, в) сигнал после дискретизации и квантования по уровню
Порог чувствительности. При полутоновом сканировании яркость каждой точки может принимать одно из множества возможных значений (градаций яркости), а при бинарном — только одно из двух. |При формировании бинарного изображения сканер сравнивает значение яркости в каждой точке с заданным (либо рассчитанным автоматически) порогом, выше которого точка считается белого цвета, а ниже — черного. Этот уровень и называется порогом чувствительности.
Динамический диапазон (диапазон оптической плотности) сканера характеризует его способность различать переходы между смежными тонами на изображении. Понятие оптической плотности D используется для характеристики поглощательной способности непрозрачных (отражающих) оригиналов и степени прозрачности прозрачных оригиналов и выражается через десятичный логарифм:
я = Ц1) = - ; о = Щ) = - 1еСр); (1.1)
где т = ф — коэффициент пропускания материала (изображения на прозрачной Ф0
основе) (рисунок 1.5, а), характеризующий его способность поглощать световой поток Ф0;
Фр
р = -т- — коэффициент отражения (рисунок 1.5, б), характеризующий способность Ф0
материала (изображения на непрозрачной основе) отражать световой поток Ф0;
Фт и Фр — соответственно световой поток, прошедший материал, и световой поток, отраженный от материала.
Рисунок 1.5 — Световые потоки для изображений на прозрачной(а) и
непрозрачной(б) основах
Оптической плотности D = 0,045 соответствуют значения т = 0,9 или р = 0,9; D = 1 соответствуют значения т = 0,1 и р = 0,1; D=2: т = 0,01; р = 0,01 и т.д.
На практике динамический диапазон сканера определяется как разность между оптической плотностью самых темных Dmax и самых светлых Dmin тонов, которые он может различать. Максимальная оптическая плотность оригинала характеризует наиболее темную область оригинала, распознаваемую сканером, более темные области воспринимаются сканером как абсолютно черные. Соответственно минимальная оптическая плотность оригинала характеризует наиболее светлую область оригинала, распознаваемую сканером, — более светлые области воспринимаются сканером как абсолютно белые.
Коэффициент увеличения показывает (обычно в процентах), во сколько раз можно увеличить изображение оригинала в процессе сканирования.
Особенности цифрового представления сканированного символа.
Процесс сканирования текста:
1. Непрерывный оригинал
2. Непрерывное полутоновое изображение - виртуальный образ (после отражения света)
3. Дискретный полутоновый отсканированный образ
4. Дискретный черно-белый образ (при бинаризации на этапе сканирования)
5. Цифровое изображение Ф
6. Кодирование и сохранение в память цифрового изображения Ф в заданном формате ( «tiff», «bmp», «jpeg» и др.)
Цифровое изображение Ф можно определить как двумерную функцию Ф = (/¿,fc), i = 1,2, ...,N, к = 1,2, ...,М, где i, к - координаты на плоскости, а /¿,fc-интенсивность изображения в заданной точке.
В результате, из оригинального символа формируется его некоторый образ (рисунок 1.6). Ступенчатая структура возникает из-за наложения символа на сетку сканера, а всевозможные выступы - из-за аппаратных погрешностей, несовершенства напечатанного прообраза и некоторых других факторов.
Рисунок 1.6 - Искажение символа при сканировании
Основные причины искажения изображений при сканировании:
1. Текст не идеально черный, а бумага (фон) не идеально белая.
2. Посторонние объекты на стекле сканера (пылинки, ворсинки, различные отпечатки и прочие загрязнения).
3. Часть света рассеивается при прохождении сквозь оптическую систему, в результате на сенсор проецируется уже искаженное отражение.
Искажения первого типа возможно в значительной мере нейтрализовать различными нормировками (например, увеличив контрастность) и иными преобразованиями, к примеру, снятие фона. Стоит отметить, что в сложных случаях (гербовая бумага, текстурный фон) операция удаления фона является не тривиальной.
Искажения второго типа - добавочный шум, характер которого определяется аппаратными помехами, волокнистой структурой бумаги, неровностями
наложения типографской краски или тонера, пылью и прочим мусором на оптических элементах сканера.
Третий тип искажений - дефокусировка. Полностью восстановить символ-оригинал после дефокусировки, как правило, не удается. В процессе сканирования отраженные от объекта лучи света до попадания на сенсор отражаются несколько раз от зеркал и проходят сквозь некоторое количество линз.
Подробно, вопрос влияния различных воздействий на результат сканирования рассмотрен в работе [74]. Процитируем выводы ко 2 главе вышеобозначенной работы: «На основе экспериментальных данных и теоретических расчетов построена модель рассеивания образа при сканировании для непрерывного случая. Полученные экспериментальные данные позволяют сделать вывод, что границы символов при сканировании искажаются сложным образом, что в свою очередь препятствует построению простых алгоритмов восстановления идеального образа и накладывает существенные ограничения на выбор функции близости для сравнения с эталоном.»
1.2 Сегментация цифровых изображений рукописных документов
Сегментация изображений - значительная область в теории цифровой обработки изображений, процесс разделения цифрового изображения на несколько частей, обладающих схожими характеристиками, например, на объект и фон [36].
Одним из значимых этапов при обработке цифровых изображений текста является сегментация (разбиение текста) на слова и символы. В печатном тексте слова разделяются «пробелом», строго фиксированным по длине, между символами, составляющими слово, также есть пространство и отсутствуют связки. На этих свойствах основываются два основных подхода к сегментации печатного текста: по вертикальной гистограмме и по областям объединения. В случае рукописного текста, расстояние между словами варьируется в широких пределах, составляющие слово символы могут быть связаны между собой, не связаны и
связаны частично. Присутствуют наклон теста и различные декоративные элементы, что существенно усложняет задачу сегментации.
В работе Л. С. Фришкопф и Л. Д. Хармон (1961) представлен метод сегментации, базирующийся на наборе признаков слова, таких как: экстремум в вертикальном направлении, выходящий за пределы «центральной зоны»; точки возврата движения и специальные знаки. Также оценивали «среднюю ширину буквы путём простых вычислений из числа пересечений линии текста прямой линией, проведенной посередине центрального поля и длина слова», и вычисляли (приблизительно) количество букв в этом слове, откуда можно выделить позиции сегментации.
В работе Беррин Яникоглу [93] рассматривался метод, использующий линейное программирование. Первым этапом выделяются точки предварительной сегментации-линии под разными углами в диапазоне (-30,-20, -10, 0, 10, 20, 30) градусов. Далее вычисляются весовые значения для каждой возможной точки, на основании общих характеристик почерка и локальных характеристик точки (расстояния от данной точки до предыдущей точки сегментации и пр.). Решение системы ограничений дает желаемые весовые коэффициенты. По словам авторов, полученный результат в некоторых условиях может достигать 92% корректных сегментаций. Однако из-за изменчивой ширины символов процесс определения предварительных точек сегментации требует трудоемкого и долговременного обучения.
М. Blumenstein и В. Уегта [115] опубликовали серию статей с 1997г. по сегментации символов, в 1999г. их работа была посвящена методу сочетания эвристических и нейронных подходов: при эвристическом подходе определяются точки локального минимума по вертикальной гистограмме и по особенным позициям точек в данном слове, а с помощью нейронной сети, определяются наиболее вероятные точки сегментации.Шходы для обучения и классификации на «корректные» и «некорректные» точки сегментации получатся глобальными и локальными признаками слова. В результате в некоторых случаях достигается до 81% правильных точек сегментации.
В работе [97] John T. Favata осуществлял сегментацию символов эвристическим подходом. Слово разбивается на набор элементов (графем): крест, дыры, верхние и нижние минимумы, Т-образный. Идея сегментации заключается в обнаружении лигатуры символов, где лигатура (лат. ligatura - связь) - знак системы письма, образованный путем соединения двух и более графем. «Лигатура определяется горизонтальным ходом между острыми вертикальными ходами.»
Одним из распространенных методов нормализации символов является их скелетизация. Gergely Tímár [113] предложил формировать не только скелет символов, но и скелет фона (граница, полученная путем утончения фона слова), проведен анализ с позиций сегментации слова на символы, в некоторых случаев количество корректно сегментированых символов достигает до 74,1%.
Похожие диссертационные работы по специальности «Теоретические основы информатики», 05.13.17 шифр ВАК
Модели и методы контроля технических средств в системах страхового хранения информации2013 год, кандидат наук Клещарь, Сергей Николаевич
Алгоритмы распознавания рукописных символов в условиях малой обучающей выборки2017 год, кандидат наук Хаустов Павел Александрович
Субполосные модели и вариационные методы обработки изображений земной поверхности2016 год, кандидат наук Черноморец, Андрей Алексеевич
Комбинированные алгоритмы в задачах распознавания текстов2000 год, кандидат технических наук Славин, Олег Анатольевич
Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке2008 год, кандидат технических наук Хоанг Зянг
Список литературы диссертационного исследования кандидат наук Ефимов Никита Олегович, 2019 год
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Абламейко, С. В. «Обработка изображений. Технология, методы, применение» [Текст] / С. В. Абламейко, Д. М. Лагуновский. - М.: Амалфея, 2000. -304 c.
2. Абрамов Е. С. «Моделирование систем распознавания изображений» (На примере печатных текстов) : Дис. ... канд. техн. наук : СПб., 2006 - 140 с.
3. Александров, В. В. «Представление и обработка изображений: Рекурсивный подход» [Текст] / В. В. Александров, Н. Д. Горский. - М.: Наука, 1985.
- 192 с.
4. Анисимов, Б. В. «Распознавание и цифровая обработка изображений» [Текст] / Б. В. Анисимов, В. Д. Курганов, В. К. Злобин. - М.: Высшая школа, 1983.
- 295 с.
5. Арлазаров, В. Л. «Обработка изображений и анализ данных» [Текст] / В. Л. Арлазаров, Н. Е. Емельянов. - Т.38, ИСА РАН, 2008. - 368 с.
6. Афонасенко А.В., Елизаров А.И. «Обзор методов распознавания структурированных символов» / А.В. Афонасенко, А.И. Елизаров. - доклады ТУСУРа №2(18), часть 1, 2008»
7. Багдонас А., Жлабпс Р., Кведаравичус А., Нашлю-нас Р., Швагждис П., Яшинскас П. «Читающее устройство «РУТА 701»» // "Автоматизация ввода письменных знаков в электронно-вычислительные машины: доклады науч.- техн. совещания, Вильнюс, 1968. - С. 96-121.
8. Борисов Е. «Сегментация изображения текста»: [Электронный ресурс]. 2008 URL: http://mechanoid.kiev.ua/cv-text-image-segmentator.html (Дата обращения: 01.04.2019).
9. Вапник, В.Н. «Теория распознавания образов. Стохастические проблемы обучения.» [Текст]/ Вапник В.Н., Червоненкис А.Я. - М.: Наука, 1974. - 415с.
10. Ветров, Д.П. «О минимизации признакового пространства в задачах распознавания» [Текст] / Ветров Д.П., Рязанов В.В. // Доклады Всероссийской
конференции «Математические методы распознавания образов»/ ММРО - 10: Изд-во ВЦ РАН, Москва, 2001. с. 22 - 25.
11. Визильтер, Ю.В. «Обработка и анализ цифровых изображений с примерами на LabVIEW и IMAQ Vision» [Текст] / Ю.В. Визильтер, С.Ю. Желтов, В.А. Князь, А.Н. Ходарев, А.В. Моржин. - М.: ДМК пресс, 2007 г. - 464 с.
12. Гонсалес, Р. «Цифровая обработка изображений» [Текст] / Р. Гонсалес, Р. Вудс. - М.: Техносфера, 2006. - 1072 с.
13. Гонсалес, Р. «Цифровая обработка изображений в среде Matlab» [Текст] / Р. Гонсалес, Р. Вудс., С. Эддинс - М.: Техносфера, 2006. - 616 с.
14. Голд, Б. «Цифровая обработка сигналов» [Текст] / Б. Голд, Ч. Рейдер. -М.: Сов. Радио, 1973. - 376 с.»
15. Горелик, А.Л. «Методы распознавания» [Текст]/ А.Л. Горелик, Скрипкин В.А. - Москва: Высшая школа, 2004. - 264с.
16. Горлов Д.В. «Распознавание изображений на основе признаков, инвариантных к сдвигу, вращению, масштабированию»: Автореф. дис. канд. техн. наук: - Красноярск, 2002. - 20 с.
17. Горский, Н «Распознавание рукописного текста: от теории к практике» [Текст]/ Горский Н., Анисимов В., Горская Л. - СПб.: Политехника, 1997. -126 с.
18. Горошкин А. Н. «Обработка и распознавание рукописного текста в системах электронного документооборота»: диссертация ... кандидата технических наук : 05.13.01 / А. Н. Горошкин, Красноярск, 2008
19. Громыко Г. Л. Теория статистики: Учебник/Под ред. проф. Г.Л. Громыко - 2-е изд., перераб. И доп. - М.: ИНФРА-М, 2005. - 267 с - (Классический университетский учебник)
20. Грузман, И. С. «Цифровая обработка изображений в информационных системах» [Текст]: учебное пособие / И. С. Грузман, В. С. Киричук и др. -Новосибирск: НГТУ, 2002. - 352 с.
21. Гуревич, И.Б. «Минимизация булевых функций и эффективные алгоритмы распознавания» [Текст]/ Гуревич И.Б., Журавлев Ю.И. // Кибернетика, 1974, № 3. - 16-20.
22. Демин А.А. «Обзор интеллектуальных систем для оценки каллиграфии»/Инженерный вестник, МГТУ им. Н.Э. Баумана, 77-48211/478895, № 09 сентябрь 2012 г
23. Джгаркава Г.М, Лавров Д.Н. «Использование метода SURF для обнаружения устойчивых признаков изображения при создании сферических панорамных снимков» / Омский государственный университет им. Ф.М. Достоевского, Математические структуры и моделирование, вып. 22, 2011
24. Дуда Р., Харт П. «Распознавание образов и анализ сцен». М.: - Мир, 1989.
- 510 с.
25. Ефимов Н. О. О прецедентном распознавании фрагментов изображений рукописного текста [Текст] / Н. О. Ефимов // Материалы 1 молодёжной научно -практической конференции с международным участием - Белгород, 2017 - С.211-215 СТ1
26. Ефимов Н.О. Ефимов Н.О. О применении субполосных методов в области обработки видеоизображений [Текст] / Н.К. Веселых, Н.О. Ефимов // Сборник научных статей III Международной научно-практической конференции студентов и аспирантов «Математика и ее приложения в современной науке и практике» / Курск: ЮЗГУ, 2013 - с.213-217
27. Ефимов Н.О. «О применении субполосного градиентного оператора для совмещения фрагментов видеоизображений» // Материалы III Международной научно-технической конференции «Современные направления развития информационно-коммуникационных технологий и средств управления». -г.Харьков, 2013 СТ5
28. Ефимов Н. О. О прецедентных методах распознавания фрагментов рукописного текста [Текст] / Н. О. Ефимов // Сборник научных трудов по материалам международной заочной научно-практической конференции «Актуальные Направления Научных Исследований XXI Века: Теория И Практика»
- Воронеж, 2017 - С.185-188 СТ2
29. Ефимов Н. О. Процедура сегментации изображений рукописного текста на слова в задачах прецедентной идентификации / Н. О. Ефимов // Электронные информационные системы- 2018. Т.18. - №3. - С. 69-80 383
30. Жиляков, Е.Г. «Вариационные алгоритмы анализа и обработки изображений на основе частотных представлений»: Монография [Текст] / Е.Г. Жиляков, А.А. Черноморец. - Белгород: Изд-во ГИК, 2009. - 146 с.
31. Жиляков, Е.Г. «Оптимальная фильтрация изображений на основе частотных представлений» [Текст] / Е.Г. Жиляков, А.А. Черноморец // Вопросы радиоэлектроники. Сер. ЭВТ. - 2008. - Вып. 1. - С. 118-131.
32. Жиляков Е.Г., Ефимов Н.О. «О субполосном анализе изображений» [текст] // Научные ведомости БелГУ, 33/1, Белгород, 2015 ВАК1
33. Жиляков Е.Г. О субполосном анализе изображений рукописного текста [Текст] / Е. Г. Жиляков, Н. О. Ефимов, А. А. Черноморец, Д. И. Трубицына // Электронные информационные системы- 2019. Т.20. - №1. - С. 73-86 ВАК4
34. Жиляков Е.Г., Веселых Н.К., Ефимов Н.О. «Автоматизированное распознавание изображений биологических объектов» // Сборник научных статей Международной научно-технической конференции «Проблемы информатики и моделирования» (ПИМ-2013), Харьков, ноябрь 2013;
35. Жиляков Е.Г. «Автоматизированный анализ изображений биологических объектов в задачах их диагностики» [текст] / Жиляков Е.Г., Веселых Н.К., Ефимов Н.О. /Сборник научных статей XI Курчатовской молодежной научной школы.-г Москва, 2013
36. Жиляков Е.Г., Веселых Н.К., Ефимов Н.О. «Автоматическая сегментация изображений биологических объектов в задачах их диагностики» // Сборник научных статей Международной научно-технической конференции «Проблемы информатики и моделирования» (ПИМ-2013), Харьков, ноябрь 2013
37. Жиляков Е.Г. «Распознавание фрагментов изображений сканированного текста, основанное на использовании субполосной меры близости» [текст] / Жиляков Е.Г., Ефимов Н.О./ Сборник научных статей XII Курчатовской молодежной научной школы.-г Москва, 2014
38. Жиляков Е.Г. Распознавание фрагментов рукописного текста. Характерные частотные интервалы [Текст] / Е. Г. Жиляков, Н. О. Ефимов // Информационные технологии - 2018. Т.24. - №7. - С.481-486 ВАК25
39. Жиляков Е. Г., Сегментация изображений рукописного текста на основе субполосного анализа [Текст] / Е.Г. Жиляков, А.А. Черноморец, Н.О. Ефимов. // Научные ведомости БелГУ. Сер. Экономика. Информатика - 2019. Т.46. - №1. -С.184-190 ВАК5
40. Журавлёв Ю.И. «Об алгебраических методах в задачах распознавания и классификации» [Текст]/ Журавлёв Ю.И. //Распознавание, классификация, прогноз.Вып. 1 .—М. :Наука,1988.—С.9-16.
41. Журавлёв Ю.И. Р»аспознавание образов и распознавание изображений» [Текст]/ Журавлёв Ю.И., Гуревич И.Б. //Распознавание, классификация, прогноз.Вып. 2. —М.: Наука,1989. —С.5 -72.
42. Журавлев Ю.И., Рязанов В.В., Сенько О.В. «Распознавание. Математические методы. Программная система. Практические применения.» М.: Фазис, 2005.
43. Журавлев, Ю.И. «Избранные научные труды» [Текст]/Журавлев Ю.И -М:Магистр, 1998. - 422с.
44. Заливин А.Н, «Повышение визуального качества видеоизображений на основе субполосной обработки» [текст]/ Заливин А.Н., Веселых Н.К., Ефимов Н.О. // Теория и практика системного анализа: сборник трудов Всероссийской молодёжной конференции / Белгород. - Белгород, 2012 (1-3 октября). - С. 195-198. СТ3
45. Заливин А.Н., «Повышение чувствительности меры идентичности при совмещении изображений земной поверхности [текст]/ Заливин А.Н., Веселых, Н.К., Ефимов Н.О. // Сборник научных статей Международной научно-практической конференции «Прикладная математика, управление и информатика». - Белгород, 2012. - С. 385-389. СТ4
46. Заливин А.Н. «О применении субполосных методов для обработки видеоизображений» [текст] / Заливин А.Н., Балабанова Т.Н., Веселых Н.К., Ефимов
Н.О., Трубицына Д.И./ 15-я международная конференция «Цифровая обработка сигналов и её применение - DSPA-2013». - М.: РНТОРЭС им. А. С. Попова, т.2 2013г. - С. 81-84 СТ6
47. Заливин А. Н. «Разработка субполосных методов и алгоритмов предварительной обработки изображений земной поверхности»: диссертация ... кандидата технических наук: 05.13.17 / А. Н. Заливин Николаевич, 2012.
48. Зеленцов И. А., «Методика распознавания древнерусских скорописных текстов»: диссертация ... кандидата технических наук : 05.13.17 / И. А. Зеленцов, Москва, 2011.
49. Конушин А. «Слежение за точечными особенностями сцены (Point feature tracking)». Компьютерная графика и мультимедиа. Выпуск №1(5)/2003.
50. Котович Н.В., Славин О.А. «Распознавание скелетных образов». Электронный ресурс. URL: http:ocrai.narod.ru (Дата обращения: 01.04.2019).
51. Красильников, Н. Н. «Цифровая обработка изображений» [Текст] / Н. Н. Красильников. - М.: Вузовская книга, 2001. - 320 с.
52. Крамер Г. Математические методы статистики [Текст] / Г. Крамер // М.: Мир, 1975. — 848 с.
53. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов / Н.Ш. Кремер. — М.: ЮНИТИ-ДАНА, 2004. - 573 с.
54. Куприянов, М.С. «Цифровая обработка сигналов: процессоры, алгоритмы, средства проектирования» [Текст] / М.С. Куприянов, Б.Д. Матюшкин. — СПб.: Политехника, 1999.
55. Лайонс Р. «Цифровая обработка сигналов»// М.: ООО «Бином-Пресс», 2006. -656 с.
56. Лихошерстный А. Ю., «Прецедентное распознавание фрагментов изображений земной поверхности»: диссертация ... кандидата технических наук : 05.13.17 / А. Ю. Лихошерстный, Белгород, 2015.
57. Лузин Н. Н. Дифференциальное исчисление: Учебное пособие. Изд. 8-е. / Н. Н. Лузин // М.: ЛЕНАНД, 2017. — 480 с. (Физико-математическое наследие: математика (математический анализ))
58. Мерков А.Б. «Основные методы, применяемые для распознавания рукописного текста» // Лаборатория распознавания образов МЦНМО, 2004.
59. Мозговой А.А., «Проблемы извлечения рукописных слов из сканированного изображения» // А. А. Мозговой - Вестник Воронежского института высоких технологий. 2013.
60. Мозговой А.А. «Предварительная обработка изображений символов с целью улучшения качества последующей скелетизации (утонения)» / Мозговой А.А. // Вестник Воронежского института высоких технологий. 2013. № 10. С. 156160.
61. Мисюрёв A.B. Использование искусственных нейронных сетей для распознавания рукопечатных символов. [Текст] / А. В. Мисюрев // Сб. трудов ИСА РАН "Интеллектуальные технологии ввода и обработки информации", 1998, С Л 22-127
62. Павлидис Т. «Иерархические методы в структурном распознавании образов» [Текст] / Павлидис Т. //ТИИЭР.—1979.—Т.67.—№5.—С.39-49.
63. Попов А.Н. «Технические средства информатизации» - Учебное пособие, Нижневартовск: НГСГК, - 2007
64. Препарата Ф. «Вычислительная геометрия». / Ф. Препарата, М. Шеймос - М.: Мир, 1989. - 295 с.
65. Прэтт, У. «Цифровая обработка изображений» [Текст] / У. Прэтт: Кн. 1, 2. — М.: Мир, 1982. - 792 с.
66. Рабинер, Л. «Теория и применение цифровой обработки сигналов» [Текст] / Л. Рабинер, Б. Гоулд. - М.: Мир, 1978. - 327 с.
67. Сай И. С. «Алгоритмическое и программное обеспечение для распознавания и идентификации изображения оттиска печати: диссертация ... кандидата технических наук» : 05.13.01 / И. С. Сай, Хабаровск, 2011
68. Семенов, Ю.А. «Алгоритмы телекоммуникационных сетей». В 3 частях. Часть 1. Алгоритмы и протоколы каналов и сетей передачи данных [Текст] / Ю.А. Семенов. - М.: Бином. Лаборатория знаний, 2007. - 640 с.
69. Сергиенко, А.Б. «Цифровая обработка сигналов: учеб. пособие» [Текст] / А.Б. Сергиенко. - СПб.: БХВ-Петербург, 2011. - 768 с.: ил.
70. Сорокин А. И. «Сегментация рукописных и машинописных текстов методом диаграмм Вороного» // С. А. Запрягаев, А. И. Сорокин, Воронежский государственный университет 2010 вестник ВГУ, серия: системный анализ и информационные технологии, 2010, № 1
71. Сорокин Андрей Игоревич. «Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения»: диссертация ... кандидата технических наук : 05.13.17 / Сорокин Андрей Игоревич, Воронеж, 2010
72. Сойфер В. А. «Методы компьютерной обработки изображений» [Текст] / под ред. В.А. Сойфера. - Изд. 2-е, испр. - М.: ФИЗМАТЛИТ, 2003. - 784 с.
73. Сойфер, В. А. «Методы компьютерной обработки изображений» [Текст] / В. А. Сойфер. - М.: ФИЗМАТЛИТ, 2003. - 784 с.
74. Титов Ю. В. «Адаптивные алгоритмы распознавания текстов»: диссертация ... кандидата технических наук: 05.13.01 / Ю. В. Васильевич; [Место защиты: Ин-т систем. анализа РАН]. - Москва, 2007.- 115 с.: ил. РГБ ОД, 61 075/5246
75. Телков А.Ю. «Экспертные системы: Учебное пособие». - Воронеж: ИПЦ ВГУ, 77-48211/478895, № 09 сентябрь 2012 г 25 2007. - 83 с.
76. Ту, Дж. «Принципы распознавания образов» [Текст]/ Дж. Ту, Р. Гонсалес
- М.: Мир, 1978. - 411с.
77. Форсайт, Дэвид А. «Компьютерное зрение. Современный подход» [Текст] / Форсайт, Дэвид А., Понс, Жан. - М.: Издательский дом «Вильямс», 2004. - 928с.
78. Фу К. «Структурные методы в распознавании образов». - М.: Мир, 1977
- 320 с.
79. Фукунага К. «Введение в статистическую теорию распознавания образов». - М.: Наука, 1979. - 368 с.
80. Черноморец А.А. «Субполосные модели и вариационные методы обработки изображений земной поверхности»: автореферат дис. ... доктора
технических наук : 05.13.17 / А. А. Черноморец; [Место защиты: Белгород. гос. нац. исслед. ун-т]. - Белгород, 2016. - 36 с. «
81. Черноморец, А.А. «О частотной концентрации энергии изображений» [Текст] / А.А. Черноморец, В.А. Голощапова, И.В. Лысенко, Е.В. Болгова // Научные ведомости БелГУ. Сер. История. Политология. Экономика. Информатика. - 2011. - № 1 (96). - Вып. 17/1. - С. 103-108.
82. Шапиро Л., Стокман Дж. «Компьютерное зрение»// М.: БИНОМ. Лаборатория знаний, 2006. — 752 с.
83. Шахнов В.А., Власов А.И., Кузнецов А.С., Поляков Ю.А. «Нейрокомпьютеры: архитектура и схемотехника». - М.: Машиностроение, 2000. -64 с.
84. Шахнов В.А., Власов А.И., Поляков Ю.А., Кузнецов А.С. «Нейрокомпьютеры: Архитектура и схемотехника» // ChipNews, 2011.. - С.18-21.
85. Яне, Б. «Цифровая обработка изображений» [Текст] / Б. Яне. - М.: Техносфера, 2007. - 584 с.
86. Alonso D., Nieto M., Saldaro L.Robust Vehicle «Detection through Multidimensional Classification for On Broad Video Based Systems» IEEE. - 2007.
87. Antony P. J., Savitha C. K., Ujwal U. J. «Efficient Binarization Technique for Handwritten Archive of South Dravidian Tulu Script»//Emerging Research in Computing, Information, Communication and Applications - 2016 pp651-666
88. Bal A., Saha R. «An Improved Method for Text Segmentation and Skew Normalization of Handwriting Image» //Advances in Intelligent Systems and Computing -2017- Vol.518
89. Bay H., A. Ess, T. Tuytelaars, L.V. Gool, «SURF: Speeded-up robust features», Comput Vis Image Und vol. 110, no. 3, pp. 346-359. 2008.
90. Benafia Ali, Smaine Mazouzi, Benafia Sara «Handwritten Character Recognition on Focused on the Segmentation of Character Prototypes in Small Strips» //International Journal of Intelligent Systems and Applications(IJISA) - 2017 Vol. 9, Issue 12
91. Belhumeur P. N., Hespanha J. P. and Kriegman D. J. Eigenfaces vs Fisherfaces: «Recognition Using Class Specific Linear Projection». IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 711-720.
92. Bhowmik S., Malakar S., Sarkar R., Basu S., Kundu M., Nasipuri M. «Off-line Bangla handwritten word recognition: a holistic approach»// Neural Computing and Applications - 2018 -pp 1-16.
93. Berrin Yanikoglu «Segmentation of off-line cursive handwriting using linear programming» Pattern Recognition 31(12): 1825-1833 ■ December 1998 Berrin Yanikoglu, Peter A. Sandon, 1998
94. Blumenstein Michael «A Novel Feature Extraction Technique for the Recognition of Segmented Handwritten Characters», Blumenstein Michael, Verma Brijesh, Basli, Hasan Proceedings of the Seventh International Conference on Document Analysis and Recognition (ICDAR '03), Proceedings of the Seventh International Conference on Document Analysis and Recognition (ICDAR'03) 0-7695-1960-1/03 $17.00 © 2003 IEEE
95. Berg M. «Computational Geometry Algorithms and Applications» / [Edited by M. Berg]. - 3rd Edition. - Berlin.: Springer-Verlag, 2008 - 386 pp
96. Favaro P., Jin H., Soatto S. «Real-time tracking and outlier rejection with changes in illumination» ICCV'01, Vol.1, 2001. - pp. 684-689.
97. Favata J.T. «Offline general word handwritten word recognition using an approximate BEAM matching algorithm». IEEE Trans. PAMI, 23910091021, 2001
98. Fortune S. «A sweepline algorithm for Voronoi diagrams» / S. Fortune // Proceedings of the second annual symposium on Computational geometry.»- 1986. - P. 313 - 322.
99. Hochulia A.G., Oliveiraa L.S., Britto A.S., Sabourinc JrbR. «Handwritten digit segmentation: Is it still necessary?» // Pattern Recognition - 2018 - Vol. 78,
100. Khaissidi Ghizlane, Youssef Elfakir, Mostafa Mrabti, Mounim A. El Yacoubi, Driss Chenouni, Zakia Lakhliai «Segmentation-free Word Spotting for Handwritten Arabic Documents» // International Journal of Interactive Multimedia and Artificial Intelligence Vol. 4, Issue 1
101. Kong Hui, Morgan Kaufmann Publishers, San Mateo. «A Generalized Laplacian of Gaussian Filter for Blob Detection and Its Applications. Hui Kong, Hatice Cinar Akakin, and Sanjay E. Sarma» 2168-2267/$31.00 © 2012 IEEE transactions on cybernetics
102. Mathivanan P., Ganesamoorthy B, Maran P. «Watershed algorithm based segmentation for handwritten text identification»//ICTACT Journal on Image and Video Processing - 2014- Vol. 4, Issue 379. Munish Kumar
103. Naga Manisha C., Sundara Krishna Y. K., Sreenivasa Reddy E. Glyph «Segmentation for Offline Handwritten Telugu Characters» //Advances in Intelligent Systems and Computing - 2017- Vol. 542
104. Oendrila S., Anandarup R., Swapan K. Paruia, Bhattacharya U «An HMM framework based on spherical-linear features for online cursive handwriting recognition» //Information Sciences -2018- Vol. 441,
105. Otsu N. (1979). «A threshold selection method from gray-level histograms» // IEEE Trans. Sys., Man., Cyber. - 1979 Vol. 9
106. Parashuram B, Chandrashekar G. «Identification and classification of historical kannada handwritten document images using GLCM features»// International Journal of Advanced Research in Computer Science -2018- Vol. 9, Issue 1,
107. Prabhakar C. J., Thonta Dari «Segmentation Based Word Spotting Method for Handwritten Documents» // International journals of advanced research im computer science and software engineering - 2017 Vol. 7, Issue 6
108. Papageorgiou C., Poggio T «A trainable system for object detection Computer Vision». Vol.38. No.1, 2000. - pp. 15-33
109. Pawlak Z Rough Sets - «Theoretical Aspects of Reasoning about Data», Kluwer Academic Publishers, Dordrecht
110. Quang Nhat Vo, Soo Hyung Kim, Hyung Jeong Yang, Guee Sang Lee «Text line segmentation using a fully convolutional network in handwritten document images» //IET Image Processing - 2018 Vol. 12, Issue 3
111. Quinlan JR .C4.5: «Programs for Machine Learning by J. Ross Quinlan». Morgan Kaufmann Publishers, Inc., 1993
112. Sagarika Borah «Segmentation of Assamese Handwritten Characters based on Projection Profiles» // International Journal of Computer Applications - 2015 Vol. 130, Issue 17
113. Timar Gergely «Analogic preprocessing and segmentation algorithms for offline handwriting recognition» Gergely Timar, Kristof Karacs, Csaba Rekeczky 7th IEEE International Workshop on Cellular Neural Networks and their Applications pp 407-414; doi: 10.1109/cnna.2002.1035077
114. Thontadari C., Prabhakar C. J. «Scale Space Co-Occurrence HOG Features for Word Spotting in Handwritten Document Images»// International Journal of Computer Vision and Image Processing - 2016 - Vol. 6, Issue 2
115. Verma Brijesh «Pattern Recognition Technologies and Applications: Recent Advances», Brijesh Verma Central Queensland University, Australia Michael Blumenstein Griffith University, Australia Information science reference, Hershey • New York 2008
116. Vetter T. and Poggio T. «Linear Object Classes and Image Synthesis From a Single Example Image». IEEE Transactions on Pattern Analysis and Machine Intelligence 1997, Vol. 19, pp. 733-742
117. Zisserman F., Fergus, P., Perona, R. «A sparse object category model for efficient learning and exhaustive recognition». In IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'2005), pp. 380-387, San Diego, CA
ПРИЛОЖЕНИЕ А
Л
УТВЕРЖДАЮ Проректор по образовательной деятельности ФГАОУ ВО «Белгородский государственный национальный исследовательский университет»,
кандидат тех^ скнх наук, доцент
А. В. Маматов
Ж
1едований,
ъ£о±
Акт о внедрении результатов Полученных в диссертации Ефимов4/Никиты Олеговича «Разработка и исследование метода и алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста»
Мы, нижеподписавшиеся, директор Института инженерных и цифровых технологий ФГАОУ ВО «Белгородский государственный национальный исследовательский университет», доктор технических наук, доцент Полыциков К. А., заведующий кафедрой информационно-телекоммуникационных систем и технологий, доктор технических наук, профессор Жиляков Е. Г., составили настоящий акт о внедрении результатов научных исследований, полученных Ефимовым Н. О., в образовательный процесс специалистов по направлению подготовки 11.05.04 «Информационно-аналитические системы безопасности».
В лекционные и лабораторные занятия по дисциплине «Анализ речевых сигналов и изображений» были включены следующие исследованные темы:
1. Анализ сканированного рукописного текста на основе субполосных признаков
2. Сегментация цифровых изображений рукописного текста
3. Прецедентная идентификация фрагментов сканированного рукописного
текста
4. Автоматизированное обнаружение значимых изменений почерка
Внедренческий центр «АннаСофт»
1С Франчайзинг
Разработка, внедрение и комплексное обслуживание программных продуктов 1С Предприятие 8_
ИП Покшоиа A.A.. ИНН 312326491313
308033, Белгород г, Ватутина пр-кт, дом Na 12а, кв. 72,
р/с 40802810307000004409, в банке БЕЛГОРОДСКОЕ ОСБ N8592,
БИК 041403633, к/с 30101810100000000633
АКТ
использования метода прецедентной идентификации фрагментов сканированного рукописного текста на основе субполосного анализа
Настоящий акт составлен о том, что во Внедренческом центре «Аннасофт» были проведены испытания программной реализации информационной технологии прецедентной идентификации фрагментов сканированного рукописного текста, разработанной ассистентом кафедры информационно-телекоммуникационных систем и технологий НИУ «БелГУ» Ефимовым Никитой Олеговичем в рамках диссертационного исследования.
Представленная программная реализация информационной технологии применялась при обработке сканированных рукописных документов средствами вычислительной техники.
Преимуществами представленной программной реализации информационной технологии отмечается:
1) Возможность проведения контекстного поиска целевых фрагментов рукописного текста;
2) Возможность автоматизированной сегментации рукописного текста и сохранения выделенных фрагментов на устройство хранения данных.
3) Функциональный интерфейс программной реализации, не требующий специального обучения оператора для использования разработанных алгоритмов.
Качественным отличием представленных алгоритмов от существующих систем обработки сканированных рукописных текстов является прецедентность процедуры идентификации заданных фрагментов, что определяет адекватность процесса их идентификации, в том числе на этапе обучения.
За счет автоматизации процесса поиска целевых фрагментов текста отмечается существенное снижение трудовых и временных затрат при проведении анализа рукописных документов.
По результатам испытаний программной реализации информационной технологии прецедентной идентификации в рабочем процессе, представляется целесообразным её использование совместно с существующей системой электронного документооборота.
Директор ВЦ «АннаСофт» Коммерческий директор ВЦ «АннаС
ИГ1 Пекшева A.A.
Пекшев Д.С.
ПРИЛОЖЕНИЕ Б
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.