Обработка и распознавание рукописного текста в системах электронного документооборота

Горошкин, Антон Николаевич

Обработка и распознавание рукописного текста в системах электронного документооборота тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Горошкин, Антон Николаевич

Горошкин, Антон Николаевич
кандидат технических наук
2008

Специальность ВАК РФ05.13.01

Количество страниц 107

Горошкин, Антон Николаевич. Обработка и распознавание рукописного текста в системах электронного документооборота: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Красноярск. 2008. 107 с.

Оглавление диссертации кандидат технических наук Горошкин, Антон Николаевич

ВВЕДЕНИЕ.

Глава 1. Анализ методов и систем обработки и распознавания рукописных символов и текста.

1.1 Классификация существующих методов обработки изображений рукописных документов.

1.1.1 Предварительная обработка изображений.

1.1.2 Сегментация изображений рукописных документов.

1.2 Сравнительный анализ подходов к распознаванию рукописных символов и текста.

1.2.1 Распознавание рукописных символов в пассивном режиме.

1.2.2 Распознавание рукописного текста.

1.3 Анализ существующих систем распознавания рукописных символов и текста.

1.4 Выводы по главе.

Глава 2. Построение моделей сегментации и распознавания рукописных символов и текста в пассивном режиме.

2.1 Метод обнаружения информативных зон на изображении.

2.2 Метод сегментации изображений текстовых зон на отдельные символы.

2.3 Векторный подход к распознаванию рукописных символов.

2.3.1 Построение векторной модели.

2.3.2 Преобразование векторной модели к инвариантному виду.

2.3.3 Распознавание рукописных символов на основе инвариантной векторной модели.

2.4 Метод распознавания рукописного текста с использованием вероятностного подхода на основе лингвистической модели слова.

2.4.1 Разработка лингвистической модели слова.

2.4.2 Адаптивное построение дерева решений на основе вероятностного подхода.

2.5 Выводы по главе.

Глава 3. Построение экспериментальной комплексной системы распознавания рукописного текста.

3.1 Структурная схема комплекса по распознаванию рукописного текста.

3.2 Описание основных модулей системы.

3.3 Результаты экспериментальных исследований.

3.4 Программа «Модуль ввода данных».

3.5 Выводы по главе.

Введение диссертации (часть автореферата) на тему «Обработка и распознавание рукописного текста в системах электронного документооборота»

Актуальность работы. Входной информацией в системах электронного документооборота могут быть не только документы с печатным текстом, но и рукописные документы (документация паспортно-визовой службы, анкетирование, прием заявлений от населения). Также имеется большое количество унаследованных рукописных документов, содержащих важную техническую информацию, которые желательно было бы перевести в электронный вид.

Несмотря на то, что задачей распознавания рукописных символов исследователи начали заниматься с 70-х гг. XX в. (Ковалевский В.А., Рыбак В.И., Фукунага К. и др.), до сих пор имеются как теоретические, так и практические проблемы, связанные с большим многообразием написания отдельных рукописных символов и текста. В настоящее время наиболее активные разработки в данном направлении проводятся университетами State University of New York at Buffalo, University of Missouri, University of Massachusetts Amherst (США), University of Fribourg (Швейцария), Ohio University (Греция), Concordia University (Канада), Univesite de Monreal (Франция), Queensland University of Technology (Австралия), Московский государственный университет, Московский физико-технический институт (Государственный университет) (РФ).

Известны два основных подхода к распознаванию рукописного текста: распознавание в режиме текущего ввода символов (интерактивный режим) и распознавание ранее написанных документов (пассивный режим). Первый подход используется в системах реального времени, к которым относятся системы сенсорного ввода рукописных символов в карманных персональных компьютерах, коммуникаторах и других устройствах. Существует множество алгоритмов, решающих данную задачу достаточно эффективно. Точность распознавания символов достигает 98%, при этом в ряде случаев не требуется обучения на конкретный почерк. Входными данными являются траектории указывающего устройства (стилус, перо и т.д.). Системы, решающие задачу в рамках второго подхода, имеют невысокую точность распознавания (около 70—75%), требуют настройки на конкретный почерк и стиль написания. Данные системы используются при вводе информации с бумажных носителей. Входными данными в этом случае являются изображения, полученные со сканера или других цифровых устройств. Таким образом, задача обработки и распознавания рукописного текста является актуальной и востребованной в различных сферах деятельности, а разработка методов и алгоритмов распознавания ранее написанного рукописного текста позволит повысить эффективность работы таких систем.

Целью диссертационной работы является усовершенствование методов и алгоритмов обработки и распознавания рукописного текста в системах электронного документооборота, представленного в виде изображений текстовых документов.

Поставленная цель определила необходимость решения следующих задач:

1. Провести анализ подходов для построения систем обработки изображений текстовых документов, методов сегментации изображений на информативные текстовые зоны, а также методов распознавания отдельных рукописных символов и рукописного текста на основе структурных грамматик.

2. Усовершенствовать методы и алгоритмы сегментации изображений на текстовые зоны, содержащие рукописные слова, а также сегментации текстовых зон на отдельные символы.

3. Модифицировать методы и алгоритмы распознавания рукописных символов и текста на основе векторного подхода.

4. На основе предложенных методов и алгоритмов создать программные модули для реализации системы распознавания рукописных символов и текста, представленных в виде изображений.

5. Разработать экспериментальную систему распознавания для оценки эффективности предложенных алгоритмов при решении различных задач распознавания, основанных на контурной информации об объектах.

Методы исследования. При выполнении диссертационной работы использовались методы теории информации, теория обработки сигналов, теория распознавания образов, теория математической морфологии, методы аналитической геометрии, методы объектно-ориентированного программирования.

Научная новизна диссертационной работы состоит в следующем:

1. Усовершенствован метод сегментации изображений, содержащих рукописный текст, на отдельные текстовые зоны (строки и слова) на основе операций морфологической обработки и на отдельные символы с использованием процедуры адаптивной подстройки выделяющей ячейки и усиления ядра символов.

2. Предложена векторная модель описания внешнего контура изображений рукописных символов, основанная на нахождении опорных точек с применением модифицированного фильтра Робертса, а также алгоритм построения модели на основе процедур уплотнения и нормализации параметров векторного представления.

3. Разработан алгоритм распознавания рукописных символов, использующий базу эталонных векторных описаний с обучением и без обучения на конкретный почерк, и распознавания текста с использованием тематических электронных словарей.

Практическая значимость. Предложенные в диссертационной работе методы и алгоритмы предназначены для практического применения в системах документооборота предприятий, анкетирования населения, паспортно-визовой службы и других систем, где входными данными являются изображения текста, написанного от руки. На основе диссертационных исследований разработана библиотека модулей для создания систем обработки и распознавания изображений рукописного текста.

Реализация результатов работы. Разработанная программа «Система векторизации и распознавания внешнего контура изображений рукописных символов (Vectoryzator)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 7 июня 2007 г. (свидетельство №2007612407), а также программа «Сегментация изображений рукописного текста (SegPic)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 5 сентября 2008 г. (свидетельство №2008614243).

Разработанные алгоритмы и программное обеспечение используются в учебном процессе при проведении занятий по дисциплинам «Интеллектуальная обработка данных», «Теоретические основы цифровой обработки изображений» в Сибирском государственном аэрокосмическом университете им. академика М. Ф. Решетнева (СибГАУ), а также в программном комплексе по обработке результатов социологических исследований «Социорасчет» социологической лаборатории СибГАУ.

Основные положения, выносимые на защиту:

1. Метод сегментации изображений рукописного текста на отдельные текстовые зоны и символы на основе морфологической обработки и процедуры адаптивной подстройки выделяющей ячейки.

2. Векторная модель описания внешнего контура изображений рукописных символов, основанная на нахождении опорных точек, а также алгоритм построения данной модели.

3. Алгоритм распознавания рукописных символов и текста на основе векторного подхода с использованием тематических словарей.

Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на 10-й международной конференции и выставке «Цифровая обработка сигналов и ее применение» (Москва 2008 г.),

IX международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж 2008 г.), всероссийской 6 конференции «Модели и методы обработки изображений» (Красноярск 2007 г.), всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Решетневские чтения» (Красноярск 2004, 2005, 2006, 2007 гг.), всероссийской научной конференции студентов, аспирантов и молодых ученых «Наука. Технологии. Инновации» (Новосибирск 2004 г.), региональном смотре-конкурсе программных проектов «£о//1-Парад-2007» (Красноярск 2007 г.), всероссийской конференции творческой молодежи, посвященной дню космонавтики «Актуальные проблемы авиации и космонавтики» (Красноярск 2005, 2006, 2007 гг.), студенческом семинаре Летней школы компании «Интел» (Москва, Нижний Новгород 2008 г.), а также на научных семинарах лаборатории систем цифровой обработки изображений СибГАУ.

Публикации. По результатам диссертационного исследования опубликовано 18 печатных работ, из них 4 статьи, 12 тезисов докладов, 2 свидетельства, зарегистрированных в Российском реестре программ для ЭВМ.

Структура работы. Работа состоит из введения, трех глав, заключения, списка литературы и приложения.

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Горошкин, Антон Николаевич

3.5 Выводы по главе

Рассматривается разработанный экспериментальный комплекс по распознаванию изображений документов, содержащих рукописный текст. Приведены структурные схемы функционирования основных модулей и их функциональные характеристики, а также структура базы данных эталонных векторных моделей. Рассмотрены основные типы почерков с учетом общепринятой криминалистической классификации.

Программный комплекс представляет собой модульное приложение, состоящее из отдельных программных модулей, которые позволяют решать определенный класс задач, связанный с сегментацией изображений, f содержащих рукописный текст, векторизацией внешнего контура изображения и распознаванием отдельных рукописных символов и текста. Система состоит из пяти модулей: модуль организации интерфейса с пользователем, конфигурационный модуль, модуль предварительной обработки, модуль сегментации и модуль распознавания и принятия решения. Кроме того, в состав комплекса входит база данных эталонных векторных моделей и набор тематических словарей, а также различного рода конфигурационные файлы. Среди множества типов почерка были выбраны основные типы (левонаклонный, средний, правонаклонный, слабосвязанный, сильносвязанный, крупный, мелкий и т.д.).

Проведено тестирование модулей для данных типов почерка в различных режимах функционирования системы, как с применением

83 предложенных в работе модификаций методов и алгоритмов, так и без них. Предложенная процедура адаптивной подстройки выделяющей ячейки позволяет увеличить точность распознавания в среднем на 5—7%. А применение в системе распознавания лингвистической модели слова позволяет увеличить точность распознавания на 5-9%, при этом средняя точность распознавания составляет 75—80% для среднего типа почерка в зависимости от режима функционирования системы. Работа системы распознавания в режиме обучения позволяет увеличивать точность распознавания на 10-15%.

ЗАКЛЮЧЕНИЕ

В диссертационной работе исследовалась задача обработки и распознавания рукописного текста в системах электронного документооборота.

Был проведен анализ методов и алгоритмов обработки и распознавания изображений рукописных документов. К основным методам обработки относится: предварительная обработка и сегментация. Основной задачей предварительной обработки изображений текстовых документов является бинаризация, поскольку в данном случае цвет текста не является его функциональной характеристикой, и улучшение вида изображения в целом (устранение разрывов, мелких искажений контуров и т.д.). Известны три метода бинаризации (по пороговому значению, по площади, по гистограмме), которые могут быть применены для решения задач данного класса. Для сегментации изображений рукописного документа на отдельные строки и слова применяется ряд процедур, к которым относятся метод построения гистограмм изображения с последующим поиском максимальных и минимальных значений, подход, основанный на построении контура изображения с эвристическими процедурами поиска изображений примитивов, метод сегментации на основе построения скелета изображения и т.д. Известны два основных подхода к построению систем распознавания рукописного текста — распознавание в пассивном режиме, характерном для систем документооборота при анкетировании населения, паспортно-визовой службы, наличии унаследованных документов и т.п., и распознавание в интерактивном режиме, учитывающем динамику написания текста (карманные персональные компьютеры). Диссертационное исследование было посвящено реализации первого подхода.

В работе предложена модификация метода сегментации, основанного на построении гистограмм. Метод поиска текстовых зон на изображении усовершенствован посредством маркировки изображения и построения таблицы связности текстовых зон. Он позволяет за один проход по

85 изображению обнаруживать все имеющиеся текстовые зоны изображения документа (строки и слова) и определять их основные геометрические характеристики: угол наклона изображения строки, максимальные геометрические размеры прямоугольников, описывающих изображения отдельных слов. Разработана процедура сегментации изображений текстовых зон на отдельные символы при помощи адаптивной подстройки выделяющей ячейки на основе операции морфологического расширения к базовой линии (усиление ядра символов).

Для формирования признаков изображений рукописных символов предложена модификация фильтра Робертса, позволяющая осуществлять построение векторной модели описания внешнего контура символов с применением модифицированного волнового алгоритма для определения связности опорных точек. Разработанные процедуры уплотнения и нормализации векторного представления в рамках решаемой задачи позволяют получить инвариантное к сдвигам и масштабированию описание символов. Разработанный алгоритм построения инвариантной к выбору начального вектора модели символа (инвариантность к поворотам и форме написания) повышает эффективность последующего распознавания рукописных символов.

На основе векторной модели разработан алгоритм распознавания рукописных символов и текста. Алгоритм распознавания рукописных символов основан на вычислении меры близости между текущей векторной моделью символа и эталонными векторными моделями. В качестве меры близости было использовано четыре метрики, основанные на комбинации нормализованных длин и нормализованных углов векторов модели.

Предложена методика построения лингвистической модели слова, которая строится с использованием вычисления вероятности появления очередного символа в слове на основе тематических словарей (словарь Ожегова, орфографический словарь Лопатина, русско-английский и англо-русский словари, толковый словарь В. Даля) и учитывает предыдущие распознанные

86 символы. Применение такой модели слова в разработанном алгоритме распознавания рукописного текста позволяет повышать точность распознавания за счет сокращения количества эталонных векторных моделей на этапе распознавания одиночных рукописных символов.

На основе предложенных методов разработан экспериментальный комплекс по распознаванию изображений документов, содержащих рукописный текст. Программный комплекс представляет собой модульное приложение, состоящее из отдельных программных модулей, которые позволяют решать определенный класс задач, связанный с сегментацией изображений, содержащих рукописный текст, векторизацией внешнего контура изображения и распознаванием отдельных рукописных символов и текста. Система состоит из пяти модулей: модуль организации интерфейса с пользователем, конфигурационный модуль, модуль предварительной обработки, модуль сегментации и модуль распознавания и принятия решения. Кроме того, в состав комплекса входит база данных эталонных векторных моделей и набор тематических словарей, а также различного рода конфигурационные файлы. Среди множества типов почерка были выбраны основные типы (левонаклонный, средний, правонаклонный, слабосвязанный, сильносвязанный, крупный, мелкий и т.д.).

Проведено тестирование модулей для данных типов почерка в различных режимах функционирования системы, как с применением предложенных в работе модификаций методов и алгоритмов, так и без них. Предложенная процедура адаптивной подстройки выделяющей ячейки позволяет увеличить точность распознавания в среднем на 5—7%. А применение в системе распознавания модели слова позволяет увеличить точность распознавания на 5-9%, при этом средняя точность распознавания составляет 75-80% для среднего типа почерка в зависимости от режима функционирования системы. Работа системы распознавания в режиме обучения позволяет увеличивать точность распознавания на 10—15%.

Дальнейшие направления работы связаны с исследованием комбинаций методов сегментации и распознавания. Так, в частности, заложенный принцип последовательного распознавания позволяет осуществлять предварительное распознавание на этапе сегментации и, таким образом, позволяет учитывать наиболее гибко специфику отдельных рукописных символов («ш», «щ», «ы» и т.д.). Это позволяет применять различные параметры выделяющей ячейки для различных символов и сокращать количество ложных сегментаций. На этапе последующего распознавания целесообразно применять более сложные грамматики, построенные на скрытых марковских моделях и учитывающие совокупность всех символов в слове, например на основе алгоритма Витерби. При этом учет результата распознавания на этапе сегментации символов позволяет сократить число сравнений на этапе последующего распознавания. Кроме того, целесообразным является автоматический выбор соответствующего тематического словаря на основе распознаваемых слов. Дальнейшее применение более сложных алгоритмов, основанных на понимании смысла текста на естественном языке, позволяет осуществлять коррекцию не только слов, написанных с ошибками, но и словосочетаний и предложений в целом.

Список литературы диссертационного исследования кандидат технических наук Горошкин, Антон Николаевич, 2008 год

1. Арлазаров В.Л., Славин О.А. Алгоритмы распознавания и технологии ввода текстов в ЭВМ. // Информационные технологии и вычислительные системы, №1, 1996. — с. 15—19.

2. Белан С. М., Моторнюк Р. Л. Сегментация изображений в однородных клеточных автоматах // Вторая Международная научно-методическая конференция «ИНТЕРНЕТ ОБРАЗОВАНИЕ - НАУКА - 2000», Винницкий гос. Техн. Ун-т, Винницк, 2000. - с. 307-310.

3. Богуславский А.А., Соколов С.М. Программно-аппаратные средства ввода зрительных данных в память персонального компьютера. Препринт ИПМ им. М.В.Келдыша РАН №52, Москва, 2002. 22 с.

4. Богуславский Ан. С++ и компьютерная графика. — М.: КомпьютерПресс, 2003. 352 с.

5. Борисов В. В. , КругловВ. В. Искусственные нейронные сети. Теория и практика. М.: Горячая линия-Телеком, 2001. — 382 с.

6. Браверман Э. М, Мучник И. Б. Структурные методы обработки эмпирических данных. М.: Наука, ГРФМЛ, 1983. — 368 с.

7. Бутаков Е, А„ Островский В. И., Фадеев И. Л, Обработка изображений на ЭВМ, М: Радио и связь, 1987. - 238 с,

8. Гайдышев И. Анализ и обработка данных: специальный справочник. — СПБ:Питер, 2001. 752 с.

9. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005. - 1072 с.

10. Ю.Горелик А. Л., Скрипкин В. А. Методы распознавания: Учеб, пособие, 3-е изд. -М.: Высшая школа, 1989. 350 с.

11. П.Горелик А. Л., Гуревич И. Б., Скрипкин В, А, Современное состояние проблемы распознавания: Некоторые аспекты. Сер, Кибернетика. — М,: Радио и связь, 1985. — 160 с.

12. Горошкин А.Н. Обработка изображений в системах распознавания рукописного текста // В материалах 10-й международной конференции и выставке «Цифровая обработка сигналов и ее применение», Москва, Россия, 2008. с. 489-491.

13. Горошкин А.Н. Адаптивное выделение символов рукописного текста // Решетневские чтения: материалы XI Международной научной конференции. Красноярск, 2007. — с. 285.

14. Горошкин А.Н. Алгоритм векторизации внешнего контураизображения // Материалы Всероссийской научной конференции

15. Модели и методы обработки изображений ММОИ-2007» (Красноярск,9019.22 ноября 2007) / ред. Г.М. Цибульский, М.В.Носков. — Красноярск, 2007.-с. 35-38.

16. Горошкин А.Н. Метод обнаружения информативных текстовых зон на изображении // Актуальные проблемы авиации и космонавтики: материалы Всероссийской научно-практической конференции / СибГАУ. Красноярск, 2007.

17. Горошкин А.Н. Программный комплекс по распознаванию рукописных символов в анкетных формах // Решетневские чтения: материалы 9 Всероссийской научной конференции с международным участием / СибГАУ. Красноярск, 2006.

18. Горошкин А.Н. Система предварительной обработки изображений объектов динамической двухмерной сцены // Решетневские чтения: материалы 8 Всероссийской научной конференции с международным участием / СибГАУ. Красноярск, 2005. - с. 313.

19. Горошкин А.Н. Алгоритм динамического обучения в системе распознавания // Актуальные проблемы авиации и космонавтики: материалы Всероссийской научно-практической конференции / СибГАУ. Красноярск, 2005. - с. 288-289.

20. Горошкин А.Н. Алгоритм инвариантных преобразований в системеобработки изображений // Наука. Технологии. Инновации: материалы91

21. Всероссийской научной конференции молодых ученых / НГТУ. -Новосибирск, 2004. Часть 1. — с. 17—18.

22. Горошкин А.Н. Инвариантная система обработки изображений объектов двухмерной сцены // Решетневские чтения: материалы 7 Всероссийской научной конференции с международным участием / СибГАУ. Красноярск, 2004. - с. 198-199.

23. Горошкин, А.Н. Система векторизации и распознавания внешнего контура изображений рукописных символов (Vectoryzator). Свидетельство №2007612407. Зарегистрировано в Реестре программ для ЭВМ г. Москва, 7 июня 2007 г.

24. Горошкин, А.Н., Фаворская М.Н. Сегментация изображений рукописного текста (SegPic). Свидетельство №2008614243. Зарегистрировано в Реестре программ для ЭВМ г. Москва, 5 сентября 2008 г.

25. Ищенко Е.П., Топорков А.А. Криминалистика: Учебник. Изд. 2-е, испр. И доп. /Под ред. Доктора юридических наук, профессора Е.П. Ищенко. М., «Инфра-М», 2005. - 696с.

26. Калинкина Д., Ватолин Д. Проблема подавления шума на изображениях и видео и различные подходы к ее решению // Научно-образовательный сетевой журнал «Графика и мультимедиа», 2005.

27. Каллан Р. Основные концепции нейронных сетей. М.:Изд. Дом «Вильяме», 2001.

28. Коневский O.JI. Адаптивная морфологическая обработка бинарных контуров. Электронный журнал «Исследовано в России», 149, 1722— 1731, 2001. http://zhurnal.ape.relarn.ru/articles/2001/149.pdf

29. Корн Г., Корн Т. Справочник по математике. — М.: "Наука", 1984.

30. Котович Н.В., Славин О.А. Распознавание скелетных образов. Электронный ресурс. Электрон. Дан. — Режим доступа: http://ocrai.narod.ru/skeletrecognize.html -Загл. С экрана.

31. Линейка продуктов ABBYY FineReader Электронный ресурс. -Электрон. Дан. — Режим доступа: http://www.abbyy.ru/finereader/ — Загл. С экрана.

32. Мерков А.Б. Основные методы, применяемые для распознавания рукописного текста Электронный ресурс. Электрон. Дан. — Режим доступа:http://www.recognition.mccme.iWpub/RecognitionLab.html/methods.html -Загл. С экрана.

33. Местецкий Л.М. Непрерывный скелет бинарного изображения. Доклад на конференции Графикон-99.

34. Никулин Е. Компьютерная геометрия и алгоритмы машинной графики. Серия «Учебное пособие». — СПб.: БХВ-Петербург, 2003. — 560 с.

35. Павлидис Т. Алгоритмы машинной графики и обработки изображений. Пер. с англ. М.: Радио и связь, 1986.

36. Патрик Э. Основы теории распознавания образов: Пер. с англ. /Под ред. Б.Р.Левина. М.: Сов. Радио, 1980. - 408 с.

37. Петров М.Н., Молочков В.П. Компьютерная графика: Учебник для вузов. СПб.: Питер, 2002. - 736 с.

38. Поляков А. Методы и алгоритмы компьютерной графики в примерах на Visual С++. Серия «Мастер». СПб.: БХВ-Петербург, 2002. - 416 е.: ил.

39. Помощь по Microsoft Office: Распознавание рукописного текста Электронный ресурс. — Электрон. Дан. Режим доступа: http://office.microsoft.com/ru-ru/assistance/CHO 10003311049.aspx — Загл. С экрана.

40. Порев В. Компьютерная графика. Серия «Учебное пособие». СПб.: БХВ-Петербург, 2002. - 432 с.

41. Поцепаев Р.В., Петров И.Б. Эффективный алгоритм предобработки изображений для структурных методов распознавания рукописныхсимволов. Электронный журнал «Исследовано в России», 149, 1722— 1731, 2001. http://zhurnal.ape.relarn.ru/articles/2001/149.pdf.

42. Претт Э. Цифровая обработка изображений: Пер. с англ. — М.:Мир, 1982.-312с.

43. Применение волнового алгоритма для нахождения скелета растрового изображения Электронный ресурс. — Электрон. Дан. — Режим доступа: http://ocrai.narod.ru/vectory.html -Загл. С экрана.

44. Рейнбоу В. Компьютерная графика. Энциклопедия. СПб.: Питер,2003. 768 с.

45. Рукопись система рукописного распознавания русского языка для КПК PocketPC Электронный ресурс. - Электрон. Дан. - Режим доступа: http://chis.nnov.ru/rukopis/ — Загл. С экрана.

46. Русый Б. П. Структурно-лингвистические методы распознавания изображений в реальном времени. Киев: Наукова думка, 1986 — 127 с.

47. Себастиан Г. Процессы принятия решения при распознавании образов. Киев, 1965.- 151 с.

48. Сергиенко А. Цифровая обработка сигналов: Учебник для вузов. — СПб.: Питер, 2002. 608 с.

49. Сойфер В. А. Компьютерная обработка изображений. Часть 1. Математические модели. Соросовский образовательный журнал, №2, 1996.

50. Сойфер В. А. Компьютерная обработка изображений. Часть 2. Методы и алгоритмы. Соросовский образовательный журнал, №3, 1996.

51. Сойфер В.А. Методы компьютерной обработки изображений. — М.: «Физматлит», 2004. 784 с.

52. Соколов Е. Н., Вейткявичус Г. Г. Нейроинтеллекг. От нейрона к нейрокомпьютеру. -М.: Наука, 1989. -240 с.5 7. Сэломон Д. Сжатие данных, изображений и звука. М.: Техносфера,2004. 339 с.

53. Тимохин В, И. Применение ЭВМ для решения задач распознавания образов: Учеб, пособие, Д.; ЛГУ, 1983. - 215 с.

54. Титаренко А., Ватолин Д. Удаление шума и царапин в старых видеозаписях // Материалы XIII Международной конференции студентов, аспирантов и молодых учёных «Ломоносов», секция «Вычислительная математика и кибернетика», Москва, 2006. с.52-53.

55. Ту Дж., Гонсалес Р. Принципы распознавания образов — М.: МИР, 1978.-414 с.

56. Убитый яблоком Электронный ресурс. Электрон. Дан. — Режим доступа: http://www.ferra.ru/online/mobilis/12848/ - Загл. С экрана.

57. Форсайт ДА., Понс Дж. Компьютерное зрение. Современный подход.

58. М.: Издательский дом «Вильяме», 2004. 928 с.

59. Фу К.С. Структурные методы в распознавании образов: Пер. с англ. -М.: Мир, 1977.-320 с.

60. Фурман Я. А., Кревецкий А. В., Передреев А. К. и др. Введение в контурный анализ; приложения к обработке изображений и сигналов. — М.: ФИЗМАТЛИТ, 2003. 592 с.

61. Шикин Е.В., Боресков А.В. Компьютерная графика. М.: "Мир" 1995.- 220 с.

62. Щепин Е. В., Непомнящий Г. М. К топологическому подходу в анализе изображений. Геометрия, топология и приложения // Межвуз. Сб. научн. Труд. М.: Мин. Высшего и среди, спец, образ. РСФСР, Московский институт приборостроения, 1990. -с. 13-25.

63. Ян Д.Е., Анисимович К.В., Шамис А.Л. Новая технология распознавания символов. Теория, практическая реализация, перспективы. М. : Препринт, 1995.

64. A. Aksela Matti and Laaksonen Jorma . On Adaptive Confidences for Critic-Driven Classifier Combining // In Proceedings of ICAPR 2005, pp. 71-80, 2005.

65. Aksela Matti, Laaksonen Jorma , Oja Erkki, Kangas Jari . Application of adaptive committee classifiers in on-line character recognition // Published in the Proceedings of ICAPR' 01, pp. 270-279, 2001.

66. Aksela Matti, Laaksonen Jorma , Oja Erkki , Kangas Jari. Rejection methods for an adaptive committee classifier // Published in the Proceedings oflCDAR'Ql, pp 982-986, Seattle, USA, September 2001.

67. Belongie S., Malik J., Puzicha J. Shape matching and object recognition using shape contexts. // IEEE Trans. On Pattern Analysis and Machine Intelligence 2002 vol. 24, no. 4, pp. 509-522.

68. Brakensiek A., Rottl J., Kosmala A. and Rigoll G. Off-line handwriting recognition using various hybrid modeling techniques and character n-grams // In 7th International Workshop on Frontiers in Handwritten Recognition, 2000, pp. 343-352.

69. Cheng-lin Liu and In-jung Kim and Jin H. Kim. Model-based stroke extraction and matching for handwritten Chinese character recognition // Pattern Recognition 34, p.2339-2352, 2001.

70. Deng, P.S., Liao, H.-Y.M., Ho, C.W., Tyan, H.-R. Wavelet-Based Off-Line Handwritten Signature Verification // Computer Vision and Image Understanding, 76 (3), p. 173-190, Dec 1999.

71. Dong, J.x., Krzyzak, A., Suen, C.Y. An improved handwritten Chinese character recognition system using support vector machine // Pattern Recognition Letters, 26 (12), p.l849-1856, Sep 2005

72. Giovanni Seni and Edward Cohen. External word segmentation of off-line handwritten text lines //Pattern Recognition, 27, p. 41—52, 1994.

73. Goltsev, A., Rachkovskij, D. Combination of the assembly neural network with a perceptron for recognition of handwritten digits arranged in numeral //Pattern Recognition, 38 (3), p.315-322, Mar 2005.

74. Govindaraju, V, Krishnamurthy, R.K. Holistic handwritten word recognition using temporal features derived from off-line images // Pattern Recognition Letters, 17 (5), p.537-540, May 1996.

75. Guilevic, D., Nishiwaki, D., Yamada, K. Word lexicon reduction by character spotting // Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition, September 11—13 2000, Amsterdam, pp. 373-382.

76. Guler, I, Meghdadi, M. A different approach to off-line handwritten signature verification using the optimal dynamic time warping algorithm // Digital Signal Processing, 18 (6), p.940-950, 2008.

77. Hall J., Greenhill D., Jones G. Segmenting in sequences using active surfaces //In International Conference on Image Processing, 1997.

78. Hewavitharana S., Fern H. C. and Kodikara N. D. Off-line Sinhala Handwriting Recognition using Hidden Markov Models // Proc. Of Indian Conference on Computer Vision, Graphics & Image Processing (ICVGIP) 2002, Ahmedabad, India, 2002, pp. 266-269.

79. Howe, N., Rath, T. and Manmatha, R. Boosted Decision Trees for Word Recognition in Handwritten Document Retrieval // The Proceedings of the 28th Annual International ACM SIGIR Conference (SIGIR2005), pp. 377-383.

80. Huang, K., Yan, H. Off-line signature verification using structural feature correspondence //Pattern Recognition, 35 (11), p.2467—2477, Nov 2002.

81. Husni A. Al-Muhtaseba, Sabri A. Mahmouda, and Rami S. Qahwajib. Recognition of off-line printed Arabic text using Hidden Markov Models // Signal Processing, Volume 88, Issue 12, 2008, pp. 2902-2912.

82. Jaehwa Park and Venu Govindaraju and Sargur N. Srihari. Ecient word segmentation driven by unconstrained handwritten phrase recognition // In Proceedings of International Conference on Document Analysis and Recognition, 1999, pp. 605-608.

83. Kim, S.H., Jeong, S., Suen, C.Y. A lexicon-driven approach for optimal segment combination in off-line recognition of unconstrained handwritten Korean words // Pattern Recognition, 34 (7), Jan 2001, pp. 1437-1447.

84. Koerich A. L., Sabourin R., Suen C. Y. Large vocabulary off-line handwriting recognition: A survey // Pattern Analysis and Applications, 2003, Volume 6, pp. 97-121.

85. Lallican, P., Viard-Gaudin, С., Knerr, S. From Off-line to On-line Handwriting Recognition // Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition, September 11-13, 2000, Amsterdam, pp. 303-312.

86. Lam L., Suen C. Y. An Evaluation of Parallel Thinning Algorithms for Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, 1995, vol. 17, no. 9, pp.724-737.

87. Lasko, T. Approximate string matching algorithms for limited-vocabulary OCR output correction // Proceedings of SPIE, Vol. 4307, Document Recognition and Retrieval VIII, 2000.

88. Lavrenko, V., Rath, T. and Manmatha, R. Holistic Word Recognition for Handwritten Historical Documents // The Proceedings of Document Image Analysis for Libraries (DIAL), 2004, pp. 278-287.

89. Lazzerini, В., Marcelloni, F. A linguistic fuzzy recognizer of off-line handwritten characters // Pattern Recognition Letters, 21 (4), p.319—327, Apr 2000.

90. Liu, J., Gader, P. Neural networks with enhanced outlier rejection ability for off-line handwritten word recognition // Pattern Recognition, 35 (10), p. 2061-2071, Oct 2002.

91. Mahmoud, S. Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models // Signal Processing, 88 (4), p. 844-857, Apr 2008.

92. Manmatha, R. and Srimal, N. Scale space technique for word segmentation in handwritten manuscripts // The Proceedings of the Second International Conference on Scale-Space Theories Computer Vision (Scale Space 99), p. 22-33.

93. Marquis, R, Taroni, F , Bozza, S , Schmittbuhl, M. Quantitative characterization of morphological polymorphism of handwritten characters loops //Forensic science international, 164 (2—3), p. 211—220, Dec 2006.

94. Marti U.-v. and Bunke H. Text line segmentation and word recognition in a system for general writer independent handwriting recognition // In Sixth International Conference on Document Analysis and Recognition, p. 159—163, 2001.

95. Mati'c, N. , Guy on, I. , Denker, J. and Vapnik, V. Writer adaptation for on-line handwritten character recognition // In ICDAR93, Tokyo, 1993. IEEE Computer Society Press.

96. Nacken, P. Image Analysis Methods Based on Hierarchies of Graphs and Multi-Scale Mathematical Morphology // PhD-thesis, University of Amsterdam, 1994.

97. Plamondon R., Srinari S, On-Line and Off-Line Handwriting Recognition: A Comprehensive Survey // IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000. vol. 22, no. 1, pp. 914—919.

98. Plamondon R., Suen C. Y., Bourdeau M., Barriere C. Methodologies for Evaluating Thinning Algorithms for Character Recognition // Pattern Recognition and Artificial Intelligence, special issue thinning algorithms. 1993. vol. 7, no. 5, pp. 1247-1270.

99. Plamondon, R. and Lorrette, G. Automatic signature verification and writer identification — the state of the art // Pattern Recognition, 22(2), pp. 107-131, 1989.

100. Plamondon, R., Srihari, S.N. Online and off-line handwriting recognition: a comprehensive survey // Pattern Analysis and Machine Intelligence, IEEE Transactions on, Volume: 22, Issue 1, 2000, pp. 63-84.

101. Sargur Bin Zhang, Srihari N. Analysis of Handwriting Individuality Using Word Features // 7th International Conference on Document Analysis and Recognition, Edinburgh, Scotland, August 3-6, 2003.

102. Srihari, S. N., Cha, S.-H., Arora, H. and Lee, S. Individuality of handwriting// Journal of Forensic Sciences, 47(4), pp. 1-17, July 2002.

103. Thoma, G.R. Automating data entry into MEDLINE // Proceedings of the 1999 Symposium on Document Image Understanding Technology, pp. 217-218,1999.

104. Tubbs, J. D. A note on binary template matching // Pattern Recognition, 22(4), p. 359-365, 1989.

105. Vinciarelli, A., Bengio, S. Writer adaptation techniques in HMM based Ojf-Line Cursive Script Recognition // Pattern Recognition Letters, 23 (8), p. 905-916, Jun 2002.

106. Vinciarelli, A. A survey on off-line Cursive Word Recognition // Pattern Recognition, 35 (7), p.1433-1446, Jul 2002.

107. Vinciarelli, S. Bengio, and H. Bunke. Offline recognition of unconstrained handwritten texts using HMM and statistical language models // IDIAP-RR 3-22, Dalle Molle Institute for Perceptual Artificial Intelligence, 2003.

108. Vuokko Vuori, Erkki Oja. Analysis of Different Writing Styles with the Self-Organizing Map // Published in the proceedings of the ICONIP2000, volume 2, p. 1243-1247, Taejon, South Korea, November 2000.

109. Vuokko Vuori, Jorma Laaksonen, Erkki Oja, Jari Kangas. Controlling On-Line Adaptation of a Prototype-Based Classifier for Handwritten

110. Characters // Published in the proceedings of the ICPR2000, volume 2, pp. 331-334, Barcelona, Spain, September 2000.

111. Vuokko Vuori, Jorma Laaksonen, Erkki Oja, Jari Kangas. Speeding up On-line Recognition of Handwritten Characters by Pruning the Prototype Set // Published in the Proceedings ofICDAR'01, pp. 501-505, Seattle, USA, September 2001.

112. Vuokko Vuori, Jorma Laaksonen, Jari Kangas. Influence of Erroneous Learning Samples on Adaptation in On-line Handwriting Recognition // Published in Pattern Recognition, pp 915-926, volume 35, number 4, 2002.

113. Vuokko Vuori, Jorma Laaksonen. A Comparison of Techniques for Automatic Clustering of Handwritten Characters // Published in the Proceedings of the 16th International Conference on Pattern Recognition, volume 3, pp. 168-171, August 2002.

114. Vuokko Vuori. Clustering Writing Styles with a Self-Organizing Map // Published in the Proceedings of the 8th International Workshop on Frontiers in Handwriting Recognition, pp. 345-350, August 2002.

115. Wakahara T. Shape machine using LAT and its application to handwritten character recognition //IEEE Transactions on Pattern Analysis and Machine Intelligence, 1994. vol. 16, no, 6. pp. 618-629.

116. Wang, X. , Govindaraju, V. and Srihari, S. N. Holistic digit pair recognition // Journal of Pattern Recognition, 33(12), pp. 1967—1974, December 2000.

117. Weissman, H. , Schenkel, M. , Guy on, I., Nohl, C. and Henderson, D. Recognitionbased Segmentation of On-line Run-on Handprinted Words: Input vs. Output Segmentation//Pattern Recognition, October 1992.

118. Wienecke, M. , Fink, G. A. and Sagerer, G. Videobased on-line handwriting recognition // In Proc. Of Int. Conf. on Document Analysis and Recognition, pp. 226-230, 2001.

119. Wu V., Manmatha R., Riseman E. M., Finding Text In Images // In Proc. Of the 2nd Intl. Conf. on Digital Libraries. Philadaphia. PA. 1997, pp. 1-10.

120. Wu Y., Tian Q., Huang T. S. Discriminant-EM algorithm with application to image retrieval //Proc. CVPR, 2000, pp. 222—227.

121. Xie L., Xu P., Chang S. F., Divakaran A., Sun H. Structure analysis of soccer video with domain knowledge and hidden Markov models // Pattern Recogn. Lett. 2004 vol. 25, no. 7, pp. 767-775.

122. Yang J., Gao J., Zhang Y, Chen X., Waibel A. An automatic sign recognition and translation system // Proceedings of Perceptual User Interface Workshop 2001.

123. Yanikoglu Berrin and Sandon Peter A. Segmentation of off-line cursive handwriting using linear programming // Pattern Recognition, 31 (12), pp. 1825-1833, 1998.

124. Y-HPao Adaptive pattern recognition and neural network// Addison-Wesley, 1989.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Оглавление диссертации кандидат технических наук Горошкин, Антон Николаевич

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Адаптивное распознавание и его применение к системе ввода печатного текста2011 год, доктор технических наук Славин, Олег Анатольевич

Моделирование процесса идентификации графических объектов2011 год, кандидат технических наук Курушин, Даниил Сергеевич

Введение диссертации (часть автореферата) на тему «Обработка и распознавание рукописного текста в системах электронного документооборота»

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Компьютерный метод локализации лиц на изображениях в сложных условиях освещения2011 год, кандидат технических наук Пахирка, Андрей Иванович

Комбинированные алгоритмы в задачах распознавания текстов2000 год, кандидат технических наук Славин, Олег Анатольевич

Разработка и исследование методов и средств распознавания текста факсимильных сообщений2003 год, кандидат технических наук Цопкало, Николай Николаевич

Разработка и исследование методов распознавания рукописных арабских текстов2003 год, кандидат технических наук Салюм Саид Салех

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Горошкин, Антон Николаевич

Список литературы диссертационного исследования кандидат технических наук Горошкин, Антон Николаевич, 2008 год