Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке тема диссертации и автореферата по ВАК РФ 05.13.12, кандидат технических наук Хоанг Зянг

  • Хоанг Зянг
  • кандидат технических науккандидат технических наук
  • 2008, Санкт-Петербург
  • Специальность ВАК РФ05.13.12
  • Количество страниц 108
Хоанг Зянг. Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке: дис. кандидат технических наук: 05.13.12 - Системы автоматизации проектирования (по отраслям). Санкт-Петербург. 2008. 108 с.

Оглавление диссертации кандидат технических наук Хоанг Зянг

ВВЕДЕНИЕ.

ГЛАВА 1. АНАЛИЗ ВЬЕТНАМСКОГО ЯЗЫКА НА ПРЕДМЕТ

РАСПОЗНАВАНИЯ ТЕКСТА.

ГЛАВА 2. ПОЛУЧЕНИЕ ЦИФРОВОГО ИЗОБРАЖЕНИЯ ИЗ ПЕЧАТНЫХ ДОКУМЕНТОВ И ПЕРВИЧНЫЕ ОБРАБОТКИ ИЗОБРАЖЕНИЯ.

2.1 Преимущество электронных документов по отношению к бумажным. Типы электронных Документов.

2.2 Процесс преобразования документов.

2.3 Дискретизация входного документа.

2.4 Бинаризация.

2.5 Связный компонент.

2.5.1 Понятие связного компонента.

2.5.2 Алгоритм анализа связных компонентов изображения.

2. 6 Подавление шумов.

2.6.1 Удаление малых шумовых блоков.

2.6.2 Подавление шума с помощью морфологических операций.

2.7 Выравнивание страницы.

2. 7.1 Метод Байрда.

2.7.2.Метод Гашизуме.

2.7.3.Метод Блумберга.

2.7.4.Метод Амина и By.

2.7.5. Разработанный метод.

ГЛАВА 3. СЕГМЕНТАЦИЯ БЛОКОВ ДОКУМЕНТА.

3.1 Анализ основных методов сегментации.

3.2 Динамическая локальная карта связи.

3.3 Анализ результатов применения алгоритма определения пороговых значений для многошкальной сегментации.

3. 4 Разработка алгоритма построения иерархического дерева сегментации.

3. 5 Идентификация текстовых блоков.

ГЛАВА 4. ВЫДЕЛЕНИЕ СТРОК И СИМВОЛОВ ИЗ ИЗОБРАЖЕНИЯ. КЛАСТЕРИЗАЦИЯ СИМВОЛОВ.

4.1 Разбиение текстовых блоков на строки.

4.2 Извлечение символов из строки.

4.2.1 Разделение связанных символов.

4.2.2 Объединение связных компонентов одного символа.

4.2.3 Извлечение символов на базе распознавания.

4.2.4 Целостный подход.

4.2.5 Разработанный метод.

ГЛАВА 5. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ВЬЕТНАМСКОГО ЯЗЫКА.

5.1 История развития оптического распознавания символов.

5.2 Обзор по современным опубликованным методам распознавания символов.

5.2.1 Метод Пелега (Peleg) и Розенфелда.

5.2.2 Метод Наги (Nagy) и др.

5.2.3 Метод Ли (Lee) на основе скрытой Марковской модели.

5.2.4 Распознавание символов на базе нейронных сетей.

5.3 Разработанный метод.

5.3.1. Рейтинговый подход.

5.3.2. Распознавание с помощью нейронных сетей.

5.3.3. Комбинированный подход.

ГЛАВА 6. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ КОМПЛЕКСА МЕТОДОВ И

АЛГОРИТМОВ.

6.1 Обработка документа перед распознаванием.

6.1.1 Анализ компонентов.

6.1.2 Определение блоков.

6.1.3. Идентификация блоков.

6.1.4 Определения угла отклонения.

6.1.5 Извлечения строк из текстовых блоков.

6.1.6 Извлечения символов из строк.

6.2 Распознавание символов.

6.2.1 Распознавание с помощью рейтингового подхода.

6.2.2 Распознавание с помощью нейронных сетей.

6.2.3. Комбинированный подход.

Рекомендованный список диссертаций по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Введение диссертации (часть автореферата) на тему «Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке»

Актуальность темы диссертационного исследования.

В настоящее время автоматизация проектирования стала неотъемлемой составляющей научно-технического прогресса. Она значительно снижает длительность, трудоемкость и стоимость создания математического и программного обеспечения (ПО) систем различного назначения при одновременном повышении его качественного уровня. Учитывая то, что на создание ПО и математического обеспечения (МО) уходит больше средств, чем на создание всей системы, снижение трудоемкости разработки и, следовательно, ее стоимости является очень важным аргументом на пути применения систем автоматизированного проектирования (САПР) при разработке МО и ПО.

Автоматизированное проектирование главным образом используется для детальной разработки трехмерных и/или двухмерных моделей физических объектов. Кроме этого, САПР также используется по всему технического процесса из концептуального проектирования, динамического анализа сборка до определения методов производства приборов.

САПР стало особенно важной технологией, которая позволяет разрабатывать приборы с низкими затратами и короткого цикла проектирования. С помощью САПР проектировщик может сидеть перед экраном дисплея компьютера, разрабатывать, раскладывать детали приборов, распечатать чертежи на бумаге или сохранить их для дальнейшего редактирования, экономя время работы на их реальных чертежах.

Возможность и эффективность применения ЭВМ для решения тех или иных задач проектирования непосредственно связаны со степенью математической формализации этих задач. Наибольший успех достигнут для тех объектов и задач проектирования, для которых найдены адекватные математические модели (ММ), развиты эффективные вычислительные процедуры, доказана их разрешимость, определены ограничения. В САПР это, в первую очередь, относится к задачам анализа и параметрической оптимизации.

В то же время многие задачи проектирования (например, подавляющее большинство задач структурного синтеза) плохо поддаются автоматизации, решаются вручную, эвристически на основе опыта и интуиции разработчика. При этом качество получаемых решений определяющим образом зависит от творческих способностей человека. Такие задачи принято называть плохоформализуемыми, к ним относятся: 1) задачи, не имеющие точно выраженной математической постановки (в терминах САПР - задачи, не имеющие конструктивной ММ) и/или 2) задачи, решение которых алгоритмическими методами невозможно или неэффективно. Наряду с поиском и разработкой формальных подходов к решению таких задач перспективным является использование методов и средств искусственного интеллекта (ИИ).

Искусственный интеллект - это (применительно к проблематике АП) научная дисциплина, развивающая теорию и средства решения на ЭВМ плохоформализуемых задач на основе оперирования неформальными знаниями человеком.

Кроме перечисленных выше недостатков, плохоформализуемые задачи обычно обладают следующими особенностями:

• неоднозначность, неполнота и противоречивость исходных данных,

• неоднозначность, неполнота и противоречивость знаний о решаемой задаче,

• большое количество возможных решений.

Плохоформализуемые задачи - это чаще всего задачи в нечисловой форме.

Работы в области ИИ ведутся по нескольким тесно связанным друг с другом направлениям: автоматическое доказательство теорем, распознание образов и сцен, обработка естественного языка, автоматическое программирование, планирование целесообразного поведения роботов, консультирующие экспертные системы и так далее. Теоретические и практические результаты, достигнутые в каждом из этих разделов ИИ, находят или могут найти приложение в САПР. Среди них распознание образов является одним из развивающихся разделов ИИ и часто применяется для обработки входных данных для САПР. В данной работе основное внимание уделяется задаче оптического распознания образов, (англ.: OCR - Optical Character Recognition) которая представляет собой процесс преобразования изображений (с помощью сканера, фотоаппарата, фотокамеры и т.д), содержащих рукописный или машинописный текст в машинно-редактируемый текст. Это преобразование дает большую пользу для коммерческих и жизненных целей. OCR является одним из исследовательских разделов распознавания образов, искусственного интеллекта и компьютерной визуализации.

Состояние изученности проблемы. Хотя академическое исследование продолжается, в настоящее время большинство работ фокусируется на применения OCR в конкретные предметные области, поскольку нет общих алгоритмов для решения всех распознаваемых объектов. Каждый объект имеет свои характеристики и особенности. Кроме того, для распознавания' одинакового объекта в различных условиях требуется разработка специальных алгоритмов для каждого случая. Например, алгоритмы, применяемые для выделения и распознавания печатного текста, будут плохо работать в задаче обнаружения и распознавания текста, появляющегося на экране телевизора.

В настоящее время задача текстового распознавания (TP) применяется во многих практических задачах, например - регистрация номеров автомобилей, автоматическая идентификация торговой марки, при разработке программного обеспечения (ПО) автоматического чтения текста для людей с ограниченным зрением и т.д. Применение TP позволяет сохранить документ в электронном виде, что экономит пространство для архива, упрощает поиск нужного документа и т.д.

Вместе с развитием теории распознавания образов и компьютерной технологии по времени появлялись более совершенные системы. В конце 1960х годов OCR-системы уже успешно использовались для автоматической обработки выходящих писем, опечатки пальцы на кредитной карточки, формы для сбора информации о населении и т. д. [8].

С 1960 по 1980-годам, оптическое распознавание символов непрерывно развивалось. Были разработаны более совершенные методы. Распознавание уже не просто сравнение символов с шаблоном. Появились статистические и синтаксические методы.

- В статистических методах сначала система обучается большим количеством изображений символов разных шрифтов и размеров. Особенности (признаки) этих изображений комбинируются и сохраняются, чтобы создать шаблоны символов в базе данных. Потом в фазе распознавания изображение символа сравнивается с шаблонами для нахождения соответственного символа.

- Синтаксические методы используются как вторичная обработка или коррекция результата распознавания другими способами для повышения эффективности системы. Эти методы реализуются путем сбора информации о частоте присутствия одного символа после другого при обработке текста большого объема. Эти символьные диаграммы могут-расширяться, вместо одного символа рассматриваются комбинации 3-4 символов или целое слово. К сожалению этот подход ограничен вычислительной возможностью компьютера.

В середине 1980-годов на базе этих развитой создана OCR-система "Omnifont", которая может распознавать символы разных шрифтов и размеров с высокой точностью[6],[9].

Алгоритмы оптического распознавания символов (англ.: optical character recognition или OCR) алгоритмы постоянно развиваются и совершенствуются. В настоящий момент для некоторых языков, например английского, французского, русского, уже разработаны алгоритмы, распознающие печатные тексты с высокой эффективностью [1],[8]. Современное коммерческое ПО OCR для этих языков рекламируются с заявлением о точности распознавания выше 99%[10]. Но для более сложных языков, таких как вьетнамский язык, не решено еще много задач. Во вьетнамском языке букв и их комбинаций с диакритическими знаками примерно 190, и многие из них очень похожи друг на друга. Поэтому кроме обычных алгоритмов требуются специализированные алгоритмы для распознавания таких языков. На настоящий момент публикаций по теме "Распознавание вьетнамского языка" очень мало и они не решают многие задачи, проявляющие в процессе распознавания этого языка [2]. Например, в работе [2] авторы представляют метод распознавания документа вьетнамского языка. Основав на особенностях вьетнамского языка, они пытались минимизировать число символов и интегрировать проверку орфографии в процесс распознавания. Они также разработали статистические модели частоты присутствия слова в тексте для прогнозирования следующего ; слова, словарь вьетнамской частотности слова был создан, чтобы предсказать следующие слова. Но, несмотря на попытки этих авторов, строгие, эксперименты показывают, что их методы недостаточно эффективны для обработки сканируемых изображений с шумами, и предлагаемые модели не отражают все сложности вьетнамского языка. Поэтому, исходя из вышесказан-' ного, задача разработки математического обеспечения (МО) для систем автоматизированного проектирования (САПР) OCR — систем, специализированных для вьетнамского языка, является актуальной.

Цель диссертационной работы состоит в исследовании, модификации существующих и разработке новых методов и алгоритмов OCR, применяемых при проектировании МО в специализированных для вьетнамского языка автоматизированных системах обработки и распознавания документов.

Задачи исследования. Для достижения поставленной цели необходимо решить следующие задачи:

1. Анализ особенностей вьетнамского языка с точки зрения распознавания текста. Выделение ограничений при применении стандартных и существующих методов распознавания.

2. Выбор и исследование методов и алгоритмов первичной обработки изображения: подавление шумов, выравнивание страница, анализ связных компонентов.

3. Разработка методики решения задачи сегментации и извлечения символов.

4. Разработка методики решения задачи распознавания символов на основе применения геометрического анализа и нейронных сетей.

5. Построение и обучение нейронной сети.

6. Разработка ПО для проведения экспериментов и демонстрации полученных результатов.

Предметом исследования являются методы и алгоритмы автоматизированной системы, применяемые во всех этапах обработки.

Методы исследования базируются на использовании теории и методов САПР, принципах системного подхода, теории искусственных нейронных сетей, теории алгоритмов, теории идентификации.

Научная новизна заключается в разработке новых и модификации существующих методов и алгоритмов, входящих в состав МО САПР специализированных для вьетнамского языка автоматизированных OCR -системах обработки и распознавания документов.

Основные положения, выносимые на защиту:

1. Разработаны алгоритмы первичной обработки изображения (анализа связных компонентов, подавления шумов, выравнивания страницы)

2. Разработаны алгоритм многошкальной сегментации блоков с использованием динамической локальной карты связи и алгоритм идентификации блоков, чтобы определить данный блок является - ли текстовым.

3. Разработан алгоритм извлечения строк из текстовых блоков

4. Разработан алгоритм извлечения символов из строки с учетом диакритических знаков вьетнамского языка и возможности того, что каждый связный компонент может содержать более одного символов.

5. Разработана методика построения и обучения нейронной сети для распознавания букв вьетнамского алфавита.

6. Разработан комбинирований алгоритм распознавания символов на основе применения геометрического анализа и нейронных сетей, что позволяет использовать преимущества каждого метода для повышения точности распознавания.

7. Разработаны экспериментальные программные модули используя язык С++, среду программирования Visual Studio, среду для построения и моделирования нейронных сетей MathLab.

Практическая значимость работы. Эффект от использования результатов диссертационной работы состоит в следующем:

1. Создан эффективный набор методов и алгоритмов для всех этапов распознавания печатных документов вьетнамского языка.

2. Полученные результаты используются для создания коммерческого ПО для распознавания вьетнамского языка.

3. Сокращение сроков и стоимости преобразования бумажных документов в текстовой цифровой документ.

4. Некоторые алгоритмы могут использоваться в других областях кроме распознавания документов, например, для повышения качества изображения или выделения интересуемых объектов.

Апробация результатов работы. Основные результаты работы докладывались на научно-технических конференциях. Среди них: Международная конференция «Интеллектуальные САПР - 2006» (3—10 сентября 2006 г., Геленджик), конференция ППС (8 января 2008 г. СПб ГУ

ИТМО), V- Всероссийская межвузовская конференция молодых ученых (15-18 апреля 2008 г. СПб ГУ ИТМО).

Публикации. Теоретические и практические результаты, представленные в диссертации, отражены в 6 научных работах, в том числе входящие в список рекомендованных ВАК для защиты кандидатских диссертаций.

Структура и объём диссертационной работы. Диссертация состоит из введения, шести глав, заключения, списка литературы из 42 наименований; изложена на 108 страницах машинописного текста, иллюстрированного 49 рисунками.

Похожие диссертационные работы по специальности «Системы автоматизации проектирования (по отраслям)», 05.13.12 шифр ВАК

Заключение диссертации по теме «Системы автоматизации проектирования (по отраслям)», Хоанг Зянг

Заключение

Основная цель диссертационной работы - это исследование, модификация существующих и разработка новых методов и алгоритмов, применяемых на всех этапах работы OCR системы, специализированной для вьетнамского языка. Как видно из главы 6, экспериментальные результаты показывают, что разработанные методы и алгоритмы имеют достаточные точность и производительность для применения в реальных системах OCR.

Основные преимущества разработанных методов и алгоритмов

До сих пор, публикаций в области распознавания вьетнамского языка очень мало. Кроме того, почти все работы в этой области концентрируются вокруг проблемы распознавания символов. Но как известно, это лишь послед-, ний этап работы OCR системы. До этого нужно выполнить очень большие и трудные операции для извлечения изображений отдельных символов, что является входными данными для распознавания. Первое и главное преимущество данной работы - это анализ сложности вьетнамского языка, трудности при разработке OCR системы для него и полное описание алгоритмов специализированных для вьетнамского языка, применяемых во всех этапах OCR системы.

Хотя эти алгоритмы разработаны для вьетнамского языка, но большинство из них не теряют универсальность. Их можно использовать без значительных изменений и для других языков, если у них есть алфавит.

Уникальность алгоритмов еще показывается тем, что их можно применить и в других областях кроме распознавания документов. Например, алгоритмы бинаризации, подавления шумов, анализ связных компонентов, выделения блоков можно применить для обработки изображений для повышения их качества или выделения интересуемых объектов. Алгоритмы распознавания можно применить для идентификации других объектов, кроме символов.

Будущие работы и усовершенствование

Как показано в главе 6, точность разработанного метода распознавания составляет примерно 95%. Это конечно не предел. Можно повысить этот коэффициент следующими путями:

Найти другие способы вычисления решающей функции Подбирать весовые коэффициенты, так чтобы они отображали разные влияния на результат распознавания. В данное время этим коэффициентам задаются одинаковые значения.

Одна из главных причин ошибочного распознавания - это подобие нескольких букв (например, буквы 1, i и число 1, к и h) или буква с похожими диакритическими знаками (например, б, б, 6). Если разработать грамматический анализ как дополнительную операцию после распознавания, то можно значительно улучшить результат распознавания. Другое направление для получения более качественного документа - это обработка слов, разбиваемых на двух строках, причем первая строка заканчивается тире.

Если входные изображения цветные, то сначала они преобразуются в бинарные для дальнейшей обработчик. Но на практике встречаются надписи, каждый символ которых украшается несколькими цветами или имеется градиент яркости от черного до светлого (например, логотипы). В таких случаях алгоритмы бинаризации, сегментации могут некорректно работать.

В разработанных алгоритмах используются многие пороговые значения и некоторые из них определяются опытным путем (пороговые значения для бинаризации и для извлечения символов из строки), что не очень строго с научной точки зрения. В дальнейшем алгоритмы, описанные в данной работе будут продолжаться усовершенствовать, и эти пороговые значения будут обучаться или автоматически определяться в зависимости от характеристик изображения (например, от плотности пикселей).

Список литературы диссертационного исследования кандидат технических наук Хоанг Зянг, 2008 год

1. Энциклопедия Википедия Электронный ресурс. / WTKIMEDIA Project -Режим доступа: http://vi.wikipedia.org/wiki/ChLrQuocngir, свободный. Яз. вьетнамский.

2. David Doermann, Jian Liang, and Huiping Li. Progress in camera-based document image analysis // In Proceedings of the 7th International Conference on Document Analysis and Recognition (ICDAR'03) 2003. - Vol. 1. - P. 606-616.

3. Oivind Due Trier and Anil K. Jain. Goal-directed evaluation of binarization methods // IEEE Transactions on Pattern Analysis and Machine Intelligence -December 1995.-№ 17(12).-P. 1191-1201.

4. Azriel Rosenfeld and John L. Pfaltz. Sequential operations in digital picture processing // Journal of the ACM. October 1966. - № 13(4). - P. 471-494.

5. Ronald Lumia, Linda Shapiro, and Oscar Zuniga. A new connected components algorithm for virtual memory computers. // Computer Vision, Graphics, and Image Processing 1983. - № 22(2). -P.287-300.

6. Linda Shapiro and George Stockman. / Computer Vision. Prentice Hall, March -2000.

7. Henry S. Baird. The skew angle of printed documents. In Lawrence O'Gorman and R. Kasturi, editors. // Document Image Analysis 1995. - P. 204-208. - IEEE Computer Society Press.

8. Akihide Hashizume, Pen-Shu Yeh, and Azriel Rosenfeld. A method of detecting the orientation of aligned components. // Pattern Recognition Letters № 4. - April 1986.-P. 125-132.

9. Dan S. Bloomberg, Gary E. Kopec, and Lakshmi Dasari. Measuring document image skew and orientation. // In Proceedings of the SPIE Conference on Document Recognition II 1995. P. 302-316.

10. Alan Pearlman. Converting to ABBYY FineReader OCR 9.0. Электронный ресурс. Режим доступа:http://www.law.com/jsp/legaltechnology/pubArticleLT.jsp?id=1207219552296

11. Adnan Amin and Sue Wu. Robust skew detection in mixed text/graphics documents. // In Proceedings of the 8th International Conference on Document Analysis and Recognition. 2005. P. 247-251.

12. A. Jain and B. Yu. Document representation and its application to page decomposition. / IEEE trans. // On Pattern Analysisand Machine Intelligence. № 20(3). - March 1998. - P. 294-308.

13. O. Okun, D. Doermann, and M. Pietikainen. Page segmentation and zone classification: The state of the art. // In UMD 1999.

14. F. Wahl, K. Wong, and R. Casey. Block segmentation and text extraction in mixed text/image documents. // CGIP. 1982. - № 20. P. 375-390.

15. D. Wang and S. Srihari. Classification of newspaper image blocks using texture analysis. // CVGIP 1989. № 47. P. 327-352.

16. T. Pavlidis and J. Zhou. Page segmentation by white streams. // Proc. 1st Int. Conf. Document Analysis and Recognition (ICDAR). 1991. P. 945-953. - Int. Assoc. Pattern Recognition.

17. M. Hose and Y. Hoshino. Segmentation method of document images by two-dimensional Fourier transformation. // System and Computers in Japan. 2004 P. 57-65.

18. A. Jain. Fundamentals of digital image processing. Prentice Hall, 1990.

19. C. Tan and Z. Zhang. Text block segmentation using pyramid structure. // SPIE Document Recognition and Retrieval. San Jose, USA. - 2001 January 24-25. P.297-306.

20. S. S. G. Nagy and S. Stoddard. Document analysis with expert system. // Proceedings of Pattern Recognition in Practice II. June 1985.

21. R. B. Hennis. The IBM 1975 optical page reader: System design. // IBM Journal of Research and Development. №12(5). - P.346-353. - September 1968.

22. Robert M. Haralick, S. R. Sternberg, and X. Zhuang. Image analysis using mathematical morphology. // IEEE Transactions on Pattern Analysis and Machine Intelligence. № 9(4) - 1987. - P. 532-550.

23. George Nagy. Twenty years of document image analysis in PAMI. // IEEE Transactions on Pattern Analysis and Machine Intelligence, № 22(1) January 2000.-P. 38-62.

24. Yann LeCun, Leon Bossou, Yoshua Bengio, and Patrick Haner. Gradient-based learning applied to document recognition. // Proceedings of the IEEE. № 86(11) November 1998. - P. 2278-2324.

25. Richard G. Casey and Eric Lecolinet. A survey of methods and strategies in character segmentation. // IEEE Transactions on Pattern Analysis and Machine Intelligence. № 18(7) July 1996. - P. 690-706.

26. Gary Huang, Andrew McCallum, and Erik Learned-Miller. Cryptogram decoding for optical character recognition. // Technical Report 06-45 June 2006. University of Massachusetts Amherst.

27. Dilip Sarkar. Methods to Speed Up Error Back-Propagation Learning Algorithm // ACM Computing Surveys, Vol. 27, №. 4, December 1995

28. Gustav Tauschek. Reading machine Электронный ресурс. / U.S. Patent 2026329, December 1935. Режим доступа:http://www.google.com/patents?vid=USPAT2026329

29. Paul W. Handel. Statistical machine Электронный ресурс. / U.S. Patent 1915993, June 1933. Режим доступа:http://www.google.com/patents7vidKJSPAT 1915993

30. S. Mori, CY Suen, and K. Yamamoto. Historical review of OCR research and development. //Proceedings of the IEEE, Vol. 80(7), 1992. P. 1029-1058.

31. Mindy Bosker. Omni document technologies. // Proceedings of the IEEE, Vol. 80(7), July 1992. P. 1066-1078.

32. George Nagy. Document image analysis: What is missing ? // Proceedings of the8th International Conference on Image Analysis and Processing. 1995. - P. 577—587.

33. Simon Kahan, Theo Pavlidis, and Henry S. Baird. On the recognition of printed characters of any font and size. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 9(2), March 1987. P. 274-287.

34. Shmuel Peleg and Azriel Rosenfeld. Breaking substitution ciphers using a relaxation algorithm. // Communications of the ACM, Vol. 22(11), November 1979.-P. 598-605.

35. George Nagy, Sharad Seth, and Kent Einspahr. Decoding substitution ciphers by means of word matching with application to OCR. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 9(5), 1987. P. 710-715.

36. Dar-Shyang Lee. Substitution deciphering based on HMMs with application to compressed document processing. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 24(12), December 2002. P. 1661-1666.

37. Алгоритм Баума-Велша Электронный ресурс. Режим доступа: http://ru.wikipedia.org/wiki/AлгopитмБayмa-Beлшa

38. Viterbi algorithm. Электронный ресурс. — Режим доступа: http://en.wikipedia.org/wiki/Viterbi algorithm

39. Ньейн Эй. Разработка и исследование ПО для распознавания и анализа объектов на изображении с помощью нейронной сети: Диссертации насоискание ученой степени кандидата технических наук. / Московский инженерно-физический институт. М., 2007

40. Тропченко А.Ю. Цифровая обработка изображений. Методы сжатия и вторичной обработки изображений. Распознавание объектов на изображении. СПб.: ИТМО- 1999.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.