Комбинированные алгоритмы в задачах распознавания текстов

Славин, Олег Анатольевич

Комбинированные алгоритмы в задачах распознавания текстов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Славин, Олег Анатольевич

Славин, Олег Анатольевич
кандидат технических наук
2000

Специальность ВАК РФ05.13.01

Количество страниц 168

Славин, Олег Анатольевич. Комбинированные алгоритмы в задачах распознавания текстов: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Москва. 2000. 168 с.

Оглавление диссертации кандидат технических наук Славин, Олег Анатольевич

ВВЕДЕНИЕ

ГЛАВА 1. ЗАДАЧИ РАСПОЗНАВАНИЯ. ОБЗОР ИЗВЕСТНЫХ АЛГОРИТМОВ

1.1. Задачи программ распознавания текстов.

1.2. Анализ изображений.

1.3. Методы распознавания отдельных символов

1.4. Распознавание текстов как многокритериальная задача.

1.5. Выводы.

ГЛАВА 2. БАЗОВЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ СИМВОЛОВ

2.1. Характеристики методов распознавания.

2.2. Метод 3x

2.3. Событийный метод.

2.4. Методы наложения.

2.5. Древовидные методы.:.

2.6 Нейронная сеть над образом 16x16.

2.7. Выводы.

ГЛАВА 3. КОМБИНИРОВАННЫЕ МЕТОДЫ РАСПОЗНАВАНИЯ

ПЕЧАТНЫХ И РУКОПЕЧАТНЫХ СИМВОЛОВ

3.1. Распознавание полей рукопечатных почтовых индексов.

3.2 Распознавание рукопечатных полей.

3.3. Распознавание строк печатных текстов.

3.4. Дополнительные алгоритмы сегментации символов.

3.5. Выводы.

ГЛАВА 4. АДАПТИВНЫЕ АЛГОРИТМЫ РАСПОЗНАВАНИЯ СТРОК И СТРАНИЦ.

4.1. Базовые линии и линейный критерий.

4.2. Многопроходная схема с обучением.

4.3. Распознавание атрибутов текста.

4.4. Выводы.

Введение диссертации (часть автореферата) на тему «Комбинированные алгоритмы в задачах распознавания текстов»

Настоящая работа посвящена различным аспектам разработки систем распознавания текстов и документов, предназначенных для ввода в компьютер информации с бумажных носителей.

Бурный рост научно-технического прогресса привел в настоящее время к качественно новому этапу состояния компьютерной техники. Технические устройства достигли высоких характеристик быстродействия, информационной емкости и передачи информации. Одновременно произошла стандартизация интерфейсов, упрощающая конструирование и совершенствование технических средств. Нельзя не отметить и постоянные миниатюризацию и удешевление удельных характеристик выпускаемых устройств. Стандартизация и возрастающие вычислительные возможности предопределили и качественно новый этап разработки программного обеспечения, состоящий в создании программных компонент, использующих мощные базовые средства операционных систем и предлагающих стандартизованные пользовательские интерфейсы. Эти тенденции сделали возможным решение сложных задач управления и преобразования информации не только в крупных вычислительных центрах, но и в небольших организациях и у персональных пользователей. Последнее предполагает бурный рост числа потенциальных пользователей компьютеров с постоянно обновляемыми техническими устройствами и программным обеспечением.

С одной стороны, ориентация компьютерной промышленности на персонального пользователя приводит к повышению вычислительной и информационной мощности домашних компьютеров и их периферийных устройств, с другой - современные возможности и интерфейсы упрощают создание специальных высокопроизводительных качественно новых систем. Ввод документов в компьютер предполагает наличие устройства оцифровки (сканер, цифровая фото- или видеокамера), устройства долговременного хранения (жесткий, магнитооптический или компакт диск) и программы обработки оцифрованного образа документа. Как минимум, обработка включает в себя запись на устройство хранения цифрового образа документа в одном из стандартных форматов хранения изображений, но оцифрованные изображения, содержащие текстовую информацию, целесообразно распознать, то есть найти в них текстовую информацию и представить ее в одном из текстовых форматов. В дальнейшем возможно как автономное 3 хранение распознанного текста или одновременного хранения текста и исходного изображения, так и передачи их информационно-поисковым системам.

С точки зрения пользователя персонального компьютера распознавание текстов представляет собой процесс, симметричный распечатке документа, уравнивающий электронные документы и их твердые копии. Произвольный документ, содержащий текстовую информацию, может быть преобразован после сканирования и распознавания в электронный документ, подлежащий дальнейшей обработке в текстовых процессорах точно так же, как и вновь созданный документ. Преимуществом для пользователя является выигрыш времени по сравнению с ручной набивкой документа и его версткой для документа сложной структуры. Типами распознаваемых документов могут служить машинописные страницы, страницы книг, журналов и газет, твердые копии электронных документов, произведенные печатающими устройствами различных систем, распечатки факсов. Также могут быть распознаны цифровые изображения, такие как принятые компьютером факсы и копии экрана. Другими словами, распознавание необходимо всем пользователям персональных компьютеров, которые сталкиваются с текстовой информацией на бумажных носителях. Учитывая неуклонное возрастание числа персональных компьютеров и сканирующих устройств [39,81,83,85], становится очевидной потребность в программах распознавания текстов.

Профессиональные применения ввода текстовой информации разнообразны. К ним, естественно, относится издательская деятельность, нуждающаяся в переиздании текстов, не имеющих электронного представления. Другими применением являются создание электронных архивов, в том числе в финансовых учреждениях, и электронных библиотек для долговременного хранения. Архивная деятельность характеризуется большим объемом вводимой информации, для которого необходимы скоростные сканирующие устройства. Ввод динамически изменяющейся текстовой информации с помощью видеокамер необходим для оперативного управления (номера на производственных изделиях) или охранных систем (автомобильные номера). Важным классом использования распознавания текстов является обработка структурированных документов, заполненных от руки, например, ввод стандартизованных анкет социологических опросов или налоговых деклараций.

Таким образом, многочисленные примеры показывают актуальность распознавания текстов для решения задач ввода информации с помощью бумажных носителей в разнообразных приложениях и системах. 4

Задачи распознавания образов широко и давно известны. В 1932 году инженером В.Е.Агаповым была разработана машина, предназначенная для ввода цифр в счетное устройство [37] методам наложений на систему эталонов. В работе [38] автор ссылается на Jacob Rabinow, начавшего исследования по оптическому распознаванию в 1940 году. Большое число известных работ [8-11,31,35] исследуют решения задачи распознавания как задачи классификации. Этот этап накопления большого числа подходов к распознаванию изображений, включающих вопросы оптимального обучения и классификации, характеризуется автономностью исследований по отношению к общей проблеме ввода текстового документа в компьютер.

Как ранние, так и поздние работы тяготеют к исследованию проблем распознавания с помощью фиксированных признаковых систем, для которых и находятся оптимальные условия вычисления признаков, обучения и классификации. Разумеется, оптимизация объема признаковой системы и скорости распознавания являются важными вопросами. Но, во-первых, повышение объема оперативной памяти и быстродействия компьютеров в последнее десятилетие приобрело необратимый характер (можно приблизительно оценить ежегодное изменение этих характеристик для домашних персональных компьютеров как удвоение объема памяти и скорости), и, во-вторых, никто не ограничивает разработчиков систем распознавания каким-то конкретным набором признаков. Имеется в виду, что количество признаков может расти, возможно, также использование нескольких признаковых систем и иных распознавательных механизмов, разумеется, для достижения более качественного распознавания документов.

В корне изменился и критерий качества распознавания. Если ранее качество распознавания изображений оценивалось теоретически или статистически на узком классе изображений, то в системах ввода текстов критерий качества объективизировался. Последнее означает, что число ошибок оценивается после распознавания реальных документов как число исправлений, необходимых для приведения результатов распознавания к виду, приемлемому для последующей обработки. Не менее важным в системах массового ввода структурированных документов является и критерий надежности, необходимый для выделения в текстовых результатах фрагментов, которые нуждаются в проверке оператором, то есть надежность определяется умением системы формировать отказы. Объективизация критериев качества в совокупности с доступностью вычислительных экспериментов, состоящих в распознавании больших порций отсканированных документов, приводит к более надежному обучению и тестированию не только всей системы, но и отдельных компонент 5 распознающих алгоритмов. Достаточно сказать, что в распоряжении создателей распознающих алгоритмов сейчас находятся базы графических образов объемом в миллионы символов, что сказывается на достоверности результатов.

В отличие от автономных алгоритмов распознавания образов ввод отсканированных документов предполагает системный подход к решению задачи. А именно, такие естественные компоненты распознавания как сегментация страницы на текстовые фрагменты и строки, нахождение иллюстраций и таблиц, сегментация и распознавание отдельных символов, использование геометрических и лингвистических соображений и другие алгоритмы рассматриваются взаимозависимыми, межкомпонентные связи являются как логическими, так и информационными. Обмен информацией между алгоритмами распознавания приводит к их использованию в виде последовательных, параллельных и итерационных схем, которые призваны повысить адаптивные свойства системы и качество распознавания. Для реализации такого подхода необходимо конструирование каждого из алгоритмов распознавания таким образом, чтобы используемый в нем механизм мог предоставлять всю накопленную информацию последующим алгоритмам и пользоваться результатами работы предыдущих компонент.

В настоящей работе делается попытка осмысления накопленного к настоящему времени набора алгоритмов как частей программных продуктов ввода текстовых документов, ориентируясь на объективные критерии качества распознавания документов. Инженерный подход позволяет комбинировать различные распознающие алгоритмы для достижения оптимальных результатов и конструировать новые механизмы для поддержки в тех случаях, когда требуемое качество недостижимо. Проектирование программ распознавания текстовых документов, которые являются центральной частью систем документооборота с бумажными носителями и систем ввода документов в компьютер, должно быть осуществлено с учетом сегодняшних потребителей.

Задачей диссертации является выработка критериев качества распознавания, разработка методов построения целостной и полнофункциональной системы ввода документов и системном рассмотрении всего возникающего цикла проблем. Задача качественного распознавания в системах ввода документов различна в зависимости от предназначения системы. В программах распознавания отсканированных текстов (OCR) главной целевой функцией является минимизация общего числа ошибок, быстродействие имеет важное, но не первостепенное значение. Системы массового ввода большого числа печатных и рукопечатных документов (ICR) 6 имеют следующий критерий оптимальности: надежность распознавания, понимаемая как умение разбивать распознанные результаты на подмножества, не требующие вмешательства человека, и подмножества, нуждающиеся в проверке операторами, причем вероятность ошибки в первом подмножестве близка к нулю, а доля второго подмножества минимальна. Иногда скорость функционирования комплексов ввода большого числа структурированных документов также является предметом оптимизации для обеспечения прохождения отсканированного и распознанного текста в общей системе документооборота. Разумеется, есть различия и в содержимом текстов, предназначенных для систем ICR и OCR. Структурированные документы могут содержать рукописный текст более сложный для распознавания, но, в то же время, такие документы обладают достаточно стандартизованным геометрическим устройством, облегчающим нахождение границ символов, алфавит рукописных символов, как правило, ограничен (например, не требуется различение заглавных и строчных букв), поля структурированных документов часто могут быть сопоставлены со словарями ограниченного объема. Отсканированные страницы, распознаваемые программами OCR, не предполагают известных заранее ограничений структуры страницы, наличия или отсутствия иллюстраций или таблиц, размеров и типов шрифтов, алфавита символов. От программ OCR ожидается не только качественное распознавание символов, но и сохранение типов шрифтов и структуры страницы. В то же время, в силу структурных сложностей программы распознавания текстов OCR не распознают рукописные символы.

Если потребности в адаптации к устройству отсканированной страницы у OCR и систем массового ввода структурированных документов существенно различны, то адаптивность в распознавании символов весьма сходна. Как печатные, так и рукописные символы после оцифровки с различными характеристиками сканирования могут искажаться. Естественными деформациями сканирования являются случайное зашумление образов, перекос изображения, изменение толщин линий в символах и, в меньшей степени, масштабирование. Не менее естественным искажением, приводящим к значительно большим трудностям, является нарушение топологической структуры образов, приводящее к рассыпанию и склеиванию символов, что затрудняет сегментацию символов, то есть нахождение их границ. Сегментация рассыпанных и склеенных символов, имеющих окружением случайный фоновый шум, является неизбежным этапом любой системы распознавания отсканированных документов. Комбинаторные алгоритмы сегментации символов предполагают появление 7 несимволов [40], то есть случайно сформированных образов, начертание которых не совпадает с начертанием допустимых символов, что приводит к потребности механизма отделения символов от несимволов.

Таким образом, в системах распознавания необходимо решить следующие задачи: сегментация документа, заканчивающаяся нахождением строк текста сегментация символов в текстовых строках адаптивное распознавание символов в условиях их деформации и случайного шума адаптивное распознавание всей страницы, то есть настройка на особенности документа.

Целью работы является построение алгоритмов распознавания различного уровня и методик комбинирования распознающих механизмов для программ распознавания текстов OCR и систем массового ввода структурированных документов ICR в условиях реального искажения сканирующими устройствами исходных документов и оптимизация характеристик алгоритмов распознавания с точки зрения критериев качества OCR и ICR. Будет рассмотрена подсистема для распознавания строк символов, то есть распознавание после сегментации страницы. Построение и оптимизация алгоритмов учитывает их использование в модульной системе с сильным межмодульным обменом информацией, предполагающей дополнительную адаптацию к различным типам и качеству содержимого документов.

Теоретические и алгоритмические исследования механизмов распознавания различного уровня позволили добиться существенного улучшения качества ввода документов в известных системах OCR Cognitive Tiger®, OCR Cognitive Cuneiform® и ICR Cognitive Forms®.

OCR Cognitive Tiger® представляет собой шрифтовую систему распознавания печатных текстов, поставляемую с набором базовых шрифтов, обеспечивающую автоматическую настройку на распознаваемый шрифт и предоставляющую пользователю средства обучения новым шрифтам. Системы ориентирована на распознавание полиграфической информации, обеспечивая беспрецедентную точность и скорость распознавания на обученных шрифтах и печати хорошего качества (книжная продукция). Алгоритмическая распознающая часть состоит из блоков сегментации и распознавания символов русского алфавита и специальных символов.

OCR Cognitive Cuneiform® является омнифонтовой независимой от шрифта программой распознавания печатных текстов, не имеющей обучения. 8

Она предназначена для распознавания печатной информации с самой разнообразной структурой: книг, газет, журналов, машинописных страниц, факсов, страниц, созданных на лазерных и матричных печатающих устройствах. Внутренние распознающие модули обеспечивают сегментацию и распознавание символов кириллицы, латиницы и порожденных ими языков (русский, украинский, английский, французский и пр.). После главного цикла распознавания происходит самообучение программы, заканчивающееся построением шрифта страницы, используемого для второго прохода, улучшающего качество распознавания, достигнутое при первичной сегментации и распознавании.

ICR Cognitive Forms® представляет собой систему массового ввода структурированных документов, содержащих как печатную (платежные поручения), так и рукописную (пенсионные анкеты) информацию. Используется в подсистемах ввода бумажных документов в проектах архивации и финансового документооборота. Призвана ускорить ввод с бумажных носителей и повысить надежность вводимой текстовой информации. Содержит компоненты распознавания рукописных и печатных символов с различными схемами сегментации и средства самообучения.

Большинство решений в описанных наукоемких системах распознавания оформлены в виде модулей, пригодных для использования в других программах. Используемые оригинальные алгоритмы оптимизированы с точки зрения функционирования OCR и ICR. 9

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Славин, Олег Анатольевич

4.4. Выводы

Рассмотренные в настоящей главе задачи расширяют требования качества, предъявляемые к распознаванию. А именно, различие прописных и строчных букв, родственных и двуязычных символов и атрибутов текста не менее важно, нежели сегментация и классификация образов, качество этих алгоритмов может быть оценено на наборах большого числа изображений с текстами.

Для решения поставленных задач используется двухпроходная схема. При этом от первого прохода требуется не максимальная точность распознавания и устранения двусмысленностей, а надежное выделение в множестве распознанных символов подмножества, по которому производится обучение. Обучение проводится с учетом определенных признаков, которые наследуются надежно сформированными кластерами. Кластерное наложение комбинируется с более точным, нежели на первом проходе методом. Второй проход позволяет поднять качество распознавания и сегментации символов в сомнительных с точки зрения первого прохода зонах и доопределить признаки текста и устранить ряд двусмысленностей. Таким образом, обеспечивается адаптация к шрифтам, содержащимся в распознаваемых страницах.

125

ЗАКЛЮЧЕНИЕ

В работе получены следующие результаты.

1. Разработана классификация базовых методов распознавания печатных и рукопечатных символов, на основе характеристик распознающих механизмов одного символа. Эти характеристики позволяют оценить пригодность метода к решению тех или иных задач в реальных системах ввода и распознавания документов. Ряд характеристик (точность и быстрота распознавания, представление объекта распознавания) являются традиционными в распознавании образов, в то время как другие (полнота коллекции распознавания, информативность оценок, способность к отказам, алфавит) необходимы непосредственно для многоэтапных систем распознавания документов. Характеристики базовых методов оценены с помощью статистических экспериментов над базами графических образов достаточного объема (порядка 10б элементов), спроектирована структура необходимых баз данных и утилиты сбора и ведения графических данных.

2. На основе разработанной классификации исследованы известные к настоящему времени механизмы распознавания русскоязычных и англоязычных образов печатных и рукопечатных символов, таких как топологические, древовидные, методы наложения, нейронные сети различной структуры, для которых вычислены введенные характеристики распознавания на базах графических образов большого объема. Среди исследованных методов распознавания отсутствует механизм, превосходящий конкурентов по всем характеристикам. Наилучшим по точности являются нейронные сети, по скорости и способности к отказам -топологические методы, по монотонности - методы наложения. Разброс характеристик распознающих методов делает возможным комбинирование методов распознавания с целью улучшения качества работы.

3. Для распознавания почтовых рукопечатных цифровых индексов в качестве комбинирующей наиболее приемлема голосующая схема, обеспечивающая повышение, как точности, так и надежности распознавания в условиях использования нескольких быстрых базовых методов со сходными характеристиками качества.

Для распознавания рукопечатных образов разработан алгоритм, аналогичный голосующей схеме, но учитывающий особенности

126 распознавания образов символов, например, родственных образов. Алгоритм опирается на нейронные сети, поддержанные дополнительными конкурирующими базовыми методами, улучшающими качество получаемых оценок. Схему пересечения методов дополняет алгоритм распознавания образов, которые не могут быть классифицированы надежно первичным комбинированием, для чего используется объединяющая схема, не ухудшающая монотонность оценок.

Сегментация рукопечатных символов, понимаемая как определение границ символов в пределах строки, предполагающая как условно фиксированные границы знакомест, так и комбинаторный перебор, чувствительна к оценкам распознавания произвольных образов, среди которых могут выступать как допустимые символы, так и образы символами не являющиеся. Разработанные комбинированные алгоритмы распознавания рукопечатных индексов и символов позволяют достигать точности близкой к 100% для отдельных индексов и 99.6% для отдельных символов в рамках работы схем рукопечатной сегментации.

4. В отличие от полей структурированных документов, содержащих рукопечатные символы, строки текстовых символов, подверженные дефектам печати и сканирования, нуждаются в сегментации рассыпанных и склеенных образов символов, предполагающей существенно большее число попыток распознавания в процессе нахождения границ печатных образов. Для этого используется алгоритм динамического программирования, накладывающий дополнительные требования на быстродействие алгоритма распознавания и его способность различения символов и несимволов. Было разработано два комбинированных алгоритма распознавания. Первый из них использует быстрый топологический метод для сужения алфавита распознавания и снижения временных издержек работы более точных методов наложения и бинарных нейронных сетей, причем возможен этап перераспознавания на полном алфавите. Полученная оценка может быть уменьшена за счет разработанных штрафных эвристических механизмов, оперирующих оригинальным изображением образа и корректирующих результаты распознавания базовых методов. Сконструированы штрафные функции для некоторых букв кириллицы и латиницы. Достоинствами этого комбинированного метода являются высокое быстродействие и низкие оценки несимволов и деформированных букв.

Второй из разработанных алгоритмов распознавания печатных символов обладает способностью порождать высокие оценки и для деформированных букв за счет манипулирования несколькими

127 высокоточными базовыми методами. Наличие двух комбинированных методов классификации печатных символов и схемы сегментации границ символов позволяет строить библиотеки однопроходного и многопроходного (адаптивного) распознавания тестовых строк.

5. Одновременно с распознанием печатных символов происходит распознавание их атрибутов, таких как курсивность, серифность, жирность, подчеркивание и т.п. В работе перечислены специальные признаки нахождения атрибутов отдельных символов, сформулирован принцип использования атрибутов в базовых методах распознавания и описаны схемы надежной классификации слов с точки зрения текстовых атрибутов. Многоэтапное определение атрибутов в общей схеме распознавания строки символов позволяет помимо основной цели поднять качество классификации отдельных символов.

6. Исследованы вопросы возможности классификации образов с точки зрения их размера и расположения в строке символов. Получены оценки надежности нахождения базовых линий в строках различной длины и построены алгоритмы вычисления базовых линий. Описаны способы применения вычисленных базовых линий в различителях прописных и строчных, нормальных и опущенных букв и штрафных функциях символов.

7. Описана процедура адаптивного обучения шрифтам, присутствующим на распознаваемой странице, с точки зрения классификации образов известных символов кириллицы и латиницы. Сконструирована функция метода наложения на идеальные образы, порожденные результатами обучения. Разработан алгоритм распознавания текстового символа с помощью построенного множества кластеров, в том числе, в условиях неполноты кластеров, то есть в комбинации с омнифонтовыми механизмами распознавания. Описаны алгоритмы нахождения атрибутов текста работы на втором проходе с целью распознавания.

Все приведенные в работе алгоритмы реализованы в виде набора библиотек, входящего в программу распознавания текстов OCR Cognitive Cuneiform® и систему массового ввода структурированных документов ICR Cognitive Forms® различных версий. В этих системах достигается оптимальное соотношение между потребностями точности распознавания, быстродействия и надежности результатов.

128

Автор выражает глубокую благодарность своему руководителю B.JI. Арлазарову и своим коллегам и специалистам в области распознавания A.A. Леману, А.Б. Талалаю, И.А.Фараджеву, М.А. Кронроду, В.В. Постникову, A.B. Мисюреву, Н.Е. Бузикашвили, В.В. Троянкеру, И.Б. Чернышовой, П.А. Куратову, A.A. Михайлову, Б.А. Шахвердиеву, Н.В. Котовичу, А.Я. Подрабиновичу, A.A. Подрабиновичу и A.C. Логинову, без которых эта работа не состоялась бы.

Список литературы диссертационного исследования кандидат технических наук Славин, Олег Анатольевич, 2000 год

1. Анисимов Б.В., Курганов В.Д., Злобин В.К. Распознавание и цифровая обработка информации. М.: Высшая школа, 1983 -295 с.

2. Шеннон К. Работы по теории информации и кибернетике. М.:ИЛ, 1963, 829 с.

3. Загоруйко Н.Г. Методы распознавания и их применение. М.: Сов. Радио, 1972,-206 с.

4. Фу К. Последовательные методы в распознавании образов и обучения машин. М.: Наука, 1971 с. 256

5. Калеватых А.В., Павлов Б.А. Обзор современных методов автоматизированного анализа изображений // Автоматика и телемеханика. 1995. Вып. 9, с. 3-21.

6. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 511 с.

7. Террайен Ч.У., Куатъери Т.Ф., Даджон Д.Е. Алгоритмы анализа изображений, основанные на статистических моделях // ТИИЭР. 1986. Т. 74. № 4. с. 4-25.

8. Себастиан Г. Процессы принятия решения при распознавании образов. Киев., 1965 151 с.

9. Промахова И.М., Коростелев А.П. Об одном классе вероятностных рекуррентных алгоритмов распознавания. ВНИИСИ, препринт. М.: 1984,-45 с.

10. McCulloch W.S. and Pitts W., "A logical Calculus of Ideas Immanent in Nervous Activity", Bull. Mathematical Biophysics, Vol. 5, 1943, pp. 115133.

11. Розенблатт Ф. Принципы нейр о динамики. Перцептроны и теория механизмов мозга. М.: Мир. 1965, 480 с.

12. Минский М, Пейперт С. Перцептроны. М.: Мир, 1971 - 264 с.

13. Hopfield J.J., "Neural Networks and Physical Systems with Emergent Collective Computational Abilities", in Proc. National Academy of Sciences, USA 79, 1982, pp. 2554-2558.

14. Lippmann R.P., "An Introduction to Computing with Neural Nets", IEEE ASSP Magazine, Vol.4, No.2, Apr. 1987, pp. 4-22.

15. Haykin S., Neural Networks: A Comprehensive Foundation, MacMillan College Publishing Co., New York, 1994.

16. Mohiuddin К., Mao J., "A Comparative Study of Different Classifiers for Handprinted Character Recognition", in Pattern Recognition in Practice1301., E.S. Gelsema and L.N. Kanal, eds. Elsevier Science, 1994, pp. 437448.

17. Сип Y. Le et al., "Back-Propagation Applied to Handwritten Zip Code Recognition", Neural Computation, Vol. 1, 1989, pp. 541-551.

18. Westall J.M., Narasimha M.S. Vertex directed segmentation of handwritten numerals. Pattern Recognition Vol. 26, 10 (1993), pp. 14731486

19. Wang J., Jean J. Segmentation of merged characters by neural networks shortest path. Pattern Recognition 27,Vol. 5 (1994), pp. 649-658

20. Кохонен Т. Ассоциативная память. М.: Мир, 1980, 239 с.

21. Нильсон Н., Обучающиеся машины. М.: Мир, 1967, 180 с.

22. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. М.: Наука, 1996, 208 с.

23. Roy В. Methodologie Multycritere d'Aide a la Decision. Paris: Economoica, 1985

24. Saieki H. Allocation of Importance. An axiom system // Journal of Mathematical Psychology. 1972, №9 - p. 55-65

25. Подиновский В.В. Об относительной важности критериев в многокритериальных задачах принятия решений//Проблемы и процедуры принятия решений при многих критериях. М.: ВНИИСИ, 1982.- с.21-42

26. Ладензон А.Б., Литвак Б.Г. Принцип упорядоченных критериев для многокритериальных альтернатив// Известия АН СССР. Техн. Кибернетика. 1988. - №6 - с. 49-54

27. Ларичев О.И., Зуев Ю.А., Гнеденко Л.С. Метод построения классификации проектов прикладных научных исследований и разработок/Шерспективное планирование проектов прикладных научных исследований и разработок. М.: Наука, 1974.-с.28-57

28. Журавлев Ю. И. Корректные алгебры над множествами некорректных (эвристических) алгоритмов I, II, III.- Кибернетика, 1977, № 4, с. 14 21, № 6, с. 21 - 27; 191 ., № 2, с. 35 - 43.

29. Журавлев Ю. И. Непараметрические задачи распознавания образов. Кибернетика, 1976, № 6. с. 93 - 103.131

30. Журавлев Ю. Н. Об алгебраическом подходе к решению задач распознавания или классификации,- Пробл. кибернетики, 1978, № 33, 1978, с. 5-67.

31. Журавлев Ю. И. Экстремальные алгоритмы в математических моделях для задач распознавания и классификации,- Докл. АН СССР, 1976, 231, №3, с. 212-214.

32. Журавлев Ю. И., Камилов М. М., Туляганов Ш. Э. Алгоритмы вычисления оценок и их применения,-Ташкент: Фан, 1974, 114 с.

33. Журавлев Ю. И., Никифоров А. В. Алгоритмы распознавания, основанные на вычислении оценок,- Кибернетика, № 3, 1972. с. 1 -11.

34. Ковалевский В. А. Методы оптимальных решений в распознавании изображений. М.: Наука, 1967, - 328 с.

35. Васильев В.И. Распознающие системы. Киев: Наукова думка, 1983, 422 с.

36. Саплин М.С. Фотоэлектрическое устройство, воспринимающее цифровые печатные знаки. Электрон. Вычисл. Машины, 1960, № 1, с. 110-123

37. Braun E.W. Applying Neural Networks to Character Recognition. http://www.ccs.neu.edu/home/feneric/charrecnn.html

38. Громов Г.P. Национальные информационные ресурсы: проблемы промышленной эксплуатации. М.: Наука, 1984, 240 с.

39. Арлазаров В.Л., Славин O.A. Алгоритмы распознавания и технологии ввода текстов в ЭВМ. Информационные технологии и вычислительные системы № 1, 1996, 6, стр. 48-54

40. Гоппа В. Д. Введение в алгебраическую теорию информации. М.: Наука, 1995, 112 с.

41. Браверман Э.М., Мучник И.Б. Структурные методы обработки эмпирических данных. М.: Наука, 1983, 464 с.

42. Мисюрёв A.B. Использование искусственных нейронных сетей для распознавания рукопечатных символов. В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с.122-127

43. Арлазаров В.Л., Астахов А.Д., Троянкер В.В., Котович Н. В. Адаптивное распознавание символов. В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с. 39-56

44. Pao Y-H, Adaptive pattern recognition and neural network, Addison-Wesley, 1989132

45. Бахвалов H.С. Численные методы. Т.1. Анализ, алгебра, обыкновенные дифференциальные уравнения. М.: Наука, 1975, 623 с.

46. Классификация и кластер // Сборник. М.: Мир, 1980, 390 с.

47. БеллманР. Динамическое программирование. М.: ИЛ, 1960, 400 с.

48. Постников М.М. Аналитическая геометрия. М.: Наука, 1973, 752 с.

49. Постников В.В. Разработка методов наложения формы на графическое изображение документа. В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с. 157-163

50. Haigh S. Optical Character Recognition (OCR) as a Digitization Technology, Network Notes #37 ISSN 1201-4338, Information Technologiy Services national Library of Canada, 1996 http://www.nlc-bnc.ca/publications/netnotes/notes37.htm

51. Portegys Т.Е. A Search Technique for pattern Recognition Using Relative Distances. // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995, pp. 910-912

52. Kazem T., Borsack J., Condit A. Evaluation of Model-Based Retrieval Effectiveness with OCR Text // ACM Transactions on Information System, Vol. 14, № 1, 1996, pp. 64-93

53. Li Y., Lopresti D., Nagy G., TomkinsA. Validation of Image Defect Models for Optical Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 18, № 2, 1996, pp. 99-108

54. Shi H., Pavlidis T. Font Recognition and Contextual Processing for More Accurate Text Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol 17, № gt 1997, pp. 39-44

55. Rosha J., Pavlidis T. Character Recognition Without Segmentation // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995, pp. 903-909

56. Фу К. Структурные методы в распознавании образов. М.: Наука, 1977, 320 с.

57. Lam L., Suen С.Y. An Evaluation of Parallel Thinning Algorithms for Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995, pp. 914-919

58. Szmurlo M. Boundary normalization for recognition of non-touching non-degraded characters // The 4th International Conference on Document Analysis and Recognition (ICDAR 97), August 1997, Ulm, Germany, pp. 463-466

59. Wakahaga T., Odaka K. Adaptive Normalization of Handwritten Characters Using Global/Local Affine Transformation // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, № 12, 1998 pp. 28-33133

60. Alimoglu F., Alpaydin E. Combining Multiple representations and Classifiers for Pen-based Digit Recognition // The 4th International Conference on Document Analysis and Recognition (ICDAR 97), August 1997, Ulm, Germany, pp. 637-640

61. Kim J., Seo K, Chung К A Systematic Approach to Classifier Selection on Combining Multiple Classifiers for Handwritten Digit Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 20, № 12, 1998, pp. 459-462

62. Славин О.А., Корольков Г.В., Болотин П.В. Методы распознавания грубых объектов. В сб. "Развитие безбумажных технологий в организациях", 1999, с. 290-311

63. Славин О.А., Подрабинович А.А. Древовидное распознавание нормализованных символов. В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с. 137-157

64. Славин О.А. Средства управления базами графических образов символов и их место в системе распознавания. В сб. " Развитие безбумажных технологий в организациях ", 1999, с. 277-289

65. Krishnamoorthy М., Nagy G., Seth S., Viswanathan M. "Syntactic segmentation and labeling of digitized pages from technical journals," IEEE Journal on Pattern Analysis and Machine Intelligence, Vol. 15, no.7, 1993, p.737-747

66. Плискин E.JI. Контроль и корректировка при распознавании форм. В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с. 128-136

67. Богданов К.Е., Славин О.А. Объединение последовательностей объектов распознавания В сб. "Интеллектуальные технологии ввода и обработки информации", 1998, с. 86-96

68. Арлазаров B.JJ., Корольков Г.В., Славин О.А. Линейный критерий в задачах OCR. В сб. " Развитие безбумажных технологий в организациях ", 1999, с. 17-23

69. Sneath Р.Н.А., R.R. Sokal. Numerical Taxonomy. W.H. Freeman, 1973. San Francisco.

70. Ward J. H. Hierarchical grouping to optimize an objective function. Journal of the American Statistical Association, 1963 Vol.58, 236.

71. Tryon R.C. Cluster Analysis // Ann. Arb., Edw. Brathers. 1939

72. Горелик А.Л., Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания. М.: «Радио и связь», 1985, 160 с.

73. Impedovo S., Ottaviano L., Occhinegro S. Optical character recognition a survey. Character and Handprinting Recognition, Expanding Frontiers. Word Scientific Publishing, River Edge, N.J., pp. 1-24134

74. White J.M., Rohrer G.D. Image Thresholding for Optical Character Recognition and Other Applications Requiring Character Image Extraction, IBMRD(27), № 4, 1983, pp. 400-411.

75. Логинов А. С. О некоторой схеме распознавания на основе признакового подобия объектов. Алгоритм построения дерева распознавания. В сб. " Развитие безбумажных технологий в организациях ", 1999, с. 127-136

76. Постников В.В., Михайлов А.А. Алгоритмы сегментации рукопечатных символов. В сб. " Развитие безбумажных технологий в организациях ", 1999, с. 179-188

77. White Н. Learning in artificial networks: A statistical perspective // Neural Computation, № 1, 1989, pp. 425-464

78. RichardM.D., Lippman, R.P. Neural Network Classifiers estimate Bayesian a posteriori probabilities. // Neural Computation, № 3, 1991, pp. 461-483

79. Kickpatrick D.G. Efficient computation of continuous skeletons. In Proceeding of the 20th Annual IEEE Symposium on FOCS, 1979, pp. 18-27

80. Острейковский B.A. Информатика. M.: Высш. Школа, 2000, 511 с.

81. Бербышев Е.М. Технологии ММХ. Новые возможности процессоров Р5 и Р6. М: Диалог-Мифи, 234 с.

82. Джексон Т. Intel: взгляд изнутри. М.: Лори, 1998, 346 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.

Комбинированные алгоритмы в задачах распознавания текстов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Славин, Олег Анатольевич

Оглавление диссертации кандидат технических наук Славин, Олег Анатольевич

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Адаптивное распознавание и его применение к системе ввода печатного текста2011 год, доктор технических наук Славин, Олег Анатольевич

Разработка и исследование методов и средств распознавания текста факсимильных сообщений2003 год, кандидат технических наук Цопкало, Николай Николаевич

Обработка и распознавание рукописного текста в системах электронного документооборота2008 год, кандидат технических наук Горошкин, Антон Николаевич

Введение диссертации (часть автореферата) на тему «Комбинированные алгоритмы в задачах распознавания текстов»

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Метод распознавания символов, основанный на полиномиальной регрессии2012 год, доктор технических наук Пестрякова, Надежда Владимировна

Разработка и исследование методов распознавания рукописных арабских текстов2003 год, кандидат технических наук Салюм Саид Салех

Моделирование систем распознавания изображений: На примере печатных текстов2006 год, кандидат технических наук Абрамов, Евгений Сергеевич

Адаптивные алгоритмы распознавания текстов2007 год, кандидат технических наук Титов, Юрий Васильевич

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Славин, Олег Анатольевич

Список литературы диссертационного исследования кандидат технических наук Славин, Олег Анатольевич, 2000 год