Адаптивная обработка каллиграфической информации, представленной в виде рукописных символов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат наук Демин, Алексей Анатольевич
- Специальность ВАК РФ05.13.01
- Количество страниц 181
Оглавление диссертации кандидат наук Демин, Алексей Анатольевич
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. АНАЛИЗ МЕТОДОВ И СРЕДСТВ ОБРАБОТКИ ИНФОРМАЦИИ, ПРЕДСТАВЛЕННОЙ РУКОПИСНЫМИ СИМВОЛАМИ
1.1. Актуальность обработки информации, представленной рукописными образами
1.2. Классификация систем распознавания рукописных образов
1.3. Анализ решений для распознавания рукописных образов
1.4. Анализ обобщенной модели информации, представленной совокупностью рукописных образов
1.5. Постановка задачи обработки информации рукописных текстов в свете разрешения противоречий процессов формирования навыков каллиграфии
*
Выводы по главе 1
ГЛАВА 2. МАТЕМАТИЧЕСКИЕ МЕТОДЫ И МОДЕЛИ РАСПОЗНАВАНИЯ РУКОПИСНЫХ СИМВОЛОВ И ОБРАБОТКИ КАЛЛИГРАФИЧЕСКОЙ ИНФОРМАЦИИ
2.1. Обобщенная модель оперативного и автономного методов распознавания рукописных образов
2.2. Метод обработки каллиграфической информации, представленной в виде рукописных символов
2.3. Алгоритмы изменения цветности изображения для автономного метода распознавания
2.4. Фильтры шумоподавления и сглаживания для автономного метода распознавания
2.5. Методы получения векторов признаков рукописных символов для
автономного метода распознавания
2.6. Оперативные методы распознавания рукописных символов
2.7. Математическая модель оперативного метода распознавания рукописных символов и обработки заключенной в них каллиграфической информации
Выводы по главе 2
ГЛАВА 3. РАЗРАБОТКА ОБУЧАЮЩЕЙ СИСТЕМЫ ДЛЯ ФОРМИРОВАНИЯ НАВЫКОВ КАЛЛИГРАФИИ
3.1. Анализ функциональных требований к обучающей системе
3.2. Структурно-функциональная модель работы обучающей системы
3.3. Модели вариантов использования обучающей системы
3.4. Логическая модель обучающей системы
3.5. Модель реализации обучающей системы
»
3.6. Модель развёртывания обучающей системы
Выводы по главе 3
ГЛАВА 4. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ ОБУЧАЮЩЕЙ СИСТЕМЫ ФОРМИРОВАНИЯ НАВЫКОВ КАЛЛИГРАФИИ
4.1. Структура и состав экспериментального стенда исследования обучающей системы
4.2. Опытная эксплуатация обучающей системы при решении образовательных задач
4.3. Опытная эксплуатация обучающей системы при решении реабилитационно-медицинских задач
4.4. Прогнозируемые результаты применения обучающей системы для восстановления тонкой моторики кистей рук и для диагностики состояния
организма у космонавтов
Выводы по главе 4
ЗАКЛЮЧЕНИЕ
СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Алгоритмы распознавания рукописных символов в условиях малой обучающей выборки2017 год, кандидат наук Хаустов Павел Александрович
Алгоритмы обработки и анализа символов вейвлет-преобразованием, методом главных компонент и нейронными сетями2014 год, кандидат наук Фан Нгок Хоанг
Математическое моделирование контурных изображений и вычислительная сложность их анализа2017 год, кандидат наук Каташевцев, Михаил Дмитриевич
Современная каллиграфия как социокультурный феномен2019 год, кандидат наук Куланина Елена Михайловна
Разработка и исследование метода и алгоритмов прецедентной идентификации фрагментов сканированного рукописного текста2019 год, кандидат наук Ефимов Никита Олегович
Введение диссертации (часть автореферата) на тему «Адаптивная обработка каллиграфической информации, представленной в виде рукописных символов»
ВВЕДЕНИЕ
Актуальность
Объектом диссертационного исследования являются адаптивные методы формирования навыков каллиграфии.
Проблема обработки каллиграфической информации, содержащейся в рукописных текстах (то есть информации о структуре текста, связанной с правильным начертанием символов), выступает как основополагающая при решении целого ряда задач.
Одной из таких задач является задача быстрого, эффективного и качественного обучения младших школьников грамотному и каллиграфически правильному письму.
Рост информационных потоков, объема знаний и коммуникативной активности в современном обществе обуславливает возрастание требований к уровню владения письмом и иными базовыми образовательными навыками, необходимыми для активного участия в деятельности общества. В связи с этим процессы обучения письму, восстановления навыков письма, а также обработки и сохранения рукописной информации приобретают новое, сложное содержание, становясь предметом изучения для специалистов в области системного анализа.
Этому способствует усложнение самого понятия грамотности и повышение ее роли в обществе. Согласно материалам ЮНЕСКО основным навыком считается активное владение письмом, включая его рукописный вариант. Обучение письму и совершенствование навыков письма рассматривается как основа сохранения человеческой культуры, современной цивилизации.
Навык письма тесно связан с развитием высших психических функций -внимания, восприятия, памяти, мышления. Навык письма является также двигательным, основанным на моторике и координации мелких движений рук. Он формируется одновременно и взаимозависимо с умственным развитием. Эта взаимосвязь лежит, например, в основе методик, определения школьной зрелости.
Они позволяют по степени выполнения специальных графических заданий провести диагностику «зрелости» мелкой моторики и одновременно -психологическую и физиологическую готовность детей к школьному обучению.
Обучение письму в свою очередь способно стимулировать развитие индивидуума. Это влияние лежит в основе обучающих упражнений*по письму. Такие упражнения не только прививают и совершенствуют базовый навык письма, но и способствуют совершенствованию функции зрительно-двигательной координации, зрительной памяти, произвольного внимания, аналитического восприятия.
Не менее важной задачей является восстановление навыков письма, утраченных в результате пребывания в невесомости, болезней или травм и тренировка нарушенной моторики рук с применением компьютерных методов реабилитационной терапии. Психическая и физическая активизация, восстановление функций у больных, например, после перенесенного инсульта, наиболее успешно решается в системе комплексной реабилитации, включающей наряду с медикаментозным и физиотерапевтическим лечением упражнения по восстановлению нарушенной речи, навыков письма и пр.
Актуальны также иные задачи: реадаптация моторной активности рук после воздействия гипо- и микрогравитации, диагностика общего функционального состояния организма по состоянию моторики рук и функции письма, проблемы идентификации почерка и оперативного перевода рукописной информации в электронную форму, и др.
Рассмотренные задачи обуславливают актуальность создания комплексной системы, выполняющей функцию упражнений для обучения письму, тренировки навыков каллиграфии, корректировки почерка, восстановления нарушенных умений письма. Разработка алгоритмов и методов, необходимых для создания таких упражнений является междисциплинарной задачей, базирующейся на учении о психосоматическом развитии личности, использовании адаптивных
методик обучения, методах обработки информации (распознавание рукописных символов), технических решениях (сенсорный ввод) и т.д.
Анализ процессов обучения письму и восстановления нарушенных навыков письма как сложных прикладных объектов исследования, позволил выявить системные противоречия, заключенные в них. Важность такого анализа продиктована тем, что подобные исследования, отличающиеся междисциплинарным характером, редко проводятся, несмотря на их необходимость.
Разрешение этих противоречий может быть найдено на пути создания и применения упомянутой выше специальной обучающей системы и библиотеки упражнений для обучения и совершенствования навыков письма и восстановления мелкой моторики рук. Система позволит ввести обратную связь на уровне обучаемого, нивелируя несовершенство функции самоконтроля, обусловленное возрастом или болезнью, а также даст возможность индивидуализировать процессы обучения и реабилитации.
Исследованиями структурных аспектов рукописного текста, включая каллиграфию, занимались с начала 70-х годов XX века В.А. Ковалевский [1], К.Фукунага [2], разработкой классификаторов для рукописных символов и компьютерным распознаванием - Д.Е. Ян [3], Н.Д. Горский и др. [4], В.Л.Арлазаров и др. [5]. В XXI веке Н.В. Котович, О.А Славин исследовали скелетизацию рукописного текста и методы адаптивного распознавания [6], В.В.Постников, A.A. Михайлов - методы сегментации текста [7], А.Б. Мерков -методы обработки слитного текста [8]; и др. Применением рандомизированных алгоритмов для распознавания и анализа каллиграфии рукописных текстов занимается научная школа проф. О.Н. Граничина [9, 10], и др.
Тем не менее, проблема обработки каллиграфической информации рукописных тестов недостаточно исследована в аспекте формирования навыков письма. Такая постановка проблемы дает возможность вести поиск ее решений, направленных в частности на разработку математического и алгоритмического
обеспечения для обучающей системы, позволяющей формировать навыки каллиграфии при обучении письму или реабилитационной терапии.
Цель работы:
Исследовать проблему обработки каллиграфической информации рукописного текста в аспекте создания и применения адаптивных методик по формированию навыков каллиграфии на основе упражнений по коррекции почерка.
Решаемые задачи:
исследование методов * визуализации, трансформации и анализа графических образов в реальном времени;
системный анализ процессов формирования навыков каллиграфии при обучении письму и реабилитации функции мелкой моторики рук;
классификация методов распознавания графических образов; разработка метода обработки каллиграфической информации, представленной в виде рукописных символов;
разработка математических моделей и алгоритмов преобразования необработанных письменных символов в форму, адаптированную для компьютерной обработки;
разработка алгоритма обработки рукописных образов в режиме реального времени для обучающей системы формирования навыков каллиграфии;
проектирование базы данных для интеллектуальной системы обработки каллиграфической информации и формирования навыков письма;
разработка адаптивной методики составления индивидуального курса обучения и восстановления навыков письма.
Методы исследования:
При решении поставленных задач в работе использованы методы системного анализа, нелинейного программирования, теории информационных систем и обработки данных, теория вероятностей, математическая статистика; также в работе были использованы методы обработки образов печатного и
рукописного текста с использованием оптимизированной файловой БД для хранения информационных структур символов. Научная новизна работы:
- разработан метод обработки каллиграфической информации, представленной в виде рукописных символов, основанный на алгоритмах автономного и оперативного распознавания, отличающийся введением алгоритмов сравнения и оценки каллиграфических символов с эталоном;
- разработана математическая модель оценки рукописных символов в процессе написания, основанная на самообучающемся адаптивном рандомизированном алгоритме стохастической оптимизации, отличающаяся наличием расчета численной оценки сравнения каллиграфических символов с эталоном;
- предложен алгоритм обработки рукописных образов в режиме реального времени, позволяющий оценить качество каллиграфии, скорость письма и прогресс выполнения упражнений;
- формализована база данных специальных адаптивных упражнений для обучения письму, коррекции почерка, тренировки и восстановления мелкой моторики рук;
- предложен адаптивный алгоритм подбора упражнений из базы данных на основе оценки качества письма для проведения индивидуальной коррекции почерка.
Достоверность научных положений работы подтверждена результатами численных экспериментов с математической моделью, а также экспериментальными исследованиями и опытной эксплуатацией обучающей системы формирования навыков каллиграфии, в ходе которых даны статистические оценки работы системы и применяющихся в ней алгоритмов (количественные оценки приведены в пунктах «Научная новизна» и «Реализация результатов»).
Научная значимость результатов
Для достижения поставленной цели в работе был проведен системный анализ процессов распознавания рукописных символов и обработки заключающейся в них каллиграфической информации, в процессе которого были исследованы существующие алгоритмы распознавания рукописных текстов. Проведенный анализ показал, что для обработки каллиграфической информации рукописных текстов может быть использован рандомизированный алгоритм стохастической оптимизации [9, 10]. Он был положен в основу математической модели для обучающей системы, позволяющей проводить обработку, визуализацию и преобразование каллиграфической информации и формировать навыки каллиграфии на основе адаптивных методов обучения с применением специальной библиотеки упражнений. Проведена разработка математического и алгоритмического обеспечения для этой системы.
Современные системы оптического распознавания имеют более низкую точность распознавания символов для рукописных текстов по сравнению с печатными текстами, из-за сложности их структурных характеристик, включая каллиграфию. Поэтому еще одной актуальной задачей, решенной в работе, было повышение точности обработки рукописных текстов при одновременном снижении потерь качества и данных.
Положения, выносимые на защиту:
- математическая модель оценки рукописных символов в процессе написания, основанная на самообучающемся адаптивном рандомизированном алгоритме стохастической оптимизации.
- алгоритм обработки рукописных образов в режиме реального времени, позволяющий оценить качество каллиграфии, скорость письма и прогресс выполнения упражнений.
- библиотека специальных адаптивных упражнений для обучения письму, коррекции почерка, тренировки и восстановления мелкой моторики рук.
- адаптивный алгоритм подбора упражнений на основе оценки качества письма для проведения индивидуальной коррекции почерка.
Практическая значимость полученных результатов
Разработанная система оценки каллиграфии может применяться в различных сферах деятельности: для обучения базовым навыкам письма, совершенствования каллиграфии, как одно из вспомогательных средств для обучения русскому и иностранным языкам, для восстановления нарушенного почерка в сфере восстановительной медицины и других областях.
В перспективе система может быть применена для решения частных прикладных задач, например, для автоматизированной экспертизы почерка, а также для оценки функционального состояния организма и тренировки рук в процессе реадаптации при воздействии гипо- и микрогравитации.
Созданный сенсорный комплекс для оценки каллиграфии позволяет вводить рукописный текст с планшета, КПК и других сенсорных панелей, распознавать введенные символы, анализировать отклонения их написания от эталона и предлагать рекомендации по улучшению почерка и скорости письма. С целью повышения грамотности пользователя в ПО комплекса могут быть введены словари для проверки орфографии и дополнительные алгоритмы для исправления ошибок пунктуации.
Практическую значимость имеют также решения, полученные на этапе разработке сенсорной системы для оценки каллиграфии. В частности, разработанная автором структура базы данных для хранения характеристик начертания символов, пригодная для реализации во всех основных СУБД и классических файловых БД, а также основанная на ней процедура классификации контуров при структурном подходе к распознаванию образов.
Реализация результатов
По результатам опытной эксплуатации системы «Электронная пропись» в учреждениях дошкольного и среднего образования г. Москвы для обучения письму младших школьников было сделано заключение о ее эффективности при
обучении письму и' тренировке почерка учеников. Экспертные оценки на основании проведенных исследований с использованием экспертных панелей и метода средних арифметических рангов составили от 8,5 до 10 баллов по десятибалльной шкале.
Полученные результаты использованы в обучающем процессе Калужского государственного университета им. К.Э. Циолковского, что позволило разработать перспективные методики постановки руки в процессе обучения письму посредством комплексных упражнений с элементами развития почерка и мелкой моторики рук.
В результате применения комплекса в курсе реабилитации больных после инсульта в центрах восстановительной терапии НИИ цереброваскулярной патологии и инсульта Российского национального исследовательского медицинского университета им. Н.И. Пирогова Минздравсоцразвития России было отмечено достоверное ускорение восстановления мелкой моторики и улучшение показателей высших психических функций пациентов. Вынесено заключение о целесообразности применения системы «Электронная пропись» в комплексной программе реабилитационных мероприятий пациентов с острым нарушением мозгового кровообращения.
Апробация работы была проведена на научных семинарах кафедры проектирования и технологии производства электронной аппаратуры ФГБОУ ВПО МГТУ им. Н.Э. Баумана (Москва, 2010-2014 гг.), IV Всероссийском конкурсе молодых ученых (Москва, 2012 г.), Третьей международной научно-технической конференции Аэрокосмические технологии (Москва, 2014 г.), Первая международная научная конференция «Научное развитие в европейских странах: новые концепции и современные решения» (Штутгарт, 2013 г.), десятом международном симпозиуме 1МТЕЦ5'2012 (Вологда, 2012 г.), Молодежной научно-технической конференции «Наукоемкие технологии и интеллектуальные системы» (Москва, 2010 г.).
Система «Электронная пропись» зарегистрирована в Роспатенте
(Свидетельство о регистрации программ для ЭВМ №2008611676).
Публикации
Основные результаты работы опубликованы в 11 печатных работах, из них две в журналах, рекомендованных ВАК для публикации результатов диссертаций.
Структура и объем работы:
Диссертационная работа состоит из введения, четырех глав, заключения и списка литературы. Общий объем работы 150 страниц, включая 76 иллюстраций, список литературы и приложения. Библиография содержит 67 наименований, из них 4 из иностранных источников.
ГЛАВА 1. АНАЛИЗ МЕТОДОВ И СРЕДСТВ ОБРАБОТКИ ИНФОРМАЦИИ, ПРЕДСТАВЛЕННОЙ РУКОПИСНЫМИ
СИМВОЛАМИ
Ы.Актуальность обработки информации, представленной рукописными
образами
Проблему обработки информации, содержащейся в рукописных текстах, чаще всего исследуют как более узкую проблему распознавания текста, применяя для этого методы распознавания образов. Наиболее сложным и малоизученным аспектом работы с рукописными текстами остается обработка имеющейся в них структурной информации, включая каллиграфию.
Каллиграфия в современной методике обучения письму понимается как умение писать четким, устойчивым, удобочитаемым почерком. Следовательно, обработка каллиграфии рукописного текста - это извлечение структурной информации, связанной с начертанием символов в данном тексте и его отклонениями от принятого эталона начертания символов.
Выше было отмечено большое значение обработки рукописных текстов для решения задач обучения письму и восстановления навыков письма. Возрастание доли обмена рукописными текстами, такими как: элементы деловой или служебной переписки, формы страховых и кредитных организаций, журналы и заметки усиливает актуальность исследований в области обработки рукописных текстов. Все это обуславливает необходимость разработки устойчивой системы, позволяющей выполнять оперативное распознавание и интерпретацию рукописных данных и проводить корректировку почерка, тренировку правильного и быстрого письма. Методы анализа и оценки каллиграфии, использующиеся в этой системе, будут также ценны для применения при экспертной оценке почерка, почерковедении и иных областях.
Системный подход, используемый при распознавании рукописных образов. В общем виде систему распознавания рукописных данных можно представить в
виде трех подсистем (Рисунок 1.1): подсистемы извлечения признаков, непосредственно подсистемы распознавания и подсистемы принятия решения, к какому классу относится данный объект.
Рукописные данные
Текстовые
Графические ■ (графики, блок-схемы)
Сенсорный экран
Графическое представление рукописных данных
Представление рукописных данных в виде структурных компонентов
¡3 ш
Двухуровневый классификатор
Текстовое представление
рукописных данных и построение соответствий с рукописной информацией
Рисунок 1.1. Система распознавания рукописной информации
Разработка системы ввода текста, её тестирование и отладка, невозможна без создания базы данных символов, в общем случае состоящей из следующих частей:
• неконфликтные символы (отличающиеся по форме написания) в хорошем исполнении;
• конфликтные символы в хорошем исполнении;
• символы с нарушенными требованиями к качеству написания. Открытых баз практически не существует, поэтому при разработке системы
ввода рукописного текста приходится создавать и наполнять собственную базу символов.
Для достижения наиболее высокой скорости и качества распознавания используется несколько классификаторов работающих параллельно. Первый
производит быстрое распознавание с большим количеством гипотез, второй работает более медленно и производит более точную оценку обнаруженных сомнительных символов.
Система ввода обычно реализуется в виде программно-аппаратного комплекса, выполняющего следующие функции: считывание рукописного текста; распознавание вводимых символов; формально-логический и словарный автоматический контроль распознанной информации; возможность ручная верификация данных; запись обработанной информации в необходимом формате и ее хранение.
1.2.Классификация систем распознавания рукописных образов
Классификация по методам распознавания. Классификация методов распознавания может базироваться на разных принципах, и поэтому классификации разных авторов могут существенно отличаться друг от друга. На Рисунке 1.2 рассмотрен один из вариантов, учитывающий направления классификации по распознаванию отдельных символов и распознаванию наборов символов.
Многослойный Сети с
персегттрон радиальными
базисными
функциями
С распозна- Без
вателем букв распознавателя
букв
Рисунок 1.2. Методы распознавания рукописных данных
Классификация с учетом аппарата обработки данных. Все системы распознавания рукописных образов можно разделить с учетом аппарата обработки данных на несколько подгрупп в соответствии с используемыми методами, как приведено в Таблице 1.
Таблица 1.
Системы, классифицируемые с учетом аппарата обработки данных
Метод Описание Преимущество/недостаток
Логические методы Подгруппа методов применяет алфавит значений признаков, состоящий только из 2х значений: истина и ложь. Недостаток: использование лишь двух значений. Преимущество: быстродействие модели.
Аналитические методы Подгруппа методов применяет систему функций и критериев. Пример - система, реализующая метод "обобщенного портрета" Недостаток: отсутствие единого методического подхода к построению аналитической части. Преимущество: возможность адаптации к используемому виду и размерности данных соответствующих аналитических выражений
Статистические методы Подгруппа методов применяет инструменты статистики (математическое ожидание, среднеквадратическое отклонение, и т.д.) для реализации процесса классификации Недостаток: на результаты классификации влияет качество входной информации. Преимущество: стабильные положительные результаты классификации при низкой зашумленности входных данных
Таблица 1 (продолжение)
Метод Описание Преимущество/недостаток
Бионические Персептрон,сети с Недостаток: проблемы в работе с
методы латеральным вариативными образами.
торможением и т.д. Преимущества: сохранение
способности к распознаванию
информации при нарушении
собственной структуры
(устойчивость к повреждениям);
отсутствие необходимости к
перебору вариантов.
Классификация с учетом характеристик процесса. Системы так же классифицируются с учетом характеристик процесса распознавания. При данной классификации все системы делятся на несколько подгрупп с учетом одного или нескольких параметров:
• время распознавания (или количество шагов метода);
• точность полученного результата;
• общность получаемых результатов (универсальность метода);
• количество и качество признаков, участвующих в реализации метода И т.д.
1.3.Анализ решений для распознавания рукописных образов
Методы аналогичных случаев. Метод заключается в запоминании всех объектов обучающей выборки. Если системе предъявлен нераспознанный объект х*, то она относит этот объект к тому образу (Рисунок 1.3), чей «представитель» оказался ближе всех к х*.
о
о о
о
ООО
Рисунок 1.3. Решающее правило «Минимум расстояния до ближайшего соседа»
Преимуществами метода рассуждений на основе аналогичных случаев являются простота использования полученных результатов, независимость решений от природы исследуемого образа, использование не «верных» решений, а всего лишь лучших из возможных.
Деревья решений
Преимущества использования деревьев решений заключаются в быстром процессе обучения, возможности использования этого метода в трудно формализуемых областях, использовании естественных языков для формулировки правил, высокой точности прогноза, сопоставимой с другими методами (статистика, нейронные сети) и др. [18].
Недостаток - падение значимость классификации по мере движения до конечного узла.
Генетические алгоритмы
Генетический алгоритм может быть применен для распознавания рукописных символов. Перед его применением последовательно выполняется скелетизация, векторизация и удаление «шпор», разбиение на символы и их распознавание.
На Рисунке 1.6 показано отсканированное изображение, переведенное в однобитовый режим.
а
Рисунок 1.6. Отсканированное изображение в однобитовом режиме
Стадия скелетизации (утончения линий изображения) отличается простотой, быстродействием и дает наименьшее количество «шпор». Если в результате скелетизации образуются «шпоры», то запускается алгоритм удаления «шпор».
Затем к изображению применяется алгоритм выделения отдельных символов (Рисунок 1.7).
Нейронные сети. Искусственные нейронные сети (ИНС) - это математическая или компьютерная модель, построенная по принципу работы биологических нейронных сетей. Упрощенная модель НС, представлена на Рисунке 1.8.
Рисунок 1.7. Результат работы генетического алгоритма
I ♦
выхо.
взвешенные связи
скрытый слой
узлы
входной слой
Рисунок 1.8. Схема искусственной нейронной сети
Применение нейросетевых парадигм для решения какой-либо задачи возможно при следующих условиях:
• могут быть представлены примеры решения задачи;
• имеется взаимосвязь между входными и выходными данными, т. е. изменения на входе влияют на результат на выходе.
Искусственные нейронные сети являются достаточно эффективным инструментом в решении трудно формализуемых задач с неполной или плохо определенной информацией [19]. Например, для распознавания рукописных символов. Пример такой сети схематически представлен на Рисунке 1.9.
Input Hidden Layer Output Layer
Г-> Г-N
at = logsig (IWupi +Ы; ai = /^/¿(LW^iai+bJ)
Рисунок 1.9. Схема двухслойной нейронной сети для распознавания образов
Для обучения сверточной нейронной сети используется алгоритм обратного распространения ошибки. Обучение сети начинается с предъявления образа и вычисления соответствующей реакции. Сравнение с желаемой реакцией дает возможность изменять веса связей таким образом, чтобы сеть на следующем шаге могла выдавать более точный результат [15].
Основные способы обучения [27]:
• обучение с учителем (выходное пространство решений нейронной сети известно);
• обучение без учителя — нейронная сеть формирует выходное пространство решений только на основе входных воздействий (самоорганизующиеся сети);
• обучение с подкреплением — в сети действует система назначения штрафов и поощрений от среды.
В процессе обучения сеть в определенном порядке просматривает обучающую выборку. Один полный проход по выборке называется эпохой обучения [27].
1.4.Анализ обобщенной модели информации, представленной совокупностью рукописных образов
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Обработка и распознавание рукописного текста в системах электронного документооборота2008 год, кандидат технических наук Горошкин, Антон Николаевич
Моделирование процесса идентификации графических объектов2011 год, кандидат технических наук Курушин, Даниил Сергеевич
Синтез объектной нейросетевой модели распознавания образов и её применение в задачах железнодорожной автоматики2013 год, кандидат наук Зуев, Денис Владимирович
Методы распознавания рукописных текстов в системах автоматизации документооборота на промышленных предприятиях2008 год, кандидат технических наук Ла Суан Тханг
Адаптивное распознавание и его применение к системе ввода печатного текста2011 год, доктор технических наук Славин, Олег Анатольевич
Список литературы диссертационного исследования кандидат наук Демин, Алексей Анатольевич, 2014 год
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ
1. Ковалевский В. А. Методы оптимальных решений в распознавании изображений / В.А. Ковалевский. М.: Наука, 1967. 328 с.
2. Фукунага К. Введение в статистическую теорию распознавания образов / К.Фукунага; [Пер. с англ.]. М.: Наука, 1979. 368 с.
3. Ян Д.Е. Новая технология распознавания символов. Теория, практическая реализация, перспективы / Д.Е. Ян, К.В. Анисимович, A.JI. Шамис. М.: Препринт, 1995. 36 с.
4. Горский Н.Д. Распознавание рукописного текста: от теории к практике / Н.Д.Горский, В.А. Анисимов, Л.М.Горская. СПб.: Политехника, 1997. 126 с.
5. Демин А. А. Методы и средства автоматизированной оценки каллиграфии для электронных учебников // Итоги диссертационных исследований: в 2 т. Т. 2: Материалы IV Всероссийского конкурса молодых ученых. М.: РАН, 2012. С. 126-137.
6. Арлазаров В.Л. Алгоритмы распознавания и технологии ввода текстов в ЭВМ/ В.Л. Арлазаров, О.А.Славин // Информационные технологии и вычислительные системы, 1996. №1. С. 22-27.
7. Котович Н.В. Распознавание скелетных образов / Н.В. Котович, O.A. Славин // Сб. трудов ИСА РАН "Методы и средства работы с документами". М.: Эдиториал УРСС, 2000. С. 204-215.
8. Оганезов А.Л. Применение нейронных сетей в задачах распознавания образов: дис. на соискание ученой степени канд. физ.-мат. наук. Тбилиси. 2006. 149 с.
9. Демин А. А. Альтернативная технология изготовления сенсорного емкостного экрана / A.A. Демин, Д.С.Терентьев // Датчики и Системы. М. : РАН, 2013. №9. С.56-63.
10. Постников B.B. Алгоритмы сегментации рукопечатных символов /
B.В.Постников, A.A. Михайлов // Развитие безбумажных технологий в организациях: сб. материалов. М. 1999. С. 179-188.
11. Демин А. А. Обзор интеллектуальных систем для оценки каллиграфии // Инженерный вестник: электронный научно-технический журнал. 2012. №9.
C. 1-25.
12. Мерков А.Б. Основные методы, применяемые для распознавания рукописного текста [Электронный ресурс] / А.Б. Мерков. Режим доступа: http://hutchinson.belmont.ma.us
13. Алиев Т.М. Системы отображения информации / Т.М.Алиев, Д.И. Вигдоров, В.П.Кривошеев. М.: Высшая школа, 1988. 86 с.
14. Граничин О.Н. Рандомизированный алгоритм стохастической аппроксимации в задаче самообучения / О.Н. Граничин, O.A. Измакова // Автоматика и телемеханика. 2005. №8. С. 52-63.
15. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // Наукоемкие технологии и интеллектуальные системы 2007: Сборник трудов 9-ой Молодежной научно-технической конференции. М.: МГТУ им. Н. Э. Баумана, 2007. С. 152-154.
16. Moody J. Fast Learning In Netwoks of Locally TunedProccssing Units / Moody, J., Darken C.J. // Neural Computation, 1989. — № 1. — C. 281-284.
17. Обзор программы FineReader [Электронный ресурс]. Режим доступа: http://www.abbyy.ru (дата обращения 29.04.2014).
18. Обзор программы MyScript Notes [Электронный ресурс]. Режим доступа: httn://www.notestaker.ru (дата обращения 29.04.2014).
19. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // Современная техника и технологии: Сборник трудов 14-ой Международной научно-практической конференции. Томск: Томский политехнический университет, 2008. С. 284-285.
20. Гонсалес Р. Принципы распознавания образов / Р. Гонсалес, Дж. Ту. М.: Мир, 1978.414 с.
21. Журавлев Ю.И. Распознавание образов и распознавание изображений / Ю.И.Журавлев, И.Б. Гуревич // Распознавание, классификация, прогноз. 1989. Т. 2. С. 5-73.
22. Костевич Л.С. Математическое программирование. Информационные технологии оптимальных решений: учебное пособие для экономических специальностей вузов / Л.С. Костевич. М.: Новое знание, 2003 . 424 с.
23. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // Машиностроение 2008: Сборник трудов научно-технической конференции. М.: МГТУ им. Н.Э. Баумана, 2008. С. 152-154.
24. Борисова И.А. Методы решения задач распознавания образов комбинированного типа: дис. на соискание ученой степени канд. тех. наук. Новосибирск. 2008. 121 с.
25. Афонин В.Л. Интеллектуальные робототехнические системы [Электронный ресурс] / В.Л. Афонин, В.А. Макушкин. Режим доступа: http://www.intuit.ru.
26. Хант Э. Искусственный интеллект / Э. Хант. М.: Мир, 1978. 560 с.
27. Демин А. А. Электронная пропись: монография. Саарбрюккен: Ламберт Академик Паблишинг, 2009. 80 с.
28. Стариков А. Применение нейронных сетей для задач классификации [Электронный ресурс] / А. Стариков. Режим доступа: http://www.hasegroup.ru (дата обращения 29.04.2014).
29. Борисов В.В. Искусственные нейронные сети. Теория и практика / В.В.Борисов, В.В. Круглов. М.: Горячая Линия-Телеком, 2001. 382 с.
30. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // Наукоемкие технологии и интеллектуальные системы 2010: Сборник трудов 12-й Молодежной научно-технической конференции. М.: МГТУ им. Н.Э. Баумана, 2010. С. 152-154.
31. Кугаевских А.В. Возможность применения искусственных нейронных сетей "неокогнитрон" для распознавания древнеегипетских иероглифов / А.В.Кугаевских, А.Г. Ивашко // Вестник Тюменского Государственного Университет. Тюмень: Изд-во ТюмГУ, 2009. №6. С. 209-214.
32. Kanevsky D. Large Vocabulary Speaker-Independent Continuous Speech Recognition in Russian Language / D. Kanevsky, M. Monkowsky, J. Sedivy // Proc SPECOM'96. St.Peterburg, 1996. p. 117-121.
33. Фу К. Структурные методы в распознавании образов / К. Фу. М.: Мир, 1977. 320 с.
34. Афонасенко А.В. Обзор методов распознавания структурных символов / А.В.Афонасенко, А.И.Елизаров // Доклады ТУСУРа, 2008. №2 (18). С. 14-19.
35. Двойной И.Р. Распознавания изображения лица человека цветовым признакам и идентификации личности скрытых марковских моделей в системах видеонаблюдения: дис. на соискание ученой степени канд. тех. наук. Пенза. 2013. 135 с.
36. Горошкин А.Н. Обработка изображений в системах распознавания рукописного текста / А.Н. Горошкин // 10-ая международная конференция и выставка «Цифровая обработка сигналов и ее применение» : сб. материалов. М., 2008. 120 с.
37. Гайдышев И. Анализ и обработка данных: специальный справочник / И.Гайдышев. СПб.: Питер, 2001.750 с.
38. Демин А. А. Интеллектуальная интерактивная обучающая система «Электронная пропись» // INTELS'2012: Сборник трудов десятого международного симпозиума. Вологда: Вологодский государственный технический университет, 2012. С. 20-23.
39. Шикин А.В. Компьютерная графика. Полигональные модели / А.В. Шикин, А.В. Боресков. М.: Диалог-МИФИ, 2000. 464 с.
40. Местецкий JI.M. Непрерывный скелет бинарного изображения / Л.М.Местецкий // Конференция Графикон: сб. материалов. М., 2006. С. 24-25.
41. Препарата Ф. Вычислительная геометрия: Введение / Ф. Препарата, М.Шеймос. М.: Мир, 1989. 478 с.
42. Бутаков Е.А. Обработка изображений на ЭВМ / Е.А. Бутаков,
B.И.Островский, И.Л. Фадеев. М.: Радио и связь, 1987. 240 с.
43. Буч Г. Объектно-ориентированный анализ и проектирование с примерами приложений на С++ / Г. Буч. 2-е изд.; [Пер. с англ.]. М.: «Издательство Бином», 2000. 560 с.
44. Рихтер Дж. Программирование на платформе Microsoft .NET Framework / Дж. Рихтер; [Пер. с англ.]. М.: Русская Редакция, 2003. 512 с.
45. Шишкин В.В. Методическое пособие по дисциплине "Технология разработки программных продуктов" / В.В. Шишкин. Смоленск: Издательство СПЭК, 2005. 118 с.
46. Аникина Г.О. Непараметрические системы распознавания образов в условиях разнотипных данных: дис. на соискание ученой степени канд. тех. наук. Красноярск. 2005. 185 с.
47. Компьютер, периферийные устройства, устройства обмена информацией [Электронный ресурс]. Режим доступа: http://www.ityoursclf.ru (дата обращения 29.04.2014).
48. Вендров A.M. CASE технологии. Современные методы и средства проектирования информационных систем / A.M. Вендров. М.: Финансы и статистика, 1998. 148 с.
49. Маклаков C.B. BPwin и ERwin. CASE средства разработки информационных систем / C.B. Маклаков. М.: ДИАЛОГМИФИ, 1999. 256 с.
50. Богуславский A.A. Программно-аппаратные средства ввода зрительных данных в память персонального компьютера / A.A. Богуславский,
C.М.Соколов. М, 2002. 6 с. Препринт ИПМ им. М.В. Келдыша РАН.
51. Введение в эргономику / под ред. В. П. Зинченко. М.: Советское радио, 1974. 350 с.
52. Чайнова Л.Д. Функциональный комфорт. Компоненты и условия формирования / Л.Д. Чайнова // Техническая эстетика. 1983. №1. С.23-28.
53. Головач В. Дизайн пользовательского интерфейса [Электронный ресурс] / В.Головач. Режим доступа: http://uibook2.usethics.ru (дата обращения 29.04.2014).
54. Санитарно-эпидемиологические требования к условиям и организации обучения в общеобразовательных учреждениях. СанПиН 2.4.2.2821-10. М.: УЦ «Перспектива», 2011 10 с.
55. Свидетельство о регистрации программ для ЭВМ. Программно-аппаратный комплекс для тренировки мелкой моторики, логического развития и обучения письму «Электронная пропись» / Демин А. А., Власов А. И.; заявитель и правообладатель Демин А. А. №2008611676; опубл. 31.03.2008.
56. Соловов A.B. Проектирование компьютерных систем учебного назначения / A.B. Соловов. Самара: СГАУ, 1995. 140 с.
57. Вострокнутов И.Е. Теория и технология Оценки качества программных средств образовательного назначения / И.Е. Вострокнутов. М.: Госкоорцентр информационных технологий, 2001. 300 с.
58. Лурия А.Р. Высшие корковые функции человека и их нарушения при локальных поражениях мозга / А.Р. Лурия. М.: Изд-во МГУ, 1962. 432 с.
59. Логопед и психолог онлайн [Электронный ресурс] Режим доступа: httns://sites.goog1e.com/site/logopedon1ain/ (дата обращения 29.04.2014).
60. Выготский Л.С. Психология развития человека / Л.С. Выготский. М.: Изд-во Смысл, 2005. 1136 с.
61. Селевко Г.К. Энциклопедия образовательных технологий: [в 2 т.] / Г.К.Селевко. М: НИИ школьных технологий, 2006. Т.1. 816,[1] с.
62. Хорошилова Е.И. Характеристика специфических ошибок письма младших школьников / Е.И. Хорошилова // Начальная школа. 2001. №7. С.7-11.
63. Демин А. А. Методы автоматизированной оценки каллиграфии // Программные продукты и системы. 2011. №1. С. 21-24.
64. Цыновникова Ю.Л. Автоматизация навыка письма на этапе первичного усвоения буквенных знаков / Ю.Л. Цыновникова // Начальная школа. 2001. №7. С. 17-19.
65. Корчажкина О.М. Интерактивность как показатель дидактических возможностей современных электронных образовательных ресурсов / О.М.Корчажкина// Информатика и образование. 2008. № 7. С. 108-109.
66. Попов Д.И. Способ оценки знаний в дистанционном обучении на основе нечетных отношений / Д.И. Попов // Дистанционное образование, 2000. №6. С. 34-37.
67. Наземнова Н.В. Обучение старшеклассников аналитическим методам распознавания геометрических образов: дис. на соискание ученой степени канд. пед. наук. Пенза. 2006. 147 с.
68. Аносов H.H. Восстановительное лечение больных, перенесших инфаркт мозга. / H.H. Аносов // Геронтология и гериатрия. Киев, 1971. С. 471-480.
69. Коган О.Г. Медицинская реабилитация в неврологии и нейрохирургии / О.Г.Коган, В.Л. Найдин. М., 1988. 304 с.
70. Оппель В.В. Восстановление речи после инсульта / В.В. Оппель. Л.: Медицина, 1972. 150 с.
71. Вейн A.M. Неврологические синдромы / A.M. Вейн, В.Л. Голубев. М.: «Эйдос Медиа», 2003. 832 с.
72. Цыкунов М.Б. Обследование в процессе реабилитации пациентов с повреждением спинного мозга / М.Б Цыкунов, Г.Е. Иванова, В.Л. Найдин, [и др.] // Реабилитация больных с травматической болезнью спинного мозга; под общ. ред. Г.Е. Ивановой и др. М.: ОАО «Московские учебники и Картолитография», 2010. С. 278-288.
73. Визель Т.Г. Основы нейропсихологии: учеб. для студентов вузов / Т.Г.Визель. М.: АСТАстрель Транзиткнига, 2005.- 384 с.
74. Белова А.Н. Шкалы, тесты и опросники в медицинской реабилитации / А.Н.Белова, О.Н. Щепетова; под. ред. А.Н. Беловой, О.Н. Щепетовой. М.: Антидор, 2002.440 с.
75. Козловская И.Б. Нейрофизиологические механизмы гипогравитационной атаксии / И.Б. Козловская // Научные труды I Съезда физиологов СНГ Сочи, 19-23 сентября 2005. -М.: Медицина-Здоровье, 2005. С. 8.
76. Козловская И.Б. Гипогравитационный двигательный синдром: природа и механизмы развития / И.Б. Козловская // «Нейронаука для медицины и психологии», VIII-й Международный Междисциплинарный Конгресс. М.: ООО "МАКС Пресс", 2012. С. 37.
77. Шенкман Б.С. Структурно-метаболическая пластичность скелетных мышц млекопитающих во время гипокинезии и невесомости / Б.С. Шенкман // Авиакосмическая и экологическая медицина. 2002. Т.36. №3. С. 3-14.
78. Томиловская Е.С. Характеристики точностных движений руки в условиях длительных космических полетов / Е.С. Томиловская, И.Б. Козловская // «Нейронаука для медицины и психологии», VIII-й Международный Междисциплинарный Конгресс. М.: ООО "МАКС Пресс", 2012. С. 45.
79. Структурные изменения в мышцах руки после микрогравитации [Электронный ресурс]. Режим доступа: http://www.algohiotehno1ogia.ru (дата обращения 29.04.2014).
80. Егоров А.Д. Теория и методология медицинского контроля в длительных космических полетах (ГНЦ РФ ИМБП, Актовая речь) [Электронный ресурс]. Режим доступа: http://www.imbp.ru/wehpages/winl251/Science/UchSov/Poc1/2001/Egorov actsp. html (дата обращения 29.04.2014).
81. Граничин О.Н. Рандомизированные алгоритмы оптимизации и оценивания при почти произвольных помехах / О.Н. Граничин, Б.Т. Поляк. М.: Наука, 2003. 291 с.
Wacom Россия [Электронный ресурс] Режим доступа: http://www.wacom.ru/arxiv/bamboo-penatouch/bamboo-pen.html (дата
обращения 29.04.2014).
ПРИЛОЖЕНИЕ ПЛ. Технические характеристики аппаратных средств
Виды и характеристики сенсорных экранов
В настоящее время существует несколько вариантов реализации чувствительной поверхности с экраном [34, 66]:
• резистивные сенсорные экраны (четырехпроводной, пятипроводной);
• емкостные экраны;
• проекционно-ёмкостные сенсорные экраны;
• сенсорные экраны на поверхностно-акустических волнах;
• инфракрасные и оптические сенсорные экраны;
• тензорезистивные сенсорные экраны.
Наиболее доступными являются первые два варианта.
Пятипроводной резистивный сенсорный экран является более надежным. На стеклянной подложке находятся четыре электрода по углам и нанесено резистивное покрытие, а на мембрану нанесен проводящий слой. Изначально на мембрану подается напряжение, а четыре электрода заземлены. Уровень напряжения отслеживается через АЦП и при изменении (что соответствует нажатию на экран), микроконтроллер вычисляет координаты касания. На два правых (условно) электрода подается напряжения, левые заземляются - это напряжение соответствует координате X. Затем два верхних подключают к напряжению, а два нижних заземляют - полученное напряжение соответствует координате У.
Емкостной сенсорный экран представляет собой стеклянную подложку с электродами расположенными по углам и прокрытую резистивным материалом. Принцип действия основан на возникновении проводимости по переменному
току объекта с большей емкостью. Значения тока регистрируется на четырех электродах и передается на контроллер для вычисления координат.
Емкостные экраны обладают большей надежностью по сравнению с резистивными (2 млн. нажатий), но не обладают подходящими средствами ввода (написания) текстовой информации. Резистивные экраны достаточно надежны, обладают невысокой ценой благодаря отлаженной системе производства данных экранов.
Технические характеристики различных планшетов
Таблица 9.
Основные технические характеристики планшетного компьютера iRU Classmate
Параметр Характеристика
Процессор Intel Atom N2600 AMD
Оперативная память 2 Гб
Объем HDD до 500 Гб
LCD-экран 10,1" по диагонали
Разрешение экрана 1024x600
Тип графического контроллера Интегрированный
Операционная система Windows ХР
Размер рабочей поверхности А5
Разрешение сканирующей поверхности 2000 Ipi
Интерфейс подключения к ПК USB
Функциональность беспроводная связь Wi-Fi, WiMAX, слот для кардридера, web-камера.
Таблица 10.
Технические характеристики планшета Edge 3.0
Параметр Характеристика
Процессор nVIDIA Tegra T30L или TI ОМАР 4470 E-ink панелью, управляемой встроенным TI DSP
ЖК-дисплей 10.1 дюймов, RGB, разрешение 1024x600
Операционная система Linux, а также операционная система Android Ice Cream Sandwich
E-ink экран 9.7 дюймов, черно-белый (16 цветов), разрешение 1200x825
Оптическая мышь Использует надстройку EDGE 2.5
Приложения для ЖКД Использует надстройку EDGE 2.0
Оперативная память 1024Мб, DDR-3
Internal storage еММС 4 Гб
Wi-Fi 802.11 b/g
USB USB 2.0 Type A ports X 2
Web-камера более 2 Мегапиксель
Размеры 200.5 х 253 х 12.5 (мм) для любой половины
Масса Не более 1.4 кг
Таблица 11. Технические характеристики планшета Wacom Bamboo Pen&Touch[77]
Планшет
Параметр Характеристика
Рабочая область сенсорного ввода 125,0x85,0 мм
Рабочая область пера 147,2x92,0 мм
Таблица 11 (продолжение)
Планшет
Параметр Характеристика
Вес 360 г, приблизительно
Разрешение, перо 100 линий/мм (2540 линий на дюйм)
Разрешение сенсорного ввода 4 линий/мм (101.6 линий на дюйм)
Расстояние для распознавания пера 16 мм
Высота считывания для пера, среднее значение 7 мм
Скорость отслеживания, перо 133 точки в секунду, максимум
Скорость отслеживания, планшет 50 точек в секунду, максимум
Интерфейс связи USB
Перо
Размеры (длина х диаметр) 154,0 х 11,8 мм
Масса 15 г, приблизительно
Число уровней нажима 1024
Системные требования
Оборудование: • Доступ к Интернет для загрузки программного обеспечения. • Windows® ХР и выше, USB-порт, цветной дисплей
П.2. Методическое обеспечение программно-аппаратного комплекса обработки каллиграфических данных
Руководство оператора
Запуск программы. Сразу после запуска программы «Электронная пропись» появляется главный экран, на котором расположены иконки меню быстрого доступа с их кратким описанием, справа - панель с конками. В нижнем правом углу появляется главный персонаж, который дает подсказки по ходу занятий (Рисунок П.1). В самом начале он озвучивает инструкцию по пользованию программой.
Для проверки выполненного упражнения нажмите на кнопку с профессором.
Для выбора размера пера нажмите эту кнопку. Чем выше последняя точка линии, тем она толще. Для применения изменений - снова нажмите эту кнопку
Для смешения текущего цвета с синим - нажмите несколько раз или удерживайте эту кнопку.
:
Для смешения текущего цвета с зеленым - нажмите несколько раз или Ж <
л г
удерживайте эту кнопку.
Для смешения текущего цвета с красным - нажмите несколько раз или
удерживайте эту кнопку.
Для перехода кследующему упражнению или пропуска текущего-нажмите эту кнопку. Она активна после проверки упражнения и до его выполнения
Рисунок П. 1. Главный экран программы «Электронная пропись»
Настройки. Толщина пера регулируемая, для выбора его размера необходимо нажать на кнопку с пером, откроется окно настройки пера (Рисунок П.2). Чем выше последняя точка линии, тем она толще. Для применения изменений снова нажмите на изображение пера. Для смешивания текущего цвета
с синим, зеленым или красным следует нажать соответствующую картинку с кисточкой.
Радуга
Рисунок П.2. Настройка толщины и цвета пера
Выполнение упражнений
1. Чтобы начать упражнение необходимо нажать на кнопку с изображением мальчика в правом нижнем углу. Она так же служит для перехода к следующему упражнению или пропуску текущего.
2. Задание для выполнения написано вверху листа (Рисунок П.З), а так же озвучивается при переходе к упражнению.
В центре листа обведи круг
/ Л \ / Л N
и к \
У, А к Л
I ( V \
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.