Структурно-аппроксимационные методы распознавания речевых образов и их применение в тренажно-моделирующих системах тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Синецкий, Роман Михайлович
- Специальность ВАК РФ05.13.01
- Количество страниц 217
Оглавление диссертации кандидат технических наук Синецкий, Роман Михайлович
список сокращений. введение.
1. анализ проблемы речевого управления тренировкой в тренажно-моделирующих системах.
1.1. Характеристика процессов управления сценариями тренировок.
1.2. Модели использования командно-речевых интерпретаторов в тренажномоделирующих системах.
1.3. Анализ современного состояния компьютерных речевых технологий и формирование требований к командно-речевым интерпретаторам в составе тренажно-моделирующих систем.
1.4. Анализ современных методов распознавания речевых образов.
1.5. Задача разработки инструментов и технологий построения эталонных речевых образов командно-речевых интерпретаторов.
1.6. Выводы.
2. разработка математических моделей и метода структурной аппроксимации и распознавания речевых образов.
2.1. Предварительные замечания.
2.2. Структурная детерминированность речеобразующих процессов.
2.3. Определение структурных моделей речевых образов
2.4. Математическая постановка задачи синтеза аппроксимационной модели
2.5. Оптимизационная схема решения задачи синтеза аппроксимационной модели.
2.6. Синтез аппроксимационных структурных моделей при параметрических представлениях спектров.
2.7. Функционально-логическая модель командно-речевого интерпретатора.
2.8. Методика построения эталонных моделей речевых образов.
2.9. Выводы.
3. разработка, численная реализация и исследование алгоритмов обработки речевых сигналов в командно-речевом интерпретаторе.
3.1. Характеристика задач исследования.
3.2. Численные соотношения, используемые в алгоритмах цифровой обработки речевых сигналов.
3.3. Алгоритм определения временных границ речевого сигнала.
3.4. Алгоритмы формирования речевых образов.
3.5. Разработка и исследование алгоритмов сегментации речевых образов.
3.6. Комплексная оценка надежности и вычислительной эффективности командно-речевого интерпретатора.
3.7. Выводы.
4. программная реализация командно-речевого интерпретатора и его применение в составе тренажерных систем.
4.1. Программная реализация командно-речевого интерпретатора.
4.2. Программная реализация методики настройки эталонов голосовых команд.
4.3. Технологические приемы повышения надежности распознавания речевых сигналов.
4.4. Применение командно-речевого интерпретатора в составе тренажерных систем.
4.5. Выводы.
Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Построение математического обеспечения систем распознавания речи на основе нелинейных методов сравнения образов1984 год, кандидат технических наук Туркин, Виктор Николаевич
Речевая коммуникация в системах ввода сообщений для автоматизации рабочих мест оперативно-диспетчерского персонала2000 год, кандидат технических наук Зозуля, Валерий Анатольевич
Алгоритмы распознавания речевых команд в управляющих системах2006 год, кандидат технических наук Литвиненко, Сергей Леонидович
Информативные признаки на основе линейных спектральных корней в системах распознавания речевых команд2010 год, кандидат технических наук Гладышев, Константин Константинович
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Введение диссертации (часть автореферата) на тему «Структурно-аппроксимационные методы распознавания речевых образов и их применение в тренажно-моделирующих системах»
Проблема речевого взаимодействия «человек-машина» рассматривалась различными исследователями еще с середины XX века. За более чем 60 лет исследований были достигнуты определенные успехи в этой области, предпринимались попытки создания систем распознавания слитной речи и изолированных слов. Однако, обобщая накопленный опыт, можно сказать, что задача в целом все еще далека от своего решения, речевое общение на естественном разговорном языке не стало, как планировалось, обычным способом взаимодействия с машиной. Вместе с тем, имеются примеры эффективного применения систем распознавания изолированных слов (или словосочетаний - голосовых команд) для решения частных задач в некоторых прикладных областях [1, 2, 3, 4, 5, 6].
Одними из таких перспективных областей применения речевых технологий являются обучающие и тренажерные системы. Однако о применении голосового управления в составе тренажерных систем можно найти лишь краткие упоминания или информационные сообщения [7, 8, 9, 10]. Возможно, это связано с тем, что практически все передовые тренажерные системы являются закрытыми военными разработками и какие-либо обширные исследования в данном направлении, как правило, не публикуются. Можно утверждать, что эта область исследований является недостаточно изученной и освещенной.
Задача голосового управления в составе тренажерных комплексов заключается в построении такой системы распознавания речевых команд, которая с достаточной надежностью распознавания и требуемым быстродействием обеспечивает распознавание команды, поданной оператором в микрофон, ее интерпретацию и трансляцию в управляющие сигналы тренажерной системы.
Речевое управление имеет определенные преимущества перед другими способами управления [И]: освобождаются руки оператора для выполнения другой работы; оператор не должен занимать фиксированную позицию; не имеют значения условия освещения, механической вибрации и так далее. Вместе с тем, имеются и недостатки: речевой сигнал (РС) подвержен шумовым помехам; применение речевого управления затруднено в условиях, когда речевой канал используется для выполнения другой работы (например, для радиосвязи с другими операторами).
Кроме того, если оценивать целесообразность голосового управления по времени взаимодействия, отсчитываемого от момента, когда пользователь приступает к выполнению задачи, и до момента, когда он получает ответ, то речевой ввод не всегда обеспечивает меньшее время взаимодействия по сравнению с другими видами управления. Его применение отдельно от других органов управления не дает положительного эффекта, а скорее наоборот, ухудшает оперативность. Поэтому голосовое управление должно функционировать совместно с существующими органами, стать дополнительным каналом ввода информации. Функционируя совместно, все каналы ввода информации позволяют устранить недостатки друг друга и повысить общую эффективность управления.
Применение голосового управления в составе тренажерных комплексов представляется целесообразным для следующих систем: системы контроля и управления тренировкой, в составе которой функции голосового управления предназначены для повышения удобства и оперативности управления системами тренажера со стороны инструкторов и руководителей тренировки; системы моделирования объекта, в составе которой функции голосового управления используются в обучающем процессе (например, обучение командира надводного корабля отдаче нужных команд в определенных ситуациях, управление техническими системами тренажера со стороны обучаемого).
В рамках данной работы рассматривается применение голосового управления в составе систем контроля и управления тренировкой тренажно-моделирующих систем (ТМС).
В последнее время в разработке систем распознавания речи появилась тенденция к созданию программных библиотек распознавания голосовых команд (в иностранной литературе называемых «Speech Recognition SDK»), добавляющих возможности голосового управления в использующие их программные комплексы. Такую библиотеку можно назвать командно-речевым интерпретатором (КРИ). Как правило, библиотеки КРИ специфичны и ориентированы на конкретную область приложений, но имеют наилучшие показатели надежности распознавания и возможность встраивания. Существуют библиотеки для систем телефонии, автоматических справочных, управления технологическим оборудованием и других приложений, однако, упоминания о применении КРИ в составе тренажерных систем в отечественной и зарубежной литературе встречаются крайне редко. В рамках диссертационной работы рассматривается разработка такой библиотеки для тренажерных систем и ее внедрение в составе конкретных тренажеров.
В данной работе для распознавания речевых образов (РО) предлагается использование схемы метода структурной аппроксимации одномерных временных образов, обладающей достаточной конструктивностью для построения на ее основе алгоритмов распознавания РО, а также небольшими вычислительными затратами в реализации и невысокими требованиями априорной информации для настройки. Ранее этот метод успешно применялся для оценивания параметров электрофизиологических сигналов (электрокардиограмм, сфигмограмм и др.), но для распознавания PC применяется впервые.
Целью данной диссертационной работы является разработка комплекса структурно-аппроксимационных алгоритмов синтеза и распознавания речевых образов и реализация на этой основе командно-речевого интерпретатора для управления сценариями тренировок в тренажно-моделирующих системах.
Для достижения указанной цели в диссертационной работе решаются следующие основные задачи исследования:
1. Анализ процессов формирования и реализации сценариев проведения тренировки и выработка требований к КРИ в составе ТМС.
2. Разработка и исследование комплекса алгоритмов цифровой обработки РС, предназначенных для синтеза и распознавания структурных РО.
3. Разработка функциональной модели КРИ для численной реализации схемы метода структурной аппроксимации и распознавания РО в составе пультов управления ТМС.
4. Разработка методики и соответствующих инструментальных средств формирования эталонных РО с учетом специфики ТМС.
5. Экспериментальные исследования эффективности применения КРИ в составе пультов контроля и управления ТМС.
Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК
Исследование и разработка алгоритмов и программ автоматического распознавания ограниченного набора команд вьетнамской речи2010 год, кандидат технических наук Нгуен Ван Хунг
Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть2001 год, кандидат технических наук Кисельман, Бронеслав Арнольдович
Разработка технических средств обмена речевой информацией с ЭВМ на основе клиппированных сигналов1984 год, кандидат технических наук Лисай, Николай Юрьевич
Аудиовизуальные речевые интерфейсы в ассистивных информационных технологиях2013 год, доктор технических наук Карпов, Алексей Анатольевич
Методы и программные средства многоканальной дистанционной обработки речи и их применение в интерактивных многомодальных приложениях2010 год, доктор технических наук Ронжин, Андрей Леонидович
Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Синецкий, Роман Михайлович
4.5. Выводы
1. Описана программная реализация КРИ в составе ПКУ в виде динамически загружаемой библиотеки с функциональным интерфейсом. Программные функции библиотеки позволяют выполнять инициализацию, управление библиотекой, получение результата распознавания и обработку ошибок. Конфигурация и база данных эталонов КРИ хранятся во внешних файлах заданной структуры, редактирование которых возможно при помощи соответствующего программного инструментария. Реализация в виде динамически загружаемой библиотеки является универсальным решением, которое позволяет однотипно использовать КРИ из различных модулей ТМС, подгружая библиотеку при необходимости, экономит дисковую и оперативную память ЭВМ ПКУ.
2. Представлена программная реализация полуавтоматической технологии формирования эталонов голосовых команд КРИ, и описан технологический процесс настройки эталонов. Особенностью предложенной технологии является участие оператора в процессе формирования эталонов, которое позволяет контролировать при формировании эталона результаты автоматической сегментации, выделения границ РС и исправлять ошибки автоматических процедур. Процесс формирования эталонов является интуитивно понятным и позволяет оператору с минимальной подготовкой в области цифровой обработки РС и прикладной фонетики получать качественные эталоны голосовых команд.
3. Предложены технологические приемы снижения количества ошибок распознавания КРИ, включающие в себя: запрос на подтверждение исполняемой команды, формирование списка наиболее вероятных команд, контекстное разделение команд. Эти приемы не влияют на показатель надежности распознавания КРИ, но их разработка и реализация существенно проще и легче совершенствования алгоритмов КРИ с целью повышения его показателя надежности.
4. Описано применение КРИ в составе конкретного тренажера, позволяющее подавать через микрофон ряд общесистемных команд тренажера. Часть этих команд требует подтверждения исполнения, которое может быть подано либо через микрофон, либо при помощи клавиатуры или мыши. В состав системного меню ПКУ добавлены команды включения, выключения режима голосового управления и выбора диктора.
ЗАКЛЮЧЕНИЕ
В работе рассмотрены применение метода структурной аппроксимации и распознавания одномерных временных образов для распознавания РО и разработка на его основе КРИ для использования в составе ТМС, удовлетворяющего требованиям этих систем. Основные результаты работы следующие:
1. Введено предположение о структурной детерминированности речеоб-разующего процесса, на основе этого предположения обоснована применимость метода структурной аппроксимации одномерных временных образов для распознавания РО.
2. Введена алгебра структурных речевых образов, позволяющая оперировать речевыми сигналами как со структурными объектами (структурными моделями речевых образов) и в комплексе применять как традиционные понятия и методы цифровой обработки сигналов, так и алгебраические понятия и методы структурной теории образов.
3. Схема метода структурной аппроксимации одномерных временных образов, применяемая ранее в задачах структурного анализа и оценивания параметров сигналов, впервые успешно применена к задаче распознавания речевых образов. Для реализации схемы структурной аппроксимации предложены конкретные формы представления структурных РО и виды критериев аппроксимации.
4. В рамках концепции структурной аппроксимации одномерных временных образов сформулирована математическая постановка задачи синтеза аппроксимационной модели для предложенных форм представления РО.
5. Разработаны оптимизационные схемы синтеза аппроксимационных моделей с использованием метода динамического программирования, получены соответствующие рекуррентные соотношения Беллмана, определяющие вычислительную схему синтеза.
6. В рамках проблематики распознавания речевых образов задача сегментации структурного образа, порождаемого структурно-детерминированным источником, сформулирована как задача его приведения к заданной мощности, определяемой мощностью структурно-детерминированного источника. Предложены постановки задач и разработаны алгоритмы сегментации/приведения структурных РО к заданной мощности. Рассмотрены вопросы влияния мощности деформированной модели на результат распознавания, и предложены способы обоснованного выбора мощности для достижения высокой надежности распознавания.
7. Разработана функциональная модель КРИ на основе метода структурной аппроксимации одномерных временных образов.
8. Разработаны инструменты формирования эталонных РО, пригодные для применения в составе ТМС и позволяющие добиться высокой надежности распознавания.
Научная значимость полученных результатов заключается в разработке комплекса оригинальных алгоритмов синтеза и распознавания РО, учитывающих естественные структурно-детерминированные свойства РС, и функциональной модели КРИ.
Практическая значимость полученных результатов заключается в реализации и эффективном применении КРИ для решения задач голосового управления в составе ТМС.
Результаты экспериментальной оценки надежности распознавания и вычислительной эффективности КРИ показали, что данные характеристики существенно зависят от способа представления РО и вида критерия аппроксимации. Перспективным направлением дальнейших исследований являются поиск более эффективных критериев аппроксимации и разработка новых способов представления, позволяющих повысить надежность распознавания и снизить вычислительную трудоемкость КРИ.
Другим перспективным направлением дальнейшего исследования струк-турно-аппроксимационного подхода к распознаванию РО является формализация и решение задачи синтеза эталонных (идеальных) моделей структурных
РО. Целью этих исследований является разработка инструментов и технологий формирования эталонных образов, простых в использовании и требующих минимального участия со стороны оператора, вместе с тем, синтезирующих качественные эталоны, позволяющие достигать высокой надежности распознавания.
Третьим перспективным направлением может быть дальнейшее исследование задачи сегментации структурных РО с целью разработки алгоритмов, позволяющих получать результаты сегментации, близкие к естественным фазам структурно-детерминированного речеобразующего процесса. Применение таких алгоритмов актуально как для задачи распознавания РО на основе метода структурной аппроксимации, так и для задачи формирования эталонных структурных моделей РО.
В данной диссертационной работе на примере использования в составе ТМС показано, что метод структурной аппроксимации является перспективным для применения в системах распознавания РО. Результаты экспериментов по оценке надежности и вычислительной трудоемкости КРИ показывают высокую эффективность применения метода. Полученные характеристики КРИ не хуже соответствующих характеристик аналогичных систем, а в некоторых аспектах применения в ТМС превосходят их.
Список литературы диссертационного исследования кандидат технических наук Синецкий, Роман Михайлович, 2008 год
1. Леонович, A.A. Современные технологии распознавания речи / A.A. Леонович // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог'2005» (Звенигород, 1-6 июня, 2005 г.) / Под ред. И.М. Кобозевой,
2. A.C. Нариньяни, В.П. Селегея. М.:Наука, 2005. - 616 с.
3. Методы автоматического распознавания речи: в 2-х книгах. Пер. с англ. / Под. ред. У. Ли.-М.: Мир, 1983.-Т. 1.-328 с.
4. Методы автоматического распознавания речи: в 2-х книгах. Пер. с англ./ Под. ред. У. Ли.-М.: Мир, 1983.-Т. 2.-392 с.
5. Обжелян, Н. К. Речевое общение в системах «Человек-ЭВМ» / Н. К. Обжелян, В. Н. Трунин-Донской. Кишинев: «Штиинца», 1985.-176 с.
6. Козадаев, Б.П. Теоретико-методологические основания проблемы автоматического распознавания и понимания речи / Б.П. Козадаев. М.: ВЦ АН СССР, 1991 - 64 с.
7. Вопросы кибернетики. Анализ и синтез речи в системах управления / Под ред. В. Н. Емельянова. -М.: Изд. ВИНИТИ, 1981. 152 с.
8. Speech recognition: Wikipedia, The free encyclopedia Электронный ресурс. / Электрон, дан. Режим доступа: http://en.wikipedia.org/wiki/Speechrecognition/, свободный.
9. The CMU Sphinx Group Open Source Speech Recognition Engines Электронный ресурс. / Sphinx Group, Carnegie Mellon University Электрон, дан. - Режим доступа: http://cmusphinx.sourceforge.net/html/cmusphinx.php/, свободный.
10. Современные тренажерные технологии Электронный ресурс. / ЗАО «КоШэ». Электрон. дан. - Режим доступа: http://www.traintech.ru/, свободный.
11. Центр речевых технологий Электронный ресурс. / Электрон, дан. Режим доступа: http://speechpro.ru/, свободный.
12. Потапова, Р.К. Речевое управление роботом: лингвистика и современные автоматизированные системы / Р.К. Потапова. М.:КомКнига, 2005. - 328 с.
13. ГОСТ 26387-84. Система человек-машина. Термины и определения. / Государственный комитет СССР по стандартам. М., 1984.
14. Тренажерные комплексы и тренажеры. Технологии разработки и опыт эксплуатации /
15. B. Е. Шукшунов, В. В. Циблиев, С. И. Потоцкий и др. Под ред. В. Е. Шукшунова. М.: Машиностроение, 2005. - 384 с.
16. Huang, X. Spoken Language Processing: a guide to theory, algorithm, and system development / X. Huang, A. Acero, H.-W. Hon. USA, New Jersey: Prentice-Hall, 2001. - 980 c.
17. Харт, Дж. М. Системное программирование в среде Microsoft Windows / Дж. M. Харт-М.: Вильяме, 2005. 592 с.
18. AudiTech, Ltd (ООО «ОДИТЕК») Электронный ресурс. / Электрон, дан. Режим доступа: http://www.auditech.ru/, свободный.
19. Научно-производственный центр «Истра-Софт» Электронный ресурс. / Электрон, дан. Режим доступа: http://www.istrasoilt.ru/, свободный.
20. Philips Speech Recognition Электронный ресурс. / Электрон, дан. — Режим доступа: http://www.speechrecognition.philips.com/, свободный.
21. Microsoft Speech Technologies Электронный ресурс. / Электрон, дан. Режим доступа: http://www.microsoft.com/speech/, свободный.
22. Nuance Communications Электронный ресурс. / Электрон, дан. Режим доступа: http://www.nuance.com/, свободный.
23. BBN Technologies Электронный ресурс. / Электрон, дан. Режим доступа: http://wvvw.bbn.com/, свободный.
24. AT&T Lab Research. Watson ASR Электронный ресурс. / Электрон, дан. Режим доступа: http://www.research.att.com/, свободный.
25. Voice Recognition. 21st Century Eloquence, Inc. Электронный ресурс. / Электрон, дан. -Режим доступа: http://www.voicerecognition.com/, свободный.
26. Стэл Компьютерные Системы. Распознавание речи, речевые технологии Электронный ресурс. / Электрон, дан. - Режим доступа: http://www.stel.ru/speech/, свободный.
27. Wang, Y.-Y. Is word error rate a good indicator for spoken language understanding accuracy / Y.-Y. Wang, A. Acero, С. Chelba // IEEE Workshop on ASRU '2003, 30 Nov.-3 Dec. 2003 -p. 577-582.
28. Soft-Forum. Обзоры программного обеспечения. Электронный ресурс. / Электрон, дан.- Режим доступа: http://www.soft-forum.ru/forum/, свободный.
29. Софт-боард. Обзоры программного обеспечения. Электронный ресурс. / Электрон, дан. Режим доступа: http://www.softboard.ru/forum/, свободный.
30. Речевые технологии. Информационный портал. Электронный ресурс. / Электрон, дан.- Режим доступа: http://speech-soft.ru/, свободный.
31. Форум глухих, слабослышащих и всех. Электронный ресурс. / Электрон, дан. Режим доступа: http://www.deafnet.ru/forum/, свободный.
32. Информационное агентство «Пари» Электронный ресурс. / Электрон, дан. Режим доступа: http://vvwvv.pari.ru/, свободный.
33. Макс, Ж. Методы и техника обработки сигналов при физических измерениях: В 2-х томах. Пер. с франц. / Ж. Макс. М.: Мир, 1983. - Т.1 - 312 с.
34. Златоустова, JI. В. Общая и прикладная фонетика. Учебное пособие / JI. В. Златоустова, Р. К. Потапова. В. Н. Трунин-Донской М.: Изд-во МГУ, 1986. - 304 с.
35. Pickles, J.O. An Introduction to the Physiology of Hearing / J.O. Pickles USA, New York: «Academic Press», 1983. - 311 c.
36. Применение цифровой обработки сигналов / Под ред. А. Оппенгейма. М.: Мир, 1980552 с.
37. Потапова, Р.К. Речь: коммуникация, информация, кибернетика: Учебное пособие. Изд. 3-е, стереотипное / Р.К. Потапова М.: Едиториал УРСС, 2003. - 568 с.
38. Рамишвили, Г.С. Автоматическое опознавание говорящего по голосу / Г.С. Рамишвили- М.: Радио и связь, 1981. 224 с.
39. Фланаган, Д.Л. Анализ, синтез и восприятие речи. Пер. с англ. / Д.Л. Фланаган. М.: Связь, 1968.-198 с.
40. Горелик, A.J1. Методы распознавания. Учеб. пособие для вузов / A.JI. Горелик, В.А. Скрипкин. М.: «Высш. Школа», 1977. -222 с.
41. Горелик, AJI. Современное состояние проблемы распознавания: Некоторые аспекты / A.JI. Горелик, И.Б. Гуревич, В.А. Скрипкин. М.: «Радио и связь», 1985. - 160 с.
42. Загоруйко, Н. Г. Методы распознавания и их применение / Н.Г. Загоруйко -М.:«Советское радио», 1972. 208 с.
43. Винцюк, Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винцюк. -Киев: «Наук. Думка», 1987. 264 с.
44. Renals, S. Using Speech Recognition / S. Renals // ITNOW.- 1996 № 38 (6).- c. 27-72.
45. Itakura, F. Minimum prediction residual principle applied to speech recognition / F. Itakura // IEEE Trans. Acoustics, Speech, and Signal Proc. 1975. - vol.23.- c. 52-72.
46. Фу, К. Структурные методы в распознавании образов. Пер с англ./ К. Фу М.: Мир, 1977.-320 с.
47. Brown, P.F. Class-based n-gram models of natural language / P.F. Brown, V.J. Delia Pietra, P.V. deSouza, J.C. Lai, R.L. Mercer. // Computer Linguistics.-1992.-№18(4).-c. 467-479.
48. Круглов, В.В. Искусственные нейронные сети. Теория и практика / В.В. Круглов, В.В. Борисов -М.: Горячая линия-Телеком, 2001.-382 с.
49. Шевелев, А. Нейронные сети и распознавание образов / А. Шевелев // Программист. — 2001.-№10. с. 54-66.
50. Уоссерман, Ф. Нейрокомпьютерная техника: теория и практика / Ф. Уоссерман М.: Мир, 1985.-с. 294.
51. Рутковская Д. Нейронные сети, генетические алгоритмы и нечеткие системы / Д. Рут-ковская, М. Пилиньекий, JT. Рутковский М.: Горячая линия-Телеком, 2007 — 452 с.
52. Schmid, Н. Part-of-Speech Tagging with Neural Networks Электронный ресурс. / H. Schm-id // Proceeding of COLING-1994, ppl72-176 / Электрон, дан. Режим доступа: http://acl.ldc.upenn.edU/C/C94/C94-1027.pdf, свободный. - Электрон, версия печ. публикации.
53. Sameti, Н. HMM-Based Strategies for Enhancement of Speech Signals Embedded in Nonsta-tionary Noise / H. Sameti. H. Sheikhzadeh, L. Deng, L. Brennan // Trans, of IEEE on Speech and Audio Processing. 1998-№ 5 (9), vol. 6- c. 445-455.
54. Rabiner, L.R. A Tutorial on Hidden Markov Models and Selected Application in Speech Recognition / L.R. Rabiner // Proc. of IEEE. -1989.- № 77 (2).-c. 257-286.
55. Pylkkonen, J. Duration Modeling Techniques for Continuous Speech Recognition / J. Pylkkonen, M. Kurimo // Proc. of the 8th ICSLP'04 (Interspeech 2004), October 4-8.-Jeju Island, Korea, 2004 -c. 385-388.
56. Ostendorf, M. From HMM's to Segment Models: A Unified View of Stochastic Modeling for Speech Recognition / M. Ostendorf, V.V. Digalakis, O.A. Kimball // Trans, of IEEE on Speech and Audio Processing.- 1996.-№ 5 (9), vol. 4.- c. 360-378.
57. Гавриков, M.M. Метод структурной аппроксимации в обработке сигналов и экспериментальных кривых / М.М. Гавриков, А.Н. Иванченко // Изв. вузов. Электромеханика-1992.- №5.- с. 67-79.
58. Гавриков, М.М. Конструирование алгоритмов структурной аппроксимации сигналов / М.М. Гавриков, А.Н. Иванченко // Изв. вузов. Электромеханика.-1995.-№1-2.-е. 104112.
59. Гавриков, М.М. Оптимизационная процедура синтеза структурно-аппроксимационной модели сигнала на основе вероятностных критериев / М.М. Гавриков, А.Н. Иванченко; Новочерк. гос. техн. ун-т.-Новочеркасск, 1995.-9 с.-Деп. В ВИНИТИ 13.03.95. №662-В95.
60. Гавриков, М.М. Автоматизация процессов обработки информации в кабинетах функциональной диагностики / М.М. Гавриков, Н.Д. Листопад; Юж.-Рос. гос. техн. ун-т. Новочеркасск, 2000.-18 с.-Деп. в ВИНИТИ 24.04.2000 г. №1145-ВОО.
61. Гавриков, М.М. Структурная аппроксимация и распознавание одномерных временных образов. Концепция и применения / М.М. Гавриков // Изв.вузов. Электромеханика. -2003.-№6.-с. 52-60.
62. Гренадер, У. Лекции по теории образов. Пер. с англ. В 2-х томах / У. Гренадер М.: Мир, 1976-Т.1 -382 с.
63. Гренадер, У. Лекции по теории образов. Пер. с англ. В 2-х томах / У. Гренадер М.: Мир, 1976-Т.2-446 с.
64. Пелед, А. Цифровая обработка сигналов: Теория, проектирование, реализация: Пер. с англ / А. Пелед, Б. Лиу Киев: Вища школа. Головное изд-во, 1979. - 264 с.
65. Цифровая обработка сигналов: Справочник / Л. М. Голденберг, Б. Д. Матюшкин, M. Н. Поляк. М.: Радио и связь, 1985. - 312 с.
66. Гавриков, М.М. Алгоритмическая и численная реализация структурно-аппроксимационного метода распознавания речевых образов / М.М. Гавриков, P.M. Си-нецкий // Изв. вузов: Электромеханика. 2007.-№2. - с 51-59.
67. Арис, Р. Дискретное динамическое программирование. Введение в оптимизацию многошаговых процессов. Пер. с англ. / Арис Р, под ред. Б.Т. Поляка.-М.:Мир, 1969.-172 с.
68. Беллман, Р. Введение в теорию матриц / Р. Беллман М.: Наука, 1976. - 375 с.
69. Гавриков, М.М. Технология синтеза структурно-аппроксимационных эталонов речевых образов в командно-речевых интерпретаторах / М.М. Гавриков, P.M. Синецкий // Изв. вузов. Электромеханика. 2005. -№ 1.-е. 40-46.
70. Оппенгейм, А. В. Цифровая обработка сигналов: Пер. с англ./ А. В. Оппенгейм, Р. В. Шафер, под ред. A.C. Ненашева. М.: Техносфера, 2006. - 856 с.
71. Маклаков, С. В. Моделирование бизнес-процессов с AllFusion Process Modeler / С. В. Маклаков М.: Диалог-Мифи, 2002. - 240 с.
72. Феллер, В. Введение в теорию вероятностей и ее приложения. В 2-х томах. Пер. с англ./ В. Феллер. М.: Мир, 1984.-Т. 1-528 с.
73. Левин, Б.Р. Теоретические основы статистической радиотехники. В трех томах / Б.Р. Левин. М.: «Сов. радио», 1975. - Т.2 - 392 с.
74. Левин, Б.Р. Теоретические основы статистической радиотехники. В трех томах / Б.Р. Левин. М.: «Сов. радио», 1976. - Т.З - 288 с.
75. Ерохин, А.Н. Обнаружение сигнала на фоне пуассоновской помехи / А.Н. Ерохин, И.В. Тиме // Автоматика и телемеханика-1987.-№5 .-с. 174-178.
76. Борисенко, В.И. Сегментация изображения (состояние проблемы) / В.И. Борисенко, A.A. Златопольский, И.Б. Мучник // Автоматика и телемеханика.-1987.-№7.-с.З-56.
77. Коган, И.А. Оптимальная сегментация структурных экспериментальных кривых на основе метода динамического программирования / И.А. Коган // Автоматика и телемеханика.-! 983.-№7.-с. 146-156.
78. Воробьев, С.А. Алгоритмы выделения и классификации фрагментов повторяющейся формы на экспериментальных кривых / C.A. Воробьев // Автоматика и телемеханика-1985.-№8.-с.89-93.
79. Боденштайн, Г. Выделение признаков из электроэнцефалограммы методом адаптивной сегментации / Г. Боденштайн, X. М. Преториус // ТИИЭР.- 1977.-№ 5(65). с. 59-72.
80. Златопольский, A.A. Сегментация изображения по границам с разрывами / A.A. Злато-польский // Автоматика и телемеханшса.-1985.-№9.-с. 109-117.
81. Рабинер, Л. Р. Цифровая обработка речевых сигналов: Пер. с англ./ Л. Р. Рабинер, Р. В. Шафер / Под. ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь, 1981. - 496 с.
82. Моттль, В.В. Сегментация структурных кривых на основе метода динамического программирования / В.В. Моттль, И.Б. Мучник // Автоматика и телемеханика.-1985.-№1— с.101-108.
83. Моттль, В.В. Оптимальная сегментация экспериментальных кривых / В.В. Моттль, И.Б. Мучник, В.Г. Яковлев // Автоматика и телемеханика.-1983.-№8.-с.84-98.
84. Моттль, В.В. Алгоритмическая реализация лингвистического подхода к анализу экспериментальных кривых / В.В. Моттль, И.Б. Мучник, В.Г. Яковлев // Автоматика и телемеханика -1984.-№4.-с.5-25.
85. Сорокин, В.Н. Сегментация и распознавание гласных / В.Н. Сорокин, А.И. Цыплихин // Информационные процессы 2004- № 2, т. 4.-е. 202-220.
86. Валуева, Н.М. Автоматическая сегментация речевого сигнала по динамической спектрограмме / Н.М. Валуева, Е.Б. Каничева М.: ВЦ АН СССР, 1988.- 12 с.
87. Залманзон, Jl. А. Преобразования Фурье, Уолша, Хаараи их применение в управлении, связи и других областях / Л.А. Залманзон М.:Наука.Гл.ред.физ.-мат.лит., 1989. - 496 с.
88. Нуссбаумер, Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток: Пер. с англ./ Г. Нуссбаумер М.: Радио и связь, 1985.-248 с.
89. Лайонс, Р. Цифровая обработка сигналов: второе издание. Пер. с англ. / Р. Лайонс М.: ООО «Бином-Пресс», 2006. - 656 с.
90. Марпл, С. Л.-мл. Цифровой спектральный анализ и его приложения: Пер. с англ. / С. Л. Марпл-мл. М.: Мир, 1990. - 584 с.
91. Блейхут, Р. Быстрые алгоритмы цифровой обработки сигналов: Пер. с англ. / Р. Блейхут -М.: Мир, 1989.-448 с.
92. Маккделлан, Дж. Г. Применение теории чисел в цифровой обработке сигналов: Пер. с англ. / Дж. Г. Маккделлан, Ч. М. Рейдер / Под ред. Ю. И. Манина. М.: Радио и связь, 1983.-264 с.
93. Бахвалов, Н.С. Численные методы. В 2-х томах. / Н.С. Бахвалов — М.: Наука, 1975. — Т.1 632 с.
94. Березин, И.С. Методы вычислений. В 2-х томах / И.С. Березин, Н.П. Жидков М.: Физматит.,1966. - Т.1 - 632 с.
95. Холл, М. Комбинаторика. Пер. с англ. / М. Холл М.: Мир, 1970. - 424 с.
96. Intel, Inc. Электронный ресурс. / Электрон, дан. Режим доступа: www.intel.com, свободный.
97. Multiple Channel Audio Data and WAVE Files Электронный ресурс. / Электрон, дан. -Режим доступа: http://www.microsoft.com/whdc/device/audio/multichaud.mspx, свободный.
98. Орлов, С. Технологии разработки программного обеспечения. 3-е изд. / С. Орлов -СПб.: Питер, 2004.-527 с.
99. Дейт, К. Дж. Введение в системы баз данных, 6-е издание: Пер. с англ. / К. Дж. Дейт -К., М., СПб.: Издательский дом «Вильяме», 2000. 848 с.
100. Тутевич, В.Н. Телемеханика. Изд. 2. / В.Н. Тутевич М.: Высшая школа, 1985. - 424 с.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.