Исследование алгоритмов обработки речевых сигналов при распознавании команд в системах компьютерной телефонии тема диссертации и автореферата по ВАК РФ 05.12.13, кандидат технических наук Левин, Кирилл Евгеньевич
- Специальность ВАК РФ05.12.13
- Количество страниц 148
Оглавление диссертации кандидат технических наук Левин, Кирилл Евгеньевич
Введение.
1. Анализ факторов, влияющих на достоверность автоматического распознавания голосовых команд в компьютерной телефонии.
1.1. Факторы, определяющие достоверность распознавания.
1.2. Методы повышения помехоустойчивости системы распознавания голосовых команд.
1.3. Выбор системы параметров речевого сигнала.
Выводы к главе 1.
2. Оценка достоверности распознавания и исследование алгоритмов обработки речевых сигналов.
2.1. Методы оценки достоверности распознавания.
2.1.1. Анализ влияния помех на достоверность распознавания.
2.1.2. Анализ влияния параметров моделей голосовых команд на достоверность распознавания.:.
2.2. Поэтапное построение моделей команд с контролем качества моделей на каждом этапе.
2.3. Исследование алгоритмов подавления помех.
2.3.1. Использование фильтра Винера.
2.3.2. Адаптивная компенсация помех.
Выводы к главе 2.'.
3. Программный комплекс для исследований алгоритмов обработки речевого сигнала.
3.1. Требования, предъявляемые к комплексу.
3.2. Структура комплекса и особенности его реализации.
3.3. Оценка достоверности распознавания и исследование алгоритмов обработки речевых сигналов средствами комплекса.
3.3.1. Оценка достоверности распознавания.
3.3.2. Определение параметров огибающей кратковременного спектра сигнала.
3.3.3. Определение частоты основного тона.
3.3.4. Компенсация помех.v.
Выводы к главе 3.
4. Система прямого доступа к абонентам учрежденческой АТС, управляемая голосовыми командами.
4.1. Общая характеристика системы.
4.2. Особенности аппаратного обеспечения.
4.3. Структура программного обеспечения.
4.4. Алгоритм построения моделей голосовых команд.
Выводы к главе 4.
Рекомендованный список диссертаций по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Разработка средств исследования и повышения помехоустойчивости систем автоматического распознавания голосовых команд в телефонии2014 год, доктор наук Левин Евгений Калманович
Структурно-аппроксимационные методы распознавания речевых образов и их применение в тренажно-моделирующих системах2008 год, кандидат технических наук Синецкий, Роман Михайлович
Разработка и исследование алгоритмов распознавания речи для голосового управления через телефонную сеть2001 год, кандидат технических наук Кисельман, Бронеслав Арнольдович
Автоматизация процесса верификации абонентов АСУ с речевым управлением2008 год, кандидат технических наук Катков, Олег Николаевич
Выделение и предобработка сигналов в системах автоматического распознавания речевых команд2011 год, кандидат технических наук Новоселов, Сергей Александрович
Введение диссертации (часть автореферата) на тему «Исследование алгоритмов обработки речевых сигналов при распознавании команд в системах компьютерной телефонии»
Актуальность темы
Растущие возможности вычислительной техники стимулируют развитие систем компьютерной телефонии. Эти системы позволяют значительно расширить ассортимент услуг, которые пользователь может получить по телефону, не прибегая к помощи человека - оператора. Это и заказ авиабилетов, и операции с банковским счетом, и автоматическая переадресация телефонного вызова в учрежденческих автоматических телефонных станциях. Развитие таких услуг требует повышения «интеллекта» подсистем автоматического речевого ответа, входящих в состав систем компьютерной телефонии. Одним из направлений развития-систем речевого ответа является использование систем автоматического распознавания речи. Такие системы позволяют перейти к привычному для пользователя голосовому способу общения с автоматом и сократить время обработки телефонных вызовов [50].
Современная система распознавания речи для компьютерной телефонии -это сложная структура, объединяющая в себе программную и аппаратную составляющие. Алгоритмы, которые сейчас наиболее широко используются при цифровой обработке речевых сигналов, базируются на теории скрытых марковских процессов. Теоретические основы систем цифровой обработки сигналов и распознавания речи были заложены такими зарубежными и отечественными учеными, как Маркел Дж.Д., Оппенгейм А.В., Рабинер JI.P., Стирнз С., Фланаган Дж., Шафер Р.В.,, Уидроу Б., Винцюк Т.К., Галунов В.И., Потапова Р.К.
Хотя в последние годы системы автоматического распознавания речи стали интенсивно внедряться в системы компьютерной телефонии, тем не менее следует отметить во многом эмпирический подход, который используется разработчиками при создании систем распознавания. Проблема состоит в том, что до сих пор остается много неясного в механизме восприятия речи человеком (именно на этих механизмах сосредоточено внимание многих исследователей в области автоматического распознавания речи). Поэтому параметры алгоритмов обработки речевых сигналов, которые используются при распознавании речи, часто подбираются экспериментально путем тестирования систем распознавания большими выборками голосовых команд, что требует больших затрат времени.
При разработке системы автоматического распознавания речи решаются две основные задачи:
- выбирается совокупность алгоритмов обработки речевых сигналов, порядок их применения, обеспечивающие выполнение требований технического задания;
- для каждого алгоритма определяются значения параметров, при которых алгоритм работает наиболее эффективно.
Для решения этих задач используются специализированные инструментальные средства.
Для исследования и разработки систем распознавания речи во всем мире широко используется система НТК (Hidden Markov Toolkit), разработанная группой ученых кембриджского университета совместно с фирмой Microsoft [89]. Она реализует основные алгоритмы обработки речевых сигналов и обеспечивает создание модели системы распознавания на их основе. Однако средств оптимизации и настройки систем распознавания, реализованных в НТК, недостаточно для проведения полноценных исследований. Кроме того, система НТК предлагает несколько возможных методов параметрического описания речевого сигнала, однако выбор этих параметров целиком возложен на пользователя системы. В НТК отсутствуют некоторые блоки, необходимые для реализации автоматического распознавания речи в системах компьютерной телефонии, например блок подавления помех и блок построения речевого меню. Отсутствуют средства обработки результатов исследования.
Другой программный исследовательский комплекс MATLAB (вместе с пакетом Digital Signal Processing) от компании Mathworks [44] обладает широкими возможностями по исследованию устройств цифровой обработки сигналов. Тем не менее, в нем отсутствуют специализированные средства исследования блоков обработки речевого сигнала, использующихся в распознавании речи.
Исходя из вышеизложенного, актуальной является задача создания инструментальных средств разработки систем автоматического распознавания речи для компьютерной телефонии, позволяющих определить порядок использования алгоритмов обработки речевых сигналов, а также их параметры.
Цель диссертационной работы заключается в исследовании алгоритмов обработки речевого сигнала, применяемых при автоматическом распознавании голосовых команд для систем компьютерной телефонии, и разработке на базе этих исследований специализированных инструментальных средств проектирования систем автоматического распознавания голосовых команд.
Для достижения поставленной цели необходимо решение следующих задач:
1. Анализ факторов, снижающих достоверность распознавания голосовых команд;
2. Разработка методов исследования алгоритмов обработки речевого сигнала в системах распознавания;
3. Разработка структуры комплекса инструментальных средств для проектирования систем распознавания;
4. Реализация комплекса инструментальных средств и его апробация путем проектирования системы автоматического распознавания голосовых команд для практического использования.
Методы исследования. При проведении исследований в диссертационной работе использовались математический аппарат теории случайных процессов, методы математической статистики, теории-адаптивной фильтрации, теории цифровой фильтрации. Анализ полученных решений проводился моделированием на ЭВМ.
Научная новизна состоит в следующем:'
1. Предложен критерий оценки достоверности распознавания голосовых команд, который позволяет оценить достоверность систем распознавания голосовых команд, имеющих малую относительную частоту ошибок.
2. Разработан многоэтапный алгоритм определения параметров моделей скрытого марковского процесса с контролем качества создаваемых моделей на каждом этапе.
3. На базе выявленного в работе состава типовых процедур обработки сигналов и данных, применяемых при исследовании систем автоматического распознавания голосовых команд, разработана структура комплекса инструментальных средств для исследования и проектирования таких систем.
Практическая ценность полученных результатов заключается в следующем:
1. Разработан программный комплекс, позволяющий создавать различные инструментальные средства для исследования алгоритмов обработки речевых сигналов из отдельных блоков методом визуального программирования. В состав комплекса входит 56 функциональных блоков.
2. Разработана методика проектирования системы автоматического распознавания голосовых команд, используемых в компьютерной телефонии.
3. Разработана система автоматического распознавания голосовых команд, используемых в компьютерной телефонии. Относительная частота ошибок распознавания в системе не превышает 3%, что значительно меньше допустимого порога в 5%.
4. Разработана система прямого доступа абонентов городской телефонной автоматической станции к абонентам автоматической телефонной станции учреждения. Особенностью системы является использование автоматического распознавания голосовых команд, что позволяет абонентам ГТС использовать телефонные аппараты, как с импульсным, так и с тональным набором номера. За счет программной реализации большей части служебных функций удалось снизить стоимость аппаратных средств по сравнению с аналогичными решениями в 6 раз.
Внедрение
1. Созданная на основе результатов диссертационной работы система прямого доступа к абонентам учрежденческой АТС с голосовым управлением используется в городском информационно-методическом центре г. Владимира.
2. Результаты научной работы автора использованы в коммерческом проекте SMARTKOM университета Фридриха-Александра (г.Эрланген, Германия).
3. Созданный программный комплекс для исследования алгоритмов обработки речевых сигналов используется в научно-техническом центре ОАО «Завод Автоприбор». Также этот комплекс внедрен в учебный процесс Владимирского государственного университета на кафедре радиотехники и радиосистем и используется в лабораторном практикуме дисциплины «Моделирование устройств компьютерной телефонии».
На защиту выносятся:
1. Критерий оценки достоверности распознавания, позволяющий проанализировать влияние различных факторов на функционирование системы автоматического распознавания с малым значением относительной частоты ошибок распознавания.
2. Многоэтапный алгоритм создания моделей голосовых команд, позволяющий создать инструментальное средство для обучения системы распознавания.
3. Результаты моделирования алгоритмов компенсации помех для систем распознавания голосовых команд, позволившие оценить границы применимости этих алгоритмов.
4. Комплекс программных средств, позволяющий проводить исследования алгоритмов обработки речевых сигналов в системах распознавания речи.
Апробация работы. По материалам диссертации автором сделано 18 докладов, в том числе 14 докладов на международных конференциях. В частности, два доклада сделаны на международных конференциях «SPECOM» (г.Патрас (Греция) - 2005г.; г.Москва - 2003г.).
Работа «Программный комплекс моделирования устройств обработки речевых сигналов» награждена Грамотой Президиума центрального совета
РНТО РЭС им. А.С. Попова и журнала «Радиотехника» на Всероссийском конкурсе студенческих работ в 2004г.
Работа «Использование фильтра Винера для обработки речевых сигналов при автоматическом распознавании голосовых команд» отмечена как одна из лучших в конкурсной программе Международной научно-технической школы-конференции «Молодые ученые - 2005».
Публикации. По теме диссертации опубликована 21 работа, в том числе 3 статьи в центральных рецензируемых журналах, 14 статей в трудах международных конференций и симпозиумов.
Структура работы. Диссертация состоит из введения, четырех глав, заключения, приложений, списка литературы, имеющего 91 наименование отечественных и зарубежных источников, в том числе 21 работа автора. Общий объем диссертации 129 страниц, в том числе, 101 страница основного текста, 10 страниц списка литературы, 61 рисунок, 3 таблицы и 19 страниц приложений.
Похожие диссертационные работы по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Информативные признаки на основе линейных спектральных корней в системах распознавания речевых команд2010 год, кандидат технических наук Гладышев, Константин Константинович
Разработка эффективных методов и комплексов программ распознавания речи в системах человеко-машинного взаимодействия2010 год, кандидат технических наук Гребнов, Сергей Викторович
Методы и модели распознавания русской речи в информационных системах2014 год, кандидат наук Гусев, Михаил Николаевич
Аудиовизуальные речевые интерфейсы в ассистивных информационных технологиях2013 год, доктор технических наук Карпов, Алексей Анатольевич
Заключение диссертации по теме «Системы, сети и устройства телекоммуникаций», Левин, Кирилл Евгеньевич
Выводы к главе 4
1. Разработанная система прямого доступа абонента городской телефонной сети к абонентам учрежденческой АТС обеспечивает удобный для пользователя голосовой интерфейс с автоматом. Возможно использование телефонных аппаратов, как с импульсным, так и тональным набором номера
2. Разработан алгоритм построения моделей ГК, обеспечивающий высокую достоверность распознавания ГК.
3. Разработанное аппаратное обеспечение позволяет подключить СПД к УАТС без уменьшения числа телефонных линий УАТС, используемых работниками учреждения.
4. Испытания СПД показали, что относительная частота ошибок распознавания ГК не превышает 3%, что обеспечивает ее удобную для пользователя эксплуатацию.
5. Система может быть расширена для крупных учреждений с несколькими внешними телефонными линиями за счет использования более сложного аппаратного обеспечения - голосовых плат. При этом наиболее сложная часть программного обеспечения - система распознавания голосовых команд - останется неизменной.
Заключение
1. На основе анализа факторов, снижающих достоверность распознавания голосовых команд, предложен критерий оценки достоверности систем автоматического распознавания, предназначенный для сравнения систем с малой относительной частотой ошибок.
2. Предложен поэтапный алгоритм определения параметров МСМП, регламентирующий порядок постепенного повышения точности модели при ее построении. Данный алгоритм позволяет контролировать точность создаваемых моделей на каждом этапе, что дает возможность избежать неверных шагов при выборе параметров моделей.
3. Предложены методы исследования алгоритмов определения параметров речевого сигнала: частоты основного тона, коэффициентов частной корреляции.
4. Разработан программный комплекс, позволяющий создавать различные инструментальные средства для автоматизированного исследования алгоритмов обработки речевых сигналов из отдельных блоков методом визуального программирования.
5. Разработана система прямого доступа абонентов городской телефонной автоматической станции (ГТС) к абонентам автоматической телефонной станции учреждения. Особенностью системы является использование автоматического распознавания голосовых команд, что позволяет абонентам ГТС использовать телефонные аппараты как с импульсным, так и с тональным набором номера.
6. Результаты проделанной работы могут быть использованы при создании различных информационных систем компьютерной телефонии: систем прямого доступа, справочных служб организаций, систем автоматического предоставления услуг по телефону.
Список литературы диссертационного исследования кандидат технических наук Левин, Кирилл Евгеньевич, 2006 год
1. Аппараты телефонные общего применения. Общие технические условия: ГОСТ 7153-85. Введ. 01.01.87. - М., 1986.
2. Скляр Б. Цифровая связь. Теоретические основы и практическое применение / Бернард Скляр. Пер. с англ. - 2-е изд., испр. - М.: Вильяме, 2003. - 1104 с.
3. Баден П. Алгоритм вычисления площадей поперечных сечений речевого тракта / П. Баден, И.С. Макаров, В.Н. Сорокин // Акустический журнал, 2004. т. 50, № 6, С. 739-745.
4. База речевых фрагментов русского языка «ISABASE» / Д.С. Богданов, О.Ф. Кривнова, А.Я. Подрабинович, В.В. Фарсобина. // Интеллектуальные технологии ввода и обработки информации. М., 1998.
5. Бондарко JI.B. Звуковой строй современного русского языка: Учебное пособие для вузов / JI.B. Бондарко. М.: Просвящение, 1977. - 175 с.
6. Галунов В. И. Бионическая модель системы распознавания речи / В. И. Галунов // Исследование моделей речеобразования и речевосприятия. JL: Наука, 1981.-С. 36—51.
7. Галунов В.И. Речь как система / В. И. Галунов // Сборник трудов XIII сессии Российского акустического общества. -М., 2003. -т.З, С.19-21.
8. Галунов В.И. Помехоустойчивость как системообразующий фактор речи / В. И. Галунов // Проблемы и методы экспериментально-фонетических исследований. Материалы докладов международной научно-технической конференции. - М., 2002. - С.205-300. '
9. Галунов В.И Обеспечение помехоустойчивости при обработке информации в слуховой системе / В.И. Галунов, И. В. Королева // Сенсорные системы, т.2,№2. -М., 1988.
10. Гуров С.И. Оценка надежности классифицирующих. алгоритмов / С.И. Гуров. М.: Издательский отдел ф-та ВМиК МГУ, 2002. - 45 с.
11. Каналы и тракты магистральной первичной сети единой автоматизированной системы связи. Электрические параметры и методы измерений: ГОСТ 21655-87.-Введ. 29.09:87-М., 1987.
12. Колтун В. USD как альтернатива ISA интерфейсу в устройствах ввода-вывода / Шевердин А. // Компоненты и технологии, 19.10.2000,- online версия <http://www.cornpitech.ru>
13. Левин Е.К. Моделирование системы автоматического распознавания голосовых команд / Е.К. Левин, К.Е. Левин // Обработка сигналов в системах телефонной связи и вещания Материалы докладов одиннадцатой межрегиональной конференции. - М., 2002. - С.63-65.
14. Левин Е.К. Система для исследования алгоритма распознавания речевых сигналов / Е.К. Левин, К.Е. Левин // Биомедицинские технологии и радиоэлектроника. 2004. - №3. - С.28-32.
15. Левин Е.К. Удаление пауз из речевого сигнала / Е.К. Левин, К.Е. Левин // Проектирование и применение радиотехнических устройств. Тезисы124 "докладов областной научно-технической . конференции молодых специалистов и студентов. Владимир, 2000. - С.З.
16. Левин Е.К. Экспериментальное исследование системы дикторонезависимого распознавания голосовых команд / Е.К. Левин, К.Е. Левин // Телекоммуникационные и вычислительные системы Материалы докладов конференции. - М., 2004. - С.159-162.
17. Левин Е.К. Использование программного моделирующего комплекса для исследования точности оценки огибающей спектра речевого сигнала / Е.К. Левин, К.Е. Левин, О.Р. Никитин // Проектирование и технология электронных средств. 2004. - № 1. - С.49-53.
18. Левин Е.К. Экспериментальные исследования системы распознавания голосовых команд / Е.К. Левин, К.Е. Левин, О.Р. Никитин // Проектирование и технология электронных средств. 2005;•-№ 3. - С.З 8-44.
19. Левин К.Е. Моделирование детектора голосовых команд для автоматической справочной службы медицинского учреждения / К.Е. Левин, О.Р. Никитин //
20. Физика и радиоэлектроника в медицине и экологии Материалы докладов пятой международной научно-технической конференции. - Владимир, 2002. -С.148-149.
21. Левин К.Е. Моделирование устройств обработки речевых сигналов / К.Е. Левин, О.Р. Никитин // Методы и устройства передачи и обработки информации: Межвузовский сборник научных трудов. Вып.4. - СПб.: Гидрометеоиздат, 2004. - С.216-220.
22. Назаров М.В. Методы цифровой обработки и передачи речевых сигналов / М.В. Назаров, Ю.Н. Прохоров М.: Радио и связь, 1985. - 176 с.
23. Передача речи по трактам радиотелефонной связи. Требования к разборчивости речи и методы артикуляционных измерений: ГОСТ 16600-72. -Введ. 27.09.72-М., 1973.
24. Потапова Р.К. Новые информационные технологии и лингвистика / Р.К. Потапова. М.: Библиотека лингвиста, 2002. - 575 с.
25. Потапова Р.К. Речь: Коммуникация, Информатика, Кибернетика / Р.К. Потапова.-М.:УРСС, 2001.- 562 с.
26. Рабинер Л. Р. Цифровая обработка речевых сигналов / Л. Р. Рабинер, Р.В. Шафер. -М.: Радио и связь, 1981.-496 с.
27. Разумихин Д. Системы автоматического распознавания речи с различными моделями организации диалога / Д. Разумихин, А. Соловьев // Сборник трудов XIII сессии Российского акустического общества. М., 2003. - т.З, С.141-144.
28. Репина О.И. Искажения в телефонном тракте / О.И. Репина. М.: Связь, 1978.- 176 с.
29. Решение Государственной комиссии по радиочастотам при Министерстве связи Российской Федерации №23/2 от 29.08.94.
30. Рылов А.С. Анализ речи в распознающих системах / А.С. Рылов. Минск: Бестпринт, 2003. - 264 с.
31. Соболев В.Н. Структурные преобразования речевого сигнала: Учебное пособие / В.Н.Соболев. -М.: МТУ СИ, 2005. 188 с.
32. Сообщество пользователей Matlab и Simulink <http://matlab.exponenta.ru>
33. Сорокин В.Н. Структура проблемы автоматического распознавания речи / В.Н. Сорокин // Информационные технологии и вычислительные системы, № 2.,-М., 2004.-С. 25-40.
34. Уидроу Б. Адаптивная обработка сигналов / Б. Уидроу, С. Стирнз. Пер. с англ. - М.: Радио и связь, 1989. - 440 с.
35. Фланаган Д.Ж. Анализ, синтез и восприятие речи. Пер. с англ. Под редакцией А.А. Пирогова. М.: Связь, 1968. - 396 с.
36. Фонетика современного русского литературного языка. Под редакцией Панова М.В. М., «Наука», 1968.
37. Фонетический разбор: Правильное произношение / Сост. С.М. Снарская. -СПб.: «Норинт», 2005. 288 с.
38. Хижинский Д. Системы IVR: проблемы и пути их решения / Д. Хижинский // Мобильные системы. 10 ноября 2004 г. <http://ct.forte-it.ru/info/press/79>
39. Эксплуатационные нормы на электрические параметры коммутируемых каналов сети ТфОП. Утверждено приказом Госкомсвязи России от 05.04.99 №54.
40. Эффективное кодирование и распознавание речевых сигналов: Метод, указания к лабораторным работам / Владим. гос. ун-т; Сост. Е.К. Левин. Владимир, 2002. 52 с.
41. Alexander Fisher and Volker Stahl Database and Online Adaptation for Improved Speech Recognition in Car Environments // ICASSP 1999, vol.1, pp. 445-448.
42. Analytic.ru | Продукция <http://www.ancom.ru/production.html>
43. Andre Adami, Lukas Burget, Stephane Dupont, Hari Garuadadri, Frantisek Grezl, Hynek Hermansky, Pratibha Jain, Sachin Kajarekar, Nelson Morgan, Sunil Sivadas Qualcomm -ICSI OGI Features for ASR // ICSLP 2002, pp. 4-7.
44. Ben Milner A comparison of Front-end Configurations for Robust Speech Recognition // ICASSP 2002, pp. 797-800
45. DongSuk Yuk and James Flanagan Telephone Speech Recognition using Neural Networks and Hidden Markov Models // ICASSP 1999, vol.1, pp. 157-160
46. Douglas Ealey, Holly Kelleher and David Pearce Harmonic tunneling: tracking non-stationary noises during speech // Eurospeech 2001. CiteSeer.IST Scientific Literature Digital Library <http://citeseer.ist.psu.edu>
47. Douglas O'Shaughnessy Hesham Tolba Towards a Robust/Fast Continuous Speech Recognition System Using a Voiced-Unvoiced Decision // ICASSP 1999, vol.1, pp. 413-416
48. ETSI ES 202 050 VI. 1.1 "Speech processing, Transmission and Quality aspects (STQ); Distributed speech recognition; Advanced front-end feature extraction algorithm; Compression algorithms." November 2002 <www.etsi.org/aurora>
49. Euisun Choi, Donghoon Hyun and Chulhee Lee Optimizing Feature Extraction for English Word Recognition // ICASSP 2002, pp. 813-816
50. Firas Jabloun, A. Enis Cetin The Teager Energy Based Future Parameters for Robust Speech Recognition in Car Noise // ICASSP 1999, vol.1, pp. 273-276
51. H. Hermansky Perceptual Linear Predictive (PLP) Analysis of Speech //Journal of Acoust. Soc. Am., pp. 1738-1752, April 1990.
52. Intel® Telecom and Compute Products <http://www.intel.com/design/network/products/telecom/>
53. Jian Wu, Jasha Droppo, Li Deng, Alex Acero A Noise-Robust ASR Front-End using Wiener Filter Constructed from MMSE Estimation of Clean Speech and Noise // ICASSP 2003, pp. 321-326
54. Kaisheng Yao , Kuldip K. Paliwal and Satoshi Nakamura Noise Adaptive Speech Recognition In Time-Varying Noise Based On Sequential Kullback Proximal Algorithm // ICASSP 2002, pp. 189-192
55. Lawrence Rabiner, Biing-Hwang Juang Fundamentals of speech recognition Prentice Hall PTR, Englewood Cliffs, NJ 07632, 1993.—507p.
56. Levin E. К., Levin K.E. The Noise Suppression for Automatic Speech Commands Recognition // SPECOM'2005. University of Patras, Patras, Greece, 2005, pp. 507-509
57. Levin E. K., Levin K.E. Using a simulation program complex for researches of speech recognition devices // SPECOM'2003. Moscow State Linguistic University, Moscow, Russia, 2003.
58. Lukas Burget, Petr Motlicek, Frantisek Grezl, Pratibha Jain Distibuted Speech Recognition, Radioengeneering, vol. 11, No. 4, December 2002.
59. Magnus Andersson An Evaluation of Noise Robustness of Commercial Speech Recognition Systems // Master Thesis.- Stockholm, 2003.
60. Mark D. Skowronski and John G. Harris Increased MFCC Filter Bandwidth for Noise-Robust Phoneme Recognition//ICASSP 2002, pp. 801-804.
61. Mokbel C., Collin O. Incremental Enrollment of Speech Recognizers // ICASSP 1999, vol.1, pp. 453-456.
62. Montri Karnjanadecha and Stephen A. Zadorian Signal Modeling for Isolated Word Recognition // ICASSP 1999, vol.1, pp. 293-296.
63. Nam Soo Kim Time-Varying Noise Compensation using Multiple Kalman Filters // ICASSP 1999, vol.1, pp. 429-432.
64. Nicholas W.D. Evans and John S. Mason LPC-Based, Temporal-Lateral Noise Estimation Evaluated on the AURORA Corpus // SPPRA 2002. CiteSeer.IST Scientific Literature Digital Library <http://citeseer.ist.psu.edu>
65. Nicholas W.D. Evans, John S. Mason and Matt J. Roach Noise Compensation using Spectrogram Morphological Filtering // ICSLP2002. CiteSeer.IST Scientific Literature Digital Library <http://citeseer.ist.psu.edu>
66. Peter Veprek, Michael S. Scordilis Analysis, enchancement and evaluation of five pitch determination techniques / Speech Communication 37(2002) pp.249-270.
67. Philip Lockwood, PatriceAlexandre Root Adaptive Homomorphic Deconvolution Schemes for Speech Recognition in Noise // ICASSP 1994, vol.1, pp. 441-444
68. Ruhi Sarikaya and John H.L. Hansen Analysis of the Root-Cepstrum for Acoustic Modeling and Fast Decoding in the Speech Recognition. // Eurospeech 2001. -CiteSeer.IST Scientific Literature Digital Library <http://citeseer.ist.psu.edu>
69. Leonard R. G. A Database for Speaker-Independent Digit Recognition // ICASSP, San Diego, California, 1984, vol. 3, pp. 42-53.
70. Satoru Tsuge, Toshiaki Fukada, Harald Singer Speaker Normalized Spectral Subband Parameters for Noise Robust Speech Recognition // ICASSP 1999, vol.1, pp. 285-288
71. Shuen Kong Wong and Bertram Shi Channel and Noise Adaptation via HMM Mixture Mean Transform and Stochastic Matching // ICASSP 1999, vol.1, pp. 301-304
72. SoftLine поставщик программного обеспечения <http://www.softline.ru/>
73. Stephane Dupont, Christophe Ris Robust feature extraction and acoustic modeling at Multitel: experiments on the Aurora databases // Eurospeech 2003. -CiteSeer.IST Scientific Literature Digital Library <http://citeseer.ist.psu.edu>
74. Steve Young, Gunnar Evermann, Dan Kershaw, Gareth Moore, Julian Odell, Dave Ollason, Valtcho Valtchev, Phil Woodland The НТК book (for НТК Version 3.1). Speech group, Cambridge University Engineering Department, December, 2001
75. Xuedong Huang, Alex Acero, Hsiao-Wuen Hon Spoken language Processing: A guide to theory, algorithm and system development. Prentice Hall PTR, Englewood Cliffs, NJ 07632,2002.—960pp.
76. Администрация г. Владимира Управление образования1. УТВЕРЖДАЮ» Директор
77. Владимирского городского информадиднно-методического1. I г- Ч. * Y1. Й от -И, /О. 2006г.\ т.н. Сергеева '1с- 20Об г.1. АКТ ВНЕДРЕНИЯрезультатов диссертационной работы Левина К.Е. «Исследование алгоритмов обработки речевых сигналов при
78. Методист c^Kf^'^ Юдеева Л. И.распознавании команд в системах компьютерной телефонии»1. П.1
79. Заведующий кафедрой радиотехники и радиосистем д.т.н., профессор д.т.н., профессор Заведующая лабораториями1. П.1 УТВЕРЖДАЮ
80. Директор научно-технического центра ОАО
81. АКТ ВНЕДРЕНИЯ результатов диссертационной работы Левина К.Е. «Исследование алгоритмов обработки речевых сигналов при распознавании команд в системах компьютерной телефонии»
82. Данный программный комплекс предоставляет пользователю удобный интерфейс, а использование динамических библиотек для создания функциональных блоков обработки позволяет легко расширять набор исследуемых алгоритмов.
83. Заместитель директора НТЦ, к.т.н.1. Реутов Д.В.
84. Universitat Erlangen-Nurnberg Institut fur Informatik Lehrstuhl fur.Mustererkennung1.hrstuhl fllr Mustererkcnnung (Institut far Informatik) Universitat Erlangen-Ndrnberg, Martensslr. 3, D-91058 Erlapgen1. E. JMoth
85. Tel.: 09131/85-27775 (Sekretariat) Telefax: 09131/303811 noeth@informatik.uni-erlangen.de URL: http://www5.informatik.uni-erlangen.de1.re Zeichen Unser Zeichen, Unsere Nachricht vom Telefon 09131 Erlangen
86. No/22/03/yat01 85-27888 30. April 20031. Confirmation
87. Research supervisor Dr.-Ing. Elmar Noth
88. Head of the speech group universitat erlangen nOrnberg
89. LEHRSTUHL FOR MUSTERERKENNUNUG INSTITUT FOR fWFtf&MATIK F*ROF. DR.-ING. H. WEMA'NN foAFTTENSSTR.3, 0-9f658'EЙШЙМ
90. Friedrich-Alexander-Universitat Erlangen-Nurnberg1. ТУ1. TECHNISCHE FAKULTAT
91. ПЛ. Перевод акта об использовании
92. Университет Эрланген-Нюрнберг Институт информатики Кафедра распознавания образов1. Э. Нет
93. Тел.: 09131/85-27775 (секретариат) Телефакс: 09131/303811 noeth@informatik.uni-erlangen.de URJL: http://www5.informatik.uni-erlangen.de1. Подтверждение
94. Научный руководитель д.т.н. Эльмар Нет,руководитель группыпо исследованию речи
95. Президент Российского НТОРЭС им. А С. Попова Главный редактор журнала «Радиотехника», академик РАНю.в.гуляевmm1. ЩщР1. ГРАМОТА
96. ПРЕЗИДИУМ ЦЕНТРАЛЬНОГО СОВЕТА РОССИЙСКОГО НАУЧНО-ТЕХНИЧЕСКОГО ОБЩЕСТВА РАДИОТЕХНИКИ, ЭЛЕКТРОНИКИ И СВЯЗИ имени А.С.ПОПОВА и ЖУРНАЛ «РАДИОТЕХНИК/!,»1. НАГРАЖДАЮТлевина к.е.
97. Студента Владимирского государственного универсипета за участие во Всероссийском конкурсе научных работ студентов по радиоэлектронике и связи за 2004 годш
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.