Математические модели и комплекс программ для автоматического распознавания дикторов тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Адель Саллам Мохамед Хайдер
- Специальность ВАК РФ05.13.18
- Количество страниц 216
Оглавление диссертации кандидат технических наук Адель Саллам Мохамед Хайдер
ВВЕДЕНИЕ.
ГЛАВА 1. Обзор методов и систем распознавания дикторов.
1.1. Классификация систем определения индивидуальности говорящего по речи.
1.1.1. Идентификация и верификация.
1.1.2. Групповая идентификация.
1.1.3. Текстозависимые и текстонезависимые распознавание.
1.1.4. Автоматические и экспертные системы.
1.2. Научная сторона проблемы.
1.2.1. Различительные признаки.
1.2.2. Способы описания речевого сообщения в целом.
1.2.3. Проблема эталона и его обновление.
1.2.4. Решающие правила.
1.2.5. Шумы, помехи, искажения.
1.3. Критерии эффективности систем верификации.
1.4. Обзор современных программных продуктов.
1.4.1. CAVE.
1.4.2. PICASSO.
1.4.3. CV-UCP.
1.4.4. SpeakEZ.
1.5. Основные проблемы создания систем распознавания дикторов.
1.6. Выводы.
ГЛАВА 2. Методы построения признаковых описаний в задаче автоматического распознавания дикторов.
2.1. Ввод речи и ее цифровое представление.
2.2. Предварительная обработка и выделение первичных признаков.
2.2.1. Дискретное преобразование Фурье.
2.2.2. Цифровые фильтры.
2.2.3. Использование оконных функций.
2.3. Нормализация уровня сигнала.
2.4. Выделение границ фразы.
2.5. Методы получения признакового описания сигнала.
2.5.1. Спектральные методы.
2.5.2. Коэффициенты линейного предсказания.
2.5.3. Кепстральное описание.
2.6. Выделение наиболее информативных характеристик.
2.6.1. Последовательный прямой поиск (ППП).
2.6.2. Последовательный обратный поиск (ПОП).
2.7. Выводы.
ГЛАВА 3. Основные математические модели принятия решений в задачах распознавания дикторов.
3.1. Системы распознавания дикторов, основанные на сопоставлении с эталонами.
3.2. Мера сходства речевого сигнала с эталоном.
3.2.1. Статистический подход.
3.2.2. Некоторые меры сходства.
3.3. Линейное выравнивание времени.
3.4. Алгоритм динамического искажения времени(ДИВ).
3.4.1. Описание алгоритма ДИВ.
3.4.2. Принцип оптимизации Беллмана и Динамическое программирование.
3.4.3. Симметричный алгоритм ДИВ.
3.4.4. Алгоритм поиска глобального наименьшего маршрута.
3.4.5. Ассиметричный алгоритм ДИВ.
3.5. Скрытые марковские модели.
3.5.1. Статистическое распознавание речи.
3.5.2. Структура системы распознавания СММ.
3.5.3. Вычисление вероятности появления последовательности наблюдений в СММ.
3.5.4. Обучение СММ.
3.5.5. Распознавание при помощи СММ.
3.5.6. Архитектура системы распознавания дикторов на основе СММ.
3.6. Нейронные сети.
3.6.1. Алгоритм обратного распространения ошибки.
3.6.2. Алгоритм обучения RProp.
3.6.3. Полносвязная нейронная сеть.
3.6.4. Нейронная сеть с локальными связями.
3.7. Векторное квантование и построение кодовой книги при решении задач текстонезависимой верификации/идентификации.
3.7.1. Меры искажения.
3.7.2. Алгоритмы построения эталона.
3.7.3. Идентификация по кодовой книге.
3.8. Выводы.
ГЛАВА 4. Модели устранения влияния шумового окружения в задачах распознавания дикторов.
4.1. Классификация помех в речевом канале.
4.2. Методы оптимальной фильтрации в задаче подавления стационарных шумовых помех.
4.3. Спектральное вычитание.
4.3.1. Метод.
4.3.2. Описание алгоритма.
4.4. Методы адаптивной фильтрации в задаче шумоочистки речевых сигналов.
4.5. Wavelet-преобразование в задаче шумоочистки речевых сигналов.
4.5.1. Использование дискретного вейвлет-преобразования для подавления шумов в речевом сигнале.
4.5.2. Совместное использование вейвлет-преобразования и оптимальной фильтрации.
4.6. Выводы.
ГЛАВА 5. Экспериментальные исследования.
5.1. Цели и задачи экспериментов.
5.2. Исследование методов верификации дикторов на основе использования нейронных сетей.
5.2.1. Общая схема разработанной системы верификации для НС.
5.2.2. Выбор речевых характеристик.
5.2.3. Выделение наиболее информативных фарактеристик.
5.2.4. Исследование структуры НС.
5.2.5. Исследование влияния размера входного слоя НС.
5.3. Исследование свойств алгоритмов динамического искажения времени (ДИВ).
5.3.1. Выбор метрики расстояния.
5.3.2. Исследование влияния параметра степени искажения
ДИВ на качество верификации.
5.3.3. Исследование методов параметризации речевых сигналов на основе алгоритма динамического искажения времени.
5.4. Экспериментальное исследование верификации дикторов на основе использования скрытых марковских моделей (СММ).
5.4.1. Выходные параметры системы " НММ Person Verification".
5.4.2. Оценка эффективности системы верификации критерий принятия решения в системе " НММ Person Verification ".
5.4.3. Исследование методов уменьшения числа гипотез при работе алгоритма Витерби.
5.4.4. Выбор топологии СММ.
5.4.5. Исследование влияния числа итераций при обучении на качество верификации.
5.5. Результаты исследования идентификации дикторов на основе использования векторного квантования (ВК).
5.5.1. Исследование зависимости времени работы алгоритмов идентификации и построения кодовой книги от ее размера.
5.6. Сравнительные результаты тестирования различных систем верификации дикторов.
5.7 . Исследование влияния шумовых помех на эффективность распознавания дикторов.
5.8. Выводы.
ГЛАВА 6. Разработка программного обеспечения для решения задач распознавания дикторов.
6.1. "Neuro-D" - программа для верификации дикторов на основе модели нейронной сети.
6.2. "DWT-speech" - программа для исследования моделей динамического искажения времени.
6.3. " НММ Person Verification" - программа для моделирования распознавания дикторов на основе использования скрытых марковских моделей.
6.4. Реализация системы "VC - recognition" для автоматической идентификации диктора на основе векторного квантования.
6.4.1. Особенности реализации.
6.4.2. Пользовательский интерфейс.
Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Исследование и разработка алгоритмов параметризации речевых сигналов в системе распознавания диктора2008 год, кандидат технических наук Ахмад Хассан Мухаммад
Разработка методики использования широких фонетических категорий в задачах верификации диктора2010 год, кандидат технических наук Милошенко, Алексей Анатольевич
Метод и алгоритмы автоматической текстонезависимой верификации дикторов и их программная реализация2010 год, кандидат технических наук Симончик, Константин Константинович
Автоматизация процесса верификации абонентов АСУ с речевым управлением2008 год, кандидат технических наук Катков, Олег Николаевич
Разработка алгоритмов для распознавания речи1999 год, кандидат технических наук У Вэньцань
Введение диссертации (часть автореферата) на тему «Математические модели и комплекс программ для автоматического распознавания дикторов»
Актуальность темы. В последние годы отмечается существенный рост интереса к автоматическим системам опознавания (идентификации и верификации) говорящего по голосу. Потребность в разработке таких систем главным образом диктуется наличием широкого круга практических приложений, где требуется подтвердить или опознать определенную личность. Системы автоматического распознавания говорящего могут использоваться для следующих целей: задачи обеспечения безопасности (контроль за физическим доступом в помещения; доступ к базам данных, вычислительным системам и ПК; управление различными запорными механизмами; контроль над транспортными средствам и оружием; доступ к банковским счетам), задачи криминалистической экспертизы (анализ записей телефонных переговоров и отождествление их с подозреваемым; доказательства при судебных разбирательствах; идентификация «телефонных хулиганов» по записи). Особый интерес представляет собой использование систем опознавания на телефонных каналах, например, для получения баланса банковского счета, подтверждения денежных транзакций или оплаты услуг.
Направление, связанное с разработкой и исследованием систем автоматической идентификации и верификации дикторов является в данный момент прогрессирующим, к нему проявляют интерес многие крупные исследовательские и коммерческие организации. И если не сегодня, то в ближайшем будущем такие системы будут востребованы в полной мере.
В связи с вышесказанным весьма актуальным является разработка моделей и методов распознавания дикторов для различных условий применения.
Существующие решения этой задачи в настоящее время не обеспечивают достаточно высокой надежности распознавания дикторов. Поэтому актуальной задачей является сравнительное исследование различных моделей распознавания дикторов и определение наиболее перспективных направлений их создания. В работе проведен анализ моделей формирования признакового описания речевых сигналов и исследованы различные модели систем распознавания дикторов. Важное внимание уделено рассмотрению задачи распознавания дикторов в условиях помех.
Общее содержание диссертационной работы соответствует научному направлению "Распознавание образов и обработка изображений" Государственной научно-технической программы "Перспективные информационные технологии".
Цель и задачи диссертационной работы. Целью работы является разработка и исследование моделей и алгоритмов для решения задач распознавания дикторов в различных условиях. Для достижения этой цели в диссертации решались следующие задачи:
1. Анализ особенностей построения распознающих систем для распознавания дикторов в различных условиях.
2. Исследование моделей построения различных признаковых описаний в задачах распознавания дикторов.
3. Разработка алгоритмов распознавания дикторов, основанных на использовании алгоритмов динамического искажения времени (ДИВ), скрытых марковских моделей (СММ), нейронных сетей (НС) и векторного квантования (ВК).
4. Разработка методов распознавания дикторов в условиях шумового искажения речевого сигнала.
5. Разработка программного обеспечения для распознавания дикторов, реализующего рассмотренные в работе теоретические модели.
6. Проведение сравнительного экспериментального исследования разработанных алгоритмов и программных средств при обработке сигналов реальных речевых баз.
Методы исследования. В диссертационной работе используется аппарат теории вероятностей, случайных процессов, математической статистики, цифровой обработки сигналов, теории распознавания образов, теории построения математических моделей.
Научную новизну работы составляет:
• Модель слоистой нейронной сети для верификации дикторов, обеспечивающая существенное снижение вычислительных затрат по сравнению с полносвязной сетью.
• Модель системы верификации дикторов на основе скрытых марковских моделей, обладающая высокой потенциальной эффективностью.
• Модифицированный алгоритм векторного квантования Ллойда для текстонезави-симой идентификации дикторов, позволяющий существенно улучшить качество кодовых книг базы эталонов.
• Подход к построению системы верификации дикторов в условиях шумового окружения, основанный на совместном использовании оптимальной фильтрации и вейвлет-преобразования для подавления шумов.
Практическая ценность работы заключается в следующем:
• Разработаны конкретные алгоритмы, положенные в основу создания систем верификации/идентификации дикторов.
• Разработан комплекс программного обеспечения для распознавания дикторов на основе различных теоретических моделей .
• Проведено сравнительное экспериментальное исследование разработанных в диссертации моделей верификации/идентификации дикторов, позволившее выбрать наиболее эффективные модели построения систем распознавания дикторов
• Предоженные в работе модели и алгоритмы могут быть положены в основу разработки коммерческих систем распознавания дикторов
Внедрение результатов работы. Работа выполнялась в рамках Федеральной целевой научно-технической программы "Исследования и разработка по приоритетным направлениям развития науки и техники на 2000-2006 гг." - НИР "Методы распознавания образов, обработки сигналов и изображений для самоорганизующихся систем", выполняемой Государственным предприятием "Научно-инженерный центр СПбГЭТУ".
Разработанные программные средства и методические материалы использовались в учебном процессе при проведении лабораторных и курсовых работ по курсам «Системы цифровой обработки сигналов», "Распознавание речевых сигналов и изображений" для студентов специальностей 220400 и 010200 в СПбГЭТУ.
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на научно-технических конференциях СПбГЭТУ в 2003-2004 гг.; на 6-ой международной конференции 'Таспознавание образов и анализ изображений: новые информационные технологии" (РОАИ-6-2002), Великий Новгород, 2002г.; на 5-ой международной научно-технической конференции 'Таспознавание-2003", Курск, 2003 г.; на 11-й Всероссийской конференции "Математические методы распознавания образов" (ММРО-11), Москва, 2003 г.; на Международной конференции по мягким вычислениям и измерениям (SCM'2004), С.-Петербург, 2004 г., на 58-ой научно-технической конференции СПбНТО РЭС им. А.С Попова, С.Петербург, 2003 г.; на 59-ой научно-технической конференции СПбНТО РЭС им. А.С Попова, С.Петербург, 2004 г. ; на 9-ой Международной конференции "Speech and computer" (Specom 2004), С.Петербург, 2004 г.
Публикации. По теме диссертации опубликовано 9 печатных работ, из них 3 статьи , 4 доклада и тезисы к 2-м докладам на международных и всероссийских научно-технических конференциях,
Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК
Синтез, анализ и практическая реализация алгоритмов распознавания и предобработки речевых сообщений2013 год, кандидат наук Выборнов, Сергей Владимирович
Разработка математических моделей и робастных алгоритмов идентификации дикторов по их речи2003 год, кандидат физико-математических наук Репалов, Сергей Анатольевич
Исследование и разработка нейросетевых методов анализа и обработки речевого сигнала в задаче распознавания речи2006 год, кандидат технических наук Кушнир, Дмитрий Алексеевич
Математические модели и комплекс программ для автоматической оценки качества речевого сигнала2002 год, кандидат технических наук Николаев, Алексей Николаевич
Алгоритмы распознавания речевых команд в управляющих системах2006 год, кандидат технических наук Литвиненко, Сергей Леонидович
Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Адель Саллам Мохамед Хайдер
ЗАКЛЮЧЕНИЕ
Представленная диссертационная работа содержит результаты исследований по разработке методов распознавания дикторов
Основные научные и практические результаты работы можно сформулировать следующим образом:
• Сформулированы основные задачи совершенствования систем распознавания дикторов. Предложено уделить основное внимание разработке текстозависимых систем распознавания дикторов на основе использования нейронных сетей и методов ДИВ.
• Предложен новый алгоритм для выделения границ фразы, отличающийся повышенной помехоустойчивостью.
• При проведении спектрального анализа предлагается использовать нелинейную частотную шкалу Мелла. Применение нелинейной шкалы позволяет согласовать результаты спектрального анализа с психофизиологическими характеристиками слухового аппарата человека. Показано преимущество описания речевого сигнала мел-кепстральными признаками перед остальными.
• Предложена структура системы верификации дикторов, использующей нейронную сеть со слоистой архитектурой.
• Разработана модель текстонезависимой системы идентификации с использованием модели векторного квантования, позволяющая существенно улучшить качество кодовых книг базы эталонов.
• Проведен анализ свойств алгоритмов ДИВ. Для симметричного алгоритма ДИВ предложен оптимизированный алгоритм поиска минимального наименьшего маршрута. Рассмотрена реализация асимметричного алгоритма ДИВ, имеющего ряд преимуществ по сравнению с симметричным.
• Предложена процедура верификации дикторов в условиях шумового окружения основанная на совместном использования оптимальной фильтрации и вейвлет- преобразования для подавления шумов.
• Разработана структура системы верификации дикторов на основе скрытых марковских моделей.
• Разработан комплекс программ для исследования разработанных моделей распознавания дикторов.
Разработанные модели распознавания могут быть эффективно использованы для различных практических приложений связанных с распознаванием дикторов. Дальнейшие исследования в этой области могут быть направлены на создание более эффективных систем распознавания дикторов, а также на разработку текстонезависимых алгоритмов распознавания.
Список литературы диссертационного исследования кандидат технических наук Адель Саллам Мохамед Хайдер, 2004 год
1. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. Киев. -"Наукова думка", 1987.
2. Воробьев В.И., Трибун В.Г. Теория и практика вейвлет преобразования. Военный институт, Санкт-Петербург, 1999.
3. Геппенер В.В., Хайдер A.C. Методы принятия решений в задачах распознавания дикторов" Материалы 59-ой научно-технической конференции СПбНТО РЭС им. А.С Попова, изд-во СПбГЭТУ "ЛЭТИ", 2004г., с. 25-26.
4. Геппенер В.В., Хайдер A.C. Система верификации дикторов на основе использования нейронной с ети//У международная научно-техническая конференция"Распознавание-2003", Курск, 22-25 октября 2003 г.в 2-х ч., 4.1, с. 103-105.
5. Геппенер В.В., Чередниченко Д.А. Wavelet преобразование в задачах цифровой обработки сигнала, СПбГЭТУ "ЛЭТИ" 2002.
6. Гольденберг Л. М., Матюшкин Б. Д., Поляк М. Н. Цифровая обработка сигналов // М.: Радио и связь, 1990.
7. Горелик А. Л., Гуревич И. Б., Скрипкин В. А. Современное состояние проблемы распознавания. М. радио и связь, 1985. - с. 161.
8. Горелик А. Л., Скрипкин В. А. Методы распознавания: Учеб. пособие для вузов. -3-е изд., перераб. и доп. М.: Высш. шк., 1989. - 232 с.
9. Добеши И. Десять лекций по вейвлетам. Пер. с англ. Мищенко Е.В., под ред. Петухова А.П., М.: «РХД», 200.
10. Доддингтон. Дж. Р. Распознавание дикторов: Идентификация людей по голосу // -ТИИЭР, 1985, т.73, №11, с.129-145.
11. Загоруйко Н. Г. Методы распознавания и их применение. М.: Советское радио, 1972.
12. Каппелини В., А. Дж. Константинидис, П. Эмилиани. Цифровые фильтры и их применение // Пер. с англ. М.: Энергоатомиздат, 1983.
13. Косарев Ю. А. Естественная форма диалога с ЭВМ.// Л: Машиностроение, 1989.
14. Адаптивные фильтры: Пер с англ./Под ред К.Ф.Н. Коуэна и П.М. Гранта -М.:Мир, 1988.-392 с.
15. Круглов В. В., Борисов В. В. Искусственные нейронные сети. Теория и практика.- . -М.: Горячая линия- Телеком,2002.
16. Левин Б.Р. Теоретические основы статистической радиотехники.- М.: Радио и связь, 1989 .
17. Людовик Е.К., Шинкаж А.Г. Мера общности происхождения реализаций речевого сигнала. //Распознавание образов (изображений и речи). Киев: ИКАНУССР, 1980, - с.56-65.
18. Макхоул Дж. Векторное квантование при кодировании речи. // — ТИИЭР, 1985, т.73, №11, с. 19-6.
19. Маркел Дж. Д. Грэй А. X Линейное предсказание речи. Пер. с англ./Под ред. Ю. Н. Прохорова М Связь, 1980.
20. Марпл.-мл. С.Л. Цифровой спектральный анализ и его приложения: Пер. с англ.-М.: Мир.- 1990.
21. Мишенин В.Н., Хайдер A.C. Проблемы создания систем автоматического распознавания диктора по голосу// Санкт-Петербург, 58-я научно-техническая конференция НТО РЭС им. А.С Попова, 2003г., с. 40-44.
22. Назаров А. В., Лоскутов А. И. Нейросетевые алгоритмы прогнозирования и оптимизации систем-СПБ.: Наука и техника, 2003.
23. Осовский С. Нейронные сети для обработки информации / Пер. с польского Рудинского И. Д. М.: Финансы и статистика, 2002.
24. Плотников В.Н., Суханов В. А., Жигулевцев Ю. Н. Речевой диалог в системах управления.Москва, Изд-во "Машиностроение", 1988.
25. Рабинер JI.P, Шафер Р.В. Цифровая обработка речевых сигналов // Москва, Изд-во "Радио и связь", 1981.
26. Рабинер J1.P, Гоулд Б. Теория и применение цифровой обработки сигналов.// Москва, Изд-во "Мир", 1978.
27. Рамишвили Г.С. Речевой сигнал и индивидуальность голоса // Изд-во "МЕЦНИЕРЕБА", Тбилиси, 1976, стр. 1-183.
28. Рамишвили Г.С. Автоматическое опознование говорящего по голосу // Москва, Изд-во "Радио и связь", стр. 1-224.
29. Роберт Каллан. Основные концепции нейронных сетей.-Москва.:Вильямс, 2001.
30. Секунов Н. Ю. Обработка звука на PC. // СПб.: БХВ-Петербург, 2001.
31. Сергиенко А. Б. Цифровая обработка сигналов. СПБ.: Питер, 2002.
32. Солонина А. И., Улахович Д. А., Арбузов С. М. и др. Основы Цифровой обработки сигналов / СПБ.: Петербург, 2003.
33. Введение в цифровую фильтрацию/ Пер с англ./ Под ред JI. И. Филиппова — М.:Мир, 1976.-216 с.
34. Хайдер А.С. Сравнение методов параметризация речевых сигналов при решении задачи распознавания дикторов. // Известия СПбГЭТУ "ЛЭТИ", серия "Информатика, управление и компьютерные технологии" вып.1, 2004, с.36-42.
35. Хэмминг Р. В. Цифровые фильтры // Пер. с англ. М.: Сов. Радио, 1980.
36. Ariki Y., Tagashira S., Nishijima M. Speaker Récognition and Speaker Normalization by Projection to Speaker Subspace. // ICASSP-96.
37. Becchetti L. C., Ricotti L. Speech récognition. Theory and С++ implementation — New York: Willey and sons, 2002.
38. Bellman R.E. Dynamic Programming, Princeton University Press, 1957.
39. BenZeghiba, M.F., Herve, В., Mariethoz, J. Speaker vérification base on user-customized password.// (2001).
40. Berouti N., Schwartz R. and Makhoul J. Enhancement of speech corrupted by acoustic noise. In Proc. Int. Conf. on Acoustics, Speech and Signal Processing, pages 208-211,1979.
41. Bimbot, F. and Chollet, G. Assessment of speaker verification systems.// (1997), In Gibbon, D., Moore, R., and Winski, R., editors, Handbook of Standards and Resources for Spoken Language Systems, chapter 11. Mouton de Gruyter, Berlin.
42. Bimbot F., Blomberg M., Boves L. etc.An overview of the CAVE project research activities in speaker verification.// (2000).
43. Bocchieri E., Riccardi G. State typing of triphone HMM's for the 1994 AT&T ARPA ATIS recognizer, Eurospeech 95, Madrid, pp.1499-1502, September 1995.
44. Boll S., Suppression of acoustic noise in speech using spectral subtraction// IEEE Trans, on Acoustics, Speech and Signal Processing, 27(2), April 1979.
45. Bourlard H. and Bengio S. Hidden Markov Models and other finite state automata for sequence processing.// (2001).
46. Bow S.-T. Pattern Recognition and Image Preprocessing, Marcel Dekker Inc., N.-Y., 1992.
47. Bridle J.S., Brown M.D., Chamberlain R.M., An algorithm for connected word recognition, Proc. ICASSP, Paris, 1982.
48. Burten D.K. Text Independent Speaker Verification Using Vector Quautization Source Coding // IEEE Trans. ASSP-35.
49. Che.W.Ch, Lin Q., Yuk D-s. Am HMM Approach to Text-prompted Speaker Verification. // ICASSP-96, 673-676.
50. Doval B., d'Allesandro Ch. Spectral Correlates of Glottal Waveform Models: an Analytical Study.// ICASSP-97, pp. 1295-1299.
51. Fant G. Voice Source Parameters in Continious Speech. // ICSLP-94, pp. 1451-1454.
52. Franti P., Kivijarvi J. Random swapping technique for improving clustering in unsupervised classification.// ftp://ftp.cs.joensuu.fi/franti/papers/scia99-l.ps
53. Franti P., Kivijarvi J. Randomized local search algorithm for the clustering Problem.// Pattern Analysis an Applications, 3(4): 358-369, 2000, ftp://ftp.cs.joensuu.fi/franti/papers/rls.ps
54. Furui S. An overview of Speaker Recognition Technology in Automatic Speech and Speaker Recognition.
55. Gachter S. "Modeling the Computational Complexity of Unconstrained Vector Quantization". http://dewww.epfl.ch/~gachter/vectorquantization/
56. Gray R. M. Vector quantization. // IEEE ASSP Mag., vol. 1, pp. 4-29, April 1984.
57. He J.A New Codebook Traning Algorithm for NQ-based Speaker Recognition //1.ASSP- 97, 1091-1094.
58. Higgins A., Porter J., L.Bahler. YOHO Speaker Authentication.// Final Report, ITT Defense Communication Division, 1989.
59. H.Hoge.European Speech Databases for Telephone Applications.// ICASSP-97, 1771-1775.
60. Kao Yu-Hung, Hetsch L.,Rajaserarau P.K. //Speaker Recognition over Telephone Channels, in Modern Methods of Speech Processing. // Ed: R.P.Romachandron, R.Mamoone.
61. Kinnunen T., Karkkainen I., Franti P. Is speech data clustered? statistical analysis of cepstral features.- http://cs.joensuu.fi/pages/tkinnu/ research/pdf/IsSpeechClustered.pdf
62. Kinnunen T., Kilpelainen T., Franti P. Comparison of clustering algorithms in speaker identification", Proc. LASTED Int. Conf. Signal Processing and Communications (SPC): 222-227. Marbella, Spain, 2000.
63. Kinnunen T., Franti P. Speaker Discriminative Weighting Method for VQ-based Speaker identification." http: //cs. joensuu.fi/pages /tkinnu/research/pdf /Discriminative WeightingMethod.pdf
64. Kuitert M. and Boves L. Speaker verification with GSM coded telephone speech.// 1997, In Proceedings of the European Conference on Speech Technology, pages 975-978, Rhodes.
65. Li Q., fast A. sequential decoding algorithm with application to speaker verification, Multimedia Communications Research Laboratory, Bell Labs, Lucent Technologies, 1999.
66. Lockwood P. and Boudy J. Experiments with a non-linear spectral subtractor (nss), hidden markov models and the projection, for robust speech recognition in car. In Proc. European Conf. on Speech Communication and Technology, pages 79 82, 1991.
67. Lockwood P. and Boudy J. Experiments with a nonlinear spectral subtractor (nss), hidden markov models and the projection, for robust speech recognition in cars. Speech Communication, 11:215 228, 1992.
68. Lowerre B., Reddy R., The Harpy speech understanding system, in W.A. Lea, Ed., Trends in Speach Recognition, Prentice Hall, 1980.
69. Martin A., Doddington G., Kamm T., Ordowski, M., and Przybocki, M. The DET curve in assessment of detection task performance.//l 997, In Proceedings of the European Conference on Speech Technology, pages 1895-1898, Rhodes.
70. Mishenin V.N., Haider A.S.Vector quantization algorithms in automatic speaker recognition// Pattern Recognition and Image Analysis, Vol. 13 No. 1, 2003, pp 49-50.
71. Mishenin V.N., Haider A.S. Vector quantization algorithms in automatic speaker recognition// Pattern Recognition and Image Analysis, Vol. 13 No. 3, 2003, pp 465469.
72. Mokbel C., Jouvet D., and Monn J. Deconvolution of telephone line effects for speech recognition. Speech Communication, v. 19,p. 85 196, 1996.
73. Pandit M. and Kittler, J.Feature selection for a DTW-based speaker verification system.// 1999.
74. Proc. Workshop Automatic Speaker Recognition, Identification, Verification. 1994 (Switzerland).
75. Rabiner L. Juang B.H. Fundamentals of Speech Recognition. N.Y.: Prentice Hall, 1993.
76. Rabiner L. R. and Juang B. H. An introduction to hidden Markov models.//1986, IEEE Transactions on Acoustics, Speech, and Signal Processing, pages 4-15.
77. Riedmiller M. Hienrich B. A direct adaptive method for fast backpropagation learning: the RProp algorithm.// 1993.
78. Rosenberg A. E, Parthasrathy S. Speaker Bechground Models for Connected Digit Password Speaker Verification.// ICASSP-96, 81-84.
79. Rosenberg A. E., Soong F.K. Evalution of a Vector Quntization Talker Recognition System in Text Independent and Text Dependet Modes.// Computer Speech and Language, v.2, pp. 143-157, 1987.
80. Schmidt M., Gish H. Speaker Identification via Support Vector Classifiers. ICASSP-96, 105-109.
81. Shroeter J., Soudhi M. M. Techniques for Estimation Vocal-Tract Shape from Speech Signal. // IEEE Trans. SAP-2 , N1, pp. 133-150, 1994.
82. Shynk J J. Frequency-domain and multirate adaptive fltering. IEEE Signal processing magazine, January 1992, p. 15-37.
83. Kohonen T. The Self Organization Map.// Proc. IEEE, v.78, N9, pp. 1464-1480.
84. Tony Robinson. Speech Analysis. Lent Term 1998, http://mi.eng.cam.ac.uk/~ajr/SA95/node54.html
85. Viterbi A.J. Error bounds for convolutional codes and asymptotically optimum decoding algorithm, IEEE Transactions on Information Theory 13, April 1967.
86. Wenndt S, Shamsunder S. Bispectrum Features for Robust Speaker Identification. // ICASSP-97, 1095-1098.
87. Wiener N. Extrapolation, interpolation and smoothing of stationary time series, with engineering applications. NY: Wiley, 1949.
88. Zhenli Yu, P.c.Ching. Determination of Vocal-tract Shapes from Farmaut Frequencies Based on Perturbation Theory and Interpolation Method.// ICASSP-96, pp. 369-372.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.