Разработка и исследование системы автоматического выделения основного тона речи тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Лузин, Дмитрий Александрович

  • Лузин, Дмитрий Александрович
  • кандидат технических науккандидат технических наук
  • 2009, Ижевск
  • Специальность ВАК РФ05.13.01
  • Количество страниц 168
Лузин, Дмитрий Александрович. Разработка и исследование системы автоматического выделения основного тона речи: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Ижевск. 2009. 168 с.

Оглавление диссертации кандидат технических наук Лузин, Дмитрий Александрович

СОДЕРЖАНИЕ

СПИСОК СОКРАЩЕНИЙ

ВВЕДЕНИЕ

ГЛАВА 1. МЕТОДЫ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА РЕЧИ

1.1. Общие положения

1.2. Классификация методов выделения основного тона

1.3. Предварительная обработка речевого сигнала

1.4. Методы выделения ОТ

1.4.1. Временные методы выделения основного тона

1.4.2. Спектральные методы выделения основного тона

1.4.3. Комбинированные методы выделения ОТ

1.5. Выделение интервалов вокализованных и невокализованных звуков

1.5.1. Классификация выделителей Т/НТ

1.5.2. Методы принятия решения Т/НТ на основе частоты пересечений сигналом нулевого уровня

1.5.3. Методы принятия решения Т/НТ на основе энергетического критерия

1.5.4. Методы принятия решения Т/НТ на основе линейного предсказания речи

1.5.5. Методы принятия решения Т/НТ по оценке общей периодичности речевого сигнала

1.5.6. Методы принятия решения Т/НТ по изменению периодичности, получаемой при выделении ОТ

1.5.7. Принятие решения Т/НТ на основе многомерного анализа

1.6. Методы анализа результатов выделения ОТ

1.7. Выбор алгоритма выделения ОТ речи

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и исследование системы автоматического выделения основного тона речи»

3.2. Диапазон допустимых отклонений начальной частоты ОТ 71

3.3. Начальная оценка частоты ОТ с использованием автокорреляционной функции спектра (алгоритм АКФС) 72 3.3.1 Эксперименты по выбору окна 77

3.3.2. Оценка значения шага, используемого для смещения кадра анализа 80

3.3.3. Определение оптимального порога отбора гармоник 82

3.4. Экспериментальная оценка надежности выделения ОТ алгоритмом АКФС 84

3.5. Организация совместной работы метода GS и алгоритма АКФС 88

3.6. Выводы 94 ГЛАВА 4. СОВМЕСТНЫЙ АЛГОРИТМ ВЫДЕЛЕНИЯ ОТ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ GS И АКФС 96 4.1. Адаптация коэффициента асимметрии^ к анализируемому сигналу 96

4.2. Алгоритм поиска оптимального значения коэффициента асимметрии

101 102 104

104

110

112 115

ГЛАВА 5. СРАВНИТЕЛЬНЫМ АНАЛИЗ ВЫДЕЛИТЕЛЕН ОСНОВНОГО

ТОНА, ВНЕДРЕНИЕ РЕЗУЛЬТАТОВ ДИССЕРТАЦИОННОЙ

РАБОТЫ 118

5.1. Выделители основного тона в системе SIS 118

5.2. Сравнение результатов работы выделителей основного тона 123

5.3. Информационно — измерительная система с использованием алгоритма GS2 138

5.3.1. Программа TwoPassS 139

5.3.2. Программа SignalGSExplorer 140

5.4. Система обучения интонационным особенностям языка. 142

5.5. Идентификация диктора по параметрам траектории ОТ — предварительные результаты 145

5.6. Выводы 149 ЗАКЛЮЧЕНИЕ 151 СПИСОК ЛИТЕРАТУРЫ 154 ПРИЛОЖЕНИЕ Акты об использовании результатов диссертационной работы 166 в выделение основного тона по методу GS

4.3. Приращение максимума функции решения алгоритма GS

4.4. Изменение коэффициента заполнения Q в алгоритме GS

4.5. Динамическое определение порогов и алгоритм принятия решения Т/НТ

4.5.1. Введение дополнительного критерия в обобщенный признак Т/НТ

4.6. Структурная схема алгоритма выделения основного тона речи с адаптацией параметров алгоритма

4.7. Выводы

СПИСОК СОКРАЩЕНИЙ

ОТ — основной тон

ИИС — информационно-измерительная система '

ЛЧПН — логарифмическая частота пересечения нуля

ЧГГН - частота пересечения нуля

НТ/Т - "НЕ ТОН/ТОН"

Т/НТ - "ТОН/НЕ ТОН" с.к.о. — среднеквадратичное отклонение

С/Ш — сигнал/шум

ФНЧ — фильтр низких частот

ФВЧ — фильтр верхних частот

АКФС — автокорреляционная функция огибающей спектра

АКФ — автокорреляционная функция

АРУ - автоматическое регулирование усиления

ОБШ — обобщенная ошибка

КБО — количество больших ошибок

ТНТср - среднее количество ошибок НТ/Т и Т/НТ

GS - Generated Solitone - генерируемый (искусственный ) солитон SIS - система распознавания диктора ("Центр речевых технологий" г. С.-Петербург)

Е — энергия в логарифмическом масштабе Fq — частота основного тона с - частота среза фильтра предварительной обработки

G - обобщенный признак Т/НТ

Т0 — длительность периода основного тона

Тож - ожидаемая длительности периода основного тона

R( 1) — коэффициент корреляции с единичной задержкой

Zcr — частота пересечений нуля

Z'cr — логарифмическая частота пересечений нуля git) — функция решения

А — коэффициент асимметрии функции решения D — приращение функции решения Q — коэффициент заполнения функции решения

ВВЕДЕНИЕ

Актуальность темы. Речь есть средство обмена информацией между людьми. В устной речи содержится существенно большее количество информации по сравнению с письменным текстом: информация, связанная с контекстом произнесения, информация об интонационном типе высказывания (повествование, вопрос, восклицание), об эмоциональной направленности высказывания, об эмоциональном состоянии диктора, о стиле произнесения (монолог, диалог, беседа, читаемый научный текст, читаемый газетный текст и т.д.), об окружающей диктора обстановке, информация о заболевании голосового аппарата человека и т.д.

В области наук, связанных с речью работали и работают многие известные ученые, как в России, так и за рубежом: JI.H. Бондарко, В.И. Галунов, В.Р. Женило, Н.Г. Загоруйко, JI.B. Златоустова, C.JI. Коваль, О.Ф. Кривнова, В.Г. Михайлов, А.А Пирогов, М.А. Сапожков, В.Н. Сорокин, Р.К. Потапова, В.Н. Трунин-Донской, JI.A. Чистович, Атал, Гоулд, Итакура, Рабинер, Редди, Шафер, Фант, Фланаган и ряд других.

Научные работы в области использования речи в человеко-машинных системах относятся к приоритетному направлению РФФИ «Теория человеко-машинных систем управления».

Одним из основных параметров устной речи является частота повторения колебаний голосовых связок при произнесении вокализированной речи, называемая «Основным тоном» (ОТ). В мгновенных значениях частоты ОТ, в траектории контура ОТ переносится значительное количество информации, отличающей устную речь от письменной. Статистические параметры основного тона, диапазон его значений, диапазон скоростей изменения и т.д. в значительной мере определяют структуру и параметры устройств выделения основного тона. Эти устройства входят в состав большинства систем распознавания и обработки речи и относятся к одним из основных и наиболее сложных блоков.

Взаимодействие факторов, влияющих на контур ОТ, нелинейно и имеет довольно сложные зависимости, трудно поддающиеся математическому описанию. В значительной мере методы анализа и обработки речи, используемые в системах распознавания и передачи данных, основаны на эвристических предположениях.

Методы выделения ОТ, которые можно было бы использовать для решения всех поставленных выше проблем, отсутствуют. Разработка алгоритма выделения ОТ, обеспечивающего точную и надежную оценку значений частоты ОТ, работающего в автоматическом режиме с реальным речевым сигналом в условиях реальной речевой обстановки, является актуальной задачей.

Выделитель частоты ОТ должен определять мгновенные значения частоты ОТ на всем интервале работы голосового источника, включая моменты начала и окончания вокализации. Знание мгновенных значений частоты ОТ позволяет сохранить всю информацию, содержащуюся в контуре ОТ, включая изменения, связанные с мелодией ОТ. Этот алгоритм должен работать в автоматическом режиме для произвольного речевого сигнала в условиях реальной речевой обстановки. Алгоритм должен быть достаточно прост и удобен для встраивания в другие программы по обработки речи человеко-машинных систем управления. Интерфейс алгоритма должен быть дружественным по отношению к произвольному, в том числе, незнакомому с особенностями алгоритма, пользователю.

Объект исследования: системы выделения информации из акустического сигнала речи, системы автоматизации измерений, системы выделения основного тона речевого сигнала.

Предмет исследования: интегральные и локальные методы выделения основного тона и методы принятия решения «ТОН/НЕ ТОН» (Т/НТ), обеспечивающие повышенную точность и надежность выделения частоты ОТ и признака Т/НТ, методы предварительной обработки речевого сигнала, методы организации совместной работы локального и интегрального выделителя ОТ, методы автоматизации измерений в алгоритме выделения ОТ.

Цель работы: разработка и научное обоснование алгоритма выделения основного тона совместно с алгоритмом принятия решения Т/НТ, позволяющих с высокой надежностью и точностью в автоматическом режиме определять положения моментов возбуждения речевого тракта, начал и окончаний интервалов вокализации и предназначенных для работы с речевым сигналом произвольного диктора в условиях реальной окружающей обстановки.

Для достижения поставленной цели следует решить следующие задачи:

- провести анализ существующих методов выделения ОТ и методов принятия решения Т/НТ, позволяющих с высокой надежностью и точностью определять мгновенную частоту ОТ и признак Т/НТ и способных к адаптации к конкретному речевому сигналу в процессе выделения частоты ОТ и признака Т/НТ;

- уточнить параметры существующих и разработать новые способы предварительной обработки речевого сигнала, обеспечивающие повышение надежности и точности работы алгоритма выделения ОТ;

- разработать алгоритм интегральной оценки начальной частоты ОТ, необходимой для инициализации локального выделителя ОТ в моменты перехода от невокализированных интервалов речи к вокализированным;

- разработать алгоритм организации совместной работы двух выделителей ОТ, построенных на различных принципах работы: локальном и интегральном;

- разработать методику динамической адаптации параметров алгоритма выделения ОТ к конкретной реализации речевого сигнала, определить параметры алгоритма динамической адаптации;

- разработать методику выбора порогов принятия решения Т/НТ, обеспечивающую адаптацию алгоритма к конкретному произнесению в условиях реальной речевой обстановки;

- на реальном речевом сигнале провести сравнительные эксперименты по оценке надежности и точности выделения ОТ, надежности и точности принятия решения Т/НТ предлагаемым в настоящей работе алгоритмом выделения ОТ и известными методами выделения ОТ.

Методы исследования включают в себя методы: системного анализа, математической статистики, теории распознавания образов, теории анализа речевых сигналов, теории цифровой обработки сигналов, методы математического моделирования на ЭВМ. Экспериментальные исследования проведены с использованием стандартного математического обеспечения ЭВМ и собственного программного обеспечения.

Программно-инструментальные средства реализованы на алгоритмическом языке — С\С++. Программное обеспечение разработано в среде программирования Borland С++Builder 6.

Достоверность и обоснованность полученных результатов подтверждается результатами теоретических и экспериментальных исследований. Математические модели, алгоритмы и прикладные программы, предложенные в работе, основаны на фундаментальных положениях теории речеобразования, теории цифровой обработки сигналов, в том числе речевых сигналов, а так же на методах математической статистики.

Достоверность экспериментальных результатов обеспечивается использованием большого объема экспериментального материала, экспериментальным подтверждением предложенных в диссертации решений, а также сравнением экспериментальных результатов, полученных предложенным в настоящей работе алгоритмом, с результатами работы известных методов выделения основного тона.

На защиту выносятся результаты теоретических исследований и предложений по построению алгоритма автоматизированного выделения ОТ, в том числе:

- способ адаптации параметров локального выделителя ОТ, построенного по методу GS, к конкретному сигналу произвольного диктора в условиях обработки речи, близких к реальным;

- алгоритм организации совместной работы локального и интегрального методов выделения ОТ, использующей нестабильность длительностей последовательных периодов ОТ как критерий включения алгоритма интегральной оценки ОТ;

- методика принятия решения Т/НТ, обеспечивающая адаптацию принимаемого решения к произвольному речевому сигналу;

- алгоритм интегральной оценки частоты ОТ на основе вычисления автокорреляционной функции огибающей спектра;

- методика определения полуволны речевого сигнала, по которой оценивают положение начала периода ОТ;

- способ оценки величины порогов принятия решения Т/НТ по гистограмме обобщенного признака Т/НТ.

- результаты сопоставительных экспериментов по выделению контуров ОТ предложенным алгоритмом выделения ОТ и известными методами выделения ОТ;

- информационно - измерительный комплекс для обучения интонационным особенностям языка;

- программно - измерительный комплекс для использования в учебном процессе при изучении дисциплин связанных с цифровой обработки сигналов.

Научная новизна полученных результатов определяется проведенными комплексными исследованиями, в результате которых разработан алгоритм выделения контура ОТ, не требующий ручной настройки, работающий в условиях реальной речевой обстановки с повышенной точностью и надежностью оценки частоты ОТ;

- впервые предложена, разработана и исследована методика автоматической адаптации параметров GS-метода, используемая для выделения основного тона речевого сигнала в условиях реальной речевой обстановки, и предложен критерий выбора текущего оптимального значения параметров этого метода из набора альтернативных значений, получаемых в процессе обработки речевого сигнала;

- впервые разработана и обоснована стратегия управления совместной работой двух выделителей ОТ различного типа: локального выделителя основного тона, основанного на методе GS, и интегрального выделителя ОТ, использующего автокорреляционную функцию огибающей спектра. Предложен и исследован критерий определения моментов включения интегрального метода, который выполняет инициализацию метода GS на переходах от невокализиро-ванных звуков к вокализированным, осуществляет коррекцию сбоев метода GS и способствует снижению общего количества вычислений за счет уменьшения количества включений интегрального метода;

- предложена, разработана и исследована методика принятия решения Т/НТ, обеспечивающая адаптацию принимаемого решения к произвольному речевому сигналу, когда окончательное решение Т/НТ принимают на втором проходе алгоритма;

- впервые предложен и разработан интегральный алгоритм выделения основного тона, в котором для повышения надежности принятия решения о гармониках ОТ используют автокорреляционную функцию огибающей спектра и медианную фильтрацию. Алгоритм обладает повышенной надежностью оценок интегральных значений частоты ОТ, в том числе на переходах от невокали-зированных звуков к вокализированным, при работе с сигналом при низких значениях соотношения сигнал/шум;

- впервые разработана методика оценки полярности речевого сигнала, поступающего на выделитель основного тона;

- предложен, разработан и исследован алгоритм оценки значений порогов для принятия решения Т/НТ по гистограмме значений обобщенного признака, вычисляемого синхронно с основным тоном.

Практическая полезность работы состоит в том, что в результате комплексных исследований и предложений создана информационно-измерительная система автоматического выделения частоты ОТ, не требующая нормализации сигнала по амплитуде, обладающая повышенной точностью оценки мгновенных значений частоты ОТ, определяющая начало периода ОТ и обеспечивающая автоматическую подстройку параметров алгоритма к произнесению произвольного диктора.

Разработанный в ходе исследований алгоритм определения полуволны речевого сигнала, повышает точность оценки положения начала импульса ОТ, позволяет строить системы выделения параметров речи, инвариантные относительно числа инверсий в каскадах обработки и передачи речевого сигнала, в том числе системы синхронного с ОТ анализа речи.

Созданный в работе алгоритм начальной оценки частот ОТ с использованием автокорреляционной функции огибающей спектра (АКФС) обеспечивает получение интегральной оценки частоты ОТ на переходах от невокализирован-ных к вокализированным интервалам речи, на интервалах речи с повышенной нестабильностью траектории частоты ОТ при наличии аддитивных шумов и искажений. Совместная работа локального выделителя ОТ по методу GS и интегрального выделителя ОТ с использованием АКФС организована на основе критерия наибольшей близости соседних периодов ОТ. Данный критерий учитывает специфику речевого сигнала и позволяет выполнить автоматическую инициализацию метода GS в моменты начал вокализации, а также коррекцию ошибок метода GS при сбоях. Совместная работа обоих алгоритмов обеспечивает автоматическую инициализацию всего алгоритма в целом и повышение надежности и точности выделения мгновенных значений частоты ОТ.

Предложенный и реализованный алгоритм выбора оптимальной функции решения и алгоритм выбора времени блокировки выполняют автоматическую адаптацию параметров алгоритма GS к произнесению произвольного диктора.

Разработанный алгоритм определения порогов принятия решения Т/НТ по гистограмме обобщенного признака, вычисляемого синхронно с основным тоном, позволяет принимать решение Т/НТ для произвольного речевого сигнала в условиях изменения окружающей речевой обстановки.

Создан комплекс обучения интонационным особенностям иностранных языков, включая тональные языки. Комплекс обучения языку может работать как в интерактивном режиме, так и в условиях дистанционного обучения разговорной речи.

Разработанный в работе алгоритм автоматического выделения ОТ, обладающий повышенной точностью и надежностью выделения частоты ОТ и обеспечивающий автоматическую адаптацию к произвольному диктору в уеловиях реальной речевой обстановки, может найти применение в устройствах компрессии речи, используемых в системах связи и телекоммуникаций; в системах распознавания диктора по голосу для контроля прав доступа диктора к отдельным объектам; в системах оценки эмоционального состояния диктора, например в системах контроля состояния авиадиспетчеров; машинистов локомотивов и т.п.; в системах распознавания смысла высказывания и в других областях науки и техники.

Разработанные в диссертационной работе подходы анализа и обработки акустического сигнала нашли применение в экспертно — криминалистическом центре МВД по Удмуртской Республике при проведении криминалистической идентификации дикторов по фонограммам их устной речи, а именно при проведении микроанализа, на кафедре «Английский язык» при обучении интонационным особенностям иностранных языков, а также в виде программ и методик, внедренных в учебной и научной работе кафедры вычислительной техники Ижевского государственного технического университета, что подтверждено соответствующими актами.

Апробация работы. Основные научные положения и практические результаты диссертационной работы обсуждались на: научно технической конференции «Приборостроение в XXI. Интеграция науки, образования и производства» (Ижевск, 2004г.); на 3-ей научно-технической конференции «Приборостроение в XXI. Интеграция науки, образования и производства» (Ижевск, 2006г.); на XVIII сессии Российского акустического общества. Секция «Акустика речи» (Таганрог, 2006г) (работа отмечена дипломом); на XIX сессии Российского акустического общества. Секция «Акустика речи» (Нижний-Новгород, 2007г.) (работа отмечена дипломом); на XX сессии Российского акустического общества. Секция «Акустика речи» (Москва, 2008г.) (работа отмечена дипломом).

Публикации. Основные результаты диссертации опубликованы в 21 работах, из них 2 опубликованы в издании, рекомендованного ВАК РФ.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения и приложения. Основной текст изложен на 168 машинописных страницах, содержит 64 рисунка и 22 таблицы. Список литературы включает 142 наименований.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Лузин, Дмитрий Александрович

5.6. Выводы

1. Предложенная в работе модернизация алгоритма выделения ОТ по методу GS (алгоритм GS2) позволила полностью автоматизировать процесс выделения основного тона. Надежность выделения ОТ модернизированным алгоритмом GS2 превосходит надежность выделения ОТ при ручной подстройке параметров алгоритма GSI.

2. Для сравнительного анализа работы алгоритмов выделения ОТ, малые ошибки, возникающие при оценке частоты ОТ, не могут служить надежным критерием. Сравнивать алгоритмы между собой предпочтительней по обобщенной ошибке. Обобщенная ошибка определяется как корень квадратный из суммы квадратов средней ошибки Т/НТ и большой ошибки оценки траектории частоты ОТ. Анализ работы отдельного алгоритма выделения ОТ необходимо проводить отдельно по каждому виду ошибок.

3. На чистом сигнале по величине обобщенной ошибки различные методы выделения ОТ могут быть ранжированы следующим образом: алгоритм GS2 (2,76%), ЛЖ (3,63%), пиковый (4,13%), Рабинера-Гоулда (5,96%), Кепстральный (6,02%), Фильтровой (7,56%) и автокорреляционный (11,93%). Меньшую величину обобщенной ошибки показал алгоритм GS2. Три локальных выделителя ОТ (GS2, ЛЛК и пиковый) были среди лучших. Интегральные методы (Кепстральный, Рабинера-Гоулда и автокорреляционный) не передают информацию о мелких флуктуациях контура ОТ.

4. Добавление шума к сигналу снижает надежность выделения ОТ во всех, без исключения методах. Добавление шума до значения С/Ш = 10 дБ относительно слабо влияет на надежность выделения ОТ. Обобщенная ошибка при этом возрастает примерно в два раза. Резкое увеличение обобщенной ошибки, когда уже выделители ОТ практически неработоспособны начинается с соотношения С/Ш = 5 дБ. При всех уровнях шума алгоритма GS2 показал наименьшую ошибку.

5. Все методы оказались способны выделять основной тон из предельно ограниченного сигнала, что говорит о том, что только временных соотношений достаточно для извлечения информации об основном тоне.

6. Алгоритм автоматизированного выделения ОТ GS2 показал себя как конкурентоспособный на всех типах сигналов, на всех голосах при малом уровне аддитивного шума.

7. Алгоритм GS2 использован для построения системы обучения интонационным особенностям языка и в системах распознавания человека по голосу.

ЗАКЛЮЧЕНИЕ

В диссертационной работе получены следующие новые научные результаты:

1. Впервые предложена, исследована и разработана методика автоматической адаптации параметров (х^-метода, используемая при выделения основного тона речевого сигнала в условиях реальной речевой обстановки, и предложен критерий выбора текущего оптимального значения параметров этого метода из набора альтернативных значений, получаемых в процессе обработки речевого сигнала.

2. Впервые разработана и обоснована стратегия управления совместной работой двух выделителей ОТ различного типа: локального выделителя основного тона, основанного на методе GS, и интегрального выделителя ОТ, использующего автокорреляционную функцию огибающей спектра. Предложен, исследован и проверен критерий определения моментов включения интегрального метода, который выполняет инициализацию метода GS на переходах от невокализированных звуков к вокализированным, осуществляет коррекцию сбоев метода GS и способствует снижению общего количества вычислений за счет снижения количества включений интегрального метода.

3. Предложена, исследована и разработана методика принятия решения Т/НТ, обеспечивающая адаптацию принимаемого решения к произвольному речевому сигналу, когда окончательное решение Т/НТ принимают на втором проходе алгоритма.

4. Разработана автоматическая система, предназначенная для выделения частоты основного тона речи на основе совместного использования локального и интегрального методов выделения основного тона, на основе автоматической адаптации параметров локального выделителя основного тона к речевому сигналу и на основе подстройки порогов принятия решения ТОН/НЕ ТОН к конкретной реализации речевого сигнала.

5. Впервые предложен и разработан интегральный алгоритм выделения основного тона, в котором для повышения надежности принятия решения о гармониках ОТ используется автокорреляционная функция огибающей спектра и медианная фильтрация. Алгоритм обладает повышенной надежностью оценок интегральных значений частоты ОТ, в том числе на переходах от невокали-зированных звуков к вокализированным, при работе с сигналом при низких значениях соотношения сигнал/шум. По сравнению с кепстральным методом ошибки оценки частоты ОТ снижены в 1,5—2 раза.

6. Впервые разработана методика оценки полярности речевого сигнала, поступающего на выделитель основного тона.

7. Предложен, разработан и исследован алгоритм оценки значений порогов для принятия решения Т/НТ по гистограмме значений обобщенного признака, вычисляемого синхронно с основным тоном.

К результатам, отражающим практическую ценность диссертационной работы можно отнести:

1. Создан практический алгоритм выделения частоты ОТ, не требующий нормализации сигнала по амплитуде, обладающий повышенной точностью оценки мгновенных значений частоты ОТ. Разработанный алгоритм выделения ОТ обеспечил значение обобщенной ошибки 2,76% на чистом сигнале, 9,86% -на телефонном сигнале, 18,56% - на сигнале с аддитивным шумом и при соотношении сигнал/шум 5 дБ.

2. Разработанный алгоритм определения полуволны речевого сигнала, повышает точность оценки положения начала импульса ОТ, позволяет строить системы выделения параметров речи, инвариантные относительно числа инверсий в каскадах обработки и передачи речевого сигнала, в том числе системы синхронного с ОТ анализа речи.

3. Созданный в работе алгоритм начальной оценки частот ОТ на основе автокорреляционной функции огибающей спектра (АКФС) обеспечивает получение интегральной оценки частоты ОТ на переходах от невокализированных к вокализированным интервалам речи, на интервалах речи с повышенной нестабильностью траектории частоты ОТ при наличии повышенного уровня аддитивных шумов и искажений.

4. Разработанный алгоритм определения порогов принятия решения Т/НТ по гистограмме обобщенного признака, вычисляемого синхронно с основным тоном, позволяет принимать решение Т/НТ для произвольного речевого сигнала в условиях изменения окружающей речевой обстановки.

5. Разработана информационно-измерительная система, предназначенная для автоматического выделения частоты основного тона речи на основе совместного использования локального и интегрального методов выделения основного тона, на базе автоматической адаптации параметров локального выделителя основного тона к речевому сигналу и на основе подстройки порогов принятия решения Т/НТ к конкретной реализации речевого сигнала.

6. Показана возможность идентификации диктора по интонационным контурам парольных фраз, полученным предложенным в работе алгоритмом автоматического выделения основного тона. На основе информационно-измерительной системы создан информационно-измерительный комплекс для обучения интонационным особенностям иностранных языков. Разработанные в работе алгоритмы и программы по цифровой обработке сигналов использованы при проведении криминалистических экспертиз, в учебном процессе при изучении соответствующих дисциплин, в ходе дипломного проектирования и выполнения магистерских работ.

Список литературы диссертационного исследования кандидат технических наук Лузин, Дмитрий Александрович, 2009 год

1. Аврин С.Б., Мочалов В.А. Алгоритм выделения основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара (АРСО-16). М., 1991. - С. 241-242.

2. Акинфиев Н.Н., Жарова С.С., Собакин А.Н. Детектирование сигнала основного тона из озвученных звуков // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 7 Всесоюзн. школы-семинара. Алма-Ата, 1973. - С. 53-55.

3. Архипов И.О. Сегментация речи по признаку ТОН/НЕТОН синхронно с основным тоном // Труды научно-молодежной школы "Информационно-измерительные системы на базе наукоемких технологий". — Ижевск: Изд-во ИПМ УрОРАН, 1998 с. 5-8.

4. Архипов И.О., Гитлин В.Б. Оценка точности выделения основного тона методом GS // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. -С. 38-42.

5. Архипов И.О., Гитлин В.Б. Оценка частоты среза ФНЧ, используемого для выделения основного тона // Труды научно-молодежной школы "Информационно-измерительные системы на базе наукоемких технологий". — Ижевск: Изд-во ИПМ УрОРАН, 1998.-С. 12-16.

6. П.Архипов И.О., Гитлин В.Б. Формирование признака ТОН/НЕТОН синхронно с основным тоном // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. -С. 43-46.

7. Барабаш Ю.Л. и др. Вопросы статистической теории распознавания. -М.: Советское радио, 1967. 400с.

8. Баронин С.П. Автокорреляционный метод выделения основного тона речи // Сб. тр. Гос. НИИ Министерства связи СССР. 1961. 3 (24). - С. 93-102.

9. Баронин С.П., Крюков Г.В. Алгоритм выделения основного тона во временной области // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. -М., 1991. С. 100-101.

10. Баронин С.П., Куштуев А.И. О построении выделителей основного тона следящего типа// 8 Всесоюзн. акуст. конф.: Реф. докл. Том 1. - М., 1973. - С. 75.

11. Баронин С.П., Куштуев А.И. О построении системы адаптации анализаторов частоты основного тона речи // 7 Всесоюзн. акуст. конф.: Тез. докл. Л., 1071. -С. 18.

12. Баронин С.П., Куштуев А.И. Устройство для измерения частоты основного тона речевых сигналов. А.с. N 280561 СССР, МКИ Н04М 11/10, 01Н, оп. 03.09.70.

13. Белявский В.М., Ежова Л.В. Спектрально-временные признаки для сегментации речи по звукам // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 8 Всесоюзн. школы-семинара. Львов, 1974, - 4.2. - С. 32-37.

14. Блохина Л.П. Восприятие макромодуляции частоты ОТ в речевом сигнале // Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 17 Всесоюзн. семинара. Ижевск, 1992. С. 11-114.

15. Блохина Л.П. К вопросу о слуховом восприятии частотного контура фразы // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 8 Всесо-юзн. школы-семинара. Львов, 1974. - Ч.З. - С. 57-59.

16. Блохина Л.П. О возможности использования модуляции частоты основного тона в автоматическом распознавании эмоциональных состояний // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещания-симпозиума. Одесса, 1989.-С. 30-40.

17. Блохина Л.П. О роли интонации в выражении межсинтагменных и межфразовых связей в устном тексте // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. акустич. школы-семинара. -Ереван, 1980. С. 259.

18. Блохина Л.П. О роли модуляции частоты основного тона в макросегментации слитной речи // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 14 Всесоюзн. семинара. -Каунас, 1986. С. 16-17.

19. Бондаренко М.Ф., Гавращенко А.Н. Метод сегментации слитной речи по ее "динемическим портретам" // Автоматическое распознавание слуховых образов: Тез. докл. 15 Всесоюзн. семинара. Таллин, 1989. С. 184-185.

20. Борисов В.Н., Гитлин В.Б. Корреляционный метод выделения основного тона с использованием параллельной фильтрации // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. -М., 1991. С. 102-103.

21. Вокодерная телефония. Под ред. Пирогова А.А. М.: Связь, 1974. - 536 с.

22. Высоцкий Г.Я., Сомин Н.В., Трунин-Донской В.Н., Червонный В.К. Алгоритм выделения основного тона спектральными методами на ЭВМ среднего класса // Дискретная обработка речевых сигналов. -М.: ВЦ АН СССР, 1979. С. 36-66.

23. Галунов В.И., Коваль С.Л., Тампель И.Б. Биофизика речеобразования // Модели речевого процесса в норме и патологии: Докл. и сообщ. Всесоюзн. симпозиума (13-15 июня 1979 г. Гродно). Л., 1980.

24. Галунов В.И., Кутуков Г.П., Матюнин С.Н. Состояние и перспективы исследований в области речевых технологий // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999.-С. 13-16.

25. Галунов В.И., Сомин Н.В., Тарасов А.И., Трунин-Донской В.Н., Якушенков Г.А. Спектральные методы выделения основного тона // Вопросы кибернетики. Анализ и синтез речи в системах управления. М., 1976 - Вып. 22. - С. 28-38.

26. Галунов В.И., Станкевич СЛ., Тапель И.Б. Исследование и моделирование процесса речеобразования // Рефераты докл. 8 Всесоюзн. акустич. конф. -М., 1973. Т.1.-С.70.

27. Галунов В.И., Тампель И.Б. Механизм работы голосового источника / Акустический журнал. Т. 27. - Вып. 3, 1981. - С. 321-334.

28. Галунов В.И., Таубкин B.JI. Речевая наука речевые технологии - перспективы практического использования // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. - М.: ГЕОС, 1999. -С. 13.

29. Гитлин В.Б. Основной тон речевого сигнала / Деп. В ВИНИТИ, 1998. № 1206-В98. - 739с.

30. Гитлин В.Б., Книппер А.В., Сметанин A.M., Сорокин С.Л., Шуткин В.Е. Устройство для выделения основного тона речи. А.с. N 714474 СССР, МКИ 10 1/00. Оп. в БИ N 5 05.02.80.

31. Гитлин В.Б., Кузнецов П.Г.,. Тихонов Г.А. Переключающая схема для устройства выделения основного тона // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1973. - Вып. 8. - С. 223-228.

32. Гитлин В .Б., Лузин Д.А. Оптимизация выбора коэффициента асимметрии в методе GS // Приборостроение в XXI. Интеграция науки, образования и производства: Тр. научн.-техн. конф. —Ижевск: Изд-во ИжГТУ, 2005. — С. 45-48.

33. Гитлин В.Б., Лузин Д.А. Программа выделения основного тона речи по методу GS с использование оконного интерфейса. Приборостроение в XXI. Интеграция науки, образования и производства: Тр. научн.-техн. конф. — Ижевск: Изд-во ИжГТУ, 2004. -С.288-293.

34. Гитлин В.Б., Сметанин A.M. Исследование участков смыкания и размыкания голосовых связок на ЭВМ // Дискретные системы обработки информации. -Ижевск, 1978. Вып.1. -С. 71-75.

35. Гитлин В.Б., Сметанин A.M., Шуткин В.Е. Обнаружение интервалов смыкания и размыкания голосовых связок // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. -С. 134-136.

36. Гончаров С.Л., Зеленый А.И., Кашичева У.Б. Сегментация речевой волны по параметрам основного тона // Автоматическое распознавание слуховых образов: Тез. докл. 15 Всесоюзн. семинара. Таллин, 1989. - С. 190-191.

37. Гурман В.Е. Теория вероятностей и математическая статистика. Учебное пособи для вузов. Изд. 7-е, стер. М.: Высш. шк., 1999.-479с.

38. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. -512 с.

39. Какауридзе А.Г., Тушишвили М.А. Способ определения звонкости в речевом сигнале. A,c.N 390558 СССР. Оп. 11.07.73 в BHN 30, МКИ 10 1/04.

40. Кельманов А.В. Алгоритм выделения основного тона по разностной функции ряда остаточных ошибок модели авторегрессии // Вычислительные системы.

41. Методы обнаружения закономерностей с помощью ЭВМ. Новосибирск, 1981. -Вып. 91.-С. 113-124.

42. Кельманов А.В. Алгоритм классификации тон/шум по частотным автокорреляциям // Вычислительные системы. Эмпирическое предсказание и распознавание образов. Новосибирск, 1980. - Вып. 83. - С. 67-73.

43. Кельманов А.В. Алгоритм классификации тон/шум, основанный на критерии адекватности модели авторегрессии // Вычислительные системы. Методы обработки информации. Новосибирск, 1978. - Вып. 74. - С. 129-148.

44. Кельманов А.В., Хамидуллин С.А. Алгоритм оценки траектории частоты основного тона // Искусственный интеллект и экспертные системы. Вычислительные системы. Новосибирск, 1996. С. 112-136.

45. Кемешис П.П., Норейка С.Ю., Рудженис А.И. Оценка частоты основного тона сигнала, ограниченного по полосе и при наличии шумов // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982а.- С. 99-100.

46. Книппер А.В., Махонин В.А. Микровариации в речевом сигнале // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 10 Всесоюзн. школы-семинара. Тбилиси: Мецниереба, 1978. - С. 35-36.

47. Кринов С.Н., Савельев В.П., Цемель Г.И. О значимости изменений частоты основного тона для автоматического распознавания речи // Описание и распознавание объектов в системах искуственног интеллекта. М.: Наука, 1980. - С. 92-99.

48. Крылов Ю.Д., Романов С.Ф. Разработка программно-аппаратных средств речевого общения о ЭВМ: Учеб. пособие/ ЛИАП.Л.,1988.-60с.

49. Кузнецов П.Г. Исследования по автоматическому распознаванию и идентификации голосов / Диссертация на соискание ученой степени кандидата технических наук. Казань, 1970.

50. Лепешкин В.А., Пак С.П., Родионов И.Е. Простой многоканальный выделитель основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. - С. 62-63.

51. Лозовский B.C. Модифицированный разностный метод определения основного тона речи//Тр. АКИН, 1970.-Вып. 12.-С. 189-193.

52. Лузин Д. А. Влияние нормализации амплитуды речевого сигнала на надежность принятия решения «ТОНХНЕ ТОН» в методе GS // Приборостроение в XXI. Интеграция науки, образования и производства: Тр. научн.-техн. конф. -Ижевск: Изд-во ИжГТУ, 2007. -С.389-393.

53. Лузин Д. А., Гитлин В.Б. Переключение полярности входного сигнала в выделителе основного тона речи по методу GS // Приборостроение в XXI. Интеграция науки, образования и производства: Тр. научн.-техн. конф. -Ижевск: Изд-во ИжГТУ, 2007.-С.382-385.

54. Гитлин В.Б, Лузин Д.А. Алгоритм поиска оптимального значения коэффициента асимметрии в выделителе основного тона по методу GS // Сборник трудов XVIII сессии Российского акустического общества. Таганрог. Том 3. -М.: ГЕОС, 2006.-С 11-14.

55. Лузин Д.А. Алгоритм выделения основного тона речевого сигнала на основе автокорреляционной функции спектра // Высокие технологии-2004:Сб. тр. на-уч.-техн. Форума с междунар. участием: В 4ч.-Ч.З.-Ижевск:Изд-во ИжГТУ, 2004. -С. 100-106.

56. Лузин Д.А. Алгоритм начальной оценки основного тона речи для выделителя основного тона речи по методу GS // Сборник трудов XVTII сессии Российского акустического общества. -Таганрог. Том 3. -М.: ГЕОС, 2006.- С. 21-23.

57. Лузин Д.А. Экспериментальная оценка точности выделения основного тона речевого сигнала по автокорреляционной функции спектра // Сборник трудов XX сессии Российского акустического общества. Нижний-Новгород. Том 3. -М.: ГЕОС, 2007.- С. 19-22.

58. Маркел Дж. Д., Грэй А.Х. Линейное предсказание речи. М.: Связь, 1980. -308с.

59. Методические рекомендации по практическому использованию программы SIS при работе с речевыми сигналами / Центр речевых технологий. Санкт-Петербург. С. Петербург, 1997. - 394 с.

60. Муравьев В.Е. О современном состоянии и проблемах вокодерной техники // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. - С. 22-27.

61. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и Связь, 1985. - 176 с.

62. Норейка С.Ю. Исследование методов и разработка аппаратуры анализа траекторий основного тона речи / Автореф. дисс. на соиск. ученой степени к.т.н. -Каунас, 1983. 22с.

63. Норейка С.Ю., Рудженис А.И. Исследование источника возбуждения посредством обратной фильтрации // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. - С. 139142.

64. Пирогов А.А. Устройство для автоматического выделения частоты основного тона. -А.с. N 129739 СССР.- Приор, от 08.6.58 НКИ 21е 1/20 42е.

65. Рабинер Л.Р., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978.

66. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. - 485с.

67. Рамишвили Г.С. Речевой сигнал и индивидуальность голоса. — Тбилиси: Мецниереба, 1976.-184с.

68. Рылов А.С. Практические аспекты и основные компоненты современных систем распознавания речевых образов // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. -С. 145-151.

69. Сапожков М.А. Речевой сигнал в кибернетике и связи. М.: Связьиздат, 1963.-472с.

70. Сапожков М.А., Михайлов В.Г. Вокодерная связь.-М.: Радио и связь, 1983.-248с.

71. Сметанин A.M. Исследование и разработка методов повышенной точности измерений параметров формант и голосового источника. Диссертация на соискание ученой степени к.т.н. - Ижевск, 1980.

72. Собакин А.Н. Адаптивный метод выделения основного тона речи // Автоматическое распознавание слуховых образов : Тез. докл. и сообщен. 8 Всесоюзн. школы-семинара. Минск, 1976. - С. 49.

73. Собакин А.Н. Анализ голосового источника по речевому сигналу // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 15 Всесоюзн. семинара. Таллин, 1989. - С. 233-234.

74. Собакин А.Н. Основной тон речи и метод его исследования // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. -С. 47-50.

75. Соболев В.Н., Баронин С.П. Исследование сдвигового метода выделения основного тона речи // Электросвязь. 1968а. - С. 30-36.

76. Сорокин В.Н. Новые концепции в автоматическом распознавании речи // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. М.: ГЕОС, 1999. -С. 50-57.

77. Сорокин В.Н. Теория речеобразования. -М.: Радио и связь, 1985.-312 с.

78. Уилкс С. Математическая статистика. М., 1967. - 632с.

79. Фант Г. Акустическая теория речеобразования. М.: Наука, 1964. 284 с.

80. Фланаган Дж. Анализ, синтез и восприятие речи. М.: Связь, 1968. - 395 с.

81. Шишкин Е.В., Боресков А.В. Компьютерная графика. — М.:Диалог-МИФИ., 1995.-288 с.

82. Al-Hashemy B.A.R., and Taha S.M.R. Voiced Unvoiced - Silence classification of speech signals based on statistical approaches // Appl. Acoust., 1988. - 25. - N 3. - p. 169-179.

83. Atal B.S. Speech signal pitch detector using prediction error date. -Pat. N 3740476 USA. G10L 1/04. - 19.06.73.

84. Atal B.S., Rabiner L.R. A pattern recognition approach to voiced-unvoiced-silence classification with application to speech recognition // IEEE Trans. Acoust., Speech and Signal Process. 1976. - 24. -N 3. -p. 201-202.

85. Carre R. Review of French work on vocal source vocal tract interaction // Eleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. - Tallinn, 1987. - Vol. 3. - p. 371375.

86. Chan C. Voiced/unvoiced segmentation // ICASSP'86: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1986. - Vol. 3. - p. 2271-2274.

87. Dadley H. Remaking speech // J. Acoust. Soc. Am. -1939. 11. - N 2. - p. 167169.

88. De Souza P. A statistical approach to the design of an adaptive self-normalising silence detector // IEEE Trans. Acoust., Speech and Signal Process.- 1983. 31.-N3.-p.678-684.

89. Dolansky L.O. Instantaneous pitch period indicator // J. Acoust. Soc. Am. -1955.-27.-N 11.-p. 67-72.

90. Fant G. Speech production. Glottal source and excitation analysis // Quart Progr. and Status. Rept. Speech Transmits. Lab. 1979. -N 1. p. 85-107.

91. Friedman D.H. Multidimensional Pseudo-Maximum Likelihood pitch estimation // IEEE Trans. Acoust., Speech and Signal Process. 1978. - Vol. 26. - N 3. - p. 185-196.

92. Gibson B.R., Greenwood E. Windowing Function for the average magnitude difference function pitch extractor // ICASSP 80: Proc. Denver Cole., 1980, Vol. 1. -New York, N.Y. 1980. - p. 49-52.

93. Gill J.S. Apparatus for distinguishing between voiced and unvoiced sounds in a speech signal 3 / Pat. N 1113225 Grait Britan. 08.05.68. - H4R.

94. Gold В., Rabiner L. Parallel Processing techniques for estimating pitch periods of speech in the time domain // J. Acoust. Soc. Am. 1969. - 46. - N 2 (Pt.2). - p. 442448.

95. Hebid M.K., and Robinson D.M., Sincoscie W.D. Real Zeros in pitch detection // IEEE Int. Conf. Acoust., Speech and Signal Process. Record. Tulsa, Okla, 1978. New York, N.Y. - 1978. - p. 31-34.

96. Hess W. On-line digital pitch period extractor for speech signals // Proc. Summer Sch. Circuit theory : Short. Contrib. Prague, 1974. - N 2. - p. 413.

97. Hess W. Pitch determination. An example for the application of signal processing methods in speech domain // Speech Processing: Theor. and Appl: Proc. EUSIPCO-80, 1-st Eur. Signal Process. Conf. Lausanne, Sept. 16-18. Amsterdam,1980. - p. 625634.

98. Holmes J.N. An investigation of the volume velocity waveform at the larynx during speech by means of inverse filter // Proc. Speech Commun. Siminar. Stockholm, 1962.-Vol. 1.-B4.

99. Howard D.M., and Howard I.S. Quantitative comparison of speech fundamental period estimation devices // Eleventh int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallinn, 1987. Vol. 4.-p. 52-55.

100. Kasuya H. An improved autocorrelation pitch detector // J. Acoust. Soc. Jap. -1980.-(E) 1,N 4.-p. 263-264.

101. Laver J., Hiller S., Hanson R. Comparative performance of pitch detection algorithms on disphonic voices // ICASSP'82: Proc. IEEE INT. Conf. Acoust., Speech and Signal Process. New York, 1982. - Vol.1. - p. 192-195.

102. Miller N.J. Pitch detection by data reduction // IEEE Symp. speech recogn. -Carnague-Mellon Univ., 1974. Contrubut Pap. - p. 122-130.

103. Noll A.M. Cepsrtum pitch determination // J. Acoust. Soc. Am. 1967. - 41, N 2.-p. 293-309.

104. Noll A.M. Pitch determination of human speech by the harmonic product spectrum, the harmonic sum spectrum and a maximum likelihood estimation // Proc. Symp. Сотр. Proc. Commun. N.Y., 1969, Brooklin, N.Y., 1970. - p. 779-797.

105. Noll A.M. Short-time spectrum and "Cepstrum" techniques for vocal-pitch detection // J. Acoust. Soc. Am. 1964. - 36, N 2. - p.

106. Oppenheim A.V., Shafer R.W. Homomorphic analysis of speech // IEEE Trans Audio and Electroacoust. 1968. - 16, N 2. - p. 221-226.

107. Rabiner R.L., Chang M.J., Rosenberg A.E., McGonegal C.A. A comparative performance study of several pitch detection algorithms // IEEE Trans. Fcoust., Speech Process. 1976. - p. 399-418.

108. Shafer H.L., Cohen A., Freudberg R., Manley H.L. Average magnitude difference function pitch extractor // IEEE Trans> Acoust., Speech and Signal Projcess. Oct. 1974.-22.-p. 353-362.

109. Shafer R.W., and Rabiner L.R. Digital representation of speech signals // Proc IEEE. 1975. - 63, N 4. - p. 662-677.

110. Sluyter R.J., Kotmans H.J., Classen L.A.V. A nowel method for pitch extraction from speech and hardware model applicable to vocoder systems // ICASSP'80: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1980. - Vol. 1. - P. 4548.

111. Sluyter R.J., Kotmans H.J., Classen T.A.C.M. Inprovements of the Harmonic-Sieve pitch extraction scheme and an appropriate method for voiced/unvoiced detection. 1982

112. Stevens K.N. Interaction between acoustic source and vocal tract configuration for consonants // Eleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallinn, 1987. -Vol.3.-p. 385-389.136. http://www.tellmemore.com/

113. Лузин Д.А., Лекомцева Е.Ю. Комплекс программ для системы обучения интонационным особенностям иностранных языков // Информационные системы в промышленности и образовании: Сб. тр. молод, ученых. Вып.З. Ижевск: Изд-во ИжГТУ, 2008. - С. 101-106.

114. Гитлин В. Б., Лузин Д. А. Экспериментальная оценка точности выделения частоты основного тона обобщенным методом GS II XXI сессия Российского акустического общества. Москва. Том 3. -М.: ГЕОС, 2008.-С.54-58.

115. Гитлин В. Б., Лузин Д. А., Фаррахов А. Ф. Система обучения интонационным особенностям языка // XXI сессия Российского акустического общества. Москва. Том 3. -М.: ГЕОС, 2008.- С.52-54.

116. Архипов И.А., Гитлин В.Б., Лузин Д.А. Синхронный с основным тоном двухпроходный алгоритм принятия решения «ТОН-НЕ ТОН» // Вестник ИжГТУ. -Ижевск: Изд-во ИжГТУ, 2008. -№4. С.150-153.

117. Гитлин В.Б., Лузин Д.А. Автоматический алгоритм выделения основного тона речи по методу GS // Вестник ИжГТУ. — Ижевск: Изд-во ИжГТУ, 2008. №4. -С. 157-160.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.