Разработка концепции выделения основного тона речи в информационно-измерительных системах реального времени тема диссертации и автореферата по ВАК РФ 05.11.16, доктор технических наук Гитлин, Валерий Борисович

  • Гитлин, Валерий Борисович
  • доктор технических наукдоктор технических наук
  • 2000, Ижевск
  • Специальность ВАК РФ05.11.16
  • Количество страниц 308
Гитлин, Валерий Борисович. Разработка концепции выделения основного тона речи в информационно-измерительных системах реального времени: дис. доктор технических наук: 05.11.16 - Информационно-измерительные и управляющие системы (по отраслям). Ижевск. 2000. 308 с.

Оглавление диссертации доктор технических наук Гитлин, Валерий Борисович

ВВЕДЕНИЕ.

1. РОЛЬ ОСНОВНОГО ТОНА РЕЧЕВОГО СИГНАЛА КАК НОСИТЕЛЯ ИНФОРМАЦИИ. МЕТОДЫ ВЫДЕЛЕНИЯ ОСНОВНОГО ТОНА.

1.1. Введение.

1.2. Параметры голосового источника.

1.3. Модели голосового источника.

1.4. Влияние изменений трансглоточного давления на взаимодействие голосового источника и речевого тракта.

1.5. Турбулентные шумы фонем.

1.6. Процессы окончания колебаний голосовых связок.

1.7. Заключительные замечания по вопросам речеобразования.

1.8. Восприятие основного тона.

1.9. Статистика основного тона.

1.10. Просодические характеристики основного тона.

1.11. Заключительные замечания по просодическим характеристикам речи.

1.12. Требования к выделителям основного тона.

1.13 .Нелинейная предобработка.

1.14.Предварительная фильтрация.

1.15. Временные методы выделения основного тона.

1.16. Спектральные методы выделения ОТ.

1.17. Параллельные и комбинированные методы выделения ОТ.

1.18. Заключительные замечания по методам выделения ОТ.

1.19. Выделение интервалов вокализированных, невокализированных звуков и пауз.

1.20. Заключительные замечания по методам принятия решения т/нт,.

1.21. Методы постобработки.

1.22. Сравнительный анализ методов выделения ОТ.

1.23. Постановка задачи исследований.

2. ИССЛЕДОВАНИЯ ОНОВНОГО ТОНА КАК ПРИЗНАКА

ИНДИВИДУАЛЬНОСТИ ГОЛОСА.

2.1. Аудиторские испытания.

2.2. Эксперименты по выделению средней частоты основного тона.

2.3. Обобщенное распределение средней частоты основного для всех голосов.

2.4. Индивидуальные распределения средней частоты основного тона.

3. ВЛИЯНИЕ ГОЛОСОВОГО ИСТОЧНИКА НА СТРУКТУРУ

РЕЧЕВОГО СИГНАЛА.

3.1. Ведение.

3.2. Влияние импеданса голосового источника на параметры формант.

3.3. Экспериментальное исследование интервалов смыкания и размыкания голосовых связок.

3.4. Выводы.

4. СОЛИТОННАЯ МОДЕЛЬ РЕЧЕВОГО СИГНАЛА.

4.1. Введение.

4.2. Введение в солитонную модель речевого сигнала.

4.3. Аппроксимация солитонного сигнала и его спектра.

4.4. Выделение основного тона на основе понятия о генерируемом солитоне.

4.5. Предварительное оценивание параметров фильтра предобработки.

4.6. Алгоритм выделения ОТ по методу GS.

Рекомендованный список диссертаций по специальности «Информационно-измерительные и управляющие системы (по отраслям)», 05.11.16 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка концепции выделения основного тона речи в информационно-измерительных системах реального времени»

Речь есть средство обмена информацией между людьми. В отличие от сигналов, получаемых на выходе технических систем, для речевого сигнала характерна большая вариативность даже при передачах совершенно идентичных сообщений. Кроме смысла (семантики) сообщения речевой сигнал переносит огромное количество дополнительной информации, связанной с индивидуальностью голоса диктора, его эмоциональным состоянием, эмоциональной направленностью высказывания, стилем высказывания, типом речевого сообщения (беседа, монолог и т.п.), окружающей обстановкой, состоянием здоровья голосового аппарата, возрастом диктора, его ростом и весом.

Разработанные к настоящему времени методы выделения и измерения параметров речевого сигнала, основаны на подходах, используемых при анализе регулярных или случайных сигналов неживой природы и не учитывают полностью специфику речи как продукта работы живого организма, предназначенного для общения между людьми.

Речевой сигнал генерируется при прохождении сигнала голосового или шумового источника через речеобразующий тракт. Источник речевого сигнала имеет четыре основных типа: тональное или голосовое возбуждение, шумовое возбуждение, смешанное возбуждение и взрыв. Различие между звуками, определяемое типом источника, есть признак способа образования.

Высокая вариативность речевого сигнала в значительной мере связана с вариативностью параметров источника речевого сигнала. Измерение параметров источника и оценивание способа образования звука есть существенная часть задачи построения систем обработки, сжатия и распознавания речевого сигнала. Трудности оценивания способа образования и оценивания значений параметров источника вызваны следующими основными причинами. 9

1. Некорректность задачи определения параметров источника по акустическому сигналу речи, который является сверткой сигнала источника и импульсной характеристики речевого тракта.

2. Нелинейные эффекты взаимодействия источника и речевого тракта.

3. Наличие активных процессов возбуждения на интервале анализа речевого сигнала, что приводит к неустойчивости ряда линейных моделей речи.

4. Широкий диапазон изменения и стохастичность параметров источника, возможность компенсации изменений одних параметров речевого тракта за счет изменения других его параметров. Широкая вариативность формы речевого сигнала при соответствии одному и тому же фонетическому или интонационному образцу. Большая избыточность речи.

5. Наличие шумов и искажений, в том числе, нелинейных, в каналах связи; наличие акустических и реверберационных шумов.

Голосовой источник может быть представлен в виде пульсирующего воздушного потока. Частота (период) повторения импульсов голосового источника носит название частоты (периода) основного тона. Основной тон (ОТ), являясь одним из основных параметров речевого сигнала, в существенной мере определяет структуру речевого сообщения. Интонационный контур высказывания есть траектория изменения мелодии частоты ОТ. Просодика высказывания, одной из составляющих которой служит интонация, есть существенное отличие акустического сигнала речи от письменной речи.

Частота (период) ОТ переносит существенное количество информации, содержащейся в речевом сигнале. Выделение частоты ОТ, с точки зрения представленной в нем информации, представляет самостоятельный интерес. При этом необходимо определять как относительно медленные изменения (мелодию) траектории частоты ОТ, так и быстрые ее изменения, моменты включения и отключения голосового источника. С другой стороны, и при построении систем анализа, синтеза, распознавания и сжатия речи, необходимо

10 измерять частоту ОТ, которую используют как один из основных признаков, необходимых для описания речевого сигнала.

При работе с реальным речевым сигналом выделитель частоты ОТ должен быть шумозащищенным, должен быть нечувствителен к линейным и нелинейным искажениям, обеспечивать высокую точность выделения частоты ОТ, сохранять точность при больших пределах изменения частоты ОТ, при смене диктора, при смене условий передачи и т.п., при наличии микровариаций частоты ОТ, работать на сигнале непрерывной речи, иметь адекватный детектор вокализации, должен работать в реальном масштабе времени и иметь минимальную стоимость.

Для извлечения максимального количества информации, содержащейся в контуре частоты ОТ, следует предъявить следующее дополнительное требование к системам выделения частоты ОТ: выделитель частоты ОТ должен оценивать мгновенные значения периода (частоты) ОТ.

Существует довольно большое количество методов выделения частоты ОТ. Ряд из них, такие как кепстральный, автокорреляционный, метод Рабине-ра-Голда не способны оценивать мгновенные значения периода ОТ, другие, такие как пиковый, плохо работают в шумах и на телефонном сигнале. Все рассмотренные методы требуют тщательного подбора параметров для каждой конкретной реализации.

Объектом исследования настоящей работы является информационно-измерительная система речевой технологии.

Предметом исследования являются информация, переносимая частотой основного тона(ОТ); методы выделения ОТ; средняя частота ОТ как носитель информации об индивидуальности голоса диктора, структура речевого сигнала на периоде ОТ; модели распознавания речи; методы предварительной обработки речевого сигнала; алгоритм выделения частоты ОТ и алгоритм принятия решения "ТОН/НЕ ТОН" на основе предложенной модели распознавания речи и предложенного синхронно с ОТ подхода к измерению параметров речевого

11 сигнала; критерии оценивания качества предварительной фильтрации и критерии оценивания качества выделителей частоты ОТ.

Целью диссертационной работы является разработка теоретических предпосылок и практическая реализация дополненного алгоритмом принятия решения "ТОН / НЕ ТОН" метода выделения ОТ, работающего с непрерывным сигналом в близком к реальному масштабе времени, оценивающего мгновенные значения периода (частоты) ОТ, при наличии аддитивных помех, линейных и нелинейных искажений сигнала, причем точность оценки периода ОТ, определяется точностью оценок моментов времени, соответствующих моментам возбуждения речевого тракта.

Для достижения поставленной цели определены следующие научно-технические задачи.

1. Анализ видов информации, переносимой частотой ОТ; анализ связи между переносимой информацией и частотой ОТ; анализ структуры речевого сигнала как результат работы речевого тракта.

2. Исследование методов выделения ОТ с точки зрения их способности извлекать информацию из траектории частоты ОТ.

3. Исследование возможностей использования средней частоты ОТ в качестве носителя информации об индивидуальности голоса диктора.

4. Анализ структуры речевого сигнала для получения оценки минимальной длительности, характерной для вокализированного звука; анализ методов обработки речи с точки зрения структуры речевого сигнала.

5. Разработка теоретической модели распознавания речи, ориентированной на поиск единичных событий в непрерывном сигнале, расположенных на границах дискретных информационных событий различного уровня иерархии.

6. Исследование методов предобработки речевого сигнала. Разработка количественного критерия оценивания качества предобработки. Разработка и оценивание новых методов предобработки, повышающих надежность выделения ОТ.

12

7. Реализация предложенной теоретической модели и предложенных подходов в виде алгоритма выделения частоты ОТ и алгоритма принятия решения "ТОН/НЕ ТОН".

8. Разработка обобщенного критерия оценивания качества выделителей частоты ОТ, определение параметров разработанного алгоритма, подлежащих настройке при выделении ОТ конкретного произнесения; проведение сопоставительных испытаний предложенного метода с известными методами выделения частоты ОТ.

Метод исследования опирается на использование понятий технической кибернетики, теории речеобразования, физиологии восприятия речи, теории распознавания образов, теории связи и управления, теории цифровой обработки сигналов, математической статистики. В работе используются методические подходы и методы математического анализа указанных выше дисциплин.

Практическая ценность результатов работы состоит в том, что предложенные теоретические подходы реализованы в виде алгоритмов, которые обеспечили выделение ОТ и принятие решения Т/НТ с надежностью, в общем случае превышающей надежность работы известных методов выделения ОТ.

Предложенный алгоритм выделения ОТ совместно с алгоритмом принятия ре/ шения Т/НТ работает с сигналами с аддитивным шумом при малых соотношениях сигнал/шум, с сигналами, полоса которых ограничена полосой телефонного канала, и с предельно ограниченными по амплитуде сигналами. Предложенные подходы обеспечивают работу разработанных алгоритмов в масштабе времени меньше реального при минимальном числе настроек и регулировок, в том числе, для непрерывного сигнала речи. Предложенные теоретические подходы позволили разработать алгоритмы и программы анализа сигналов в задачах технической диагностики, используемых на производстве и в учебном процессе.

13

Реализация результатов работы. Разработанные в ходе выполнения работы подходы, программы и алгоритмы использованы в автоматизированной системе идентификации лиц по фонограммам русской речи, применяемой в ходе выполнения криминалистических экспертиз криминалистами-экспертами России. Отдельные научные и практические результаты внедрены в научно-производственной фирме "Центр речевых технологий" г. С.-Петербург, в ИИС на ДОАО "Ижевский оружейный завод", ОАО "Вятско Полянский машиностроительный завод "Молот", в Научно-техническом центре "Вычислительная техника", в учебной и научной работе на кафедре ВТ ИжГТУ.

Апробация работы. Основные положения работы докладывались на XI международном конгрессе фонетических наук (XI ICPhS), г. Таллин, 1987; на Всероссийской с международным участием конференции "Распознавание образов и анализ изображений" (РОАИ-98), г. Новосибирск, 1998; на Научно-технической с международным участием конференции "Информационные технологии в инновационных проектах", г. Ижевск, 2000; на IX сессии Российского акустического общества, г. Москва, 1999; на X, г. Минск, 1976, XI, г. Тбилиси, 1978, XII, г. Ереван, 1980, XIII, г. Новосибирск, XIV, г. Каунас, 1998 и XVI, г. Москва, 1991 Всесоюзных школах-семинарах по автоматическому распознаванию слуховых образов (АРСО); на Всесоюзном симпозиуме "Речь, эмоции и личность", г. Ленинград, 1978; на Всероссийской научно-методической конференции, г. Ижевск, 1997; на семинарах научно-молодежной школы "ИИС на базе наукоемких технологий по отраслевой целевой программе "Интеграция" в 1997- 1999 годах. Результаты работы обсуждались на научных семинарах и конференциях Ижевского государственного технического университета.

Публикации. По теме диссертации опубликовано в печати 64 работы и более 10 научно-технических отчетов по научно-исследовательским работам.

14

На защиту выносятся:

1. Законы распределений средних частот ОТ обобщенной группы дикторов и индивидуальные распределения средних частот ОТ.

2. Использование периода основного тона в качестве минимальной длительности постоянства параметров речевого сигнала. Предпочтительность синхронного с ОТ анализа речевого сигнала.

3. Модель распознавания речи, ориентированная на первоначальный поиск границ дискретных единиц информации в непрерывном сигнале речи.

4. Методика аппроксимации функций вида sech(x) и sech (х).

5. Критерий выбора метода предобработки.

6. Методы сглаживания сигнала на этапе предобработки, включая сглаживание всплесковым окном.

7. Предельное ограничение сигнала на этапе предобработки для сигнала с ограниченным спектром.

8. Алгоритм выделения частоты ОТ.

9. Алгоритм принятия решения "ТОН/НЕ ТОН" синхронно с основным тоном. Повышение надежности принятия решения "ТОН/НЕ ТОН" путем добавления шума к сигналу.

10. Обобщенный критерий оценивания качества работы выделителя частоты ОТ.

Диссертационная работа состоит из введения, семи глав, заключения и приложений.

Похожие диссертационные работы по специальности «Информационно-измерительные и управляющие системы (по отраслям)», 05.11.16 шифр ВАК

Заключение диссертации по теме «Информационно-измерительные и управляющие системы (по отраслям)», Гитлин, Валерий Борисович

3.4. Выводы.

Теоретическое рассмотрение и экспериментальные результаты, посвященные вопросам взаимодействия речевого тракта и источника позволяют сделать следующие выводы:

1. Влияние подглоточных областей на речевой тракт в момент открывания голосовых связок может существенным образом изменять форму акустических колебаний в речеобразующем тракте. Степень влияния

113 зависит от площади раскрытия голосовой щели и от параметров голосового источника и речевого тракта, в частности, от соотношения частот ОТ и первой форманты . Процесс существенно нелинеен, не может рассматриваться как стационарный, что является характерным признаком живой речи.

2. Интенсивное нарастание колебаний в момент схлопывания голосовых связок служит признаком начала нового периода ОТ. Исчезновение колебаний, особенно колебаний высокочастотных формант, свидетельствует о переходе к конечному интервалу периода ОТ.

3. В первом приближении спектр, измеренный на периоде основного тона, может рассматриваться как оценка спектра на интервале сомкнутых голосовых связок. Следовательно, временная функция речевого сигнала, соответствующая периоду основного тона, может быть выбрана в качестве минимальной длительности, характерной для вокализированного звука.

114

4. Солитонная модель речевого сигнала.

4.1. Введение.

Согласно Н.Г. Загоруйко [191] всякое распознающее устройство состоит из блока измерения параметров (рецептора Р), блока принятия решений (классификатора К) и блока исполнительных устройств (эффектора Э) (рис.4.1а). Рецептор воспринимает и измеряет параметры физического сигнала, а)

Р : -5 -Э К —э э

-Э б)

Рз -5 -Э К,

-5

Рис.4.1. Структурные схемы распознающих автоматов соответствующего образу. Классификатор в соответствии с некоторыми правилами относит воспринимаемую реализацию к определенной точке выборочного пространства. Эффектор реализует результат решения классификатора в определенное действие.

Рассмотренная модель является довольно грубой. Более сложная модель (рис.4.16) состоит из цепочки боле простых автоматов, каждый из которых

115 имеет структуру, близкую к структуре элементарного автомата, показанного на рис.4.1а. В качестве примера можно рассмотреть алгоритм распознавания устных слов [191]. На протяжении некоторого интервала времени, сравнимого со слогом, рецептор Pi измеряет параметры акустического сигнала, а классификатор Ki относит принятый акустический сигнал к тому или иному слогу. Эффектор Э] фиксирует это решение. Подобная процедура повторяется до конца звучания слова. Затем автомат второй ступени , используя промежуточные решения относительно слогов, определяет к какому из слов, имеющихся в его алфавите, принадлежит данная последовательность слогов. Автомат второй ступени состоит из рецептора Р2 , классификатора Кг и эффектора Эг . Выборочным пространством автомата второй ступени служит пространство слогов. Это пространство можно отнести к пространству вторичных признаков. Решение на уровне слогов фиксирует эффектор Э2.

Как правило, классификатор К2 в системе, показанной на рис.4.16, не обеспечивает надежной классификации слов. Для повышения надежности распознавания необходимо использовать дополнительную информацию, заключенную, например, в синтаксисе, в семантике и в прагматике высказывания, в вероятностях появления тех или иных комбинаций первичных признаков и т.д. Структура распознающего автомата усложняется. Выборочное пространство вторичных признаков может состоять из нескольких групп разнородных признаков, получаемых с эффекторов автоматов предшествующих ступеней (рис.4.1 в). В настоящее время последняя структура наиболее широко используется при построении систем распознавания речи.

В книге [117] проведен анализ возможности использования просодической информации как дополнительного признака, обеспечивающего повышение надежности распознавания речи. Рассмотренную на рис.4.1 в структуру, В. Б. Касевич и др. предлагают называть моделью "восходящего восприятия". В этой модели данные о просодике должны быть подключены на высших ступенях распознавания и восприятия с целью коррекции ошибок, полученных на

116 начальных этапах алгоритма. Роль просодики оказывается необязательной, факультативной, ее используют тогда, когда недостаточно информации, передаваемой другими средствами речи.

Восходящему восприятию можно противопоставить "нисходящее восприятие" [117], которое не следует рассматривать просто как перевернутое восходящее - от смысла высказывания к звучанию. Когда известен смысл, все дальнейшие процедуры излишни. Нисходящее восприятие есть процесс восприятия, который проходит ряд стадий от грубого, приблизительного оценивания объекта по некоторым очень абстрактным, общим признакам ко все более точному определению данного объекта в его конкретности со всеми только ему присущими свойствами [117].

Под абстрактностью процесса на начальных стадиях здесь понимают то, что объект в начале воспринимается огрублено, без деталей. Происходит замещение восприятия объекта его упрощенным аналогом, что есть один из видов абстракции. При этом вид абстракции не должен быть произвольным. Абстракция должна приближать конечную цель - распознавание смысла высказывания.

На основании высказанных предположений В. Б. Касевич делает два вывода: 1)уже первые стадии описания речевого сообщения должны использовать признаки, максимально коррелированные со смыслом высказывания; 2) в качестве таких признаков выступают просодические признаки: только просодика характеризует крупные единицы текста, обладающие некоторыми грамматическими, синтаксическими и лексическими свойствами, связанными с семантикой высказывания. Тем не менее, грубой семантизации, достигаемой за счет просодики, обычно недостаточно. Слушатель в процессе восприятия конкретизирует характеристики высказывания внутри просодических единиц с привлечением релевантной словарной и грамматической информации. При этом человек исходит из предположения, что слышимая речь осмысленна. Если в процессе восприятия он убедится в обратном, например, если в сообщении

117 встретятся бессмысленные слова, новые понятия и т.п., то возможен переход к собственно фонетическому анализу сообщения. Таким образом, восходящее восприятие также должно быть предусмотрено перцептивной системой. Вынужденный отказ от семантики не означает отказа от просодики как основного подхода к декодированию речевого сообщения на начальных этапах восприятия.

В целом, общая схема восприятия речи с учетом просодики может выглядеть следующим образом [117]. На первом этапе система восприятия выделяет отдельные высказывания на основе фразового ударения и пауз с учетом структуры интонационных контуров. На этом же этапе по структуре интонационного контура с привлечением некоторых добавочных признаков оценивается коммуникативный тип высказывания. На втором этапе система делит высказывание на синтагмы с использованием синтагмического ударения и определяет связь между синтагмами. Одновременно выполняется синтаксический анализ с использованием просодики и грамматики. На последующих этапах распознавания синтагмы расчленяются на слова, квазислова, ритмические группы, словоформы с использованием просодики и других средств языка. Только при недостаточности указанных средств человек переходит к анализу слогов и фонем. Это заключительный, причем часто необязательный в полном объеме этап.

4.2. Введение в солитонную модель речевого сигнала.

Рассмотренная выше модель нисходящего распознавания речи предполагает иерархическое построение дерева решений и поиск, начиная с верхних уровней иерархии к нижним. На каждом уровне иерархии, в случае необходимости, возможно уточнение характеристик выделенной иерархической единицы, последующая сегментация этой иерархической единицы и переход к более низким уровням иерархии. Можно сделать заключение, что при таком подходе

118 на первое место выходит поиск особенностей речевого сигнала, определяющих окончание одного и начала следующего информационного события в речевом сообщении. Другими словами, возникает необходимость в разработке методов анализа непрерывного сигнала, направленных на поиск единичных событий, расположенных на границах информационных единиц одного уровня иерархии. Выделенные единичные события служат маркерами этих границ. В ходе последующего анализа возможно оценивание параметров сигнала, расположенного между этими границами, в том числе, оценивание характерных признаков и характеристик, позволяющих отнести его к той или иной информационной единице. Подход, направленный на выполнение поиска единичных событий в непрерывном сигнале на начальных этапах распознавания, есть одно из основных положений предлагаемой в данной работе модели распознавания речи.

Простановка границ информационных единиц на непрерывном сигнале с последующим анализом характеристик сигнала внутри этих границ позволяет [85] устранить противоречие между непрерывной природой сигнала - носителя информации и дискретным характером представления самой информации.

В физике известен сигнал, называемый солитоном (Soliton - уединенная волна) [174], который сочетает в себе свойства непрерывности и корпускулярности. x-w Солитон представляет из себя локальный

Рис.4.2. Взаимодействие двух солитонов, при бегущий ВОЛНОВОЙ ИМПулЬС ИЛИ КОМПаКТ-котором одиночный пик не образуется [150] . ную когерентную группу волн. Он суще

119 ственно нелинеен и возникает благодаря равновесию двух эффектов, один из которых линеен, определяется дисперсией и способствует размыванию импульса, другой нелинеен и сжимает импульс.

Корпускулярность солитона проявляется не только в том, что он может передвигаться, сохраняя свою форму в виде уединенной волны одной полярности. Другое свойство солитона состоит в том, что два солитона, сталкиваясь, проходят друг через друга не теряя своих индивидуальных свойств (рис.4.2). При этом не возникает никакого излучения, процессом рассеивания не порождается никакой другой моды. Единственным последействием является фазовый сдвиг: каждый импульс оказывается сдвинутым на некоторое расстояние относительно того положения, в котором он находился бы, перемещаясь беспрепятственно. Еще одно важное свойство солитона состоит в том, что он допускает нелинейную суперпозицию N уединенных волн при произвольном N.

Примерами солитонов могут быть волны на мелкой воде, распространение акустических сигналов на значительные расстояния в вечерние часы, дислокации в кристаллической решетке, прохождение импульсаций по нервным волокнам [150].

Остановимся на некоторых свойствах солитона подробнее. Волна физического сигнала, проходя через неоднородность, например, через упругую опору, частично отражается, частично проходит через препятствие. При этом оказывается, что некоторые переменные прохождения через препятствие имеют солитонное решение [150], а именно, задается форма, скорость, амплитуда, собственная частота солитона. Эволюция рассеянных решений проста и линейна. N полюсов коэффициента прохождения, расположенные в верхней полуплоскости комплексной плоскости собственных чисел к, найденных для уравнения Шредингера

4.1)

120 где потенциал u(x,t) удовлетворяет нелинейному уравнению Кортеве-га-де Фриза

4.2) dt 4 ' ' дх дх5 приводят к N солитонам с амплитудами и скоростями, определяемыми значением собственного числа полюса коэффициента прохождения.

Солитонные следы позволяют восстановить солитонное решение на всем пространстве его существования. Для этой цели используют методы решения обратной задачи рассеивания, являющейся нелинейным аналогом'преобразования Фурье [174].

Уравнение для потенциала u(x,t), удовлетворяющего уравнениям (4.1) и (4.2) имеет вид [150]: u(x,t) = - — sec/г' х - ct)

4.3) где с - скорость распространения волны.

Солитонное решение требует достаточно точного соответствия линейной и нелинейной составляющих решения, чем можно объяснить относительно редкую возможность наблюдения солитонов в чистом виде в природе. Возвращаясь к процессу восприятия информации из непрерывного сигнала, можно отметить подобие между корпускулярностью и непрерывностью солитона, с одной стороны, и дискретностью информации и непрерывностью сигнала речи, переносящего информацию, с другой. Система, генерирующая или воспринимающая какое-либо сообщение, должна формировать дискретные информационные единицы из непрерывного сигнала, имеющие какие либо отметки начала и окончания. В качестве таких отметок могут быть использованы как естественные свойства сигнала, например, паузы дыхания на границах предложений, так и искусственно создаваемые изменения параметров сигналов на границах информационных единиц, например, изменения контура ОТ на стыках

121 синтагм. Эти устойчивые образования можно считать искусственными или генерируемыми солитонами: "Generated Soliton", сокращенно GS.

Определение. Под генерируемым солитоном будем понимать сигнал, начало и окончание которого каким-либо образом отмечены в непрерывном сигнале.

В смысле указанного определения конечный во времени сигнал есть частный случай сигнала GS. Отметим, что наличие информации о начале и окончании GS-сигнала, позволяет определить его положение в пространстве и времени. GS-сигнал верхнего уровня иерархии может состоять из некоторого количества GS-сигналов более низкого уровня иерархии. Каждый GS-сигнал нижнего уровня иерархии имеет границы начала и окончания, расположенные в пределах GS-сигнала верхнего уровня иерархии так, что окончание последнего GS-сигнала нижнего уровня иерархии совпадает с окончанием GS-сигнала верхнего уровня иерархии.

Понятие о GS-сигнале не противоречит известным из области распознавания фактам. Так, при распознавании зрительных образов, человек в первую очередь строит контур изображения с последующим уточнением составляющих образа, опять же путем первоначального выделения их контуров. Анализ знаменных песнопений [15] показывает, что большинство устойчивых сочетаний знамен оканчивается граничными знаменами. Разбиение знаменного текста на устойчивые группы сочетаний знамен по конечным знаменам значительно сокращает время выполнения указанного разбиения.

Предлагаемое понятие о генерируемом солитоне соответствует нисходящей модели распознавания речи, рассмотренной в предыдущем разделе. Так границы интонационного контура синтагм, как более низкой иерархической единицы, отличаются от границ между предложениями, как более высокой иерархической единицы, что было отмечено в обзоре, сделанном в главе 1. При этом синтагмическое ударение последней синтагмы совпадает с фразовым ударением предложения.

122

К GS-сигналам можно отнести многие типы сигналов, появляющиеся при анализе поведения физических систем. В качестве примера можно рассмотреть сигнал на выходе линейной системы. При каждом изменении характера сигнала на входе, в устойчивой линейной системе возникают переходные процессы, имеющие вид ехр(a 1t) или tк exp(<jjt), параметры которых сг(, <jj, к зависят только от параметров рассматриваемой линейной системы. Обнаружение собственных колебаний позволяет определить границы изменений сигнала на входе системы.

Остановимся на поведении речевого акустического сигнала на контуре основного тона. Этот процесс исследован в главе 3. Из выполненного исследования видно, что характер акустического сигнала в начале и в конце периода ОТ резко отличается. После схлопывания голосовых складок возбуждаются собственные колебания, определяемые формой речеобразующего тракта (формантами). Пока складки сомкнуты, речеобразующий тракт ведет себя подобно пассивной линейной системе. Начало собственных колебаний отмечает начало периода основного тона. После открывания голосовых складок, добротность речевого тракта падает, собственные колебания речевого тракта затухают, появляются новые колебательные процессы, определяемые резонансами подглоточной области. Акустический сигнал с измененной формой на интервале разомкнутых голосовых складок служит признаком окончания периода ОТ. Следовательно, акустический сигнал, ограниченный периодом основного тона, можно рассматривать как GS-сигнал.

4.3. Аппроксимация солитонного сигнала и его спектра.

В соответствии с формулой (4.3) огибающая солитона имеет вид sech х и в ряде случаев sech х [150]. Вид этих сигналов показан на рис.4.3. Наличие в

124 lim^i = lim sec/2 x = lim -— х\-юо \A~^coex+ex

Если x > 0, то при больших х е»ёх и слагаемым ех в знаменателе последнего выражения можно пренебречь. Если х < 0, то при больших /х/ е « ёх и в этом случае слагаемым ех можно пренебречь. Следовательно, limjj = lim sechx = 2e

4.6)

X—>00 x —>00 x

Из того, что ех > 0 и ёх> 0 при любых jc , следует, что

Ух = sechx<2 е Разложим / и ёх в степенной ряд:

2 3 4 y -в ОС ОС ОС е =1 + х + — + — +

4.7)

2! 3! 4!

2 3 4 v* ^ X X X = 1-Х +---+ ■

2! 3! 4!

Складывая эти два выражения и делая замену переменной w - xz / 2 , получаем

I 1 V

2 4 \ ех +е~х =2 1+ — + —+.

2! 4! . 2 л™ г, w 2 l + w + 4— + 8—4 I 4! 6! 2

3 \ 2

2 3 W W 1 + W + — + — + 2ev

Ч 2! 3!

Если w < 1, то членами, содержащими степени w выше или равной второй, можно пренебречь и указанное равенство переходит в равенство. Из последнего неравенства имеем:

У1 = SQchx = 2 х , -X е +е -w -х2/2 е — е

4.8)

Запишем совместно неравенства (4.7) и (4.8): е~х 12 <SQchx<2e~x . (4.9)

Из вывода неравенств (4.9) следует, что в области малых значений /х/ функция у] =sechx аппроксимируется экспонентой, имеющей квадратичную зависимость от аргумента (функция Лапласа, "колоколообразный" импульс), а в области больших значений Д/ экспонентой с линейным аргументом. Незави /2 симо от значений jxj е~х ограничивает sech х снизу, а 2<Г|х| - сверху.

Поскольку все части неравенства (4.9) положительны, то, возводя их в квадрат, получим:

ГХ <sec h2x<4e2x. (4.10)

ЗАКЛЮЧЕНИЕ

В диссертационной работе получены следующие новые научные результаты.

1. Диссертация есть первая научная работа в которой исследованы проблемы построения систем выделения частоты ОТ с использованием генерируемой функции, обеспечивающей принятие решения, вид которой зависит от предполагаемой структуры сигнала и ориентирован на поиск единичных событий в сигнале, расположеных на границах периодов ОТ. Экспериментально доказано, что указанный подход позволяет повысить надежность выделения основного тона, расширить диапазон допустимых искажений сигнала, снизить объем вычислений и время, необходимое для выделения основного тона.

2. Представлены результаты по изучению частоты ОТ как носителя информации. Показано, что основной тон, служащий одним из параметров просодики речи, переносит значительный объем информации о глобальных характеристиках речевого сообщения, используется человеком для сегментации речевого потока в процессе восприятия речи, связан с контекстом произнесения. Основной тон есть существенное отличие устной речи от письменной. Для извлечения полного объема информации, передаваемой контуром ОТ, необходимо оценивать мгновенные значения периода ОТ, моменты начал и окончаний вокализации, связанных с моментами начал и окончаний периодов ОТ.

3. Предложена классификация методов предварительной обработки речевого сигнала и методов выделения ОТ. Оценена их способности извлекать информацию из контура частоты ОТ. Методы, основанные на спектральном анализе, и методы, использующие корреляционные функции, не могут оценить момент начала периода ОТ. Для синхронного с ОТ анализа речи необходимо использовать методы выделения ОТ, основанные на анализе временной функции сигнала и имеющие высокое разрешение во времени.

253

4. Исследована способность средней частоты ОТ быть носителем информации о индивидуальности голоса диктора. Показано, что средняя частота ОТ сильно коррелирована с индивидуальностью голоса диктора. Однако она не может быть использована в качестве единственного признака индивидуальности голоса диктора.

5. Исследована структура речевого сигнала на периоде ОТ. Показано, что структура сигнала на интервале закрытых голосовых связок отлична от структуры сигнала на интервале открытых голосовых связок. Раздельный анализ интервалов открытых и закрытых голосовых связок может быть выполнен только синхронно с ОТ. В качестве минимального по длительности интервала с постоянными параметрами речевого тракта, включая тип возбуждения, на вокализированных интервалах речи может быть принят период ОТ.

6. Предложена теоретическая модель построения систем распознавания речи, основанная на нисходящем распознавании и ориентированная на выделение единичных событий, расположенных на границах дискретных единиц информации различного уровня иерархии.

7. Разработан алгоритм выделения ОТ, основанный на предложенной модели распознавания речи. Реализация алгоритма доказывает возможность применения предложенной теоретической модели, позволяющей повысить надежность, снизить вычислительные затраты и уменьшить время при решении задач распознавания.

8. Предложен синхронный с ОТ анализ речи, на основе которого разработан алгоритм принятия решения Т/НТ, синхронный с ОТ. Синхронное с ОТ принятие решения Т/НТ повышает надежность оценивания наличия и отсутствия вокализации в речевом сигнале и существенно снижает время принятия решения.

9. Предложен количественный критерий получения оценки качества предварительной обработки, основанный на измерении дисперсии задержки сигнала после предварительной обработки. Критерий позволяет количественно

254 оценить качество предварительной обработки и, тем самым, выбрать параметры фильтров предварительной обработки.

10. Предложены новые методы предварительной обработки речевого сигнала путем сглаживания сигнала всплесковым окном. Предложена форма всплеского окна. Выполнен сопоставительный анализ ряда методов предварительной обработки. Показано, что среди сравниваемых типов окон предложенная форма всплеского окна обеспечивает минимальную дисперсию задержки. В ряде случаев, например при обработке сигнала, ограниченного полосой телефонного канала, дисперсию задержки можно снизить при помощи операции предельного ограничения. Даны рекомендации по выбору параметров фильтров и параметров сглаживающих окон на основе критерия минимума дисперсии задержки.

11. Разработан комплекс алгоритмов по выделению ОТ по предложенному методу выделения основного тона совместно с синхронным с ОТ принятием решения Т/НТ. Алгоритм обеспечивает адаптацию функции , обеспечивающей принятие решения, к текущему значению периода ОТ и коррекцию одиночных ошибок принятия решения Т/НТ. Алгоритм способен работать с непрерывным сигналом речи в реальном масштабе времени.

12. Предложен критерий для оценивания качества работы алгоритма выделителей ОТ в виде обобщенной ошибки. Получена оценка параметров алгоритма, обеспечивающих минимизацию обобщенной ошибки выделения ОТ. Выполнен сопоставительный анализ предложенного алгоритма выделения ОТ с известными алгоритмами выделения ОТ.

Практическая ценность результатов работы состоит в том, что предложенные теоретические подходы реализованы в виде алгоритмов, которые обеспечили выделение ОТ и принятие решения Т/НТ с надежностью, в общем случае превышающей надежность работы известных методов выделения ОТ. Предложенный алгоритм выделения ОТ совместно с алгоритмом принятия решения Т/НТ работает с сигналами с аддитивным шумом при малых соотноше

255 ниях сигнал/шум, с сигналами, полоса которых ограничена полосой телефонного канала, и с предельно ограниченными по амплитуде сигналами. Предложенные подходы обеспечивают работу разработанных алгоритмов в масштабе времени меньше реального при минимальном числе настроек и регулировок, в том числе, для непрерывного сигнала речи. Предложенные теоретические подходы позволили разработать алгоритмы и программы анализа сигналов в задачах технической диагностики, используемых на производстве и в учебном процессе

При оптимальном подборе параметров и при использовании на этапе предварительной обработки сглаживания всплесковым окном, предлагаемый метод обеспечивает на чистом сигнале 0,5 % ошибок НТ/Т, 0,4 % ошибок Т/НТ, 1,0 % больших ошибок и 0,5 % малых ошибок (обобщенная ошибка 4,0 %) для мужского голоса, 1,3 % ошибок НТ/Т, 0,9 % ошибок Т/НТ, 0,3 % больших ошибок и 5,2 % малых ошибок (обобщенная ошибка 5,2 % ) для женского голоса.

На сигнале с аддитивным белым шумом при С/Ш =10 дБ, в случае предобработки фильтром низких частот, обобщенная ошибка возрастает до 14,4 % для мужского голоса и до 24,0 % для женского за счет роста количества ошибок НТ/Т и малых ошибок. Обобщенная ошибка выделения ОТ клиппирован-ного сигнала составила 13,6 % для мужского голоса за счет существенного увеличения количества ошибок Т/НТ. Повышение надежности принятия решения Т/НТ по неискаженному сигналу повышает надежность выделения ОТ по клиппированному сигналу до уровня, сравнимого с надежностью выделения ОТ по чистому сигналу как для мужского, так и для женского голоса. Обобщенная ошибка для сигнала, ограниченного полосой телефонного канала составила 14,0 % для мужского голоса и 16,4 % для женского.

Сопоставительные испытания с известными методами выделения ОТ показали, что предлагаемый метод был предпочтительнее на всех типах сигналов, кроме чистого, где несколько лучшие результаты дал метод JIJIK.

256

Выполненные в рамках работы исследования по получению оценок индивидуальных характеристик голоса нашли применение в криминалистических системах идентификации человека по голосу. Предложенные и разработанные в рамках настоящей работы теоретические положения и практические алгоритмы использованы в системах технической диагностики и учета и в системах по обработке акустических сигналов, внедренных на предприятиях ОАО "Ижмаш", ОАО "Вятско Полянский машиностроительный завод", в учебном процессе и в научно-исследовательской работе на кафедре ВТ ИжГТУ.

257

Список литературы диссертационного исследования доктор технических наук Гитлин, Валерий Борисович, 2000 год

1.Акинфиев Н.Н., Собакин А.Н. Преобразование речевых сигналов для целей выделения основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 8 Всесоюзн. школы-семинара. - Львов, 1974, - 4.2. - С. 6-8.

2. Архипов И.О. Гитлин В.Б. Восстановление периодичности основного тона в телефонном сигнале // Распознавание образов и анализ изображений: новые информационные технологии, Новосибирск, 1998. с. 1822.

3. Архипов И. О., Гитлин В. Б. Добавление шума при сегментации речи на тональные участки // Труды научно-молодежной школы "Информационно-измерительные системы на базе наукоемких технологий. -Ижевск, 1997. С.63-69.

4. Архипов И.О. Гитлин В.Б. Метод выделения основного тона на основе понятия о генерируемом солитоне // Распознавание образов и анализ изображений: новые информационные технологии, Новосибирск, 1998.-Часть 1.-С. 23-27.

5. Архипов И.О. Гитлин В.Б. Оценка точности выделения основного тона методом GS // Современные речевые технологии. Сб. тр. IX сессии Российского акустического обществам.: "ГЕОС", 1999. С.38-42.

6. Архипов И.О. Гитлин В.Б. Оценка частоты среза ФНЧ, используемого для выделения основного тона // Труды научно-молодежной школы "Информационно-измерительные системы на базе наукоемких технологий". Ижевск, 1998, С. 12-16.

7. Архипов И. О. Сегментация речи по признаку "ТОН/НЕ ТОН" синхронно с основным тоном // Труды научно-молодежной школы "Информационно-измерительные системы на базе наукоемких технологий. -Ижевск, 1998. С.5-8.

8. Ю.Архипов И.О. Гитлин В.Б. Формирование признака ТОН/НЕ ТОН синхронно с основным тоном // Современные речевые технологии. Сб. тер. IX сессии Российского акустического общества М.: "ГЕОС", 1999. С. 4346.

9. П.Лазунов С.И., Тарасов А.И., Тираспо льский Ю.И., Якушонков Г.А. К вопросу о статистике основного тона // Вопросы кибернетики. Анализ и синтез речи в системах управления. М., 1981. С. 75-80.

10. Баранин С.П., Куштуев А.И. О построении системы адаптации анализаторов частоты основного тона речи // 7 Всесоюзн. акуст. конф.: Тез. докл.-Л., 1971.-С. 18.

11. И.Баронин С.П. Статистические методы анализа речевых сигналов // Электросвязь. 1966. N 5. - С. 50-56.

12. И.Баронин С.П., Куштуев А.И. Устройство для измерения частоты основного тона речевых сигналов. А.с. N 280561 СССР, МКИ Н04М 11/10, 01Н, оп. 03.09.70.

13. Бахмутова И. В., Гусев В. Д., Титкова Т. Н Принципы формирования словарей для дешифровки знаменных песнопений. //259

14. Распознавание образов и анализ изображений: новые информационные технологии, Новосибирск, 1998,-Часть 1.-С.37-41.

15. Башин Е.Ф., Галунов В.И., Горский Г.Д., Манеров В. X. Объективная диагностика эмоционального состояния в психиатрической клинике по речи // Речь и эмоции: Материалы симпозиума 11-14 ноября 1974 г. -Л., 1975.-С. 69-74.

16. Беликов А.П., Карасев И.А., Тунис К.В. Устройство для измерения параметров речи. А.с. N 807381 СССР, МКИ 10 1/00, заявл. 27.04.79, оп. в BHN 7 23.02.81.

17. Белявский В.М., Ежова J1.B. Спектрально-временные признаки для сегментации речи по звукам // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 8 Всесоюзн. школы-семинара. Львов, 1974, - 4.2. - С. 32-37.

18. Блохина Л.П. Восприятие макромодуляции частоты ОТ в речевом сигнале // Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 17 Всесоюзн. семинара. Ижевск, 1992. С. 11-114.

19. Блохина Л.П. О возможности использования модуляции частоты основного тона в автоматическом распознавании эмоциональных состояний // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещания-симпозиума. Одесса, 1989. С. 30-40.

20. Бровченко Т.А., Волошин В.Г. Роль текстологической просодической информации в повышении выразительности синтезированной речи // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещания-симпозиума. Одесса, 1989. С. 42-45.

21. Бровченко Т.А., Волошин В.Г. Связи и взаимодействие просодических характеристик высказывания // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982. - С. 227-230.260

22. Бровченко Т.А., Королева Т.М., Могилевский В.И. Синтез оптимального комплекса линейных алгоритмов распознавания ударных слогов // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы -семинара. Киев, 1982. - С. 339-342.

23. Брызгунова Е.А. Звуки и интонация русской речи. М., 1969.252 с.

24. Борисов В.Н., Гитлин В.Б. Аппаратно-программный комплекс с интерфейсом КОП на базе ДВК для цифровой обработки сигналов // Ученые Ижевского механического института производству. Тезисы докладов. -Ижевск, 1992,-С. 12.

25. Борисов В.Н., Гитлин В.Б. Аппаратно-программный комплекс обработки речевых сигналов // Автоматическое распознавание и синтез речевых сигналов. Киев, 1989. - С. 93-96.

26. Борисов В.Н., Гитлин В.Б., Вахрушева Е. А., Каратаев В.Н. Мультивибратор на ИС с одним устойчивым состоянием, имеющий принудительный сброс // Дискретные системы обработки информации. Ижевск, 1992. - Вып.11.- С.75-78.

27. Борисов В.Н., Гитлин В.Б. Корреляционный метод выделения основного тона с использованием параллельной фильтрации // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. М, 1991.-С. 102-103.

28. Ван дер Варден Б. Л. Математическая статистика. М.: И.Л., 1960

29. Варякоис А.К. К вопросу надежности выделения некоторых сегментных признаков речевого сигнала // Техническая кибернетика: Материалы конференции "Развитие техн. наук в респ. и использование их результатов". Вильнюс, 1979. - С. 84-86.

30. Величко В.Г., Нудельман Н.А., Шпигель И.Е. О статистике приращений соседних периодов основного тона // Тр7 учебн. ин-в связи, 1965. Т. 25. - С. 183-190.

31. Вентцель Е. Н. Теория вероятностей. М.: Физматгиз, 1962.

32. Венцов А.В. О механизме образования глухих и звонких интервокальных согласных // Модели восприятия речи: Международн. фонетический конгресс. М.-Л., 1966. -С. 103-104.

33. Венцов А.В. О работе голосовых связок при глухих смычных интервокальных согласных // Механизмы речеобразования и восприятия сложных звуков. М.-Л.: Наука, 1966. - С. 62-72.

34. Власов Е.В., Сорокин В.Н. Исследование акустических эффектов вертикальных колебаний голосовых связок / Акустический журнал, 1983.-Т. 29. Вып.1. - С. 11-18.

35. Власов Е.В., Сорокин В.Н. Новые элементы в проблеме голосообразования // Исследование речи: Тез. докл. и сообщ. Всесоюзн. школы-семинара (Гродно, 13-18 сентября 1981). JL, 1981. - С. 26-27.

36. Войцеховский П.Н. Об универсальных просодических признаках экспрессивно-волевой насыщенности приказа // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещ.-симпозиума. Одесса, 1989. - С. 56-57.

37. Вокодерная телефония. Под ред. Пирогова А.А. М.: Связь, 1974. -536 с.

38. Волошенко Ю.Я. и др. О регистрации частоты колебаний голосовых связок // Техника проводной связи. 1968, N7 С. 30-37.

39. Высоцкий Г.Я., Сомин Н.В., Трунин- Донской В.Н., Червонный В.К. Алгоритм выделения основного тона спектральными методами на ЭВМ среднего класса // Дискретная обработка речевых сигналов. -М.: ВЦ АН СССР, 1979. С. 36-66.263

40. Галунов В.И., Пиктурна В.В., Янушавичус В.Й. Акустические корреляты эмоциональной речи // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещ.-симпозиума. Одесса, 1989. - С. 16-25.

41. Галунов В.И., Коваль С.Д., Тампель И.Б. Биофизика речеобразования // Модели речевого процесса в норме и патологии: Докл. и сообщ. Всесоюзн. симпозиума (13-15 июня 1979 г. Гродно). Л., 1980.

42. Галунов В.И., Тампель И.Б. Механизм работы голосового источника/ Акустический журнал. Т. 27. - Вып. 3, 1981. - С. 321-334.

43. Галунов В.И., Коваль С.Л., Тампель И.Б. Проблемы акустической теории речеобразования // Вопросы кибернетики. Анализ и синтез речи в системах управления. М., 1981. - С. 60-74.

44. Галунов В.И., Сомин Н.В., Тарасов А.И., Трунин-Донской В.Н., Якушенков Г.А. Спектральные методы выделения основного тона // Вопросы кибернетики. Анализ и синтез речи в системах управления. М., 1976 - Вып. 22. - С. 28-38.

45. Гейльман Н.И., Куколыциков Л.Е., Штерн А.С. Распределение длительностей пауз различных типов в спонтанной диалоговой речи // Реф. докл.8 Всесоюзн. акустич. конф. М.,1973. - С. 66.

46. Гейльман Н.И., Скрелин П.А., Рыжова Ю.В. Теоретические и прикладные аспекты распознавания слитной речи // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 15 Всесоюзн. семинара Таллин, 1989. - С. 268-269.

47. Гикис И.И. Способ выделения основного тона речи. А.с. N 333580 СССР, МКИ 10 1/04, 06К 9/00.-Оп. 21.03.72 в БИ N 11, 1972.

48. Гитлин В.Б. Амплитудный детектор на МДП транзисторе с расширенным динамическим диапазоном // Дискретные системы обработки информации Ижевск: Ротапринт ИМИ, 1992. - Вып. И. - -С. 85-90.264

49. Гитлин В.Б., Новоселов В.Н., Сметанин A.M., Сорокин C.JI., Тихонов Г.А., Шуткин В.Е. Аппаратура обработки речевого сигнала // Вопросы радиоэлектроники. Электронная вычислительная техника. Вып. 4, 1979. - С. 77-85.

50. Гитлин В. Б., Макаров А. В., Паклина Н. В. Аналого-цифровые устройства обработки речевых сигналов // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание слуховых образов" (АРСО-13). Новосибирск, 1984. - Часть I. - С. 113.

51. Гитлин В. Б. Аппроксимация огибающей солитонного сигнала.// Сб. научн. тр. аспирантов и преподавателей ИжГТУ. Ин-т технологических наук и проблем конструирования в промышленности. Ижевск, 2000, - С. 2226.

52. Гитлин В. Б. Временные методы выделения основного тона // Ученые Ижевского технического университета производству. Тезисы докладов кафедры "Вычислительная техника" ИжГТУ. - Изд-во "Экспертиза": Ижевск, 1996. - С. 18-19.

53. Гитлин В. Б. Новоселов В.Н. Влияние повторных возбуждений на форму спектра формантного сигнала // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание и синтез речи" (APCO-IX). -Минск. 1976. - С. 53.

54. Гитлин В. Б., Кузнецов П.Г. Влияние числа резонансных звеньев в анализирующем фильтре на результаты измерения спектра // Известия высших учебных заведений. Радиоэлектроника. Т. XIII. - №11, 1970.-С. 1388-1389.

55. Гитлин В. Б., Кузнецов П.Г. Влияние ширины полосы пропускания фильтра на результаты измерения спектра // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1970. - Вып. VI. - С. 135-141.

56. Гитлин В. Б. Динамическая резонансная характеристика полосового фильтра с двумя взаимно расстроенными звеньями // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1970. -Вып. VI.-С. 127-135.

57. Гитлин В. Б. Идентификация диктора по частотам формант, измеренным синхронно с основным тоном // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol 4 - P. 82-85.

58. Гитлин В. Б. Сметанин A. M. Сорокин С.JI., Шуткин В.Е. Идентификация дикторов по частотам формант // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. И Всесоюзн. школы-семинара. Ереван, 1980. -С. 164-166.

59. Гитлин В. Б. Исследование частоты основного тона и формант как признаков индивидуальности голоса. Разработка быстродействующих методов их выделения / Диссертация на соискание ученой степени кандидата технических наук. Ижевск, 1974. - 266 с.266

60. Гитлин В. Б. К вопросу расчета формантных фильтров методом упрощенного преобразования Лапласа // Автоматические устройства учета и контроля. Ижевск, 1977. - Вып. 11. - С. 83-91.

61. Гитлин В. Б. Сметанин А. М. К задаче построения анализатора спектра речевого сигнала // Автоматические устройства учета и контроля. Ижевск, 1974. - Вып. IX. - С. 10-11.

62. Гитлин В. Б., Сметанин А. М., Тихонов Г.А Логарифмический преобразователь синусоидального сигнала большой амплитуды // Автоматические устройства учета и контроля. Ижевск, 1976. -Вып. 10.-С. 46-47.

63. Гитлин В. Б. Модели голосового источника и методы выделения основного тона // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание слуховых образов" (АРСО-13). Новосибирск, 1984. - Часть I. -С.79.

64. Гитлин В. Б., Кузнецов П.Г., Тихонов Г.А. Нормализатор динамического диапазона речевого сигнала // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1970. - Вып. VI. - С. 119-127.

65. Гитлин В. Б. Об измерении формантных частот синхронно с основным тоном // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание и синтез речи" (APCO-IX). Минск. - 1976. - С.54.

66. Гитлин В.Б., Новоселов В.Н., Сметанин A.M., Сорокин С. Л. Оценка влияния аппаратуры на измерение формантных параметров // Электросвязь. № 12, 1981. - С. 31-33.267

67. Гитлин В. Б., Тихонов Г.А. Об одном методе извлечения формант // Автоматические устройства учета и контроля. Ижевск, 1974. -Вып. IX.-С. 155-158.

68. Гитлин В.Б., Сметанин A.M. О повышении точности измерения параметров формант // Проблемы построения систем понимания речи. М.: Наука, 1980. - С. 109-115.

69. Гитлин В. Б. О статистических параметрах основного тона речи (обзор) // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание слуховых образов" (АРСО-14). Каунас, 1986. - Часть I. - СЛ.

70. Гитлин В.Б. Основной тон речевого сигнала / Деп. в ВИНИТИ, 1998. № 1206-В98. - 739 с.

71. Гитлин В. Б. Сметанин А. М. О точности измерения частоты формант // Тезисы Всесоюзной школы-семинара "Автоматическое распознавание и синтез речи" (APCO-IX). Минск. - 1976. - С.53.

72. Гитлин В. Б. Новоселов В.Н. Определение участков измерения ширины формант по временной функции речевого сигнала // Дискретные системы обработки информации. Ижевск, 1979. - Вып.2. - 81-85.

73. Гитлин В. Б. Применение понятия о генерируемом солитоне для выделения особенностей речевого сигнала // Распознавание образов и анализ изображений: новые информационные технологии, Новосибирск, 1998. Часть I. С. 64-68.

74. Гитлин В.Б., Кузнецов П.Г., Тихонов Г.А. Переключающая схема для устройства выделения основного тона // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1973. -Вып. 8. - С. 223-228.268

75. Гитлин В. Б. Сметанин А. М. Расчет формантных фильтров// Известия высших учебных заведений. Радиоэлектроника, 1976. Т. XIX. - Вып. 8.-С. 98-100.

76. Гитлин В.Б., Новоселов В.Н., Сметанин A.M., Шуткин В.Е. Способ задержки импульсных сигналов// А.с. N 712942 СССР, МКл2 НОЗК 5/153. Опубл. В БИ№4 30.01.80.

77. Гитлин В. Б. Спектральные методы выделения основного тона // Ученые Ижевского технического университета производству. Тезисы докладов кафедры "Вычислительная техника" ИжГТУ. - Ижевск: Изд-во "Экспертиза", 1996. - С.20-21.

78. Гитлин В.Б., Книппер А.В., Сметанин A.M., Сорокин C.JI., Шуткин В.Е. Устройство для выделения основного тона речи. А.с. N 714474 СССР, МКИ 10 1/00. Оп. в БИ N 5 05.02.80.

79. Гитлин В. Б. Устройство для задержки импульсов. А.с. N 1046924 СССР, МКИ НОЗК 5/13. Оп. в БИ N 37 07.10.83.

80. Гитлин В. Б., Гараев Р. М., Лялин В. Е., Кузнецов П. Г. Устройство для селекции признаков при распознавании образов. А.с. N 1084833 СССР, МКИ G06K 9/36. Оп. в BHN 13 07.04.84.

81. Гитлин В. Б. Частоты формант как признак индивидуальности голоса // Тезисы и аннотации докладов и сообщений всесоюзного симпозиума "Речь, эмоции и личность". Ленинград, 1978. - С. 13.

82. Горский С.М., Молева Т.П., Томаров В.П., Шаков В.Ю. Изменение спектральных линий гласных звуков при некоторых видах269дисфоний // Исследование речи: Тез. докл. и сообщ. Всесоюзн. школы-семинара (г. Гродно, 13-18 сент. 1981 г.) Л., 1981. - С. 32-33.

83. Гретен А.Г., Молева Т.П., Томаров В.П., Федорова В. К. Коррелятивный анализ возрастных изменений речевого спектра и морфологии голосовых связок // Исследование речи: Тез. докл. и сообщ. Всесоюзн. школы-семинара (г.Гродно, 13-18 сент.1981 г.)

84. Гулида В.Б., Светозарова Н.Д. О типологическом сходстве интонационных систем // Экспериментально-фонетический анализ речи. Л.: Изд-во ЛГУ, 1989. - С. 106-113.

85. Деч Г. Руководство к практическому применению преобразования Лапласа и Z-преобразовния. М.: "Наука". Гл. ред. Ф.-М. лит-ры, 1974. 289 с.

86. Дворжецкая М.П., Еременко Г.Е. Просодия интенсивности эмоциональных оценок в тексте // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещ.-симпозиума. Одесса, 1989. - С. 65-67.

87. ЮО.Джапаридзе З.Н., Тушишвили A.M. Организация интонационных контуров при компилятивном синтезе грузинской речи // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. Москва, 1991. - С. 73-74.

88. Дроздов Е. А., Пятибратов А. П., Автоматическое преобразование и кодирование информации. М.: Советское радио, 1964

89. И щ е н к о С. М. Экспериментальное исследование и математическая модель слухового механизма анализа периодичности / Акустич. журнал, 1987. -N3.-C. 498-503.

90. Ш.Кантер Л.А. Системный анализ речевой интонации. М.: Высшая школа, 1988. - 129 с.

91. Кар невская Е.Б. Выбор мелодического контура при автоматическом синтезе речи // Автоматическое распознавание слуховых271образов: Тез. докл. и сообщ. 15 Всесоюзн. семинара Таллин, 1989. - С. 281282.

92. ИЗ.Карневская Е.Б. Лингвистические принципы просодической организации речи при многоязычном синтезе // Автоматическое распознавание и синтез речевых сигналов. Киев, 1989. - С. 124-128.

93. Н.Карневская Е.Б., Лобанов Б.М. Модели синтеза мелодического контура русских и английских фраз // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982. - С. 399-402.

94. Пб.Касевич В.Б., Шабельникова Е.М., Рыбин В.В. Ударение и тон в языке и речевой деятельности. Л.: Изд-во ЛГУ, 1990. - 248 с.

95. Кейтер Дж. Компьютеры синтезаторы речи. - М.: Мир, 1985.238с.

96. Кельманов А.В. Алгоритм анализа речевых сигналов по искаженным наблюдениям // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 15 Всесоюзн. семинара. Таллин, 1989. - С. 206-207.

97. Кельманов А.В. Алгоритм выделения основного тона по разностной функции ряда остаточных ошибок модели авторегрессии // Вычислительные системы. Методы обнаружения закономерностей с помощью ЭВМ. Новосибирск, 1981. - Вып. 91. - С. 113-124.

98. Кельманов А.В. Алгоритм классификации тон/шум по частотным автокорреляциям // Вычислительные системы. Эмпирическое предсказание и распознавание образов. Новосибирск, 1980. - Вып. 83. - С. 67-73.272

99. Кельманов А.В. О некоторых алгоритмах классификации тон-шум и выделении траектории основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. -С. 88-90.

100. Кемешис П.П., Рудженис А.И., Руткаускас Р.А. О возбуждении формантного синтезатора // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982. - С. 402-404.

101. Книппер А.В., Махонин В.А. Микровариации в речевом сигнале // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 10 Всесоюзн. школы-семинара. Тбилиси: Мецниереба, 1975. - С. 3536.

102. Книппер А.В., Махонин В.А., Орлов И.Л. Элементы формантного анализатора // Распознавание образов. М.: Наука, 1977. - С. 9096.

103. Кодзасов С.В. Просодическая концепция фонетической базы данных ИРЯ РАН // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 17 Всесоюзн. семинара. Ижевск, 1992. - С. 87-89.

104. Колоколов А.С. Исследование восприятия высоты в высокочастотной области // Автоматическое распознавание слуховых образов: Тез. доел, и сообща. 12 Всесоюзн. школы-семинара. Киев, 1982. - С. 103-105.

105. Колоколов А.С. Модель временного механизма анализа высоты звука // Проблемы управления в технике, экономике, биологии. М.: Наука, 1981. -С. 155-161.

106. Колымба С.В., Нушикян Э.А., Пирогова А.А. Акустические корреляты эмоционально окрашенных фраз, выражающих зону гнева, одобрения, иронии в современном английском языке // Речь и эмоции: Материалы симпозиума. Л.,1975. - С. 90-95.

107. Колымба С.Н. Обобщенный тональный контур фраз, выражающих оттенки гнева // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещ.-симпозиума. Одесса, 1989. - С.82-84.

108. Кривнова О.Ф. Интонационное членение как средство управления процедурой смыслового распознавания // Экспериментальная фонетика. М.: Изд-во МГУ, 1989. - С. 112-124.

109. Кривнова О.Ф., Венцов А.В. Об интонационном членении некоторых типов предложений русского языка // Анализ речевых сигналов человеком. -Л.: Наука, Л.О., 1971. С. 161-172.

110. Крылов Ю.Д., Романов С.Ф. Разработка программно-аппаратных средств речевого общения с ЭВМ / Учебное пособие. Л., 1988.

111. Кузаков A.M., Егоров А.И. Процедура сегментации речевого сигнала // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982. 106-108.274

112. Кузнецов П.Г., Гитлин В.Г. Идентификация голосов по средней частоте основного тона // Применение вычислительной техники в машиностроении. Ижевск, 1977. - С. 68-74.

113. Кузнецов П. Г. Исследования по автоматическому распознаванию и идентификации голосов / Диссертация на соискание ученой степени кандидата технических наук. Казань, 1970.

114. Кузнецов П.Г., Гитлин В. Б., Чепкасов А.Г. Спектральный анализатор речевых сигналов // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1970. - Вып. VI. - С. 102-118.

115. Куколыцикова Л.Е., Светозарова Н.Д., Штерн А.С. Роль ключевых и фонетически выделенных слов в распознавании связного текста // Автоматическое распознавание слуховых образов: Туз. докл. и сообщ. 14 Всесоюзн. семинара. Каунас, 1986. - С.110.

116. Кучер Н.Ф., Епифанцев Б.Н. Интономер // Известия Томского политехнического института. Т. 246, 1974. - С. 35-38.

117. Куштуев А.И., Баронин С.П. Устройство выделения основного тона. А.с. N 573810 СССР. Оп. 25.09.77, МКИ 10 1/02 в БИ N 35.

118. Лепешкин В.А., Пак С.П., Родионов И.Е. Простой многоканальный выделитель основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. - С. 62-63.

119. Л и У. А. Применение просодического анализа для распознавания речи // Методы автоматического распознавания речи. М.: Мир, 1983. - Книга 1.-С. 224-276.

120. Лившиц М.С. Моделирование слуховых механизмов измерения высоты звука / Биофизика, 1989. Т. 33. - N 4. - С. 708-712.

121. Лобанов Б.М. Исследование и разработка методов автоматического синтеза речи по фонемному тексту / Автореферат275диссертации на соискание ученой степени доктора технических наук. Рига, 1984. - 50 с.

122. Лозовский B.C. Модифицированный разностный метод определения основного тона речи // Тр. АКИН, 1970. Вып. 12. - С. 189-193.

123. Лужбин Н.А. Алгоритм выделения мелодической кривой для эмоциональной речи // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. - С. 189.

124. Лэм Дж. Л. Введение в теорию солитонов. М.: "Мир", 1983. - 296 с.

125. Люблинская В.В. Воспроизведение простых контуров изменения частоты основного тона звуков // Анализ речевых сигналов человеком. Л.: Наука, Л.О., 1971. - С. 66-74.

126. Люблинский И. А., Яхно В. П. Исследование и моделирование механизмов восприятия ритмических сигналов // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 8 Всесоюзн. школы-семинара. Львов, 1974. - 4.1. - С. 48-50.

127. Люблинский И.А., Яхно В.П. Модель слухового механизма выделения ритмического рисунка сигнала из шума // Тр. ин-та пробл. управл., 1980.-N24.-С. 42-47.

128. Людовик Е.К., Федоринчик С.М. Алгоритм для определения мгновенной длины периода основного тона // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. - С. 64-66.

129. Людовик Е.К. Выделение основного тона, основанное на Марковской модели // Elleventh Intern. Congr. Phonetic Sci.: Proc./ XI ICPhS.-Tallin, 1987. Vol. 4. - P. 62-65.

130. Людовик Г.В. Особенности транскрибирования текстов для синтеза многоязычной речи // Автоматизация дедуктивных построений, распознавание образов и интеллектуальные роботы: Сб. научн. тр. Киев, Ин-т кибернетики, 1978. - С. 65-71.276

131. Малафеева Н.В., Полканов С.И. Выделение основного тона на основе произведения гармоник спектра // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ, 15 Всесоюзн. семинара. Таллин, 1989. -С. 214-215.

132. Манеров В.Х. Анализ эмоциональных неречевых звуков // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 10 Всесоюзн. школы-семинара. Тбилиси: Мецниереба, 1978. - С. 222-223.

133. Манеров В.Х. Исследование взаимосвязи перцепторных и акустических коррелятов свойств говорящего // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 15 Всесоюзн. семинара. -Таллин, 1989. -С. 216.

134. Маркел Дж. Д., Грэй А.X. Линейное предсказание речи. М.: Связь, 1980. - 308 с.

135. Мартынов B.C. Статические параметры основного тона речи / Автореферат диссертации на соискание ученой степени кандидата технических наук. Л., 1964.

136. Методические рекомендации по практическому использованию программы SIS при работе с речевыми сигналами / Центр речевых технологий. Санкт-Петербург. С. Петербург, 1997. - 394 с.

137. Михайлов В.Г., Златоустова Л.В. Измерение параметров речи. М.: Радио и Связь, 1987. - 168 с.

138. Михеев Ю.В. Статистический закон распределения периодов основного тона русской речи // Акустический журнал, 1970. Т. 16. - N 4. - С. 558-562.

139. Надеина Т.М., Бродовская С.Л., Парнева И.В. Восприятие в шуме слов разных степеней просодической выделенности // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 13 Всесоюзн. школы-семинара. Новосибирск, 1984. - Ч. 2. - С. 12-13.277

140. Надеина Т.М. Исследование зависимости между просодической выделенностью и смысловой значимостью слов в тексте // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 13 Всесоюзной школы-семинара. Новосибирск, 1984. - Ч. 2. - С. 9-11.

141. Надеина Т.М. Степень ударности в односинтагменной фразе // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 12 Всесоюзн. школы-семинара. Киев, 1982. - С. 259-261.

142. Назаров М.В., Прохоров Ю.Н. Методы цифровой обработки и передачи речевых сигналов. М.: Радио и Связь, 1985. - 176 с.

143. Николаева Т.М. Типология интонации и акцентное выделение. Экспериментально-фонетический анализ речи. Л.: Изд-во ЛГУ, 1989. - С. 113-122.

144. Никонов А.В., Попов В. А. Особенности структуры речи человека оператора в стрессовых условиях // Речь и эмоции: Материалы симпозиума. Л., 1975. - С. 11-16.

145. Норейка С.Ю. Исследование методов и разработка аппаратуры анализа траекторий основного тона речи / Автореф. дисс. на соиск. ученой степени к.т.н. Каунас, 1983. - 22 с.

146. Нушикян Э.А. Роль тональных характеристик в передаче эмоционального состояния говорящего // Речь и эмоции: Материалы симпозиума. Л., 1975. - С. 11-16.

147. Нушикян Э.А., Волошин В.Г. Использование вариативности восприятия и акустических параметров эмоциональной речи для верификации диктора // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. М., 1991. - С. 201-202.

148. Ньюэл А. Солитоны в математике и физике. М.: "Мир", 1989.- 328 с.174.0бжелян Н.К., Орлов Г.Ж., Попова О.Н., Пятков B.C.

149. Пакерис А.Ю. Акустическая структура просодии литовского литературного языка / Автореферат диссертации на соискание ученой степени доктора филологических наук. Вильнюс, 1983. - 48 с.

150. Петленко Б.И., Бутырский Л.С. Речевая связь в искусственных атмосферах. М.: Связь, 1978. - 144 с.

151. Петров К.С. К вопросу о статистике основного тона речи // Тр. учебн. ин-ов связи: М-во связи СССР. М., 1968.- Вып.37. - С. 64-70.

152. Полищук С. И. Особенности выражения логической экспрессивности в диалогической и монологической формах речи // Акустика речи и слуха: Материалы докл. и сообщ. 5 Всесоюзн. совещ.-симпозиума. -Одесса, 1989. С. 107-109.

153. Поспелов Б.В. К вопросу о собственном тоне русских гласных // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 16 Всесоюзн. семинара. -М., 1991. С. 171-172.

154. Ш.Поспелов Б.В., Каплун М.И., Долотин К.И. Микровариации речевого сигнала: проблемы, оценки и применение // Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 12 Всесоюзн. школы-семенара. Киев, 1982. - С. 47-49.

155. Поспелов Б.В. Экспериментальное исследование параметров вокалической микромелодики // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 17 Всесоюзн. семинара. Ижевск, 1992. - С. 181185.

156. Потапова Р.К. Речевое управление роботом. М.: Радио и Связь, 1989.-248 с.279

157. Потапова Р.К., Блохина Л.П. Разработка базы данных для смысловой интерпретации просодической информации // Автоматическое распознавание и синтез речевых сигналов. Киев, 1989. - С. 130-133.

158. Прудников А. П., Брычков Ю. А., Маричев О. И., Интегралы и ряды. Элементарные функции. М.: "Наука", гл. изд-во Ф.-М. лит-ры, 1981. 800 с.

159. Рабинер Л.Р., Гоулд Б. Теория и применение цифровой обработки сигналов. М.: Мир, 1978.

160. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. М.: Радио и связь, 1981. - 485 с.

161. Рамишвили Г.С. Об автоматическом узнавании голосов // Техническая кибернетика, 1966. № 5

162. Рамишвили Г.С. Речевой сигнал и индивидуальность голоса. -Тбилиси: Мецниереба, 1976. 184 с.

163. Распознавание слуховых образов / Под ред. Н.Г.Загоруйко и Г.Я. Волошина. Новосибирск: "Наука", 1970.- 338 с.

164. Ремель М. Некоторые положения таксономии в применении к мелодиям // Проблемы таксономии эстонских рунических мелодий. Таллин, 1977.-С. 75-79.

165. Сапожков М.А. Речевой сигнал в кибернетике и связи. М.: Связьиздат, 1963. - 472 с.

166. Сапожков М.А.,Михайлов В.Г. Вокодерная связь. М.: Радио и связь, 1983. - 248 с.280

167. Светозарова Н.Д. Восприятие ритмической организации фразы в шуме // Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 12 Всесоюзн. школы-семенара. Киев, 1982. - С. 356-358.

168. Себестиан Г. С., Процессы принятия решений при распознавании образов. Киев: Техника, 1965

169. Скрыль В.Ф., Балюн А.Г. Исследование статистических характеристик пауз речевого сигнала на каналах связи энергосистем. MB и ССО УССР, КПИ.-N 3387-81 Деп. - 28 с.

170. Сметанин A.M., Храмов С.Н. Возбуждение речевой волны// Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 17 Всесоюзн. семинара. Ижевск, 1992. - 144-147.

171. Сметанин A.M. Исследование и разработка методов повышенной точности измерений параметров формант и голосового источника. -Диссертация на соискание ученой степени к.т.н. Ижевск, 1980.

172. Смирнов В. И. Курс высшей математики. М.: "Наука". Гл. изд-во Ф.-М. лит-ры, 1965.- Том 1.- 480 с.

173. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. М.: Наука, 1969.

174. Собакин А.Н. Адаптивный метод выделения основного тона речи // Автоматическое распознавание слуховых образов : Тез. докл. и сообщен. 8 Всесоюзн. школы-семинара. Минск, 1976. - С. 49.

175. Соболев В.Н., Баронин С.П. Исследование сдвигового метода выделения основного тона речи // Электросвязь. 1968. - С. 30-36.

176. Соболев В.Н. Экспериментальное исследование сдвигового метода выделения основного тона речи // Акустический журнал, 1968. Т. 14. -Вып. 3.-С. 441-448.

177. Сомин Н.В. Сравнение нескольких спектральных методов выделения основного тона в условиях шума и ограниченной полосы частот //281

178. Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 7 Всесоюзн. школы-семенара. Алма-Ата: Наука, 1973. - С. 3-9.

179. Сорокин В.Н. Голосовой источник как система с распределенными параметрами. // Акустический журнал, 1981. -Т. 27. Вып.З. -С. 434-440.

180. Сорокин В.Н. О роли подглоточной области в процессе речеобразования // Проблемы построения систем понимания речи. М.: Наука, 1980.-С. 125-135.

181. Сорокин В.Н. Теория речеобразования. -М.: Радио и связь, 1985.312 с.

182. Урбанский Б. Электроакустика в вопросах и ответах. -М.: Радио и Связь, 1981.-248 с.

183. Фант Г. Акустическая теория речеобразования. М.: Наука, 1964.284 с.

184. Фант Г. Анализ и синтез речи. Новосибирск: Наука, С.О., 1970.168 с.

185. Фланаган Дж. Анализ, синтез и восприятие речи. М.: Связь, 1968.- 395с.

186. Фролов М.В., Таубкин B.JI. О влиянии эмоционального состояния диктора на некоторые параметры речевого сигнала. // Речь и эмоции: Материалы симпозиума. -Л., 1975. -С. 46-55.

187. Харкевич А.А. Избранные труды: Линейные и нелинейные системы. Спектры и анализ. М.: Наука, 1973. -Т. 2. - С. 87-252.

188. Цемель Г. И. Опознавание речевых сигналов. М.: Наука, 1971. 217.Чистович Л.А. Изменение основной частоты голоса какразличительный признак согласных. // Акустический журнал. -1968. Т.14. - С. 449-456.

189. Чистович Л.А., Венцов А.В., Гранстрем М.П. и др. Физиология речи. Восприятие речи человеком. -Л.: Наука, 1976. -388 с.282

190. Шараев Г. А. Об измерении высоты сложных звуков. // Автоматическое распознавание слуховых образов: Тез. докл. и сообщен. 8 Всесоюзн. школы-семинара. Львов, 1974. - Ч. 1. - С. 54-56.

191. Шейкин Р.Л. К анализу механизма возникновения пауз в речи // Механизмы речеобразования и восприятия сложных звуков. -М. -Л.: Наука, 1966.-С. 34-44.

192. Шпильберг С.М. Синтез эмоциональной речи // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 13 Всесоюзн. школы-семинара. Новосибирск, 1984. - С. 139-140.

193. Abuov Z., and Shcherbakova L.Р. The problem of bilinguism and phonetic peculiarities of Russian spoken by Kazakh // Elleveth Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tfllin, 1987. - P. 175-178.

194. A grawal A., and Lin C. Effect of voiced speech parameters on the intelligibiliti of PB words //J. Acoust. Soc. Am. -1975. -57. -N 1. P. 217-222.

195. Ainsworth W.A. A method of estimating speech synthethis parameters by temporal analysis of waveforms // Internal Journ. Man. Mach. Studies. 1971. -3. -N4. -P. 339-349.

196. Allen D.R., and Strong W.J. A model for synthesis of natural sounding vowels // J. Acoust. Soc. Am., 1985. 79. - N 1. - Pt. 1. - P. 58-69.

197. Askenfelt A., Gauffin J., Kitzing P., and Sundberg J. Electroglottograph and contact microphone for measuring vocal pitch // 3 Quart.Progr. and Status Rept. Speech Transmis. Lab., 1977. - N 4. - P. 13-21.283

198. Askenfelt A., Hammarberg B. Speech waveform perturbation analaysis // 3 Quart. Progr. and Status Rept. Speech Transmiss Lab. 1980 (1981). -N 4. - P. 40-49.

199. Atal B.S., Rabiner L.R.A pattern recognition approach to voiced-unvoiced-silence classification with application to speech recognition // IEEE Trans. Acoust., Speech and Signal Process. 1976. - 24. -N 3. -P. 201-202.

200. Atal В. S. Characterization of speech signals by linear prediction of the speech wave // IEEE Conf. Rec. Symp. Feature:Extr. and Selec. Pattern. Recogn. -1970. -P. 202-209.

201. Atal B.S. Predictive coding of speech at low bit rates // IEEE Trans. Commun. 1982. - 30. - N 4. - P. 600-614.

202. Atal B.S. Speech signal pitch detector using prediction error date. -Pat. N 3740476 USA. G10L 1/04. - 19.06.73.

203. Bannert R. From prominent syllables to skeletion of mtaning: a model of prosodically guided speech recognition // Ellerventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 2. - P. 73-76.

204. Bardina N. Principles of intonational shurturing of the spontaneous monologue // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. -Vol. 4.-P. 201-204.

205. Boe L.D. Etude des vibrations des cordes vokales dans la parole: Metods, resultats et applications // Rev. Acoust., 1976, 9. -N 37. - P. 105-107.

206. Bond Z.S., and Moore T.J. Speech produced under adverse circumstances // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 2. - P. 73-76.

207. Bordone-Sacerdote C. and Sacerdote G.G. Distribution of pauses as a characteristic of individual voices // Acustica, 1976. 34. -N 4. - P. 245247.284

208. Brookes D.M., and Naylor P.A. Speech production Modeling with variable glottal reflection coefficient // ICASSP'88: Proc. IEEE Int. Cjnf. Acjusn., Sheech and Signal Process. New York, 1988. - P. 671-674.

209. Butler P., and Moore D.J.H. Pich detection in speech//ATR, -1973.-7.-N2.-P. 39-46.

210. Carlson R., Fant G., Granstrem B. Two-formant models. Pitch and vowel perception // Quart Progr. and Status. Rept. 1976. - N 1-2. - P. 1-17.

211. Carre R., Lancia R., Ralle J. Etude etralisation d'un de detetuer de melodie pour analise de la parole // L. nnde electuque. 1963. - N 434. - May. - P. 556-562.

212. Carre R. Review of French work on vocal source vocal tract interaction // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. - Tallin, 1987. -Vol. 3.-P. 371-375.

213. Childers D.G., Micks D.M. Moore G.P., Alsaka Y.A. A model for vocal fold vibratory motion, contact area and the Electrjglottogram // J. Acoust. Soc. Am., 1986. 80. N 5. - P. 1309-1320.

214. Childers D.G., Smith A.M., Moore G.P. Relationships between electroglottograph, speech and vocal cord contact // Folia Phoniatr. 1984. -36.-N3.-P. 105-118.

215. Cohen A., Froid I. Softward package for interactive text independent speaker verification // Electrotechnol. Develop. Proc. MELECON'81 1st Meditter. Electrotechnol. Conf. Tel-Aviv, 24-28. May 1981. New-York, N.Y., 1982. - 6.2.3./1 - 6.2.3/4.

216. Cranen B. and Boves L. Aerodynamic aspects of voising glottal pulse skewing revisited // ICASSP'85: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1985.Vol. 3. - P. 1085-1088.

217. Cranen В., and Boves L. On subglottal formant analysis // J. Acoust. Soc. Am., 1987. 87. - N 3. - P. 734-746.285

218. De Souza P. A statistical approach to the design of an adaptive self-normaling silence detector // IEEE Trans. Acoust., Speech and Signal Process. -1983. 31. N 3. - P.678-684.

219. Dolansky L.O. Instantaneous pitch period indicator // J. Acoust. Soc. Am. 1955.-27.-Nil.-P. 67-72.

220. Dubnowski., Schafer R.W., Rabiner L.R. Real-time digital hardware pitch detector // IEEE Trans., Acoust., Speech and Signal Process. 1976. -Feb. - 24. - P. 2-8.

221. Duifhuis H., Willems L.F., Sluyter R.J. Measurements of pitch in speech: An implementation of Goldstein's theory of pitch perception // J. Acoust. Soc. Am. 1982. - 71. -N 6. - P. 1568-1580.

222. Dunter H.M., Sarma V.V.S. Automatic speaker identification for a large population //IEEE Trans. Acoust., Speeh and Signal Process. 1979. - 27. - N 3,-P. 255-263.

223. Fant G. Acoustic analysis and synthesis of speech with application to Swedish. Ericsson Technics, 1959. - V. 15. - N1

224. Fant G. Interactive phenomena in speech production // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 3. - P. 376-381.

225. Fant G., Nord L., Krucrerberg A. Sequental and prosodic variabilities in connected speech an applied data bank study // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. Vol. 6. - P. 102-105.

226. Fant G. Speech production. Glottal source and exitation analisis // Quart Progr. and Status. Rept. Speech Transmiss. Lab. 1979. -N 1. P. 85-107.

227. Feijoo S., Hernander C., Carmedo R. Multidimentional analysis of phonolodical degeneration in pathological voises // ICASSP'86: Proc. IEEE IECEJ AS J Int. Conf. Acoust. Speech and Signal Process // New York, 1986. - P. 673-676.286

228. Feng S., Lin S., Rong-Rong L. An experimental analysis of the five level tones of the Gaoba Kam // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 3. - P. 320-323.

229. Fitzpatrick E., and Bachenko J. Parsing for prosody what a text -to speech system needs from syntax // Annu. Arhf. Intell (Al), Syst. Cov. Conf. Washington D.C., 1989. - P. 188-194.

230. Flanagan J. L., Note on the Design of "Terminal-Analog" Speech Synthesisers // J. Acoust/ Soc/ Am. V. 29. - N2, Febriary, 1957. - p. 306-310.

231. Friedman D.H. Multidimentional Pseudo-Vaximum Likeihood pitch estimation // IEEE Trans. Acoust., Spich and Signal Process. 1978. - Vol. 26. - N 3. -P. 185-196.

232. Fujimura O. Fundamentals and applications in speech production research // Elleventh. Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. -Vol. 6. - P. 10-27.

233. Fujisaki H., Tominaga M. Automatic recognithion of voiced stop consonants in CV and VCV utterances // ICASSP 82: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. Paris, May 3-5, 1982. Vol. 3. New York, N.Y. - 1982. -P. 1996-1999.

234. Fujisaki H., Kawai H. Realization of linguistic information in the voice fundamental frequency contour of the spoken Japanese // ICASSP'88: Proc. Int. Conf. acoust., Speech and Signal Process. New York, 1988. - P. 663-666.

235. Gibson B.R., Greenwood E. Windowing Function for the average magnitude difference function pitch extractor // ICASSP 80: Proc. Denver Cole., 1980, Vol. 1. New York, N.Y. - 1980. - P. 49-52.

236. GH1 J.S. Apparatus for distinguishing between voiced and unvoiced sounds in a speech signal 3 / Pat. N 1113225 Grait Britan. 08.05.68. - H4R.

237. G о 1 d В. Computer programm for pitch detection // J. Acoust. Soc. Am. -1962.-34.-P. 916-921.287

238. Gold В., Rabiner L. Parrallel Processing techniques for estimating pitch periods of speech in the time domain // J. Acoust. Soc. Am. 1969. - 46. - N 2 (Pt.2). - P. 442-448.

239. Goldstein J.L. An optimum processor theory for the central formation of the pitch of complex tones // J. Acoust. Soc. Am. 1973. - 54. - P. 1496-1516.

240. Gomer R.J., Tribolet J.M. Speech analysis and modelling using a sequental ARMA estimation technique // ICASSP 82: Proc.IEEE Int. Conf. Acoust., Speech and Signal Process. Paris, May 3-5. 1982, Vol. 3. New York, N.Y. - 1982. -P. 1585-1588.

241. Guerin В., and Вое L.J. Etude de e'influence du couplage acoustique sourse conduit vocal sur F0 des voyelles orales // Phonetica. - 1980. - 37. - 169- 192.

242. Haggard M., Ambler S., Callow M. Pitch and voicing cue.//J. Acooust. Soc. Am. 1970. - 47. - P. 613-617.

243. Haji Т., Horiguchi S., Baer Т., Gould W.J. Frequency and amplitude perturbation analysis of electroglottograph during sustained phonation // J. Acoust. Soc. Am. 1986. - 80, N 1. - P. 58-62.

244. Harajda H. Analysis of the specific structure of the fundamental component of vocal sounds from the point of view of intonation evalhation // Arc. Acoust 1983.-8.-N4.-P. 271-291.

245. Harbeson W.D.-N4276445, USA. G10L 1/00 7.7.81.

246. Harris C.M., and Weiss M.K. Pitch extraction by computer processing of high resolution Fourier analysis data // J. Acoust. Soc. Am. -1963. -35. - N 3. - P. 339-343.

247. Hebid M.K., and Robinson D.M., Sincoscie W.D. Real Zeros in pitch detection // IEEE Int. Conf. Acoust., Speech and Signal Process. Record. Tulsa, Okla, 1978. New York, N.Y. - 1978. - P. 31-34.

248. Hess W. A pitch synchronous digital feature extraction system for phonemic recognition of speech // IEEE Symp. Speech Recogn. 1974. - P. 112-121.288

249. Hess W. Bestimming der Grund-frequenz von spachsignalen in zeitereich mit Hilfe nichtlinearer digitaler Filterung. // Frequenz. 1980. - 34. - N 5. -P. 152-156.

250. He s s W. On-line digital pitch period extractor for speech signals // Proc. Summer Sch. Circuit theory : Short. Contrib. Prague, 1974. - N 2. - P. 413.

251. Hess W. Pitch determination. An exampl for the application of signal processing methods in speech domain // Speech Processing: Theor. and Appl: Proc. EUSIPCO-8O, 1-st Eur. Signal Process. Conf. Lausanne, Sept. 16-18. -Amsterdam, 1980. P. 625-634.

252. Higgins M.B., Saxman J.H. A comparison of intrasubject variation across sessions of three vocal frequency perturbation indices // J.Acoust. Soc. Am. 1989. - 86, N 3. - P. 911-916.

253. Hilman R.E., Desterle E., Feth L.L. Characteristics of the Glottal turbulent noise sourse // J. Acoust. Soc. Am. 1983. - 74. - N 3. - P. 691-694.

254. Hilman R.E., Desterle E., Feth L.L. Characteristics of the Glottal turbulent noise sourse // J. Acoust. Soc. Am. 1983. - 74. - N 3. - P. 691-694.

255. Hodges M.R.L. Effect Threshold offsets in zero-crossihg speech detector // Electron Lett. -1981. 17. - N 19. - P. 682-684.

256. Holmes J.N. An investigation of the volume velocity waveform at the larinx during speech by means of inverse filter // Proc. Speech Commun. Siminar. -Stockholm, 1962. Vol. 1. - B4.

257. Holmes J.N. Formant extraction before and after glottal closure // IEEE Int. Conf. Acoust., Speech and Signal Process. Philadelphia. Pa. - 1976. - P. 39-42.

258. House D. Perception of tonal patterns in speech: Implications for models of speech perception // Tlltventh In t. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 1. - P. 76-79.289

259. Howard D.M., and Lindsey G.F. Conditioned variability in voicing offsets // IEEE Trans. Acoust., Speech and Signal Process. 1988. - 36, N 3. - P. 406-407.

260. Howard D.M., and Lindsey G.F. New larynograms of the singing voice // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. -Vol. 5.-P. 166-169.

261. Howard D.M., and Howard I.S. Quantitative comparison of speech fundamental period estimation devices // Elleventh int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. Vol. 4. - P. 52-55.

262. Kane M., and Wellen C.J. Acoustical measurements and clinicfl judgments of vocal quality in children with vocal nodules // Folia Phoniatr. 1985. -37, N2. - P. 53-57.

263. Kang G.S., and Everett S.S. Improvement of the narrowband LPC synthesis // ICASSP 84: Proc. IEEE Int. Conf. Acoust., Speech and Signal290

264. Process. San Diego, Calif, 19-21 March 1984, Vol. 1. New York, N.Y. - 1984. - P. 1.7/1-1.7/4.

265. Kasai I. On the Tonosyntax of a Hungarian child's early questions // Elleventh Int. Congr. Phonetic Sci.: Proc XI ICPhS. Tallin, 1987. - Vol. 1. - P. 385388.

266. Kasuya H. An improved autocorrelation pitch detector // J. Acoust. Soc. Jap. 1980. - (E) 1, N 4. - P. 263-264.

267. Kasuya H., Kobayashi Y., Kobayashi Т., Ebihara S. Characteristics of pitch period and amplitude perturbations in patologicmvoice // ICASSP'83: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1983.-P. 1372-1375.

268. Kohda T. An argument against intervals in pitch revised fine structure theory of pitch perception // J. Acoust. Soc. Jap. 1985. - E6, N 2. - P. 79-88.

269. Kohler K.J. FO in the perception of lenis and fortis plosives // J. Acoust. Soc. Am. 1985. - 78, N 1. - Part 1. - P. 21-32.

270. Koizumi Т., Taniguchi S., Hiromitsu S. Two-mass models of the vocfl cords for natural sounding voice // J. Acoust. Sos. Am. 1987. - 82, N 4. - 1179-1192.

271. Kolesnikov B.M., and Zakharov L. M. Acoustic and perception of speech in various modes of articulation // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 2. - P. 207-210.

272. Krivnova O. Intonational phrasing and its role in speech communication // Elleventh Int. Congr. Phonetic Sci.: Proc XI ICPhS. Tallin, 1987. -Vol. 2.-P. 481-485.

273. Krishnamurthy A.K., and Childers D.G. Two-chanell speech analysis // IEEE Trans. Acoust., Speech and Signal Process. 1986. - 34, N 4. - P. 730-743.291

274. Kuwabara H., and Ohguashi К. Acoustic characteristics of professional vale announcers speech sounds // Acustica. 1984. - 55, N 4. - P. 233240.

275. Larer J.N., Alsaka Y.A., Childers D.G. Variadiliti in closed phased analysis of speech // ICASSP'85: Proc IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1985. - P. 1089-1092.

276. Laver J., Hiller S., Hanson R. Comparative perfomance of pitch detection algorithms on disphonic voices // ICASSP'82: Proc. IEEE INT. Conf. Acoust., Speech and Signal Process. New York, 1982. - Vol.1. - P. 192-195.

277. Lavington S.H., and Rosental L.H. Some facilities for speech processing by computer // Computer Journal. 1967. - 9, N 4. - P. 330-339.

278. Lieberman P., Katz W., Jongman A., Zimmerman R.,Miller M. Measures of the sentence intonation of read and spontaneous speech in American English // J. Acoust. Soc. Am. 1985. - 77, N 2. - P. 649-657.

279. Lieberman P.H. Perturbation in vocal pitch // J. Acoust. Soc. Am. -1961.-33,N5.-P. 597-603.

280. Linday M. Testing a model of intonation in a tone language // J. Acoust. Soc. Am. 1986. - 80, N 3. - P. 757-764.

281. Linville S.E., and Korabic E.W. Fundamental frequency stability characteristics of elderly women's voices // J. Acoust. Sjc. Am. 1987. - 81, N4.-P. 1196-1199.

282. Linville E.E. Intraspeaker variability in fundamental frequency stability : An age-related phenjmen? // J. Fcoust. Soc. Am. 1988 - 83, N 2. - P. 741745.

283. Lisker L. Is it VOT or a first formant transition detector? // J. Acoust. Soc. Am. 1975. - 57, N 6 (Part 2). - P. 1547-1551.

284. Ljolje F., and Fallside F. Synthesis of natural sounding pitch contours in isolated utterances using Hidden Markov Models // IEEE Trans. Acoust., Speech and Signal Proces. 1986. - 34, N 5. - P. 1074-1080.292

285. Lobanov В. The phoneme text-to-text speech sistem Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. Vol. 1. - P. 120-124.

286. Lofqvist A., Baer Т., Mc.Garr N., Story R.S. The cricothyroid muscle in voicing control // J. Acoust. Sos. Am. 1989. - 85, N 3. - P. 1314-1321.

287. Lucc J. E. Automatic speaker verification using cepstral measurements // J. Acoust. Soc. Am, 1969. V. 46. - N. 4 (Part 2). - P. 1026-1032.

288. Lukatela G., Tomic Т., Drajec D. Adaptive autocorrelation techniques for vocal-pitch detection // Publ. Electrotechn. Fak. Belgrady. Serie: Eletronique, Telecom, Automatique. 1973. - 79, N 96. - P. 51-58.

289. Markel J.D. The SIFT algorithm for fundamental frequency estimation // IEEE Trans. Audio and Electroacoust. Dec. 1972. - 20, - P. 1569-1572.

290. Martin P. Comparison of pitch detection by cepstrum and spectral comb analysis // ICASSP'82: Proc IEEE Int. Conf. Acoust. Speech and Signal Process. New York, 1982. - Vol. 1. - P. 180-183.

291. Matsumoto H., and Nimura T. Text-independent speaker identification based on piecewise canonical discriminant analysis // ICASSP'78: Proc. IEEE Int. Conf. acoust. Speech and Signal Process. New York. - 1978. - P. 291-294.

292. May C.J. and Holmdel N.J. Pat. N 4277645 USA. 7.07.81. -G10L/00.

293. McGonegal C.A., Rabiner L.R., Rosenberg A.E. A semiautomatic pitch detector (SARD) // IEEE Trans. Acoust, Speech and Signal Process. Dec. 1975. - 23. - P. 570-574.

294. McGonegal C.A., Rabiner L.R., Rosenberg A.E. A subjective evaluation of pitch detection methods using LPC synthesiser speech // IEEE Trans. Acoust, Speech and Signal Process. 1977. - 25, N 3. - P. 221-229.293

295. McGowan R. S. Comments on "On the measurement of glottal flow J. Acoust. Soc. Amer. 84, 888-900 (1988). // J.Acoust. Soc. Am. 1989. - 85, N 6. - P. 2672-2673.

296. McGo wan R. S. Comments on "On the measurement of glottal flow J. Acoust. Soc. Amer. 84, 888-900 (1988). // J.Acoust. Soc. Am. 1989. - 85, N 6. - P. 2672-2673.

297. Meister E., Rohtla M., Raudsepp M. Increasement of naturaluess in synthetized speech // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 3. 1987. - P. 266-269.

298. Meyer E. Wavelet and Operators. Camdridge University Press, 1993

299. Mikami N., and Ohda R. Pole-zero analysis of voiced speech using group delay characteristics // IEEE Trans. Acoust., Speech and Signal Process. -1984.-32,N5.-P. 1095-1097.

300. Miller R.L. Perfomance Characteristics of an experimental harmonic identification (HIPEX) sustem // J. Acoust. Soc. Am. 1970. 47, N 6 (Part 2). - P. 1539-1601.

301. Miller N.J. Pitch detection by data reduction // IEEE Trans. Acoust., Speech and Signal Process (Special issue on IEEE symposium on Speech Recognition). Feb. 1975. - 23. - P. 72-79.

302. Miller N.J. Pitch detection by data reduction // IEEE Symp. speech recogn. Carnague-Mellon Univ., 1974. - Contrubut Pap. - P. 122-130.

303. Mobiuss В., Zimmerman A., Hess W. Microprosodic fundamental frequency variation in German // Tlleventh Int. Congr. Phonetic Sci.: Proc XI ICPhS. Tallin, 1987. - Vol. 1. - P. 146-149.

304. Murillo C.B.S., Berdichevsky F.M.S., Culter C. Analysis of Formant and pitch information for Spanish phonemes // ICASSP'79: Proc. IEEE Int. Conf Acoust., Speech and Signal Process., Washington, 1979. P. 1914-1919.294

305. Nadeina Т. Principles of prosodic prominence formations of words in Russian utterances // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987.-Vol. 4.-P. 275-278.

306. Nasri M.K., Caelen-Haumont G., Caelen J. Using procodic rules in speech recognition expert system // ICASSP'89: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1989. - Vol. l.S.l. - P. 671-674.

307. Nelsonne A., Sundberg J., Teenstrom S., Askenfelt A. Measuring the rate of voice fundamental frequency in fluent speech during mental depression // J. Acoust Soc. Am. 1988. - 83, N 2. - P. 716-728.

308. Neuburg E.P. Improvement of desision by use of context // ICASSP'78: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. 1978. - P. 5-7.

309. Nikolayeva T. The typology of sentence intonation systems // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 6. - P. 106-109.

310. No 11 A.M. Cepsrtum pitch determination // J. Acoust. Soc. Am. 1967. -41,N2.-P. 293-309.

311. No 11 A.M. Pitch determination of human speech by the harmonic product spectrum, the harmonic sum spectrum and a maximum likelihood estimation // Proc. Symp. Сотр. Proc. Commun. N.Y., 1969, Brooklin, N.Y., 1970. - P. 779797.

312. No 11 A.M. Short-time spectrum and "Cepstrum" techniques for vocal-pitch detection // J. Acoust. Soc. Am. 1964. - 36, N 2. - P.

313. Paliwal K.K Comparative performance evaluation of different pitch estimation methods for noisy speech // Acoust. Lett. 1983. - 6, N 11. - P. 164-166.

314. Patterson R.D. The effects of relative phase and number of components on residue pitch // J. Acoust. Soc. Am. 1973. - 53. - P. 1565-1572.

315. Pederson M.F., and Moeller S. A transport globulin, as a predicting factor of voice chance in puberty ? // Elleventh Int. Congr. Phonetic Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 4. - P. 296-299.

316. Pettorino M. Intrinsic pitch of vovels: an experimental study on Italian // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 1. -Tallin. 1987.-P. 138-141.

317. Pisani D.B., Bernacki R.H., Nusbaum H.C., Yuchtman M. Some acoustic-phonetic correlates of speech produced in noise // ICASSP'85:296

318. Proc. Int. Conf. Acoust., Speech and Signal Process. New York, 1985. - Vol. 4. - P. 1581-1584.

319. Rabiner R.L., Chang M.J., Rosenberg A.E., McGonegal C.A. A comparative performance stady of several pitch detectction algorithms // IEEE Trans. Fcoust., Speech Process. 1976. - P. 399-418.

320. Rabiner R.L., Sambur M.R. Application of an LPC distance measure to the voiced-unvoiced-silence detection // IEEE Trans. Acoust. , Speech and Signal Process. 1977. - P. 338-343.

321. Rabiner R.L., Sambur M.R., Schmidt C.E. Application of a nonlinear smoothing algorithm to speech processing // IEEE Trans. Acoust., Speech and Signal Process. 1975. - 23, N 6. - P. 552-557.

322. Rabiner L.R., Atal B.S., Sambur M.R. LPC prediction error analysis of its variation with the posision of the analysis frame // IEEE Trans. Acoust, Speech and Signal Process. 1977. 25, N 5. - P. 434-442.

323. R a b i n e r L. R. On the use of autocorrelation analysis for pitch detection // IEEE Trans. Acoust., Speech and Signal Process. 1977. - 25, N 1. - P. 24-33.

324. Ramamoorthy V. Voice/unvoice detection based on a composite-Gausian sourse model of speech // ICFSSP'80: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1980. - Vol. 1. - P. 57-60.

325. Rappaport W. Uber mesugen der Tonhohenverteiling in der Doutschen sprehe // Acustica. 1958. - 68, N 5. - P. 220-225.

326. Reddy D.K. Pitch period determination of speech sounds // Commun. ASM. 1967. - 10, N 6. - P. 343-348.

327. Regel P. A modyl for acoustic-phonetic transcription of fluent by spouken German speech // IEee Trans. Acoust. Speech and Signal Process. 1982. -30, N3.-P. 440-450.

328. Ritsma R.J., and Engel F.L. Pitch of frequency-modylated signals // J. Acoust. Soc. Am. 1964. - 36. - P. 1637-1644.297

329. Robb M.P., Saxman J.H., Crant A.A. Vocal fundamental frequency characteristics during the first two years of life // J. Acoust. Soc. Am. -1989.- 85, N4.-P. 1708-1717.

330. Ross M.J., Shaffer H.L., Cohen A., Frendberg R., Man ley H.J. Average magnitude difference function pitch extractor // IEEE Trans. Acoust., Speech and Signal Process. 1974. - 22, N 5. - P. 353-362.

331. Ryalls J.H. and Lieberman P. Fundamental frequency and vowel perception // J. Acoust. Soc. Am. 1982. - 72, N 5. - P. 1631-1634.

332. Sarma V.V.S., and Venugopal D. Studies on pattern recognition approach to voiced-unvoiced-silence classification // IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1978. - P. 1-4.

333. Schafer R.W., and Rabiner L.R. Digital representation of speech signals // Proc IEEE. 1975. - 63, N 4. - P. 662-677.

334. Schafer R.W., and Rabiner L.R. Sistem for automatic formant analysis of voiced speech // J. Acoust. Soc. Am. Feb., 1970. - 47. - P. 634-648.

335. Schouten J.F. The residue and the mechanism of hearing // Proc. Kon. Akad. Wetenschap, 1949. - 43. - P. 991- 999.

336. Schouten J.F., Ritsma R.J., Cardozo B.L. Pitch of the residue // J. Acoust. Soc. Am. 1962. - 34. - P. 1418-1424.

337. Schroeder M.R. Period histogram and product spectrum: new methods for fundamental-frequency measurement // J. Acoust. Soc. Am. 1968. - 43, N4.

338. Schroeder M.R., and Noll A.M. Recent studies in speech research at Bell Telephone Laboratories // 5-th Congr. Internat. Acoust. 1965. -A21.

339. Secrest B.G., and Doddington С.R. Post processing techniques for voice pitch trackers // ICASSP'82: Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1982. - P. 172-175.298

340. Shade C.H. Intrinsic fundamental frequency of vowels in sentence context // J. Acoust. Soc. Am. 1985. 78, N 5. - P. 1562-1567.

341. Shafer H.L., Cohen A., Freudberg R., Manley H.L. Average magnitude difference function pitch extractor // IEEE Trans> Acoust, Speech and Signal Projcess. Oct. 1974. - 22. - P. 353-362.

342. Shi Bo, and Zhang Jialu. Vowel intrinsic pitch in standart Chinese // Elleventh Int. Congr. Phonetic. Sci.: Tallin, 1987. Vol. 1. - P. 142-145.

343. Regel P. A modyl for acoustic-phonetic transcription of fluent by spouken German speech // IEee Trans. Acoust. Speech and Signal Process. 1982. -30, N3.-P. 440-450.

344. Siegel L.J., and Bessey A.C. Voiced/unvoiced/mixed exitation classification of speech // IEEE Trans. Acoust, Speech and Signal Process. 1982. -30, N3.-P. 451-460.

345. SkaIozub L.G. Articulatory dynamic organization of word production according to cinema X-ray photography date (methods of investigation and results) // Elleventh Int. Congr. Phonetic. Sci.: Proc XI ICPhS. Tallin, 1987. - Vol. 4. - P. 3235.

346. S lis I.H., and Van den Berg R. J. H. Assimilation of voice and perception of voicing: effects of phonetic context // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS.- Tallin, 1987. Vol. 5. - P. 350-353.

347. Sondhi M.M. New methods of pitch extraction // IEEE Trans. Audio and Electroacousat. 1968. - 16, N 2.

348. Sorokin V. Wave mechanics of the speech signal // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS.- Tallin, 1987. Vol. 6. - P. 7-9.

349. Sreenivas T.V., and Rao P.V.S. Pitch extraction from corrupted harmonics of the power spectrum // J.Acoust. Soc Am. 1979. - 61, N 1. - P. 223228.

350. Stevens K.N. Airflow and turbulence noise for fricative and stop consonants. Statistic consideratin // J. Acoust. Soc. Am. 1971. - 50. - P. 1188-1192.299

351. Stevens K.N. Interaction between acoustic souece and vocfl tract configuration for consonants // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS.- Tallin, 1987. Vol. 3. - P. 385-389.

352. Sugimoto Т., and Hashimoto S. The voice fundamental pitch and formant tracring computer program by short term autocorrelation function // Rev. Electr. Commun. Lab. 1962. - 10, N 9-10. - P. 447-456.

353. Summerfeld Q., Haggard M. On the dissisiation of spectral and temporal cues to the voicing distinction in initial stop consonants // J. Acoust. Soc. Am. 1977. - 62, N 2. - P. 435-448.

354. Tremain Т.Е., Tussell J.W., Dean R.A., Abzug B.M., Cowing M.D., Bound P .W.J r. Implementation of two real time narrow band speech algorithms // EASCON'78: Record Ailington, Va. New York, 1978. - P. 678-708.

355. Terhard E. Pitch, consonanse and harmony // J. Acoust. Soc Am. -1974.-55.-P. 1061-1069.

356. Terhard E., Stoll G., Seewann M. Algorithm for extraction of pitch and silence from complex tonal signals // J. Acoust. Soc. Am. 1982. - 71, N 3.- P. 679-688.

357. Thorthen N.-G. Intonation and text in standart Danish // J. Acoust. Soc. Am. 1985. - 77, N 3. - P. 1205-1216.

358. Tierney J. , and all. The Lincoln experimental terminal channel vocoder // IEEE First Annual Conf. Colorado, 1965. - P. 335-338.

359. Titze J.R. On the mechanical of vocal-fold vibration // J. Acoust. Soc. Am. 1976. - 60, N 6. - P. 1366-1380.

360. Umeda N. Influence of segmental factors on fundamental frequency in fluent speech // J. Acoust. Soc. Am. 1981. - 70, N 2. - P. 350-355.

361. Ungehouer G., Rapprath R. Zur entwiklung lines verbund system von periodzitate-analizator (Tonho-Unehreiber) und intusimeter // 5th Congr. Int. Acoust. Liege. - 1965. - J 11.300

362. Van den Berg R.J.H. The perception of voicing in dutch two-obscurenth sequences // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. -Tallin, 1987. Vol. 5. - P. 160-163.

363. Weinberg В., Bennet S. Speaker sex recognition of 5 and 6 year old children's voices // J. Acoust. Soc. Am. 1971. - 50, N 4 (Part 2). - P. 1210-1213.

364. Weiss M.R., Vogel R.P., Harris C.M. Implementation of a pitch extractor of duble-spectrum-analysis type // J. Fcoust. soc. Am. Oct. 1969. -11,N2. -P. 167-169.

365. Wight man F.L. Pitch and Stimulus fine structure // J. Acoust. Soc. Am. 1973.- 54.-P. 397-406.

366. Wightman F.L. The pattern-transformation model of pitch // J. Acoust. Soc. am. 1973. - 54. - P. 407-416.

367. Wilcox K., and Horii Y. Age and changes in vocal jitter // J. Gerotol. 1980. - 35. - P. 194-198.

368. Witten H. Digital storage and analysis of speech // Wireless Word. -Jan., 82 -88. P. 44-45, 49.

369. Wong D.Y. On understanding the quality problem of LPC speech // ICASSP'80 : Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1980.-Vol. l.-P. 725-728.

370. Yanagihara N. Significfnce of harmonic changes and noise components in hoarceass // J. Speech hear. Res. 1967. - 10. - P. 531-541.

371. Yea J.J., Krishnamurthy A.N., Naik J.N., Moore J.P., Childers D.G. Glottal sensing for speech analysis and synthesis // ICASSP'83: Proc. IEEE Int. Conf Acoust., Speech and Signal Process. New York, 1983. - Vol. l.-P. 1332-1335.

372. Yumoto E., Gould W.J., Baer T. Harmonic-to-noise ratio as an index of the degree of hoarness // J. Acoust. Soc. Am. 1982. - 71. - P. 1554-1550.301

373. Yumoto E., Okamura H. Objective assesment of hoarseness: Psychophysical measyrement and acoustic analysis // J. Acoust. Soc. Jap. (E)5. -1984.-N3.-P. 157-163.

374. Zhang J. The intrinsic fundamental frequency of vowels and the effect of speech modes on formants // Elleventh Int. Congr. Phonertic Sci.: Proc XI ICPhS. Tallin, 1987. -Vol. 3. - P. 390-393.

375. Zlatoustova L., Kozlenko N., Khitina M., Zakharov L. Automatic word stress detector // Elleventh Int. Congr. Phonetic. Sci.: Proc. XI ICPhS. Tallin, 1987. - Vol. 1. - P. 96-99.

376. Тихонов Г.А., Гитлин В. Б., Кузнецов П.Г., Тихонов Г.А., Чепкасов А.Г. Устройство выхода селектевизора. // А.с. N 283332 СССР, МКИ H04q 1/10. Приоритет от 28.04.69

377. Miller R.L. Nature of vocal cord wave // J. Acoust. Soc. Am. 1956. - 28, N 1. - P. 159

378. Какауридзе А.Г., Тушишвили M.A. Способ определения звонкости в речевом сигнале. А.с. N 390558 СССР. On. 11.07.73 в БИ N 30, МКИ 10 1/04.

379. Manceron F., and Lienard J.S. Impulse analysis of speech: Spotting and pressifying the impulses in the speech wave // ICASSP'82:M Proc. IEEE Int. Conf. Acoust., Speech and Signal Process. New York, 1982. - Vol. 1. - P. 1569-1572.

380. Patric P.J., Xydeas C.S., Steele R., Chan W.C. Wideband quality speech encoders with bit rates of 16-32 kbit/s // ICASSP'81: Proc. Ieee Int. Conf. Acoust., Speech and signal Process. New York, 1981. - Vol. 1. - P. 844-847.

381. Furui S. Comparison of speaker recognition methods using statistical features and dynamic features // IEEE Trans. Acoust., Speech and Signal Process. -1981.-29.-N3.-P. 342-350.

382. Кузнецов П. Г., Гитлин В.Б. Анализатор временных интервалов // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1968. -Вып. III. - С. 220-228.

383. Гитлин В.Б., Сметанин A.M., Шуткин В.Е. Обнаружение интервалов смыкания и размыкания голосовых связок // Автоматическое распознавание слуховых образов: Тез. докл. и сообщ. 11 Всесоюзн. школы-семинара. Ереван, 1980. -С. 134-136.

384. Гитлин В. Б., Кузнецов П.Г., Тихонов Г.А., Чепкасов А.Г. О частоте квантования спектральных параметров речевого сигнала // Автоматические устройства учета и контроля. Ижевск: Удмуртия, 1969. - Вып. IV. - С. 36-46.

385. Arkhipov I.O. and Gitlin V.B., Restoration of Fundamental-Tone Periodicity in a Telephone Signal // Pattern Recognition and Image Analysis. 1999. -Vol.9. - No.l. - P.10-13;

386. Arkh.ipov I.O. and Gitlin V.B., Method for Extracting the Fundamental Tone on the Basis of a Notion Concerning Generated Solution // Pattern Recognition and Image Analysis. 1999. - Vol.9. - No.l. - P. 14-16;

387. Научно-технический центр "Вычислительная техника" (НТЦ ВТ) в течение последних 8 лет выполняет ряд НИР, связанных с разработкой автоматизированных измерительных систем внутри- и внешнебаллистических параметров изделий.

388. Главный конструктор проекта1. B.C. Казаковоб использовании резу циидоцента кафедры ВТ ИжГТУ В.Б. Гитлина в учебном процессе1. Tftwti-г1. М » 2000 г.

389. KTOpjio учебной работе Ю. М. Мерзляков

390. Метод анализа и обработки речевых сигналов (главы 4, 5, 6 диссертационной работы В.Б. Гитлина).

391. По дисциплине "Теория цифровой обработки сигналов" читаются разделы, связанные с о спектральным анализом сигналов, со спектральным и временным анализом речевых сигналов.

392. Выделение параметров основного тона речевого сигнала (главы 5, 6, 7 диссертационной работы В.Б. Гитлина).

393. По данной теме выполнено и защищено пятнадцать дипломных проектов.

394. В.Б. Гитлин разработал и создал на электронном носителе методические указания к лабораторным работам по дисциплине "Теория цифровой обработки сигналов":1. "Генерация цифровых сигналов".

395. В работе, на базе программного комплекса "Сигнал", студенты осваивают основные принципы обработки цифровых сигналов во временной области на примере речевых сигналов.2. "Спектральный анализ сигналов".

396. В работе студенты изучают основы спектрального анализа цифровых сигналов с применением алгоритмов быстрого преобразования Фурье на примере речевых сигналов.3. "Изучение линейных систем с постоянными параметрами".

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.