Разработка и исследование алгоритмов многоуровневой временной сегментации речевых сигналов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Зилинберг, Андрей Юрьевич

  • Зилинберг, Андрей Юрьевич
  • кандидат технических науккандидат технических наук
  • 2010, Санкт-Петербург
  • Специальность ВАК РФ05.13.01
  • Количество страниц 164
Зилинберг, Андрей Юрьевич. Разработка и исследование алгоритмов многоуровневой временной сегментации речевых сигналов: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Санкт-Петербург. 2010. 164 с.

Оглавление диссертации кандидат технических наук Зилинберг, Андрей Юрьевич

ОГЛАВЛЕНИЕ

ОБОЗНАЧЕНИЯ И АББРЕВИАТУРЫ

ВВЕДЕНИЕ

1. АНАЛИЗ ИССЛЕДОВАНИЙ ПО ПРОБЛЕМЕ АВТОМАТИЧЕСКОЙ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ

1.1. Аналитический обзор публикаций по автоматическому анализу и сегментации речевых сигналов

1.2. Алгоритмы сегментации речевых сигналов

1.2.1. Спектральные алгоритмы сегментации

1.2.2. Алгоритмы сегментации речевых сигналов с использованием вейвлет-преобразования

1.2.3. Корреляционные алгоритмы сегментации

1.2.4. Алгоритмы сегментации на основе анализа временной структуры речевого сигнала

1.2.5. Алгоритмы сегментации речевых сигналов с использованием скрытых цепей Маркова

1.2.6. Алгоритмы сегментации речевых сигналов с использованием нейронных сетей

1.3. Варианты реализации алгоритмов оценки параметров речевых сигналов

1.3.1. Алгоритмы оценки параметров речевых сигналов 1.3.2. Варианты реализации алгоритмов VAD 23 1.3.3. Варианты реализации алгоритмов определения периода основного тона говорящего

1.4. Основные результаты раздела

2. РАЗРАБОТКА ИЕРАРХИЧЕСКОЙ МОДЕЛИ РЕЧИ ДЛЯ РЕАЛИЗАЦИИ МВС. АНАЛИЗ ТРЕБОВАНИЙ К АЛГОРИТМАМ

2.1. Задача сегментации речевого сигнала

2.2. Анализ моделей речевых сигналов как временных функций. Разработка классификации речевых сегментов

2.3. Многоуровневая сегментация речевых сигналов

2.4. Основные результаты раздела

3. РАЗРАБОТКА АЛГОРИТМОВ МНОГОУРОВНЕВОЙ ВРЕМЕННОЙ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ

3.1. Сегментация речевых сигналов верхнего уровня

3.1.1. Разработка УАП-алгоритма

3.1.2. Сегментация по типовым речевым элементам.

Корреляционный подход

3.1.3. Сегментация по типовым речевым элементам.

Спектральный подход

3.2. Сегментация речевых сигналов нижнего уровня ' '

3.2.1. Разработка структурных алгоритмов оценки периода ОТ

3.2.1.1. Структурные алгоритмы анализа вокализованных сегментов

3.2.1.2. Разработка структурного алгоритма оценки периода ОТ с использованием однознаковых кластеров

3.2.1.3. Разработка структурного алгоритма оценки периода ОТ с использованием кластеров монотонности'

3.2.2. Анализ и характеризация ОТ-кластеров РС

3.2.3. Анализ и характеризация кортежей ОТ-кластеров РС.

Обнаружение разладок

3.3. Основные результаты раздела

4. ОСОБЕННОСТИ РЕАЛИЗАЦИИ АЛГОРИТМОВ МНОГОУРОВНЕВОЙ ВРЕМЕННОЙ СЕГМЕНТАЦИИ

4.1. Точность сегментации речевых сигналов. Особенности алгоритмов МВС

4.2. Методы повышения точности работы алгоритма УАЕ)

4.3. Уточнение алгоритма анализа корреляционной структуры периода ОТ -105 АЛ. Повышение точности работы корреляционного алгоритма оценки периода ОТ

4.5. Использование структурных методов анализа ОТ-кластеров вокализованных сегментов для обнаружения разладок и оценки трендов параметров последовательности ОТ-кластеров

4.6. Основные результаты раздела

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Разработка и исследование алгоритмов многоуровневой временной сегментации речевых сигналов»

Актуальность проблемы. Современный этап научно-технического прогресса невозможно представить без использования речевых технологий. «Палитра» речевых устройств и программ предоставляет самые разнообразные функциональные возможности пользователю: от управления персональным компьютером до включения зажигания двигателя автомобиля. Несмотря на то, что сфера применения алгоритмов обработки речи постоянно расширяется, в настоящее время можно выделить основные направления развития и внедрения разработок:

1) сжатие (компрессия) речи - уменьшение избыточности в речевом сигнале. Основной областью применения подобных алгоритмов являются различные системы связи, в основном с ограниченной полосой пропускания,

2) верификация и идентификация дикторов — определение характеристик голоса говорящего: в первом случае с целью подтверждения его личности, во втором для выделения его из заранее определенной группы людей'(например, работников отдела, лаборатории и др.),

3) распознавание речи - преобразование речевого акустического сигнала в слово, либо последовательность слов,

4) модификация> фонограмм: Данное направление обработки речевых сигналов (РС) включает в себя алгоритмы модификации основных характеристик РС (например, изменение тембра говорящего, спецэффекты, изменение темпа произнесения и др.), а также алгоритмы повышения разборчивости речи, такие как алгоритмы шумоочистки,

5) синтез речи - генерирование речи с помощью ЭВМ для воспроизведения ограниченного числа сообщений из базы (или словаря), а также для машинного чтения текста.

На сегодняшний день задачи анализа речи, обработки РС, синтеза новых алгоритмов составляют отдельное фундаментальное научно-исследовательское направление, находящееся на стыке самых разнообразных научных дисциплин таб ких, как лингвистика, психоакустика, статистический анализ, цифровая обработка сигналов, теория распознавания образов и др.

Важно отметить, что на всем протяжении истории развития алгоритмов обработки речевых сигналов проводились исследования с целью выделить вРС интервалы в соответствии с лингвистическими единицами (фонема, слог, морфема, слово и др.), т.е. сегментировать речь. Успешная реализация данной задачи позволила бы разработать новые приложения и модернизировать существующие, взаимодействие которых с человеком не отличалось бы от естественного. Важно отметить, что программирование машины в соответствии с правилами любого языка является задачей гораздо менее сложной, чем определение из РС этого «алфавита» языка. Однако данный подход в силу сложности природы РС на сегодня-является недостаточно конструктивным и не позволяет реализовать в полной мере сегментацию РС с требуемым качеством для практических приложений. Современные методы сегментации опираются на теорию кластерного анализа. Они используют такие таксоны как речевые сегменты, аллофоны, дифоны, трифоны.и др. Однако в этом случае возникает не менее сложная проблема соотношения- сегментных единиц из РС с фонетическими единицами, а также их интерпретации, с помощь ЭВМ.

Многоуровневая временная сегментация (МВС) является технологией разделения фонограммы на акустически однородные участки1 со «сходными» временными и спектральными характеристиками и их параметризацией. Данная технология-относиться к группе алгоритмов предварительной обработки фонограмм. Использование МВС позволяет определить основные текущие характеристики речи, сформировать вектор параметров речевого сигнала, осуществить классификацию речевых сегментов. Выбор таксономии сегментов является задачей напрямую связанной с конкретной областью применения и может состоять из разного количества иерархически связанных уровней. МВС включает в себя комплекс алгоритмов обработки РС, которые являясь общими для большинства областей применения, позволяют путем "технологических" методов произвести оценку ос

1 «квазистационарные» сегменты речевого сигнала (прим. автора) новных параметров речевого сигнала. Дальнейшее использование вектора параметров зависит от конкретной области применения обработки речи:и осуществляется функциональными алгоритмами. Такой подход, где для каждого сегментированного участка в соответствии с его классификационным признаком (вектором параметров), имеется свой частный алгоритм обработки из библиотеки; является главным достоинством использования МВС, повышающим на качественном уровне работу речевого приложения (частного функционального алгоритма). ,

Цель диссертационной работы является разработка и исследование алгоритмов многоуровневой временной сегментацииречевых сигналов. .

Основные задачи: Для. достижения цели, необходимо в ходе выполнения: теоретических и экспериментальных исследований решить следующие задачи:

1) Провести анализ существующих алгоритмов сегментации речевых сигналов, а-также частных «базовых» алгоритмов, входящих в структуру МВС.

2); Исследовать структурные особенности и характеристики речевых сегментов.

3) Разработать иерархическую классификацию; типовых структурных; элементов* РС.

4); Разработать комплексную структуру временной автоматической сегментации? РС. •

5) > Разработать; алгоритмы многоуровневой временной сегментации речевых сигналов:

• алгоритм обнаружения голосовой активности,

• алгоритмы анализа структуры речевого сигнала с; использованием* корреляционного и спектрального подходов;

• алгоритмы оценки периода' основного тона.

Методы исследования. При выполнении диссертационных исследований и разработок использовались: методы системного анализа, математической статистики^, обработки временных рядов, кластерного анализа; теории-распознавания! образов;

Основные положения, выносимые на защиту: 1) Структура многоуровневой временной сегментации речевых сигналов, использующая обобщенную иерархическую модель речевого сигнала.

2) Алгоритм определения голосовой активности для сегментации речи на участки пауз и речевой активности.

3) Корреляционный алгоритм сегментации речевого сигнала по типовым временным сегментам.

4) Алгоритмы оценки периода основного тона речи, использующие структурные методы анализа речевых сигналов.

Научная значимость. В процессе выполнения исследований были получены следующие научные результаты:

1) Предложена обобщенная иерархическая модель речевого сигнала,

2)-Разработан системный подход к реализации многоуровневой автоматической временной сегментации речи.

3) Разработан алгоритм определения участка голосовой активности (УАО-алгоритм) в речевом сигнале, позволяющий сегментировать сигнал на участки активности и пауз.

4) Разработаны алгоритмы анализа структуры речевого сигнала с использованием^ корреляционного подхода для задачи многоуровневой временной сегментации.

5) Разработаны алгоритмы определения! периода основного ¡тона с использованием структурных методов анализа речевых сигналов, для синхронной с периодом основного тона разметки вокализованных сегментов.

Практическая значимость. Разработанная иерархическая модель РС и «базовые» алгоритмы сегментации речевого сигнала на основе исследовательского программного обеспечения позволяют:

1) Разрабатывать прикладное программное обеспечение для детального анализа и автоматической сегментации РС.

2) Разрабатывать алгоритмы сегментации речи с использованием фонетических кластеров: фонем, аллофонов, дифонов и др.

3) Формировать параметрическое описание временных сегментов РС для дальнейшего использования в алгоритмах обработки речи широкого круга задач (связь, 1Р-телефония, системы распознавания и др.).

4) Разрабатывать новые методы обработки речи, учитывающие особенности внутренней структуры РС.

Внедрение результатов. Основные результаты работы использованы в разработках ЗАО «НПП «Иста-Системс», а также в учебном процессе кафедры бортовой радиоэлектронной аппаратуры Санкт-Петербургского государственного университета аэрокосмического приборостроения. Внедрение результатов работы подтверждено соответствующими актами.

Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на следующих научных конференциях:

1) научные сессии ГУАП (г. Санкт-Петербург, 2005, 2006, 2007, 2008, 2009);

2) международные научные конференции на базе Таганрогского государственного радиотехнического университета («ЦМТ-2005», «ИТ-2006», «ИСС-2008», «СМИ-2009»);

3) XII Международная научно-техническая конференция студентов и аспирантов МЭИ (г. Москва, 2006);

4) школе-конференции «Мобильные системы передачи' данных» Московского Института Электронной Техники (г. Зеленоград, 2006);

5) межвузовские научно-технической конференции «Военная радиоэлектроника: опыт использования и проблемы, подготовка специалистов», ВМИРЭ, (Санкт-Петербург, 2008, 2009);

6) • конференции "Проблемы современных инфотелекоммуникаций" Санкт-Петербургского государственного университета телекоммуникаций имени проф. М.А. Бонч-Бруевича (г.Санкт-Петербург, 2008).

Публикации. По теме диссертации опубликовано 21 печатная работа, в том числе одна - в издании, рекомендованном ВАК РФ.

Объем и структура диссертации. Диссертационная работа состоит из введения, четырех разделов, заключения, списка использованных источников, включающего 90 наименований, и трех приложений. Общий объем работы составляет 164 страницы, включая 127 страниц основного текста, 75 рисунков и три приложения. Структура

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Зилинберг, Андрей Юрьевич

4.6. Основные результаты раздела

В данном разделе диссертационной работы проанализированы особенности алгоритмов, входящих МВС, которые необходимо учитывать при реализации многоуровневой сегментации:

• рассмотрен вопрос усовершенствования (модернизации) алгоритма УАБ, с целью повышения точности его работы,

• детально описывается природа происхождения ошибки, возникающей при формировании последовательности выборочных корреляционных функций, а также указываются способы ее уменьшения,

• уточняется алгоритм обработки при использовании корреляционного алгоритма оценки периода ОТ с применением нелинейного преобразования,

• показана возможность использования «разностных» метрик типа «манхэттен-ской» для детального анализа внутренней структуры РС необходимой при сегментации по типовым речевым сегментам.

ЗАКЛЮЧЕНИЕ

В рамках диссертационной работы были проанализированы существующие принципы и методы сегментации речевых сигналов, детально разработана структура иерархической сегментации речевых сигналов, описано построения прото-типного программного комплекса, реализующего комплексный метод сегментации, проведено моделирование частных алгоритмов МВС в среде МаЛаЬ.

Разработанные принципы сегментации обладают следующими отличительными качествами:

• непротиворечивостью с фонетической системой звуков русской речи,

• полнотой описания речевых сигналов,

• относительной простотой реализации алгоритмов,

• малой ресурсоемкостью алгоритмов при практической реализации на ЭВМ,

• возможностью работы при наличии стационарных фоновых шумов (при ряде ограничений),

• возможностью внедрения в существующие и разрабатываемые новые речевые приложения,

Необходимо отметить, что в рамки данной диссертационной работы не входила разработка функциональных алгоритмов, однако результаты разработки алгоритмов МВС использовались при создании перспективного функционального алгоритма модификации темпа произнесения [90], который более подробно описан в Приложении С.

На сегодняшний день, разработанный комплексный подход к сегментации речевых сигналов с использованием МВС, является наиболее гибким и удобным при обработке РС, обладает существенным преимуществом перед имеющимися, т.к. позволяет использовать разработанные алгоритмы даже в тех речевых приложения, где знание фонетического состава РС не всегда является обязательным (сжатие, модификация характеристик и др.).

Список литературы диссертационного исследования кандидат технических наук Зилинберг, Андрей Юрьевич, 2010 год

1. Фант Г. Акустическая теория речеобразования: пер. с англ. / Г. Фант; под ред. B.C. Григорьева. М.: Наука,1964. - 284 с.

2. Фланаган JL Анализ, синтез и восприятие речи: пер. с англ. / JL Фланаган; под ред. А. А. Пирогова. М.: Связь, 1968. - 397 с.

3. Грей А. Линейное предсказание речи: пер с англ. / А. Грей, Д. Маркел; под ред. Ю.Н. Прохорова, B.C. Звездина. М.: Связь, 1980. -308 с.

4. Сапожков М.А. Вокодерная связь / М.А. Сапожков, В.Г. Михайлов. М: Радио и связь, 1983. - 248 с.

5. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов / Т.К. Винцюк. Киев: Наук, думка, 1987.:-264 с.

6. Распознавание слуховых образов / под ред. Н. Г. Загоруйко, Н. Г. Волошина. -Новосибирск: Наука, 1966. 338 с.

7. Косарев Ю.А. Естественная форма диалога с ЭВМ / Ю.А. Косарев. JL: Машиностроение. 1989. - 143 с.

8. Потапова Р.К. Речевое управление роботом / Р.К. Потапова. М.: Радио и связь, 1989.-248 с.

9. Златоустова Л.В. Измерение параметров речи / Л.В. Златоустова, В.Г. Михайлов; под. ред. М.А. Сапожкова. -М.: Радио и связь, 1987. 168 с.

10. Златоустова JI.B. Общая и прикладная фонетика / Л.В. Златоустова, Р.К. Потапова, В.Н. Трунин-Донской. М.: МГУ, 1986. - 304 с.

11. Назаров В.М. Методы цифровой обработки и передачи речевых сигналов / В.М. Назаров, Ю.Н. Прохоров. М.: Радио и связь, 1985. - 176 с.

12. Сорокин В.Н. Теория речеобразования / В.Н. Сорокин. М.: Радио и связь, 1985.-312 с.

13. Лукьянцев Н.Ф. Цифровая обработка и передача речи / Н.Ф. Лукьянцев, О.И. Шелухин. М.:Радио и связь, 2000. - 454 с.

14. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу / Г.С. Рамишвили. М.: Радио и связь, 1981.-224 с.

15. Гудонавичус Р.В. Распознавание речевых сигналов по их структурным свойствам Текст. / Р.В. Гудонавичус, П.П. Кемешис, А.Б. Читавичус. Л.: Энергия, 1977. - 64 с.

16. Бондарко Л.В. Звуковой строй современного русского языка / Л.В. Бондар-ко. -М.: Просвещение, 1977. 175 с.

17. Розенберг А. Автоматическая верификация диктора: Обзор / А. Розенберг // ТИИЭР. М.: Мир, 1976. - Т. 64. - № 4. - С. 66-79.

18. Айвазян: €. А;-Прикладная статистика / С.А. Айвазян,.В;М! Бухштабер, И .С. Енюков, Л.Д. Мешалкин. Классификация и снижение размерности. М.: Финансы и статистика, 1989.-607 е.:

19. Зилинберг А.Ю; Технологические алгоритмы обработки фонограмм / А.Ю. Зилинберг, Ю.А. Корнеев // Пятьдесят ' восьмая, студенческая научно-техническая конференция ГУАП: тезисы докладов — СПб: ГУАП, 2005. -С. 55-59.

20. Михайлов ВЛ7. Из истории исследований преобразования речи / В.Г. Михайлов // Речевые технологии. Истра-2: Народное образование, 2008. - №1. — С.93-113.

21. Сорокин В.Н. Сегментация и распознавание гласных / В;Н. Сорокин, А.И. Цыплихин // Информационные процессы. 2004. - Т.4. - № 2. - С. 202-220.

22. Сорокин В.Н. Сегментация речи на кардинальные элементы / В.Н. Сорокин, А.И. Цыплихин//Информационные процессы. 2006. — Т.6. - №3: - С. 177207.

23. Воробьев В.И; Теория и практика.вейвлет-преобразования / В.И. Воробьев, В;Г. Ррибунин СПб- ВУС, 19991 - 204 с.

24. Дремин И.М. Вейвлетыи их использование / И.М. Дремин, О.В; Иванов, В.А. Нечитайло // Успехи физических наук. 2001. - Т.171. - №5. - С. 465-501.

25. Antciperov W.E. A new approach to the problem of word segmentation / W.E. Antciperov, W.A. Morozov, S.A. Nikitov // Proceedings of the 9th International Conference "Speech and Computer" SPECOM'04. St. Petersburg, 2004. - P. 686689.

26. Шевченко А.И. Проблемы сегментации речевого сообщения при построении систем автоматического распознавания речи. Труды Международного семинара Диалог'2000 по компьютерной лингвистике и ее приложениям / Под ред.

27. A.С. Нариньяни Протвино, 2000. — Т.2: Прикладные проблемы. — С. 370-373.

28. Petrushin V.A. Adaptive algorithms for pitch-synchronous speech signal segmentation / V.A. Petrushin // Proceedings of the 9th International Conference "Speech and Computer" SPECOM ' 04. St. Petersburg, 2004. - P. 146-153.

29. Vintsiuk Т.К. Speech Analysis and Recognition Synchronised by One-Quasiperiodical Segmentation / Т.К. Vintsiuk, M.M. Sazhok // Proceedings of the Second International Workshop on Text, Speech, Dialogue TSD'99. Brno, 1999. -P.175-180.

30. Yegnanarayana В. Extraction of vocal-tract system characteristics from speechsignals / B. Yegnanarayana, R.N.J. Veldhuis // Speech and Audio Processing (IEEE). New York, 1998 - Vol. 6, Issue 4. -P.313-327.

31. Рабинер JI.P. Скрытые марковские модели и их применение в избранных приложениях при распознавание речи: обзор / JI.P. Рабинер // ТИИЭР. -1989.-Т. 77.-№2.-С. 86-120.

32. Моттль В.В. Скрытые марковские модели в структурном анализе сигналов /

33. B.В. Моттль, И.Б. Мучник. М.:ФИЗМАТЛИТ, 1999. - 352 с.

34. Чесебиев И.А. Компьютерное распознавание и порождение речи / И.А. Чесе-биев. М.: Спорт и Культура- 2000, 2008. - 128 с.

35. Sjolander К. An HMM-based system for automatic segmentation and alignment of speech / K. Sjolander // In Proceedings of Fonetik 2003. Umea University, 2003.-P. 93-96.

36. Narayanan S. Refined Speech Segmentation for Concatenative Speech Synthesis / S. Narayanan, A. Sethy // Proceedings of ICSLP. Denver (USA), 2002.1. P. 149-152.

37. Galunov G.V. Automatic speech signal segmentation using neural networks / G.V. Galunov, A.F. Kononov, B.A. Smirnov // International workshop SPECOM'2000. -St. Petersburg, 2000.

38. Lee Y. Phoneme segmentation of continuous speech using multi-layer perceptron / Y. Lee, Y. Suh // Proceedings of 4th Int. Conf. Spoken Language (ICSLP-96). -Philadelphia, 1996.-P. 1297-1300.

39. Chang L. Syllable Detection and Segmentation Using Temporal Flow Neural Networks. International Congress of Phonetic Sciences / L. Shastri, L. Chang, S. Greenberg. San Francisco, 1999.-P. 1721-1724.

40. Анголов C.B. Технологические и функциональные алгоритмы фонограмм / С.В. Анголов, А.Ю. Зилинберг, Ю.А. Корнеев, Труды международной научной конференции "Цифровые методы и технологии" (ЦМТ-2005). Таганрог: ТРТУ, 2005. - 4.2. - С. 33-43.

41. Зилинберг А.Ю. Алгоритмы обнаружения речевой активности: временной и спектральный подходы/ А.Ю. Зилинберг, Ю.А. Корнеев // Пятьдесят восьмая студенческая научно-техническая конференция ГУАП: тезисы докладов. -СПб: ГУАП, 2005. С. 59-63.

42. Ravichandran Т. Performance Evaluation and Comparison of Voice Activity Detection Algorithms / T. Ravichandran, K.D. Samy. International Journal of Soft Computing. - 2007. - vol.2. - P. 257-261.

43. Vijayachandran V.M. A Novel Algorithm for Voice Activity Dectection / V.M.

44. Vijayachandran, K.B. Shobha Devi // WSES/IEEE International Multiconference: Speech, Signal and Image Processing. Malta, 2001.

45. Громаков Ю.А. Стандарты и системы подвижной радиосвязи / Ю.А. Грома-ков. М.: Эко-Трендз, 1998. - 240 с.

46. Davis A. Multi-decision sub-band voice actitvity detection for speech enhancement / A. Davis, S. Nordholm, S.Y. Low, R. Togneri // Proceedings of 11th International Workshop on Acoustic Echo and Noise Control (IWAENC2008). Washington, 2008. ,

47. Ramirez J. Efficient voice activity detection algorithms using long-term speech information/ Javier Ramirez et al. // Speech Communication. 2004. - Vol.42. -P. 271-287.

48. Ekstein K. Pavelka T. Entropy And Entropy-based Features In Signal Processing / K. Ekstein, T. Pavelka // 5th International PhD Workshop on Systems and Control a Young Generation Viewpoint. BalatonfTired (Hungary), 2004.

49. Ouzounov A. Robust Features for Speech Detection A Comparative Study / A. Ouzounov // International Conference on Computer Systems and Technologies (CompSysTech). - Varna, 2005. - P.3A.19-1 - 3A.19-6.

50. Калинцев Ю.К. Разборчивость речи в цифровых вокодера / Ю.К. Калинцев. -М.: Радио и связь, 1991. 220 с.

51. Архипов И.О. Оценка точности выделения основного тона методом GS / И.О. Архипов, В.Б. Гитлин // Современные речевые технологии. Сборник трудов IX сессии Российского акустического общества. -М.: ГЕОС, 1999. С. 38-42.

52. A.B. Аграновский, Теоретические аспекты алгоритмов обработки и классификации речевых сигналов / A.B. Аграновский, Д.А. Леднов. — М.: Радио и связь, 2004. 164 с.

53. Норейка С.Ю. Исследование методов и разработка аппаратуры анализа траекторий основного тона речи: автореф. дис. . канд. тех. наук / С.Ю. Норейка. -Каунас: КПИ, 1983. 22 с.

54. Лунг В.Н. Разработка и исследование способов повышения эффективности передачи и выделения основных параметров речевых сигналов: автореф. дис. . канд. тех. наук / Нгуен Ван Лунг. М.: МЭИС, 1980. - 18 с.

55. Аграновский A.B. Сегментация речи (математическая модель) / A.B. Аграновский, Д.А. Леднов, Б.А. Телеснин // Информационные технологии. -1998.-№9.-С. 24-28.

56. Методы автоматического распознавания речи: в 2-х книгах: пер. с англ. / под ред. У. Ли. М.: Мир, 1983. - Кн. 1. - 328 с.

57. Цыплихин А.И. Анализ и автоматическая сегментация речевого сигнала: дис. . канд. тех. наук / А.И. Цыплихин. -М., 2006. 149 с.

58. Классификация и кластер: пер. с англ. / под ред. Дж. Вэн Райзин- М.: Мир, 1980.- 389 с.

59. Потапова Р.К. Речь: коммуникация, информация, кибернетика / Р.К. Потапова. М.: УРСС, 2003. - 568 с.

60. Зилинберг А.Ю. Варианты реализации иерархической сегментации речевых сигналов // Научная сессия ГУАП: сборник докладов: в 3 ч. СПб: ГУАП, 2008. - 4.2: Технические науки. - С. 15-19.

61. Зилинберг А.Ю. Обработка изображений коррелограммы в алгоритмах иерархической сегментации речевых сигналов / А.Ю: Зилинберг, Ю.А. Корнеев// Научная сессия ГУ AFI: сборник докладов: в 3 ч. — СПб: ГУАП, 2008. -4.2: Технические науки. С. 19- 22.

62. Харкевич A.A. Спектры и анализ / А. А. Харкевич. М.: ЛКИ, 2007. -240 с.

63. Ватте Д; Спектральный анализ и его приложения: Пер. с англ. / Д. Ватте, Г. Дженкинс.- М.: Мир, 1972.-т. 1-318 с.

64. Бендат Д. Прикладной анализ случайных данных / Д: Бендат, А. Пирсол. -М.: Мир, 1989.-260 с.

65. Бокс Дж. Анализ временных рядов: Прогноз; и управление / Дж. Бокс, Е. Дженкинс. М;: Мир, 1974. - вып. 1. -406 с.

66. Зилинберг А.Ю; Разметка фонограммы на периоды основного^тона.методами структурного анализа речевого сигнала / А.Ю; Зилинберг, Ю;А. Корнеев, К.К.I

67. Томчук // Сборник докладов 20-й межвузовской научно-технической конференции «Военная радиоэлектроника: опыт использования и проблемы, подготовка специалистов». СПб: ВМИРЭ, 2009:

68. Зилинберг А.Ю; Разработка структурных методов сегментации речевого сигнала на периоды основного тона / А.Ю; Зилинберг, Ю.А. Корнеев // «Научно-технические ведомости СПбГПУ». СПб: СПбГПУ, 2009. - № 2. -С. 75-79.

69. Дэйвисон М.Л. Многомерное шкалирование: Методы наглядного представvления; данных пер. с англ. /. М.Л. Дэйвисон. М.: Финансы и статистика, 1988.- 256 с.

70. Ануфриев И. Самоучитель MatLab 5.3/б.х / И. Ануфриев. СПб.:БХВ-Петербург, 2002. - 736 с.

71. Потемкин В.Г. MATLAB 6: Среда проектирования инженерных приложений / В.Г. Потемкин. М: Диалог-МИФИ, 2000. - 448 с.

72. Дьяконов В.П. МаИаЬ 6.5 ЭР 1/7 + ЗтшНпк 5/6. Обработка сигналов и проектирование фильтров / В.П. Дьяконов. М.: СОЛОН-Пресс, 2005. - 576 с.

73. Рабинер Л. Теория и применение цифровой обработки сигналов / Л. Рабинер, Б. Голд. -М.: Мир, 1978. 848 с.

74. Зилинберг А.Ю. Анализ трендов и разладок структуры ОТ-кластеров вокализованных сегментов речи / А.Ю. Зилинберг, Ю.А. Корнеев, К.К. Томчук // Сборник докладов Научной сессии ГУАП, посвященной Всемирному дню космонавтики. СПб: ГУАП, 2010.

75. Обнаружение изменений свойств сигналов и динамических систем: пер. с англ. / под. ред. М.Бассвиль, А.Банвениста. М.: Мир, 1989. - 278с.

76. Фу К. Структурные методы в распознавании образов: пер с англ. / К. Фу -М.: Мир, 1977.-320 с.

77. Виленкин С.Я. Статистическая обработка результатов исследования случайных функций / С.Я. Виленкин. М.: Энергия, 1979. - 320 с.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.