Оценка параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа тема диссертации и автореферата по ВАК РФ 05.13.18, кандидат технических наук Киселев, Алексей Николаевич

  • Киселев, Алексей Николаевич
  • кандидат технических науккандидат технических наук
  • 2005, Тула
  • Специальность ВАК РФ05.13.18
  • Количество страниц 192
Киселев, Алексей Николаевич. Оценка параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа: дис. кандидат технических наук: 05.13.18 - Математическое моделирование, численные методы и комплексы программ. Тула. 2005. 192 с.

Оглавление диссертации кандидат технических наук Киселев, Алексей Николаевич

ВВЕДЕНИЕ.

1. Анализ технических средств и методов преобразования, обработки и распознавания речевых сигналов.

1.1. Структура систем регистрации, накопления и обработки речевых сигналов.

1.2. Классификация систем распознавания речи.

1.3. Особенности речевых сигналов. Основные характеристики, используемые в системах распознавания речи.

1.4. Методы обработки речевых сигналов в задачах распознавания речи

1.5. Выводы.

2. Определение основных параметров частотно-временного анализа.

2.1. Введение.

2.2. Модель источника речевых сигналов.

2.3. Моделирование смены состояний речи марковским процессом с дискретным временем.

2.4. Определение оптимального размера окна преобразования для марковского процесса с дискретным временем.

2.5. Определение оптимального шага смещения окна преобразования для марковского процесса с дискретным временем.

2.6. Зависимость вероятности правильного распознавания состояния от шага смещения окна преобразования по времени.

2.7. Моделирование смены состояний источника речи марковским процессом с непрерывным временем.

2.8. Определение оптимального шага смещения окна преобразования для марковского процесса с непрерывным временем.

2.9. Выводы.

3. Адаптивный частотно-временной анализ сигналов в задачах дикторонезависимого распознавания речи.

3.1. Введение.

3.2. Связь между структурой, моделью и процессом распознавания речи

3.3. Определение параметров модели.

3.4. Предсказание состояний. Способ коррекции вектора вероятностей состояний системы.

3.5. Метод адаптивного частотно-временного анализа в задачах дикторонезависимого распознавания речи.

3.6. Особенности формантного анализа на основе непрерывного вейвлет-преобразования.

3.7. Выводы.

4. Экспериментальное исследование модели источника речевых сигналов и метода адаптивного частотно-временного анализа.

4.1. Задачи и условия проведения экспериментов.

4.2. Особенности вычисления непрерывного вейвлет-преобразования. Ускорение вычислений.

4.3. Выбор шкалы частот вейвлет-преобразования для формирования полных частотно-временных картин речевых сигналов.

4.4. Визуализация результатов вейвлет-преобразования.

4.5. Алгоритм нахождения частоты основного тона и определения вокализованности/невокализованности участка речевого сигнала на основе непрерывного вейвлет-преобразования.

4.6. Сегментирование речевого сигнала.

4.7. Периодичность гласных фонем.

4.8. Дикторонезависимые признаки гласных фонем. Алгоритм формантного анализа на основе непрерывного вейвлет-преобразования.

4.9. Дикторонезависимые признаки фрикативных фонем.

4.10. Дикторонезависимые признаки глухих взрывных фонем.

4.11. Экспериментальное исследование точности оценки параметров дикторонезависимых признаков методом адаптивного частотно-временного анализа.

4.12. Экспериментальное исследование адекватности разработанной модели источника речи и вычислительных затрат метода адаптивного частотно-временного анализа.

4.13. Выводы.

Рекомендованный список диссертаций по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Введение диссертации (часть автореферата) на тему «Оценка параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа»

Актуальность темы. Средства ввода информации (СВИ) занимают одно из главных мест в организации интерактивного взаимодействия пользователя и персонального компьютера [13]. Естественным способом передачи текста и команд для человека является речь. Следовательно, наиболее перспективным подходом к вводу подобной информации в ПК являются системы распознавания речи (СРР). Однако уровень развития СВИ в настоящее время таков, что наиболее часто используемыми средствами ввода текста и команд в ПК являются клавиатура и мышь [14, 15]. Разработанные на сегодняшний день СРР имеют развитые возможности, высокую точность и сравнительно низкие вычислительные затраты, но требуют выполнения сложной и длительной процедуры обучения на конкретного диктора, что обусловливает невозможность их работы с неограниченным количеством постоянно сменяющихся пользователей (например, в справочной системе в метро или в библиотеке) и препятствует широкому распространению [10, 16].

Перечисленные выше обстоятельства обусловили выбор объекта исследования диссертации, которым является система регистрации, накопления и обработки речевых сигналов, представляющая собой аппаратно-программный комплекс распознавания речи.

Тот факт, что люди, говорящие на одном языке, понимают друг друга независимо от тембра голоса, темпа речи, и других зависящих от диктора характеристик речевого сигнала позволяет предположить существование, дикторонезависимых признаков речевых конструкций различного уровня 4 характерных для языка в целом [1, 2, 3, 4, 5, 9, 10, 12].

Однако, вместо нахождения подобных признаков, распознавание речевых конструкций в существующих СРР, в конечном итоге, сводится к определению меры схожести речевого сигнала с элементами множества эталонов, полученного в результате обучения системы [10, 16, 17, 18].

Этому есть несколько причин:

- методы статистического моделирования источника речевых сигналов (такие как искусственные нейронные сети и скрытые марковские модели) применяются к порциям данных поступающих напрямую от этапа частотно-временного анализа, и не проходят обработки с целью выделения дикторонезависимых признаков речевых конструкций [10, 16, 17, 18, 19];

- применяемые в существующих системах распознавания речи методы частотно-временного преобразования не предоставляют возможности анализа на произвольно выбираемых частотах и смещениях по времени (метод БПФ), либо основаны на модели автокорреляции (метод линейного предсказания), результаты которого для речевых сигналов одной фонемы, произнесенной различными дикторами, имеют мало общих черт [10, 16, 20, 21,22,23];

- отсутствуют методы частотно-временного анализа и распознавания речевых сигналов, использующие дикторонезависимые признаки речевых конструкций [10,16].

Одним из альтернативных методов частотно-временного анализа является непрерывное вейвлет-преобразование [1, 2, 3, 4, 10, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35], позволяющее проводить анализ на произвольно выбираемых частотах с корректировкой размера окна преобразования под каждую частоту. Данный метод, однако, не нашел применения в задачах распознавания речи вследствие высоких вычислительных затрат [1, 2]. Сокращения последних можно добиться уменьшением количества анализируемых частот и смещений преобразования по времени до достаточного для нахождения дикторонезависимых признаков речевых конструкций уровня [4]. Выбор параметров преобразования при этом должен быть основан на применении модели источника речи, состоящей из стохастической части процесса смены состояний объекта и детерминированной части дикторонезависимых признаков речевых конструкций.

Указанные обстоятельства обусловили выбор предмета исследований диссертации, который может быть охарактеризован как модель источника речевых сигналов и методы, применяемые на этапах частотно-временного анализа, предсказания и выделения дикторонезависимых признаков речевых конструкций в системах дикторонезависимого распознавания речи.

Целью диссертационной работы является решение задачи синтеза систем обработки и распознавания речевых сигналов в части моделирования источника речевых сигналов, частотно-временного анализа и оценки параметров дикторонезависимых признаков фонем.

В соответствии с поставленной целью, автором решены следующие задачи:

Разработана модель источника речевых сигналов, включающая стохастическую часть процесса смены состояний и детерминированную часть дикторонезависимых признаков фонем;

Разработан метод адаптивного частотно-временного анализа речевых сигналов, основанный на динамическом изменении параметров преобразования по модели источника речевых сигналов;

Предложены критерии оптимальности и найдены оптимальные оценки ширины и шага смещения окна преобразования по времени;

Разработана процедура оценки частоты основного тона и формантного анализа вокализованных фонем и параметров невокализованных фонем на основе непрерывного вейвлет-преобразования;

Разработано алгоритмическое обеспечение адаптивного частотно-временного анализа речевых сигналов, на основе которого создана библиотека классов;

На основе экспериментальных исследований речевых сигналов множества дикторов определены дикторонезависимые признаки гласных, фрикативных и взрывных фонем;

Проведены экспериментальные исследования, подтверждающие адекватность разработанной модели источника речевых сигналов, эффективность предложенного метода адаптивного частотно-временного анализа для оценки параметров дикторонезависимых признаков фонем.

Методы исследования. В работе используются методы частотно-временного анализа [24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35], теории вероятностей [36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46], теории распознавания образов [16, 17, 18, 19, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56], функционального анализа [57]. Разработка алгоритмов и программ осуществлялась на основе объектно-ориентированного подхода к организации данных и алгоритмов. Для визуализации результатов непрерывного вейвлет-преобразования применяются методы трехмерной компьютерной графики [58, 59, 60, 61, 62, 63, 64, 65, 66].

Научная новизна работы заключается в следующем.

1. Разработана модель источника речевых сигналов, включающая стохастическую часть процесса смены состояний и детерминированную часть дикторонезависимых признаков речевых конструкций.

2. Разработан метод адаптивного частотно-временного анализа речевых сигналов, основанный на динамическом изменении параметров преобразования по модели источника речевых сигналов.

3. Предложены критерии оптимальности и найдены оптимальные оценки ширины и шага смещения окна преобразования по времени.

4. Разработана процедура оценки частоты основного тона и формантного анализа вокализованных фонем, и оценки параметров невокализованных фонем на основе непрерывного вейвлет-преобразования.

Практическая ценность работы заключается в следующем.

1. Разработано алгоритмическое обеспечение адаптивного частотно-временного анализа речевых сигналов, на основе которого создана библиотека классов.

2. Разработан алгоритм быстрого вычисления непрерывного вейвлет-преобразования.

3. Найдены дикторонезависимые признаки гласных, фрикативных и взрывных фонем.

Реализация результатов диссертационной работы. Прикладные результаты работы внедрены в рамках инициативной исследовательской работы по теме «Метод адаптивного частотно-временного анализа в задачах дикторонезависимого распознавания речи» в ООО «ТЕХНОПУЛЬТ», при этом получен фактический экономический эффект равный 40 тыс. руб. в ценах 2005 г.

Апробация работы. Основные положения диссертационной работы докладывались на следующих конференциях и семинарах. 1. Всероссийская научно-техническая конференция «Интеллект 2003» (г. Тула, ТулГУ).

2. Всероссийская научно-техническая конференция студентов, молодых ученых и специалистов, посвященная 5-летию Рязанской государственной радиотехнической академии «Новые информационные технологии в научных исследованиях и образовании» (г. Рязань, РГРТА 2002 г.),

3. Научно-практические конференции профессорско-преподавательского состава ТулГУ (г. Тула, 2000-2005 г.г.), 4. Региональная научно-техническая конференция «Техника XXI века глазами молодых учёных и специалистов» г. Тула, 2003 г.). 5. Заочная электронная конференция «Современные & телекоммуникационные и информационные технологии» на базе Российской

Академии Естествознания (http://vmw.rae.ru, апрель 2005 г.).

Публикации. По результатам исследований опубликовано 11 печатных работ (8 статей, 3 тезисов докладов).

Характеристика работы. Диссертационная работа состоит из введения, четырех глав и заключения, изложенных на 142 страницах машинописного текста, содержит 39 рисунков, 10 таблиц, списка использованной литературы из 82 наименований и 5 приложений.

Похожие диссертационные работы по специальности «Математическое моделирование, численные методы и комплексы программ», 05.13.18 шифр ВАК

Заключение диссертации по теме «Математическое моделирование, численные методы и комплексы программ», Киселев, Алексей Николаевич

4.13. Выводы

1. Рассмотрены особенности вычисления непрерывного вейвлет-преобразования дискретного сигнала. Разработан быстрый алгоритм вычисления непрерывного вейвлет-преобразования позволяющий сократить вычислительные затраты по сравнению с методом прямого вычисления описанным в литературе [25, 26, 27] в 60 раз.

2. Предложена шкала частот, учитывающая экспоненциальное распределение информации по частотам в речевых сигналах.

3. Предложены способы визуализации результатов полного непрерывного вейвлет-преобразования в виде двухмерных растровых изображений и трехмерных поверхностей.

4. Предложен алгоритм выделения частоты основного тона и определения вокализованности/невокализованности участка речевого сигнала, основанный на непрерывном вейвлет-преобразовании.

5. Рассмотрены вопросы сегментирования речевого сигнала. Обнаружена зависимость периодичности вейвлет-образов вокализованных фонем от частоты основного тона, которая позволяет упростить процедуру сегментирования речевого сигнала и распознавания вокализованных фонем.

6. Предложен алгоритм формантного анализа на основе вейвлет-преобразования.

7. По результатам многочисленных экспериментов найдены дикторонезависимые признаки для различных групп фонем согласно приведенной классификации по акустическим свойствам.

8. Экспериментально исследована точность оценки параметров дикторонезависимых признаков методом адаптивного частотно-временного анализа.

9. Экспериментально доказана адекватность разработанной модели источника речевых сигналов и эффективности оценки параметров дикторонезависимых признаков фонем методом адаптивного частотно-временного анализа.

10. По результатам многочисленных экспериментов проведенных над речевыми сигналами различных дикторов найдены дикторонезависимые признаки гласных,, фрикативных и взрывных фонем. Эксперименты с эталонными речевыми сигналами показали, что точность оценки параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа выше, чем точность оценки тех же параметров методом БПФ. Результаты экспериментов с речевыми сигналами названий цифр (от 0 до 9), произнесенных различными дикторами показывают, что: разработанная модель источника речевых сигналов адекватна и экономична, разработанный метод адаптивного частотно-временного анализа на основе модели источника речевых сигналов требует вычислительных затрат в среднем на 6,7% меньше по сравнению с методом быстрого преобразования Фурье (БПФ), нашедшим широкое применение в существующих системах распознавания речи.

Заключение

В целом по работе можно сделать следующие выводы.

1. На основании анализа отечественной и зарубежной специальной литературы сформирована структурная схема систем регистрации, накопления и обработки речевых сигналов, представляющих собой аппаратно-программные комплексы распознавания речи. Произведена классификация подобных систем по возможностям их применения. Проведен анализ основных этапов их работы, и применяемых методов.

2. Разработана модель источника речевых сигналов, включающая стохастическую часть процесса смены состояний и детерминированную часть дикторонезависимых признаков речевых конструкций. Данная модель позволяет решить задачу синтеза системы дикторонезависимого распознавания речи за счет определения параметров стохастической части на этапе создания системы, и применения дикторонезависимых признаков речевых конструкций, найденных по статистической выборке речевых сигналов различных дикторов.

3. В рамках разработанной модели источника речевых сигналов предложены критерии оптимальности и найдены оптимальные оценки ширины и шага смещения окна преобразования по времени. В результате анализа полученных критериев сделан вывод, что действительно оптимальных результатов можно добиться при гибком изменении данных параметров в зависимости от анализируемого сигнала.

4. Определены изменения, которые необходимо внести в структуру систем обработки и распознавания речевых сигналов для решения задачи дикторонезависимого распознавания на основе адаптивного частотно-временного анализа речевых сигналов. Показано влияние модели на изменяемые и добавляемые блоки.

5. Предложены процедуры определения параметров стохастической и детерминированной частей модели.

6. Разработана процедура оценки частоты основного тона и формантного анализа вокализованных фонем и параметров невокализованных фонем на основе непрерывного вейвлет-преобразования.

7. Разработан алгоритм быстрого вычисления непрерывного вейвлет-преобразования позволяющий сократить вычислительные затраты по сравнению с методом прямого вычисления описанным в литературе в 60 раз.

8. Предложены методы визуализации результатов непрерывного вейвлет-преобразования в виде двухмерных растровых изображений и трехмерных поверхностей.

9. По результатам многочисленных экспериментов проведенных над речевыми сигналами различных дикторов найдены дикторонезависимые признаки гласных, фрикативных и взрывных фонем. Эксперименты с эталонными речевыми сигналами показали, что точность оценки параметров дикторонезависимых признаков фонем с применением адаптивного частотно-временного анализа выше, чем точность оценки тех же параметров методом БПФ. Результаты экспериментов с речевыми сигналами названий цифр (от 0 до 9), произнесенных различными дикторами показывают, что: разработанная модель источника речевых сигналов адекватна и экономична, разработанный метод адаптивного частотно-временного анализа на основе модели источника речевых сигналов требует вычислительных затрат в среднем на 6,7% меньше по сравнению с методом быстрого преобразования Фурье (БПФ), нашедшим широкое применение в существующих системах распознавания речи.

Список литературы диссертационного исследования кандидат технических наук Киселев, Алексей Николаевич, 2005 год

1. Котов В.В., Киселев А.Н. Ускорение вычисления непрерывного вейвлет-преобразования. // Интеллектуальные и информационные системы: материалы межрегиональной научно-технической конференции. // Тула: изд-во ТулГУ, 2003. 124 с. (С. 93-94).

2. Котов В.В., Киселев А.Н. Ускорение вычисления непрерывного вейвлет-преобразования при анализе высокочастотных компонент сигналов. // Известия Тульского государственного университета. Серия

3. Вычислительная техника. Информационные технологии. Системы управления. Т. 1. Вып. 2. Вычислительная техника. Тула: изд-во ТулГУ, 2003.-170 с. (С. 113-120).

4. Свидетельство №4575 от 04.04.2005 г./ Котов В.В., Киселев А.Н. Вейвлет-преобразование и анализ звуковых сигналов. — Отраслевой Фонд Алгоритмов и Программ Госкоорцентра Министерства образования и науки Российской Федерации.

5. Киселев А.Н. Определение не зависящих от диктора признаков глухих фрикативных фонем. // Естественные и технические науки. — М.: изд-во «Компания Спутник +», 2005.-251 с. (С. 145).

6. Гасов В.М., Москвин B.C., Сенькин С.И. Организация взаимодействия человека с техническими средствами АСУ. М.: Высшая школа, 1990.

7. Рош JI. Уин. Библия по техническому обеспечению Уина Роша. — Минск.: МХХК «Динамо», 1992.

8. Кочетков Г.Б. Автоматизация конторского труда в США. Теория и практика «офиса будущего». М.: Наука, 1985.

9. Пиконе Джозеф. Методы моделирования сигнала в распознавании речи. Пер. Р. Попова. Кемерово: 2000 г.

10. Фланаган Дж. Анализ, синтез и восприятие речи. М.: Связь, 1968.

11. Рабинер Л.Р., Шафер Р.В. Цифровая обработка речевых сигналов. — М.: Радио и связь, 1981.

12. Фуканага К. Введение в статистическую теорию распознавания образов. М.: Мир, 1978. - 312 с.

13. Оппенгейм А.В., Шафер Р.В., Цифровая обработка сигналов. М.: Связь, 1979.

14. Рабинер Л.Р., Гоулд Б. Теория и применение цифровой обработки сигналов. — М.: Мир, 1978.

15. Блейкут Р. Быстрые алгоритмы цифровой обработки сигналов. — М.: Мир, 1989.

16. Ахмед Н., Рао К.Р. Ортогональные преобразования при обработке цифровых сигналов. -М.: Связь, 1980.

17. Jensen A., A. la Cour-Harbo. Ripples in Mathematics: The Discrete Wavelet Transform. Springer, 2001.

18. Addison P., Addison N. The Wavelet Transform Handbook. Hardcover,2002.

19. Toswell C. Handbook Wavelet Transform Algor. Hardcover, 2002.

20. Percival D.B., Walden A.T. Wavelet Methods For Time Series Analysis. Hardcover, 2000.

21. Vidakovic. Statistical Modeling by Wavelets. Hardcover, 2000.

22. Strang G., Nguyen T. Wavelets and Filter Banks. Hardcover, 1999.

23. Mallat S.G. Wavelet analysis is signal processing. Hardcover, 1996.

24. Котов В.В. Применение вейвлетов различных типов для анализа событий. // Известия Тульского государственного университета. Серия: Вычислительная техника. Автоматика. Управление. Том 3. Выпуск 3. Управление. Тула: ТулГУ, 2001. С. 165-167.

25. Котов В.В., Соколов В.А. Частотное мультиплексирование с применением вейвлет-анализа сигналов. / Интеллектуальные и информационные системы: материалы межрегиональной научно-технической конференции. // Тула: изд-во ТулГУ, 2003. С. 86-89.

26. Новиков JI.B. Основы вейвлет-анализа сигналов. Санкт-Петербург: 1999.

27. Чжун Кай-Лай. Однородные цепи Маркова. М.: Мир, 1964.

28. Баруча-Рид А.Т. Элементы теории марковских процессов и их приложения. — М.: Наука, 1969.

29. Прохоров Ю.Н. Статистические модели и рекуррентное предсказание речевых сигналов. -М.: Радио и связь, 1984.

30. Juang В.Н. On the hidden markov model and dynamic time warping for speech recognition. AT&T Tech. J., vol. 63, no. 7, pp. 1213-1243, 1984.

31. Rabiner L.R., Juang B.H. An introduction to hidden markov models. -IEEE ASSP Mag, vol. 3, no. 1, pp. 4-16, 1986.

32. Вентцель А.Д. Курс теории случайных процессов. М.: Наука, 1975.-320 с.

33. Вентцель Е.С. Теория вероятностей. — М.: Наука, 1964. 572 с.

34. Моттль В.В., Мучник И.Б. Скрытые марковские модели в структурном анализе сигналов. М.: ФИЗМАТЛИТ, 1999. - 352 с.

35. Справочник по теории вероятностей и математической статистике / B.C. Королюк, Н.И. Портенко, А.В. Скороход, А.Ф. Турбин. М.: Наука, Гл. ред. физ.-мат. лит., 1985. - 640 с.

36. Тихонов В.И., Миронов М.А. Марковские процессы. — М.: Сов. радио, 1977.-488 с.

37. Вентцель Е.С., Овчаров Л.А. Теория случайных процессов и её инженерные приложения. — М.: Высш. шк., 2000. — 383 с.

38. Натан А.А. Теория распознавания образов. М.: Наука, 1988.

39. Васильев В.И. Распознающие системы: справочник. Киев: Наукова думка, 1983. - 422 е., ил.

40. Фор А. Восприятие и распознавание образов. — М.: Машиностроение, 1989. —271 е., ил.

41. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 1984. - 208 е., ил.

42. Ту, Дж. Т., Гонсалес, Р. Принципы распознавания образов. М.: Мир. 1978.-411 е., ил.

43. Горелик А.Л., ^Гуревич И.Б., Скрипкин В.А. Современное состояние проблемы распознавания: Некоторые аспекты. М.: Радио и связь, 1985.-160 е., ил.

44. Винцюк Т.К. Анализ, распознавание и интерпретация речевых сигналов. — Киев: Наукова думка, 1987.

45. Игнатьев В.М., Ларкин Е.В. Восприятие информации в системах искусственного интеллекта. Тула, 1993.

46. Загоруйко Н.Г. Методы распознавания и их применение. М.: Сов. радио, 1972.

47. Методы автоматического распознавания речи. / Под ред. Ли У. В 2-х томах. -М.: Мир, 1983.-716 с.

48. А.Н.Колмогоров, С.В.Фомин. Функциональный анализ.- М.:Наука,1984.

49. Шикин Е.В., Плис А.И. Кривые и поверхности на экране компьютера. — М.: Диалог-МИФИ, 1996.

50. Аммерал Л. Машинная графика на персональном компьютере. М.: Сол Систем, 1992. - 230 с.

51. Toth D.L. On ray tracing parametric surfaces // SIGGRAPH'85. 1985. -Vol.19, №3. P. 171-178.

52. Levin J.A. Parametric algorithm for drawing pictures of solid objects composed of quadric surfaces // Communication of the ACM. 1976. - Vol. 1, №10.-P. 555-563.

53. Jarke J.V. Bicubic patches for approximating non-rectangular control-point meshes // Computer Aided Geometric Design. -1986. Vol. 3, №1. P. 456459.

54. Bajaj C.L. Surface fitting using implicit algebraic surface patches. In Topics in Surface Modeling. H. Hagen, Ed., SIAM, 1992.

55. Иванов В.П., Батраков A.C. Трехмерная компьютерная графика. -М.: Радио и связь, 1995.

56. Лапшин Е.В. Компьютерная графика. -М.: Солон, 1995.

57. Тихомиров Ю. Программирование трехмерной графики в OpenGL. -Санкт-Петербург: BHV, 1998.

58. Гельман М.М. Аналого-цифровые преобразователи для информационно-измерительных систем. М.: Изд-во стандартов, 1989.

59. Gold D., Rabiner L.R. Parallel Processing Techniques for Estimating Pitch Periods of Speech in the Time Domain. Journal of the Acoustical Society of America, vol. 46, no. 2, pt. 2, pp. 442-448, 1969.

60. Noll A.M. Cepstrum Pitch Determination, Journal of the Acoustical Society of America, vol. 41, no. 2, pp. 293-309, February 1967.

61. Hess W. Pitch Determination Of Speech Signals, Springer-Verlag, New York, NY, USA, 1983.

62. Нуссбаумер Г. Быстрое преобразование Фурье и алгоритмы вычисления сверток. М.: Радио и связь, 1985. - 248 е., ил.

63. Rabiner L.R., Schafer R.W. Digital Processing of Speech Signals, Prentice-Hall, Englewood Cliffs, New Jersey, USA, 1978.

64. Блейхут P. Быстрые алгоритмы цифровой обработки сигналов. М: Мир, 1989.

65. Голд Б., Рейден И. Цифровая обработка сигналов. М.: Мир, 1973. -367 с.

66. Гольберг JI.M. Цифровая обработка сигналов. — М.: Радио и связь, 1990.- 325 с.

67. Rabiner L. R., Juang В.Н., Fundamentals of Speech Recognition, Prentice-Hall,Englewood Cliffs, New Jersey, USA, 1993.

68. Markel J., A.H. Gray, Jr. Linear Prediction of Speech, Springer-Verlag, New York, NY, USA, 1980.

69. Atal B.S., Hanauer S.L. Speech analysis and synthesis by linear prediction of the speech wave, Journal of the Acoustical Society of America, vol. 50, no. 2, pp. 637-655, March 1971.

70. Фатуев B.A., Каргин A.B., Понятский B.M. Структурно-параметрическая идентификация динамических систем: Учеб. пособие.-Тула: Изд-во Тул-ГУ, 2003.-156 с.

71. I. Daubechies. Ten Lectures on Wavelets. CBMS-NSF Regional Conf. Series in Appl. Math., Vol. 61. Society for Industrial and Applied Mathematics, Philadelphia, PA, 1992.

72. Васильев Ф.П. Численные методы решения эстремальных задач. — М.: Наука, 1980.-520 с.- 150 -Приложение

73. ВНИМАНИЕ !!!!!!!!!!!!! Теперь обработка сигнала осуществляетсяс позиции, в которую установлен скролл-бар //int CurPos=0;

74. RedrawWavelet=true; SignalScrollBar->Enabled=false; IsDWT=false;try {f0=F0Edit->Text.ToDouble();if(f0==0.0) {

75. F0Edit->SetFocus(); return;catch(EConvertError& ex) F0Edit->SetFocus();tryfn=FNEdit->Text.ToDouble(); catch(EConvertError& ex) FNEdit->SetFocus();try

76. FQ=FQEdit->Text.Tolnt(); catch(EConvertErrorS ex) FQEdit->SetFocus();try {a=AEdit->Text.ToDouble();catch(EConvertErrorS ex) {1. AEdit->SetFocus();try {1. N=NEdit->Text.Tolnt();if(N>(SignalLength-WND)) {

77. Если она сильно больше нуля,значит либо вейвлеточень маленький, и велики ошибкидискретизации, .либо вейвлет очень большой и невлезает в окноdouble dt=2.0/double(WND);

78. WaveletImage->Picture->Bitmap->Width=N;1. WaveletImage->Width=N;1. WaveletPanel->Width=N;

79. Первым делом вычисляем шкалу частот и сопустствующие значения масштабаfor(i=0;i<FQ;i++) {if(ScaleRadioGroup->ItemIndex==0) { //Линейная шкала

80. FreqFQ-i-1.=(fn-fO)*double(i)/double(FQ-1)+f0else if(ScaleRadioGroup->ItemIndex==l) {1. FreqFQ-i1.=f0*exp(double(i)*log(fn/fO)/double(FQ-1)); }else {1. FreqFQ-i-1.=100.0;

81. ScaleFQ-i-1.=a*fd*dt/(2.0*MPI*Freq[FQ-i-1]);for(i=0;i<L;i++)

82. SignalPart1.=complex<double>(double(Signali.-128),0.0);for(i=L;i<FFTN;i++)

83. SignalPart1.=complex <double> (0.0,0.0);*/if(NBytes==l) {for(i=0;i<FFTN;i++)

84. SignalPart1.=complex<double>(double(Signali.128.,0.0); }elsefor (i=0; KFFTN; i++)

85. SignalPart1.=complex<double>(double(IntSignali.)/256.0.128.0,0.0); }for(i=0;i<L;i++)

86. SignalPart1.=complex<double>(double(Signali.-128),0.0);for (i=L; KFFTN; i++)

87. SignalPart1.=complex<double>(0.0,0.0);bpf(SignalPart,FFTLN); AnsiString ForCaption; for(i=0;i<FQ;i++) { //FQ различных масштабов LineBegin=GetTickCount();

88. Morlet = GenerateMorletWavelet2(Scale 1.); Step=int(Scalei./(Scale[0]*P)); if(Step==0)

89. Step=l; if(Step>N) Step=N;

90. NCWT=double(WaveletEnd)-double(WaveletBegin) ; //CostCWT=NCWT*double(N-WND-1)/double (Step);if(Morlet>=0.3) {for(j=0;j<N;j++) {r = 255; g = b = 0; //Признак того, что вейвлет слишком мелкий1. Field1.j.=0.0;linej*3+0. = b; line[j*3+l] = g; line[j*3+2]r;

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.