Помехоустойчивые выделители основного тона для низкоскоростных вокодеров и цифровых слуховых аппаратов тема диссертации и автореферата по ВАК РФ 05.12.13, кандидат технических наук Бабкин, Владимир Владиславович
- Специальность ВАК РФ05.12.13
- Количество страниц 210
Оглавление диссертации кандидат технических наук Бабкин, Владимир Владиславович
1 Введение.
1.1 Задача оценки частоты основного тона вокализованной речи и ее место в цифровой обработке речевых сигналов.
1.2 Область применения алгоритмов оценки частоты ОТ вокализованной речи.Ю
1.3 Актуальность темы исследования.
1.4 Цель работы.
1.5 Структура диссертации.
2 Обзор существующих методов оценки частоты ОТ вокализованной речи.
2.1 Постановка задачи оценки частоты ОТ вокализованной речи.
2.2 Факторы, затрудняющие оценку частоты ОТ.
2.3 Требования к точности оценки частоты ОТ в вокодерах.
2.4 Общая структура построения выделителей ОТ.
2.5 Методы предварительной обработки речевых сигналов.
2.5.1 Линейная фильтрация.
2.5.2 Выравнивание формантной структуры спектра.
2.5.3 Нелинейные методы обогащения спектра гармониками частоты ОТ.
2.6 Методы принятия решения.
2.7 Общая классификация методов оценки частоты ОТ.
2.8 Методы оценки частоты ОТ на основе анализа речевых сигналов во временной области.
2.8.1 Методы частотной селекции.
2.8.2 Методы амплитудной селекции.
2.8.3 Многоканальные схемы построения выделителей ОТ.
2.8.3.1 Использование нескольких признаков для анализа.
2.8.3.2 Использование различных методов предварительной обработки.
2.8.3.3 Использование различных частотных полос.
2.9 Методы оценки частоты ОТ на основе анализа функциональных отображений речевых сигналов.
2.9.1 Корреляционные методы и методы линейного предсказания.
2.9.1.1 Автокорреляционный метод.
2.9.1.2 Разностные методы (AMDF и MSDF).
2.9.1.3 Метод, использующий функцию нормированной взаимной корреляции.
2.9.1.4 Методы линейного предсказания высокого порядка.
2.9.2 Методы, основанные на модификации спектра сигнала.
2.9.2.1 Кепстральный метод.
2.9.2.2 Другие методы модификации спектра.
2.9.3 Методы максимального правдоподобия.
2.9.4 Методы анализа через синтез.
2.9.5 Методы поиска гармоник частоты ОТ в частотной области.
2.9.5.1 Методы спектральной компрессии.
2.9.5.2 Обнаружение гармоник ОТ с помощью гребенчатого фильтра.
2.9.5.3 Корреляционный анализ спектров.
2.9.5.4 Методы спектрального подобия.
2.10 Методы классификации тон/шум.
2.10.1 Общие подходы к классификации тон/шум для речевых сигналов.
2.10.2 Подходы к классификации тон/шум в низкоскоростных вокодерах.
2.10.3 Признаки, используемые при классификации тон/шум.
2.10.4 Способы принятия решения тон/шум.
2.11 Постановка задач исследования.
2.12 Выводы.
3 Исследование методов оценки частоты ОТ вокализованной речи в присутствии шума и разработка помехоустойчивого выделителя ОТ.
3.1 Разработка методики оценки помехоустойчивости выделителей ОТ.
3.1.1 Требования к тестовым сигналам.
3.1.2 Количественная оценка помехоустойчивости.
3.1.3 Формирование тестовых сигналов.
3.2 Выбор функционального отображения и исследование его свойств .106 3.2.1 Корреляционные отображения.
- в .2.2 Отображения на основе гребенчатых фильтров.
3.2.2.1 Гребенчатые КИХ и Б ИХ фильтры.
3.2.2.2 Варианты построения отображений на основе гребенчатых фильтров.
3.2.3 Сравнение свойств отображений на основе ФВНК и ФЭГФ.
3.2.3.1 Качественное определение контрастности отображений.
3.2.3.2 Количественное сравнение контрастности отображений.
3.3 Исследование методов оценки периода ОТ для одного речевого кадра.
3.3.1 Выделение глобального максимума отображения.
3.3.2 Выделение глобального максимума взвешенного отображения.
3.4 Сравнение методов предварительной фильтрации.
3.5 Сглаживание траектории ОТ для нескольких кадров.
3.5.1 Медианное сглаживание траектории ОТ.
3.5.2 Сглаживание траектории ОТ методами динамического программирования
3.6 Выводы.
4 Исследование помехоустойчивости разработанного выделителя ОТ.
4.1 Описание алгоритма разработанного выделителя ОТ.
4.2 Постановка эксперимента по измерению помехоустойчивости.
4.3 Краткая характеристика сравниваемых выделителей ОТ.
4.4 Полученные результаты.
4.5 Выводы.
5 Реализация разработанного выделителя ОТ.
5.1 Особенности реализации алгоритмов цифровой обработки сигналов на цифровых процессорах обработки сигналов.
5.1.1 Функциональное моделирование алгоритмов.
5.1.2 Перевод алгоритмов в арифметику с фиксированной точкой.
5.1.3 Разработка набора тестовых векторов.
5.1.4 Реализация на ассемблере.
5.1.5 Особенности многоканальной реализации.
5.1.5.1 Метод раздельного программного кода.
5.1.5.2 Метод переключения страниц памяти.
5.1.5.3 Метод копирования контекстов.
5.1.5.4 Метод переключения дескрипторов.
5.2 Реализация разработанного выделителя ОТ в LPC вокодере.
5.2.1 Общее описание реализованного вокодера.
5.2.2 Особенности построения выделителя ОТ в LPC вокодере.
5.3 Реализация разработанного выделителя ОТ в цифровом слуховом аппарате.
5.3.1 Общее описание реализованного цифрового СА.
5.3.2 Особенности построения выделителя ОТ в цифровом С А.
5.3.3 Особенности реализации выделителя ОТ на процессорах семейства ADSP-218x
5.4 Выводы.
Рекомендованный список диссертаций по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Разработка критериев и алгоритмов сегментации речевого сигнала на участки "ТОН/НЕ ТОН" для метода выделения основного тона в информационно-измерительных системах речевой технологии2000 год, кандидат технических наук Архипов, Игорь Олегович
Разработка и исследование системы автоматического выделения основного тона речи2009 год, кандидат технических наук Лузин, Дмитрий Александрович
Алгоритмы и конвейерное вычислительное устройство помехоустойчивой сегментации вокализованных участков речевого сигнала2008 год, кандидат технических наук Панов, Александр Ефимович
Исследование и разработка алгоритмов обработки речевой информации на основе представления Хургина-Яковлева в радиотехнических устройствах2006 год, кандидат технических наук Дмитриев, Владимир Тимурович
Разработка концепции выделения основного тона речи в информационно-измерительных системах реального времени2000 год, доктор технических наук Гитлин, Валерий Борисович
Введение диссертации (часть автореферата) на тему «Помехоустойчивые выделители основного тона для низкоскоростных вокодеров и цифровых слуховых аппаратов»
1.1 Задача оценки частоты основного тона вокализованной речи и ее место в цифровой обработке речевых сигналов
Речь является основным каналом обмена информацией между людьми. С момента изобретения фонографа и телефона технические средства, работающие с речевыми сигналами, постоянно совершенствовались и расширяли сферу своего применения. В настоящее время одним из наиболее перспективных и стремительно развивающихся направлений в этой области является цифровая обработка речевых сигналов, под которой понимается преобразование аналогового электрического сигнала в цифровую форму с последующей его обработкой вычислительными методами.
Речевой сигнал в цифровой форме может рассматриваться с позиций волнового, спектрального или параметрического описания. Последнее, в силу своей компактности, широко используется при решении задач анализа, синтеза, компрессии и распознавания речи. В его основе лежит классическая модель ре-чеобразования [120](Фланаган, 1968), [115](Рабинер, 1981), состоящая в первом приближении из пассивного речевого тракта с переменными во времени параметрами и источника возбуждения в нем акустических колебаний (рис. 1.1).
Частота основного Усиление
Рис. 1.1. Классическая модель речеобразования
Текущие параметры речевого тракта и сигнала возбуждения выбираются так, чтобы синтезированный на выходе модели сигнал был близок к оригинальному речевому сигналу в смысле какого-либо критерия. Основной задачей при использовании параметрического описания речевых сигналов является оценка параметров выбранной модели на основе анализа текущей речи.
Одним из важнейших параметров сигнала возбуждения колебаний в речевом тракте является частота основного тона (ОТ) речи, характеризующая высоту голоса при произнесении вокализованных звуков речи. Задача автоматической оценки частоты ОТ и ее траектории во времени (называемая часто задачей выделения ОТ) является классической и активно обсуждается в мировой научной литературе многие десятилетия. Человек легко определяет частоту ОТ на слух или на глаз при анализе осциллограмм или спектрограмм речи, однако, построить устройство (выделитель ОТ), автоматически определяющее частоту ОТ с малой ошибкой и малой задержкой во времени, даже при относительно низком уровне помех, довольно трудно [ 100](Пирогов, 1974).
Диссертационная работа посвящена исследованию методов оценки частоты ОТ речи в присутствии белого шума и разработке помехоустойчивых выделителей ОТ, предназначенных для применения в низкоскоростных вокодерах и цифровых слуховых аппаратах.
Похожие диссертационные работы по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК
Теоретико-информационные принципы компрессии речевого сигнала на основе его квазипериодических свойств2005 год, доктор технических наук Шалимов, Игорь Анатольевич
Разработка низкоскоростного вокодера1999 год, кандидат технических наук Ли Фэйпэн
Повышение качества речевой информации с учетом действия акустических шумов транспортных средств2003 год, кандидат технических наук Нгуен Кань Лам
Разработка и исследование методов повышения эффективности программно-аппаратных вычислительных средств обработки речевых сигналов1999 год, кандидат технических наук Федоренко, Олег Григорьевич
Разработка методов эффективного кодирования речи на основе новых моделей источника речеобразования2007 год, кандидат технических наук Медведев, Олег Николаевич
Заключение диссертации по теме «Системы, сети и устройства телекоммуникаций», Бабкин, Владимир Владиславович
Основные результаты диссертационной работы заключаются в следующем:
1. Проведен аналитический обзор современных методов выделения ОТ речи и на его основе сформулированы обобщенная блок-схема построения помехоустойчивых выделителей ОТ и обозначены требования и к его отдельным узлам.
2. Разработана методика оценки помехоустойчивости выделителей ОТ, отражающая особенности их применения в низкоскоростных вокодерах и цифровых СА.
3. Созданы программные инструменты для исследования помехоустойчивости выделителей ОТ методом моделирования на ПЭВМ. Построены тестовые речевые сигналы с различными отношениями сигнал/шум и с размеченной траекторией ОТ.
4. Предложена методика сравнения эффективности использования различных функциональных преобразований сигнала для оценки ОТ речи в шуме. Проведено сравнение нескольких способов формирования кратковременных функциональных отображений речевых сигналов на основе корреляционных методов и методов максимального правдоподобия и выбрано наиболее эффективное.
5. Исследованы различные способы оценки признаков периодичности сигналов при анализе отображений вокализованной речи. Исследовано влияние на помехоустойчивость выделителя ОТ различных вариантов предварительной обработки сигнала и сглаживания траектории ОТ. На основе метода динамического программирования разработана структура решающего правила выделителя ОТ, а его параметры экспериментально оптимизированы при работе в шумах по критерию минимума грубых ошибок в оценке ОТ.
6. На основе проведенных исследований разработан алгоритм помехоустойчивого выделения ОТ и создан выделителя ОТ, реализованный в виде программной модели на ПЭВМ.
7. На основе разработанной методики проведено количественное сравнение помехоустойчивости разработанного выделителя ОТ с известными выделителями ОТ, используемыми в международных стандартах низкоскоростной компрессии речи. Сравнение показало, что предложенный алгоритм выделения ОТ имеет лучшую помехоустойчивость. Он позволяет снизить в 1,5-2 раза количество грубых ошибок в оценке ОТ для речи в белом шуме с отношением сигнал/шум 0 дБ и тем самым повысить качество работы низкоскоростных вокодеров и цифровых СА в целом .
8. Проведена оптимизация вычислительной сложности алгоритма, осуществлен перевод алгоритма в арифметику с фиксированной точкой для реализации на 16-ти разрядных ЦПОС, разработана стратегия многоканальной реализации алгоритмов ЦОС для одновременной обработки нескольких каналов на одном ЦПОС.
9. Разработанный выделитель ОТ реализован для работы в реальном масштабе времени в составе двух оконечных устройств - в модели вокодера с линейным предсказанием речи со скоростью 1200 бит/с на ПЭВМ и в цифровом СА на ЦПОС ADSP-2183.
6 Заключение
Список литературы диссертационного исследования кандидат технических наук Бабкин, Владимир Владиславович, 2003 год
1. Ahmadi S., Spanias A.S. Cepstrum-based Pitch Detection Using a New Statistical V/UV Classification Algorithm, 1.EE Transactions on Speech and Audio Processing, vol. 7, No. 3, May 1999.
2. Ahmadi S., Spanias A.S. New Techniques for Sinusoidal Coding of Speech at 2400 bps. Proc. of ASILOMAR-96, Nov. 1996.
3. Andreyev I.V., Babkin V.V., Fouks V.A., Kondroutski A.V., Lanne A.A., Zaborovski V.S., Znamerovski A.E. DSP Units for IP-Telephony Systems. Proc. of the 3rd European DSP Education and Research Conference, 20-22 September 2000, Paris.
4. Babkin V.V., Dombrovsky R.V., Molchanov A.P. About the Mechanism of extraction the Speech elements from Noise in the Hearing System of men. // Pro- ceeding of the 4-th International Congress on Sound and Vibration, St.-Petersburg,
5. Russia, 1996, June 24-27, p. 1439-1444.
6. Bagshaw P.C., Hiller S.M., Jack M.A. Enhanced Pitch Tracking and the processing of F0 Contours for Computer Aided Intonation Teaching. Proc. of EUROSPEECH-93, Berlin, 1993, vol. 2, pp. 1000-1003.
7. Barnwell III Т., Unno Т., Truong K. An Improved Mixed Excitation Linear Prediction (MELP) Coder. Proc. of ICASSP-99, pp. 245-248.
8. Bauer W.R., Blankinship W.A. Patent US4004096: Process for extracting pitch information. Jan. 18, 1977.
9. Cai J., Liu Z., Robust Pitch Detection of Speech Signals Using Steerable Filters. Proc. of ICASSP- 97, pp. 1427-1430.
10. Chazan D., Stettiner Y., Malah D. Optimal Multi-Pitch Estimation Using the EM Algorithm for Co-channel Speech Separation. Proc. of ICASSP-93. Vol. П, pp. 728-731.
11. Chen P., Ando S., Pitch from Zeros of Bank Filtered Signals. Proc. of ICASSP-93, vol. П, pp. 530-533.
12. Cho Y. D., Kim M. Y., Kim S. R., A Spectrally Mixed Excitation (SMX) Vocoder with Robust Parameter Determination. Proc. of 1С AS SP- 98, pp. 601-604.
13. Deller J., Hansen J., Proakis J. Discrete-Time Processing of Speech Signals. IEEE press, New York, 2000.
14. Doddington G.R., Secrest B.G., An Integrated Pitch Tracking Algorithm for Speech Systems. Proc. of ICASSP-83, Boston, pp. 1352-1355.
15. Doddington G.R., Secrest B.G., Patent US4696038: Voice messaging system with unified pitch and voice tracking. Sept. 22, 1987.
16. Doddington G.R., Secrest B.G., Patent US4731846:Voice messaging system with pitch tracking based on adaptively filtered LPC residual signal. March 15, 1988.
17. Droppo J., Acero A. Maximum Aposteriori Pitch Tracking. Proc. of ICSLP-98, pp. 943-946.
18. ETS 300-580-2. GSM: Digital cellular telecommunications system (Phase 2); Full rate speech; Part 2: Transcoding (GSM 06.10 version 4.1.1), March 1998.
19. ETS 300-726 ed. 2 (draft) GSM: Digital cellular telecommunications system (Phase 2+); Enhanced Full Rate (EFR) speech transcoding (GSM 06.60 version 5.2.1), June 1998.
20. ETS 300-969 ed. 2 GSM: Digital cellular telecommunications system (Phase 2+); Half rate speech. Half rate speech transcoding (GSM 06.20 version 5.1.1), May 1998.
21. FS-1016 CELP Speech Coding at 4800 bps. NCS Technical Information Bulletin. 1993.
22. GaiIlard F., Berthommier F., Feng G., Schwartz J.-L. A Reliability Criterion for Time-Frequency Labeling Based on Periodicity in an Auditory Scene. Proc. of EUROSPEECH-99, pp. 2603-2606.
23. Geoffrois E. The Multi-Lag-Window Method for Robust Extended-Range Fo Determination. Proc. of ICSPL-1996, pp. 2239-2242.
24. Gersho A. Advances in Speech and Audio Compression. Proc. of the IEEE, vol. 82, No. 6, June 1994.
25. Gersho A., Cuperman V., Li C. Robust Closed-loop Pitch Estimation for Harmonic Coders by Time Scale Modification. Proceedings of IEEE ICASSP-99, pp. 257-260.
26. Gersho A., Gottesman O. Encanced Analysis-by-Synthesis Waveform Interpolate Coding at 4 kbps. Proc. of EUROSPEECH-99.
27. Gersho A., Kumar A., Erzin E. Natural Quality Variable-Rate Spectral Speech Coding below 3.0 kbps. Proc. of ICASSP-97, pp. 1579-1582.
28. Griffin D. W. Patent US5826222: Estimation of excitation parameters, Oct. 20,1998.
29. Griffin D. W., Lim J. S. Patent US5715365: Estimation of excitation parameters, Feb. 3,1998.
30. Hanzo L., Brooks F.C.A. A Multiband Excited Waveform-Interpolated 2.35-kbps Speech Codec for Bandlimited Channels. IEEE Transactions On Vehicular Technology, Vol. 49, No. 3, May 2000.
31. Hardwick J. C., Lim J. S. Patent US5216747: Voiced/unvoiced estimation of an acoustic signal. June 1, 1993.
32. Hardwick J. C., Lim J. S. Patent US5226108: Processing a speech signal with estimated pitch, July 6, 1993.
33. Hardwick J. С., Lira J. S. Patent US5581656: Methods for generating the voiced portion of speech signals, Dec. 3,1996.
34. Hess W. Pitch determination on Speech Signals with Special Emphases on Time-Domain Methods. Proc. of NCVS Workshop on Voice Analysis, The Center of Performing Arts, Denver, February 1994.
35. Hess W. Pitch determination on Speech Signals. Springer-Verlag. New York, USA, 1983.
36. Huang H. C., Seide F. Pitch Tracking and Tone Features for Mandarin Speech Recognition. Proc. of ICASSP-2000, pp. 1523-1526.
37. Huang X., Acero A., Hon H. Spoken Language Processing: A Guide to Theory, Algorithm, and System Development. Prentice Hall, 2001.
38. Ireton M., Bartkowiak J. Patent US6047254: System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation. April 4,2000.
39. ISO/IEC 14496-3 Subpart 2. Information Technology Very Low Bitrate AudioVisual Coding, Part 3: Audio, Subpart 2: Parametric Coding. 1998-03-20.
40. ITU-T Recommendation G.723.1. Dual Rate Speech Coder For Multimedia Communications Transmitting at 5.3 and 6.3 kbit/s. March 1996.
41. ITU-T Recommendation G.729 Annex A. Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP). Annex A: Reduced complexity 8 kbit/s CS-ACELP speech codec. November 1996.
42. ITU-T Recommendation G.729. Coding of Speech at 8 kbit/s Using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction (CS-ACELP). March 1996.
43. Janer L., Bonet J. J., Lleida-Solano E., Pitch Detection and Voiced/Unvoiced Decision Algorithm based on Wavelet Transforms. Proc. of ICSLP-96, pp. 12091212.
44. Kabal P., Zad-Issa M. A New LPC Error Criterion for Improved Pitch Tracking. Proc. of IEEE Workshop on Speech Coding for Telecom. Sept. 1997.
45. Karjalainen M., Tolonen Т. A Computationally Efficient Multipitch Analysis Model. IEEE Transactions On Speech And Audio Processing, Vol. 8, No. 6, November 2000.
46. Karjalainen M., Tolonen T. Multi-pitch and Periodicity Analysis Model for Sound Separation and Auditory Scene Analysis. Proc. of ICASSP-99, pp. 929-932.
47. Kenzo I., Mizushima M. Environmental noise reduction based on speech/non-speech identification for hearing aids. Proc. of ICASSP-97, pp. 419-422.
48. Kleijn B. Continuous Representations in Linear Predictive Coding. Proc. of ICASSP-91, pp. 201-204.
49. Kleijn B. W. Encoding Speech Using Prototype Waveforms. IEEE Transactions on Speech and Audio Processing, vol. 1, No. 4, October 1993, pp. 387-399.
50. Kobayashi H., Shimamura T. A Weighted Autocorrelation Method for Pitch Extraction of Noisy Speech. Proc. of ICASSP-2000, pp. 1307-1310.
51. Koch S. R., Patent US5127053: Low-complexity method for improving the performance of autocorrelation-based pitch detectors. June 30, 1992.
52. Kondoz A. M. Digital Speech: Coding for Low Bit Rate Communication Systems, John Wiley & Sons Ltd, 1994.
53. Kondoz A., Yeldener S., Atkinson I. High Quality Split Band LPC Vocoder Operating at Low Bit Rates. Proc. of ICASSP-97, pp. 1559-1562.
54. Krubsack D., Niederjohn R. Comparision of Pitch Tracking Methods in Additive White Gaussian Noise. // Proc. of the 30th Midwest Symposium on Circuits and Systems, Elsevier Science Publishing Co., 1988, pp. 1262-1265.
55. Kunieda N., Shimamura Т., Suzuki J. Robust Method of Measurement of Fundamental Frequency by ACLOS Autocorrelation of Log Spectrum. Proc. of ICASSP-96, pp. 232-235.
56. Laflamme C., Salami R., Matmti R., Adoul J-P. Harmonic-Stochastic Excitation (HSX) Speech Coding Below 4 kbit/s. Proc. of ICASSP-96, pp. 204-207.
57. Martino J. D., Laprie Y. An Efficient Fo Determination Algorithm Based on the IMPLICIT Calculation of the Autocorrelation of the Temporal Excitation Signal. Proc. of EUROSPEECH-99, pp. 2773-2776.
58. McCree A. V., Supplee L. M., Cohn R. P., Collure J. S., MELP: The New Federal Standard at 2400 bps. Proceedings of ICASSP-97.
59. McCree A. V., Truong K., George E. В., Barnwell T. P. and Viswanathan V. A 2.4 kbit/s MELP Coder Candidate for the New U.S. Federal Standard. Proceedings of IEEE ICASSP 1996, pp. 200-203.
60. МсСгее A.V., De Martin J. С. A 1.7 kb/s MELP Coder with Improved Analysis and Quantization. Proc. of ICASSP-98, pp. 593-596.
61. Medan Y., Yair E., Chazan D. Super Resolution Pitch Determination of Speech Signals. IEEE Transactions on Signal Processing, vol. 39, No. 1, January 1991.
62. Noll A. M. Patent US3555191: Pitch detector. Jan. 12,1971.
63. N0II A. M., Schroeder M. R. Patent US3566035: Real Time Cepstrum Analyzer. Feb. 23,1971.
64. Papamichalis P. E., Practical Approaches to Speech Coding. Prentice-Hall, Inc., Englewood Cliffs, New Jersey, USA, 1987.
65. Picone J. W., Sukkar R. A., LoCicero J. L., Design and Implementation of a Robust Pitch Detector Based on a Parallel Processing Technique. IEEE journal on selected areas in communications, vol. 6, No. 2, February 1988.
66. Picone J., Doddington G. R., Secrest B. G. Robust Pitch Detection in a Noisy Telephone Environment. Proc. of ICASSP-87, pp. 1442-1445.
67. Picone J., Prezas D., Patent US4879748: Parallel processing pitch detector. Nov. 7,1989.
68. Quin X., Kumaresan R., A Variable Frame Pitch Estimator and Test Results. Proc. of ICASSP-96, pp. 228-231.
69. Rabiner L. R., Schafer R.W., Dubnowski J.J. Patent US4015088: Real-time speech analyzer. March 29,1977.
70. Salami R. at al. Design and Description of CS-ACELP: A Toll Quality 8 kb/s Speech Coder. IEEE Transactions on Speech and Audio Processing, vol. 6, No. 2, March 1998, pp. 116-130.
71. Sen Z., Shirai K. Visual Approach for Automatic Pitch Period Estimation. Proc. of ICASSP-2000, pp. 1339-1342.
72. Sercov V., Petrovsky A., The Method of Pitch Frequency Detection on the Base of Tuning to its Harmonics. EUSIPCO-98, Sept. 1998, pp. 1137-1140.
73. Sondhi M. M. Patent US3381091: Apparatus for Determining the Periodicity and Aperiodicity of a Complex Wave. April 30,1968.
74. Speech In Noise (SIN) Test, Audtitec of St. Louis, 1993.
75. The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus (TIMIT), ISBN: 1-58563-019-5, 1990.
76. Tuan V. N., d'Alessandro C. Robust Glottal Closure Detection Using the Wavelet Transform. Proc. of EUROSPEECH-99, pp. 2805-2808.
77. Veeneman D., Mazor B. Patent US4852169: Method for enhancing the quality of coded speech. July 25, 1986.
78. Wang C., Seneff S., Robust Pitch Tracking for Prosodic Modeling in Telephone Speech. Proc. of ICASSP-2000, vol. 3, pp. 1343-1346.
79. Wang Т., Tang K., Feng C. A high Quality MBE-LPC-FE Speech coder at 2.4 kbps and 1.2 kbps. Proc. of ICASSP-96, pp. 208-211.
80. Wei J., Smith K., SiVo-3: A new type of speech-pattern hearing aid for profoundly hearing impaired people. Speech, Hearing and Language, Work in Progress, Dept. Of Phonetics and Linguistics, University College London, 1996.
81. Wendt C., Petropulu A.P., Pitch Determination and Speech Segmentation Using the Discrete Wavelet Transform. Proc. of IEEE International Symposium on Circuits and Systems, 1996, vol. 2, pp. 45-48.
82. Wolnowsky et al. Patent: US 4091237: Bi-Phase Harmonic Histogram Pitch Extractor. May 23, 1978.
83. Yeldener S., A 4 kb/s Toll Quality Harmonic Excitation Linear Predictive Speech Coder. Proc. of ICASSP- 99, pp. 481-484.
84. Yeldener S., De Martin J. C., Viswanathan V., A Mixed Sinusoidally Excited Linear Prediction Coder at 4 kb/s and Below. Proc. of ICASSP- 98, pp. 589-592.
85. Ying G.S., Jamieson L.H., Michell C.D. A Probabilistic Approach to AMDF Pitch Detection. Proc. of ICSLP-96, pp. 1201-1204.
86. Андреев И.В., Бабкин В.В., Знамеровский А.Е. Реализация многоканальных речевых кодеков на цифровых процессорах обработки сигналов с фиксированной точкой. // Труды учебных заведений связи сб. № 165. СПб ГУТ, -СПб., 1999.
87. Андреев И.В., Бабкин В.В., Знамеровский А.Е. Реализация многоканальных шлюзов ЕР-телефонии. // 2-я межд. конф. Цифровая Обработка Сигналов и ее применения: докл. т. 2.-Москва, 1999. -с. 432-435.
88. Андреев И.В., Бабкин В.В., Знамеровский А.Е. Реализация многоканальных речевых CELP кодеков на DSP TMS320c548. // 2-я межд. конф. Цифровая Обработка Сигналов и ее применения: докл. т. 2., -Москва, 1999. -с. 283-287.
89. Бабкин В.В. LPC вокодер 1000-1200 бит/с. // Труды 3-ей межд. конф. Цифровая Обработка Сигналов и ее Применение (DSPA-2000) -Москва, 2000.
90. Бабкин В.В. Архитектура модуля обработки сигналов двухканального шлюза ЕР-телефонии. // 2-я межд. НТК Техника и Технология Связи. ГУТ, -СПб. 2000, (опубликована в журнале "Электросвязь" №7, 2000)
91. Бабкин В.В. Карманный цифровой слуховой аппарат на ADSP-2183. // Cheep News. -1999.-№9(42).-С. 35-39.
92. Бабкин В.В. Обзор методов обработки сигналов в цифровых слуховых аппаратах (Тезисы) 53-я НТК: тез. докл. / СПб ГУТ, -СПб, 2000.
93. Бабкин В.В. Реализация двухскоростного CELP вокодера на цифровом сигнальном процессоре ADSP-2181. (Тезисы) 52-я НТК: тез. докл./ СПб ГУТ, -СПб., 1999.
94. Бабкин В.В. Сравнение помехоустойчивости различных алгоритмов оценки периода основного тона речи. (Тезисы) 54-я НТК: тез. докл. / СПб ГУТ, -СПб, 2001.
95. Бабкин В.В., Бабкина Л.Н., Довжиков А.А., Молчанов А.П. Реализация карманного цифрового слухового аппарата на ADSP-2183. // 2-я межд. конф. Цифровая Обработка Сигналов и ее применения: докл. т. 2. -Москва, 1999, с. 386-390.
96. Бендат Д., Пирсол А. Измерение и анализ случайных процессов: Пер. с англ. / Под ред. И.Н. Коваленко М.: Мир, 1971. - 408 е., ил.
97. Вокодерная телефония. / Под. ред. А. А. Пирогова. М.: Связь, 1974. 535 е., ил.
98. Галушкин А. И. Теория нейронных сетей. Кн. 1: Учебн. Пособие для вузов / Общая ред. А. И. Галушкина. М.: ИПРЖР, 2000. - 416 е., ил.
99. ГОСТ В 20775 75. Передача речи по трактам связи, оборудованным аппаратурой засекречивания. Требования к разборчивости речи. Метод измерения.
100. Дженкинс Г., Ватте Д. Спектральный анализ и его приложения. Том 1 / Пер. с англ. В.Ф. Писаренко. М.: Мир, 1971. - 316 е., ил.
101. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики, 1999. - 270 е., ил.
102. Иванов В.Н. Вычисление линейных спектральных частот // Электросвязь. -1997.-№6.-С. 25-27.
103. Каппелини В., Константинидис А. Дж., Эмилиани П. Цифровые фильтры и их применение: Пер. с англ. / Под. ред. Н.Н. Слепова. М.: Энергоатомиз-дат, 1983. - 360 е., ил.
104. Коваленко И. Н., Филиппова А.А. Теория вероятностей и математическая статистика: Учеб. Пособие. — 2-е изд., перераб. и доп. — М.: Высш. школа, 1982.-256 е., ил.
105. Маркел Дж. Д., Грей А. X. Линейное предсказание речи: Пер. с англ. / Под. ред. Ю. Н. Прохорова, В. С. Звездина. М.: Связь, 1980. 308 е., ил.
106. Методы автоматического распознавания речи: В 2 т./ Под ред. У. Ли. Пер. с англ. М.: Мир, 1983. - 234 е., ил.
107. Отчет по НИР: Вокодер 1200 бит/с. // Санкт-Петербугский государственный университет телекоммуникаций, кафедра цифровой обработки сигналов, 2000.
108. Применение цифровой обработки сигналов. / Под. ред. А. Оппенгейма. Пер. с англ. / Под. ред. А. М. Рязанцева. М.: Мир, 1980. - 552 е., ил.
109. Рабинер Л., Голд Б. Теория и применение цифровой обработки сигналов: Пер. с англ. / Под. ред. Ю.Н. Александрова. М.: Мир, 1978. - 848 е., ил.
110. Рабинер Л. Р., Шафер Р. В. Цифровая Обработка Речевых Сигналов: Пер. с англ. / Под. ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь, 1981.- 496 е., ил.
111. Сапожков М. А., Михайлов В. Г. Вокодерная связь. М.: Радио и связь, 1983.-248 е., ил.
112. Слуховая система / Ред. Я. А. Альтман. Л.: Наука, 1990. - 620 с. - (Основы современной физиологии).
113. Соболев В.Н. Выделение основного тона методом гребенчатой фильтрации. Тезисы докладов и сообщений 12-го Всесоюзного семинара "Автоматическое распознавание слуховых образов"АРСО-12. Киев-Одесса, 1982., стр. 141-143.
114. Таланов А.О. EDSW пакет для обработки и анализа цифровых сигналов. Центр Цифровой Обработки Сигналов при Санкт-Петербургском Государственном университете Телекоммуникаций им. проф. М. А. Бонч-Бруевича, URL: www.dsp-sut.spb.ru;www.dsp.sut.ru, 2001.
115. Фланаган Дж. Л. Анализ, синтез и восприятие речи: Пер. с англ. / Под ред. А. А. Пирогова. М.: Связь, 1968. - 392 е., ил.
116. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: Пер. с нем. / Под ред. Б.Г. Белкина. М.: Связь, 1971. - 255 е., ил.
117. Цифровая обработка сигналов: Справочник / Гольденберг Л. М., Мапош-кин Б. Д., Поляк М. Н. М.: Радио и связь, 1985. - 312 е., ил.
Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.