Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека тема диссертации и автореферата по ВАК РФ 05.12.13, кандидат технических наук Стефанов, Михаил Александрович

  • Стефанов, Михаил Александрович
  • кандидат технических науккандидат технических наук
  • 2009, Самара
  • Специальность ВАК РФ05.12.13
  • Количество страниц 158
Стефанов, Михаил Александрович. Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека: дис. кандидат технических наук: 05.12.13 - Системы, сети и устройства телекоммуникаций. Самара. 2009. 158 с.

Оглавление диссертации кандидат технических наук Стефанов, Михаил Александрович

ВВЕДЕНИЕ.

1. АНАЛИЗ ДИСКРЕТНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ НА СООТВЕТСТВИЕ СИСТЕМЕ СЛУХА ЧЕЛОВЕКА.

1.1 Состояние вопроса и постановка задачи.

1.2. Требования к ДОП в высококачественных системах компрессии цифровой аудиоинформации.

1.3. Негармонические дискретные ортогональные преобразования

1.4. Гармонические ортогональные преобразования.

Выводы по главе 1.

2. ИССЛЕДОВАНИЕ ДОПУСТИМОЙ СТЕПЕНИ ОКРУГЛЕНИЯ КОЭФФИЦИЕНТОВ ГАРМОНИЧЕСКИХ ДИСКРЕТНЫХ ОРТОГОНАЛЬНЫХ ПРЕОБРАЗОВАНИЙ.

2.1. Состояние вопроса и постановка задачи.

2.2. Анализ параметров минимально ощущаемой на слух прямоугольной амплитудной модуляции полосного шума.

2.3. Метод оценки вероятности маскировки полосных шумов.

2.4. Численные характеристики допустимой степени округления коэффициентов ДОП.

Выводы по главе 2.

3. ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ СЖАТИЯ ЦИФРОВОЙ АУДИОИНФОРМАЦИИ С ПРОРЕЖИВАНИЕМ СПЕКТРА.

3.1. Состояние вопроса и постановка задачи.

3.2. Алгоритм прореживания спектра звуковых сигналов.

3.3. Метод оценки вероятности маскировки тональных компонент спектра.

3.4. Численные характеристики психоакустического анализа с прореживанием спектра.

Выводы по главе 3.

4. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ КОМПРЕССИИ ЦИФРОВОЙ АУДИОИНФОРМАЦИИ.

4.1. Состояние вопроса и постановка задачи.

4.2. Организация процессов моделирования и экспертной оценки качества звучания.

4.3. Распределение допустимой степени округления и особенности восприятия слухом сжатого спектра.

4.4. Модификация алгоритма с поблочно плавающей запятой.

4.5. Анализ эффективности алгоритма с поблочно плавающей запятой

Выводы по главе 4.

Рекомендованный список диссертаций по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК

Введение диссертации (часть автореферата) на тему «Повышение эффективности сжатия цифровой аудиоинформации с учетом свойств слухового анализатора человека»

Актуальность темы. Современный этап развития систем цифровой обработки и передачи цифровых аудиоданных характеризуется как увеличением потока передаваемой информации, так и повышением требований к ее качеству. Традиционные же методы сокращения статистической избыточности при условии его высокого качества (несущественной разницы в субъективном восприятии исходного и сжатого звука) обеспечивают выигрыш в пропускной способности канала связи лишь на 15 . 40 % [1 - 7]. Поэтому в последнее время в нашей стране и за рубежом уделяется большое внимание [8 - 22] вопросам развития новых методов сжатия цифровой аудиоинформации, основанных на использовании психоакустических свойств слуха человека. При этом сжатие звуковых сигналов (ЗС) производится не во временной, а в частотной области, для чего используются дискретные ортогональные преобразования (ДОП). Основополагающими в этой области являются работы таких авторов, как Е. Zwicker, W. Reichardt, К. Brandenburg, G. Stoll и др. В России следует выделить работы Ю.А. Ковалгина и A.M. Синильнико-ва.

Современные системы компрессии цифровой аудиоинформации стандартов MPEG {Moving Pictures Expert Group) [23 - 26] и ATSC (Advanced Television System Committee) Dolby AC-3 (A/52) [27] обеспечивают цифровые скорости от 64 кбит/с [28] для мультимедиа приложений до 384 кбит/с [29] для цифрового стереофонического вещания. При этом, судя по результатам экспертных оценок [30], несущественная разница в субъективном восприятии исходного и сжатого звука сохраняется только при сжатии цифрового потока с 768 до 128 кбит/с. Хотя по утверждению разработчиков MUSICAM [32, 33] и авторов нестандартных форматов РАС, VOF, WMA и Ogg Vorbis те же качественные показатели сохраняются и при сжатии до 8 раз. Вместе с тем известно [34], что при пропускной способности слухового аппарата в 100. 120 кбит/с человек способен осознанно воспринимать лишь порядка 100 бит/с. И хотя это относится к восприятию речи, такой большой разрыв дает повод к выводу о существовании возможности дальнейшего повышения эффективности высококачественной компрессии цифровых аудиоданных. Однако развитие соответствующих методов сдерживается рядом нерешенных проблем, основными из которых являются:

1. Эффективность сокращения психоакустической избыточности зависит [35] от вида ДОП. В настоящее время на основе весьма общих требований к свойствам ДОП в системах высококачественной компрессии цифровой аудиоинформации перспективными признаются [13, 36, 37] гармонические ДОП. Однако без достаточно обоснованной доказательной базы всегда остаются сомнения в целесообразности такого предпочтения.

2. Одним из основных психоакустических ресурсов компрессии цифровых аудиоданных является свойство порогового восприятия слухом изменения интенсивности спектральных компонент ЗС. Оно позволяет ограничить разрядность двоичного представления коэффициентов ДОП. С целью оценки допустимой' степени этого ограничения (округления) был проведен ряд исследований [30, 38 - 41]. Однако ни одно из них не учитывало такие важные факторы, как частотные свойства ДОП и связь [42] указанного свойства слуха с другим из основным его свойств — маскировкой (подавлением) спектральных компонент относительно малой интенсивности. В связи с этим отсутствует возможность эффективного ограничения разрядности цифрового представления коэффициентов ДОП. Как следствие, эмпирический подход к решению этого вопроса [43] по-прежнему актуален, хотя и обусловливает зависимость соответствующей оценки как от характера ЗС в целом (речь или музыка), так и от характера отдельных его фрагментов.

3. Уже упомянутый эффект маскировки слухового анализатора является и самостоятельным ресурсом сжатия цифровой аудиоинформации в частотной области. Его использование позволяет сократить количество передаваемых коэффициентов ДОП, ограничившись только немаскируемыми из них. Вместе с тем результаты экспериментальных [44] и теоретических [45,

46] исследований позволяют предположить существование определенных условий эффективного применения такого прореживания, связанных в частности с рабочим диапазоном частот и частотой дискретизации. Однако этот вопрос до сих пор остается открытым.

4. В настоящее время для повышения качества воспроизведения звука предполагается увеличение динамического диапазона ЗС почти до болевого порога слышимости. В связи с этим необходимы обоснованные сведения относительно влияния этого параметра на эффективность компрессии цифровых аудиоданных. Экспериментальным путем установить соответствующие зависимости весьма затруднительно, а теоретические исследования этого вопроса, судя по общедоступным литературным источникам, не проводились.

5. Недостаточно исследован вопрос адаптации алгоритма поблочного кодирования [47], хорошо зарекомендовавшего себя при сжатии ЗС во временной области, к условиям сжатия в частотной области. Вследствие относительно низкого качества прореживания кодируется весьма значительная часть маскируемых коэффициентов ДОП и/или отбрасывается часть немаскируемых из них.

От обоснованного решения перечисленных проблем зависят все важнейшие характеристики как существующих, так и новых высококачественных систем цифровой обработки и передачи ЗС. Поэтому актуальной является задача выработки обоснованных рекомендаций относительно ДОП, перспективных для целей сжатия ЗС и методов повышения производительности высококачественных систем компрессии цифровых аудиоданных.

Цель и задачи работы. Целью диссертации является повышение эффективности высококачественного сжатия цифровой аудиоинформации с использованием психоакустических свойств слухового анализатора. Для достижения указанной цели в диссертационной работе- поставлены следующие задачи:

- сформулировать обоснованные требования и выработать рекомендации относительно ДОП, перспективных для эффективной и высококачественной компрессии цифровых аудиоданных;

- исследовать допустимую степень округления (ДСО) коэффициентов перспективных ДОП с учетом их частотных свойств и взаимосвязи основных психоакустических свойств слуха и выработать рекомендации относительно допустимой степени ограничения разрядности двоичного представления коэффициентов указанных преобразований;

- исследовать эффективность прореживания коэффициентов перспективных ДОП и выработать рекомендации относительно наиболее целесообразного ДОП, а также рациональных значений частоты дискретизации (Fn) и динамического диапазона (D);

- разработать методики и провести экспериментальное исследование эффективности сжатия цифровых аудиоданных с прореживанием спектра.

Объектом исследования являются новые цифровые технологии для систем обработки и передачи цифровой аудиоинформации.

Предметом* исследования являются высококачественные системы сжатия цифровых аудиоданных.

Методы исследования. При решении поставленных задач использовались методы спектрального анализа, теории вероятностей и математической статистики, теории цифровой обработки сигналов, результаты экспериментальных исследований психоакустических свойств слуха и статистических свойств ЗС, компьютерное моделирование.

Научная новизна работы состоит в развитии методов цифровой обработки аудиоинформации и заключается в следующем:

- разработан метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора человека;

- получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

- разработан алгоритм прореживания коэффициентов гармонических дискретных ортогональных преобразований, учитывающий особенности восприятия слухом компонент сжатого спектра;

- разработан метод оценки частотной области целесообразной для прореживания в заданном рабочем диапазоне частот.

Вклад автора в разработку проблемы. Основные научные положения, теоретические выводы и рекомендации, а также методы экспериментальной обработки цифровых аудиоданных средствами математического моделирования, содержащиеся в диссертационной работе, получены автором самостоятельно.

Практическая ценность и реализация результатов работы. Полученные аналитические выражения и зависимости позволяют повысить производительность систем сжатия цифровой аудиоинформации при сохранении высоких качественных показателей.

Результаты работы могут быть использованы при разработке новых и усовершенствовании существующих цифровых технологий передачи и обработки ЗС. Разработанные методики экспериментальной обработки цифровых

•j аудиоданных могут быть использованы для оценки эффективности новых алгоритмов сжатия.

Основные теоретические и практические результаты, полученные в работе, использованы ФГУП СОНИИР и внедрены в учебный процесс ГОУВ-ПО Поволжского государственного университета телекоммуникаций и информатики г. Самара, что подтверждается соответствующими актами.

Апробация работы. Основные результаты и положения работы обсуждались и были одобрены на VIV - XVI Российских научных конференциях (Самара, 2007 - 2009), 6 Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Уфа, 2005), VII Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» (Самара, 2006), IX Международной научно-технической конференции «Проблемы техники и технологий телекоммуникаций» и

Казань, 2008), V Международной научно-технической конференции «Методы и средства управления технологическими процессами» (Саранск, 2009).

Публикации. Основное содержание диссертации отражено в 11 печатных работах, в том числе 2 статьи в научных изданиях, входящих в перечень ВАК, и 9 тезисов и текстов докладов на Российских и Международных конференциях.

Достоверность полученных результатов и положений работы обосновывается корректной интерпретацией параметров эффективности сжатия ЗС и строгим использованием математического аппарата в процессе выводов аналитических выражений. Подтверждается оценками экспертной комиссии при прослушивании сжатых цифровых аудиоданных, взятых с компакт-диска EBU-SOAM, Cat. № 422 204-2, рекомендуемого для таких испытаний исследовательской группой MPEG, а также научными трудами и апробациями на представительных научных форумах.

Основные положения, выносимые на защиту:

- метод оценки распределения допустимой степени округления коэффициентов гармонических дискретных ортогональных преобразований, учитывающий их частотные характеристики и свойства слухового анализатора* человека;

- аналитические выражения для оценки вероятности маскировки коэффициентов гармонических дискретных ортогональных преобразований любым участком кривой маскировки;

- метод оценки частотной области целесообразной для прореживания, в заданном рабочем диапазоне частот;

- результаты компьютерного моделирования обработки цифровой аудиоинформации.

Структура и объем работы. Материал диссертации состоит из введения, четырех глав основной части, заключения, списка использованной литературы и приложений. Основная часть работы содержит 146 страниц машинописного текста, 64 рисунка, 10 таблиц. Список литературы включает 168

Похожие диссертационные работы по специальности «Системы, сети и устройства телекоммуникаций», 05.12.13 шифр ВАК

Заключение диссертации по теме «Системы, сети и устройства телекоммуникаций», Стефанов, Михаил Александрович

Выводы по главе 4

1. Для системы MATLAB + Simulink разработана методика компьютерного моделирования прореживания спектра с округлением коэффициентов ДКП.

2. Результаты экспериментальной проверки основных положений данной работы позволяют считать их достаточно достоверными.

3. Предложенный в работе метод сжатия с прореживанием спектра позволяет повысить эффективность кодирования при сохранении высокого качества субъективного восприятия звука.

В результате моделирования при высоких качественных показателях скорость цифрового потока относительно наилучшего алгоритма MPEG-2 ААС уменьшилась в 1,2 раза для музыкальных сигналов и в 1,3 раза для широкополосных речевых сигналов.

4. Алгоритм с поблочно плавающей запятой при определенных условиях достаточно чувствителен к прореживанию спектра. Тем не менее, целесообразно изыскание более эффективных алгоритмов кодирования, основанных на использовании аналитического описания кривых маскировки.

ЗАКЛЮЧЕНИЕ

Теоретические и экспериментальные исследования, выполненные в диссертационной работе, позволяют сформулировать следующие основные выводы и результаты:

1. На основе психофизиологических свойств слуха сформулированы требования, позволяющие обоснованно установить ДОП, перспективные для систем высококачественного сжатия цифровой аудиоинформации.

2. Разработан метод оценки распределения ДСО коэффициентов гармонических ДОП в пределах спектральной выборки, позволяющий рационально распределить биты при кодировании сжатого спектра с учетом достаточно высокого качества субъективного восприятия сжатого звука.

3. Получены аналитические выражения для оценки вероятности маскировки коэффициентов гармонических ДОП при различной их интерпретации и использовании всех ветвей кривой маскировки.

4. Разработан алгоритм прореживания спектра, позволяющий за счет изменения D и FA дополнительно повысить эффективность компрессии цифровых аудиоданных в 1,5 раза при достаточно высоком качестве субъективного восприятия сжатого звука.

5. Разработан метод оценки эффективной для прореживания области рабочего диапазона частот, расширяющий перспективу развития новых более эффективных методов кодирования сжатых цифровых аудиоданных.

6. Разработаны методики экспериментальной обработки цифровой аудиоинформации с прореживанием спектра средствами компьютерного моделирования, позволяющие оценить эффективность новых алгоритмов сжатия ЗС.

7. Результаты проведенных исследований могут быть полезны при разработке новых рациональных с точки зрения реализационной сложности и высокоэффективных кодеков для высококачественных систем цифровой обработки и передачи ЗС. Применение их в лабораторных условиях относительно наилучшего алгоритма кодирования MPEG-2 ААС практически при тех же качественных показателях, стандартных параметрах цифровых аудиоданных и без использования дополнительного статистического уплотнения позволило снизить скорость цифрового потока в 1,2 раза.

Список литературы диссертационного исследования кандидат технических наук Стефанов, Михаил Александрович, 2009 год

1. Синильников, A.M. Дифференциальная импульсно-кодовая модуляция с плавающей запятой / A.M. Синильников. //Техника средств связи: Сер. ТРПА. 1983. - Вып. 1. - С. 56-61.

2. Дельта-модуляция / М.Д. Венедиктов и др. М.: Связь, 1976. - 272 с.

3. Харатишвили, Н.Г. Дифференциальная импульсно-кодовая модуляция в системах связи / Н.Г. Харатишвили. М.: Радио и связь, 1982. — 135 с.

4. Свириденко, В.А. Анализ систем со сжатием данных / В.А. Свири-денко. -М.: Связь, 1977. 184 с.

5. Гуревич, В.Э. Импульсно-кодовая модуляция в многоканальной телефонной связи / В.Э. Гуревич, Ю.Г. Лопушнян, Г.В. Рабинович. М.: Связь, 1973.-336 с.

6. Пилипчук, Н.И. Адаптивная импульсно-кодовая модуляция / Н.И. Пилипчук, В.П. Яковлев. М.: Радио и связь, 1986. - 295 с.

7. Сапожков, М.А. Вокодерная связь / М.А. Сапожков, В.Г. Михайлов. М.: Радио и связь, 1983. - 248 с.

8. Грудинин, А.С. Кодирование сигналов звукового вещания в базисе дискретного косинусного преобразования / А.С. Грудинин, A.M. Синильников. // Техника средств связи: Сер. ТРПА. 1986. - Вып. 3. - С. 3-10.

9. Грудинин, А.С. Кодирование звуковых сигналов в спектральной области / А.С. Грудинин, Ю.А. Ковалгин. // Техника кино и телевидения. М.: Искусство, 1987. - №7. - С. 14-19.

10. Ковалгин, Ю.А. Компрессия цифрового звука: психоакустические основы и алгоритмы / Ю.А. Ковалгин. // Звукорежиссер. 2000. - №6. — С. 56-63.

11. Колесников, В.М. Спектральные методы сокращения избыточности высококачественных звуковых сигналов / В.М. Колесников и др. // Радио и телевидение ОИРТ. 1989. - №1. - С. 36-39.

12. Колесников, В.М. Спектральные методы сокращения избыточностивысококачественных звуковых сигналов / В.М. Колесников и др. // Радио и телевидение ОИРТ. 1989. - №2. - С. 35-39.

13. Синильников, A.M. Полосное кодирование звуковых сигналов с ортогональным преобразованием / A.M. Синильников. // Электросвязь. 1991. - №8. - С. 35-37.

14. Розенберг, Е.А. Построение аппаратуры адаптивного кодирования в спектральной области / Е.А. Розенберг, A.M. Синильников, Б.И. Шехтман. // Техника средств связи: Сер. ТРПА. 1989. - Вып. 1. - С. 9-16.

15. Blesser, В.А. Digitization of Audio: A Comprehensive Examination of Theory, Implementation, and Current Practice I B.A. Blesser. // Journal of the Audio Engineering Society. 1987. -№10. - Vol. 26. - P. 739-771.

16. Brandenburg, K. OCF: Coding High Quality Audio with Data Rates of 64 kbit/sec / K. Brandenburg. // Proc. 85th Conv. Aud. Eng. Soc., Preprint #2723. -Mar. 1988.-P. 813-817.

17. Brandenburg, K. ASPEC: Adaptive Spectral Entropy Coding of High Quality Music Signals / K. Brandenburg et. al. // Proc. 90th Conv. Aud. Eng. Soc., Preprint #3011.-Feb. 1991.- 1025-1029.

18. Brandenburg, K. Transform coding of high quality digital audio at low bitrates-algorithms and implementation / K. Brandenburg et. al. // Proc. of the 1990 Int. Conf. on Acoustics, Speech and Signal Processing ICASSP. 1990. - P. 322.2.1-322.2.5.

19. Princen, J. Subband/transform coding using filter bank desingnsbased on time domain aliasing cancellation / J. Princen, A. Johnson, A. Bradley. //Proc. of the 1987 Int. Conf. on Acoustics, Speech and Signal Processing ICASSP. 1987. -P. 2161-2164.

20. Richardson, E.B. Subband coding with adaptive prediction for 56 kbit/sec audio / E.B. Richardson, N.S. Jayant. // IEEE Trans. Acoust., Speech, Signal Processing. April. 1986. - Vol. ASSP-34. - P. 691-696.

21. Smyth, M. APT-X100: A low-delay, low bit-rate, sub-band ADPCM audio-coder for Broadcasting I M. Smyth, S. Smyth. // Proceeding of the 10th International AES Conference. 1991. - P. 41-56.

22. International Standard ISO/IES 11172-3. Information technology Coding of moving pictures and associated audio for digital storage media at up to about 1,5 Mbit/s. Part 3: Audio. - 1993-08-01.

23. International Standard ISO/IES 13818-3. Information technology-Generic Coding of moving pictures and associated audio information. Part 3: Audio.-1995-05-15.

24. International Standard ISO/IES 13818-7. Information technology-Generic Coding of pictures and associated audio information. Part 7: Advanced Audio Coding (AAC). - 1997(E).

25. ISO/IES FCD 14496-3 Subpart 1. Information Technology-Very Love Bit rate Audio-Visual Coding. Part 3: Audio. - 1998-05-10 (ISO/JTC 1/SC 29, N2203).

26. Digital Audio Compression Standard (AC-3)//Doc. A/52. 1995-12-20.

27. Musman, H.G. Kompressionsalgoritmen fuer interaktive Multimedia-System / H.G. Musman, O. Werner, H. Fuchs. // Informationstechnik und Tech-nische Informatik. 1993. -N2. - S. 4-18.

28. Ковалгин, Ю.А. Цифровое кодирование звуковых сигналов / Ю.А. Ковалгин, Э.И. Вологдин. СПб.: КОРОНА-принт, 2004. - 240 с.

29. ITU-R Recommendation "Method for objective Measurements of Perceived Audio Quality" (Document 10-4/19-E, 19 March 1998).

30. Theile, G. MUSICAM Surround: The universal multi-channel coding system / G. Theile, G. Stoll. // 17. Tonmeistertagung, Karlsruhe, Bericht. 1992. -S. 96-108.

31. Артюшенко, B.M. Цифровое сжатие видеоинформации и звука: учеб. пособие / В.М. Артюшенко, О.И. Шелухин, М.Ю. Афонин; под ред. В.М. Артюшенко. М.: Дашков и К, 2003. - 426 с.

32. Стефанов, М.А. Дискретные ортогональные преобразования как инструмент сжатия звуковых сигналов / М.А. Стефанов, Э.А. Акчурин. / XIV Российская науч. конф.: тез. докладов. Самара, 2007. - С. 147-148.

33. Стефанова, И.А. К выбору ортогональных преобразований для эффективного сжатия звуковых сигналов / И.А. Стефанова. // IX Российская науч. конф.: тез. докладов. Самара, 2002. - С. 133.

34. Цифровое радиовещание / С.Г. Рихтер. М.: Горячая линия - Телеком, 2004.-352 с.

35. Дворецкий, И.М. Цифровая передача сигналов звукового вещания / И.М. Дворецкий, И.Н. Дриацкий. М.: Радио и связь, 1987. - 192 с.

36. Стефанов, A.M. Применение порогового восприятия слухом интенсивности звука в сжатии звуковых сигналов / A.M. Стефанов, И.А. Стефанова. // X Российская науч. конф.: тез. докладов. — Самара, 2003. — С. 188-189.

37. Стефанова, И.А. Оценка допустимой степени округления спектральных компонент звуковых сигналов / И.А. Стефанова. // 6 Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: сб.докладов. Уфа, 2005. - С. 36-38.

38. Цвикер, Э. Фельдкеллер Р. Ухо как приемник информации / Э. Цви-кер, Р. Фельдкеллер; пер. с нем. под ред. Б.Г. Белкина. М.: Связь, 1971. -256 с.

39. Моисеев, М.Н. Кодирование высококачественных звуковых сигналов в частотной области / М.Н. Моисеев, A.M. Синильников. // Электросвязь. 1988. -№8. - С. 34-36.

40. Zwicker, Е. Psychoacoustic / Е. Zwicker. Springier, Verlag, Berlin, Heidelberg, New York, 1982. - 326 p.

41. Стефанова, И.А. О возможности использования эффекта маскировки в сжатии звуковых сигналов / И.А. Стефанова, A.M. Стефанов. // VIII Российская науч. конф.: тез. докладов. Самара, 2001. - Ч. 1. — С.178-179.

42. Zelinsky, R. Adaptive transform coding of speech signal / R. Zelinsky, P. Noll. // IEEE Trans. Commun. 1977. - Vol. ASSP-25, № 4. - P. 1392-1401.

43. Бабуркин, B.M. Электроакустика и радиовещание / B.M. Бабуркин, Г.С. Гензель, Н.Н. Павлов. М.: Связь, 1967. - 312 с.

44. Бернар, Ж. Руководство по записи звука / В.А. Свириденко; пер. с фр. М.: Сов. радио, 1962. - 112 с.

45. CCIR. Document СМТТ. 1974. - N 1059.- Р. 1-29.

46. Ржевкин, С.Н. Некоторые результаты анализа певческого голоса / С.Н. Ржевкин. // Акустический журнал. 1956. — т. 11. — №2. - С. 205-210.

47. Church, S. ISDN and ISO/MPEG Layer III Audio Coding: Powerful

48. New Tools for Broadcast Audio Production / S. Church. //AES an audio engineerthing society preprint. The 95 Convention. New York, 1993. - October. - P. 7-10.

49. Church, S. ISDN and ISO/MPEG Layer III Audio Coding: Powerful New Tools for Broadcast Audio Production / S. Church, B. Grill, H. Popp. // Preprints

50. AES 96th Convention. Amsterdam, 1994. - February, 26-March, 01. - P. 10.

51. Theiie, G. Low bit-rate coding of high-quality audio signals. An introduction to the MASCAM system / G. Theiie, G. Stall, M. Link. // EBU Review-Technical. 1988. -№ 230. - P. 158-181.

52. Thiede, T. Arbeitsweise und Eigenschaften von Verfahren zur Gehoer-richtigen Qualitaetsbewertung von Bitratenreduzierten Audiosignalen / T. Thiede, G. Steinke. // Rundfunktechnische Mitteilungen, Jahrgang 38. 1994. - № 3. - S. 102-114.

53. Wiese, D. Optimierung von Fehlererkennung und verschleierung fur ISO/MPEG/AUDIO Codecs / D. Wiese. // Tonmeistertagung, Karlsruhe, Bericht. 1992.-№ 17.-S. 109-116.

54. Стефанова, И.А. Оптимизация временного параметра эффективности сжатия звуковых сигналов / И.А. Стефанова, М.А. Стефанов. // 6 Междунар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: сб. докладов. Уфа, 2005. - С. 38-40.

55. Банк, М.У. Формирование выборки звукового сигнала при спектральном преобразовании / М.У. Банк, В.А. Сучилин. // Электросвязь. — 1990. -№1.- С. 28-30.

56. Самусев, Р.П. Атлас анатомии человека / Р.П. Самусев, В.Я. Лип-ченко. 5-е изд., перераб. и доп. - М.: ООО «Издательский дом «ОНИКС 21 век»: ООО «Мир и Образование», 2002. - 544 с.

57. Bekesy, G. Uber ein neues Audiometer / G. Bekesy. // AEU. 1947. — No.l.-P. 13.

58. Радиовещание и электроакустика: учеб. пособие для вузов / С.И. Алябьев и др.; под ред. Ю.А. Ковалгина. М.: Радио и связь, 2002. - 798 с.

59. Стефанов, М. А. Эффективные дискретные ортогональные преобразования в компрессии цифровых аудиоданных / М. А. Стефанов. // ИКТ. — 2009. т. - №.-С.-.

60. Loeve, М. Probability Theory / М. Loeve. — Van Nostrand Company Inc., New Jersey, 1955. — 710 p.

61. Andrews, H.C. A Generalized Technique For Spectral Analysis / H.C. Andrews, K.L. Caspari. // IEEE Trans. Computers. 1970. - C-19. - P. 16-25.

62. Cooley, J.W. An Algorithm for the Machine Calculation of Complex Fourier Series / J.W. Cooley, J.W. Tukey. // Mathematics Computation. 1965. -Vol. 19.-P. 297-301.

63. Ahmed, N. Cooley-Tukey type Algorithm for the Haar Transform / N. Ahmed, T. Natarajan, K.R. Rao. II Electronics Letters. 1973. - Vol. 9. - P. 276278.

64. Ahmed, N. Some Considerations of the Modified Walsh-Hadamard and Haar Transforms / N. Ahmed, T. Natarajan, K.R. Rao. // Symposium Applications of Walsh Functions. 1973. -P. 91-95.

65. Haar, A. Zur Theorie der Orthogonalen Funktionensysteme / A. Haar. // Mathematics Analytical. 1910. -No. 69. - P. 331-371.

66. Haar, A. Zur Theorie der Orthogonalen Funktionensysteme / A. Haar. // Mathematics Analytical. 1912. -No. 71. - P. 38-53.

67. Nagy, B.S. Introduction to Real Functions and Orthogonal Expansions / B.S. Naggy. // New York Oxford University Press. 1965.

68. Andrews, H.C. A Generalized Technique For Spectral Analysis / H.C. Andrews, K.L. Caspari. // IEEE Trans. Computers. 1970. - C-19. - P. 16-25.

69. Glassman, J.A. A Generalization of the Fast Fourier Transform / J.A. Glassman. // IEEE Trans. Computers. 1970. - C-19. - P. 105-116.

70. Ahmed, N. On Matrix Partitioning and a Class of Algorithms / N. Ahmed, S.M. Cheng. // IEEE Trans. Education. 1970. - Vol. E-13. - P. 103-105.

71. Pratt, W.K. Hadamard Transform Image Coding / W.K. Pratt, H.C. Andrews. // Proc. IEEE. 1969. - Vol. 57. - P. 58-68.

72. Manz, J.W. A Sequence-Ordered Fast Walsh Transform / J.W. Manz. II IEEE Trans. Audio and Electro Acoustics. 1972. - Vol. AU-20. - P. 204-205.

73. Ohnsorg, F. Binary Fourier Representation / F. Ohnsorg. // Spectrum Analysis Techniques Symp. -20-21 Sept., 1966. P. 60-69.

74. Ahmed, N. Wolsh Functions and Hadamard Transform / N. Ahmed,

75. K.R. Rao. // Wolsh Functions Symposium. Springfield, 1972. - P. 8-13.

76. Harmuth, H.F. Transmission of Information by Orthogonal Functions / H.F. Harmuth. New York, Heidelberg, Berlin: Springer, 1972. - 160 p.

77. Ahmed, N. On Notation and Definition of Terms Related to a Class of Complete Orthogonal Functions / N. Ahmed, H. Schreiber, P. Lopresti. // IEEE Trans. Electromagnetic Compatability. 1973. - Vol. EMC-15. - P. 75-80.

78. Boesswetter, C. Analog Sequence Analysis and Synthesis of Voice Signals / C. Boesswetter. // Walsh Functions Symposium. 1970. - P. 220-229.

79. Robinson, G. Digital Sequence Decomposition of Voice Signals / G. Robinson, S.J. Campanella. // Walsh Functions Symposium. 1970. - P. 230-237.

80. Pratt, W.K. Slant Transforms for Image Coding / W.K. Pratt, L.R. Welch, W.H. Chen. // Symp. Applications of Walsh Functions. 1972. - P. 229234.

81. Chen, W.H. Color Image Coding with the Slant Transform / W.H. Chen, W.K. Pratt. // Symp. Applications of Walsh Functions. 1973. -P. 155-161.

82. Shibata, K. Waveform Analysis of Image Signals by Orthogonal Transformation / K. Shibata. // Symp. Applications of Walsh Functions. 1972. - P. 210-215.

83. Shibata, K. Block Waveform Coding of Image Signals by Orthogonal Transformation / K. Shibata. // Symp. Applications of Walsh Functions. 1973. -P. 137-143.

84. Воробьев, В.И. Теория и практика вейвлет-преобразований / В.И. Воробьев. СПб.: ВУС, 1999. - 202 с.

85. Астафьева, Н.М. Вейвлет-анализ: основы теории и примеры применения / Н.М. Астафьева. // Успехи Физических Наук. 1996. - Т. 166. — № 11. -С. 1145-1170.

86. Переберин, А.В. О систематизации вейвлет-преобразований / А.В. Переберин. // Вычислительные методы и программирование. — 2001. Т. 2. — С.133-158.

87. Поликар, Р. Введение в вейвлет-преобразование / Р. Поликар; пер. сангл. В.Г. Грибунина. СПБ.: АВТЭКС, 2001. - 59 с.

88. Дьяконов, В.П. Вейвлеты. От теории к практике / В.П. Дьяконов. -Изд. 2-е, дополненное и переработанное. М.: Солон-Р, 2004. - 400 с.

89. Новиков, JI.B. Основы вейвлет-анализа сигналов: учеб. пособие / JI.B. Новиков. СПб: ООО «Модус+», 1999. - 208 с.

90. Добеши, И. Десять лекций по вейвлетам / И. Добеши; пер. с англ. Е.В. Мищенко; под ред. А.П. Петухова. М.: РХД, 2001. - 461 с.

91. Чуй, К. Введение в вейвлеты / К. Чуй; пер. с англ. под ред. Я.М. Жилейкина. М.: Мир, 2001. - 412 с.

92. Дремин, И.М. Вейвлеты и их использование / И.М. Дремин, О.В. Иванов, В.А. Нечитайло. // Успехи Физических Наук. 2001. - Т. 171. - № 5. -С. 445-501.

93. Morlet, Jean. Decomposition of Hardy functions into square integrable wavelets of constant shape / Jean Morlet, Alex Grossman. // SIAM Journal of Mathematical Analysis.- 1984.-Vol. 15.-No. 4.-P. 723-736.

94. Van De Villem, Dimitri. Activelets and sparsity: a new way to detect brain activation from fMRI data / Dimitri Van De Ville, Jalal Fadili, Michael Un-ser. // Wavelets XII Conference 6701-Proceedings of SPIE Optics and Photonics,, Volume 6701.-2007.

95. Sardy, Sylvain. AMlet and GAMlet: Automatic Nonlinear Fitting of Additive Models and Generalized Additive Models with Wavelets / Sylvain Sardy, Paul Tseng. // Journal of Computational and Graphical Statistics. 2004.

96. Lian, J. A. Analysis-Ready Multiwavelets (Armlets) for processing scalar-valued signals / J. A. Lian, С. K. Chui. // Signal Processing Letters. 2007. -Vol. 11.-No. 2.-P. 205-208.

97. Erwan, Le Pennec. Image compression with geometrical wavelets / Le Pennec Erwan, Steiphane Mallat. // International Conference on Image Processing (ICIP). Vancouver, 2000. - P. 605-608.

98. Monro, D. M. Orthogonal wavelets with balanced uncertainty / D. M. Monro, В. E. Bassil, G. J. Dickson. // International Conference on Image Processing (ICIP). -1996. P. 581-584.

99. Donoho, David. Beamlets and Multiscale Image Processing / David Donoho, Xiaoming Huo. Stanford, 2001. - 198 p.

100. Meyer, Francis G. Brushlets: a tool for directional image analysis and image compression / Francis G. Meyer, Ronald R. Coifman. // Applied and Computational Harmonic Analysis. -1997. Vol. 4. - P. 147-187.

101. Ron, A. Caplets: wavelets without wavelets / A. Ron. // 29th Annual Spring Lecture Series, Recent Developments in Applied Harmonic Analyis, Multiscale Geometric Analysis. 2004. - P. 55-60.

102. Do, M. N. Contourlets: A Directional Multiresolution Image Representation / M. N. Do, M. Vetterli. // Proc. of IEEE International Conference on Image Processing (ICIP). Rochester, 2002. - P. 433-436.

103. Coifman, R. Noiselets / R. Coifman, F. Geshwind, Y. Meyer. // Appl. Сотр. Harmonic Analysis. 2001. - No. 10. - P. 27-44.

104. Gopinath, Ramesh A. The phaselet transform — an integral redundancy nearly shift-invariant wavelet transform / Ramesh A. Gopinath. 2004.

105. Rajpoot, N. Planelets: A new analysis tool for planar feature extraction / N. Rajpoot, R. Wilson, Zhen Yao. // International Workshop on Image Analysis for Multimedia Interactive Services (WIAMIS). 2004.

106. Goodman, T. N. T. On refinement equations determined by Polya frequency sequence / T. N. T. Goodman, C. A. Micchelli. // SIAM J. Math. Anal. -1997. Vol. 23. - P. 766-784.

107. Refregier, Alexandre. Shapelets: A New Method to Measure Galaxy Shapes / Alexandre Refregier, David Bacon. // Proceedings of the Workshop "The Shapes of Galaxies and their Halos". -Yale, 2001.

108. Clerc, Maureen. The Texture Gradient Equation for recovering Shape from Texture / Maureen Clerc, Stephane Mallat. // IEEE Transactions on Pattern Analysis and Matching Intelligence. 2002. - Vol. 24. - No. 4. - P. 536-549.

109. Величкин, А.И. Теория дискретной передачи непрерывных сообщений / А.И. Величкин. М.: Сов. Радио, 1970. - 296 с.

110. Шитов, А.В. Статистические характеристики сигналов, представляющих натуральные звучания, и их применение при исследовании электроакустических систем / А.В. Шитов, Б.Г. Белкин. // НИКФИ: сб. трудов. -1976.-Вып. 56.-С. 77-174.

111. Кнель, Г.С. Нелинейные искажения сигналов вещания при передаче их способом А-модуляции / Г.С. Кнель, А.К. Оксман, B.C. Пекедов. // Вопросы радиотехники. Сер. ТПС. 1968. - №2. - С. 13-18.

112. Fourier, J. Theorie analytique de la chaleur / J. Fourier. Paris, 1822. —90 s.

113. Снеддон, И. Преобразования Фурье / И. Снеддон. М.: ИЛ, 1955.58 с.

114. Cooley, J. W. The Finite Fourier Transform / J. W. Cooley. // IEEE Trans. Audio and Electroacoustics. 1969. - Vol. AU-17. - P. 77-85.

115. Рабинер, Л. Теория и применение цифровой обработки сигналов / Л. Рабинер, Б. Гоулд; пер. с англ.; под ред. Ю.И. Александрова. М.: Мир, 1978.-540 с.

116. Оппенгейм А.В. Цифровая обработка сигналов / А.В. Оппенгейм, Р.В. Шафер; пер. с англ. под ред. С.Я. Шаца. М.: Связь, 1979. - 416 с.

117. Прудников, А. П. Интегралы и ряды / А. П. Прудников, Ю. А. Брычков, О.И. Маричев. М.: Наука, 1981. - 800 с.

118. Danielson, G.C. Some Improvements in Practical Fourier Analysis and Their Application to X-Ray Scattering From Liquids / G.C. Danielson, C. Lanczos. // J. Frankin Inst. 1937. - Vol. 233 - P. 365-380, 435-452.

119. Goertzel, G. An Algorithm for the Evaluation of Finite Trigonometric Series / G. Goertzel. // Amer. Math. Monthly. 1958. - Vol. 65. - P. 34-35.

120. Голд, Б. Цифровая обработка сигналов / Б. Голд, Ч. Рэйдер; пер. с англ. М.: Сов. радио, 1973. - 368 с.

121. Gentleman, W.M. Fast Fourier Transforms for Fun and Profit / W.M. Gentleman, G. Sande. // AFIPS Conf. Proc. - 1966. - Vol. 29. - P. 563-578.

122. Singleton, R.C. An Algorithm for Computing the Mixed Radix Fast

123. Fourier Transform / R.C. Singleton. // IEEE Trans. Audio Electroacoust. 1969. -Vol. AU-17.-P. 93-103.

124. Bergland, G.D. A Fast Fourier Transform Algorithm Using Base 8 Iterations / G.D. Bergland. // Math. Computation. 1968. - Vol. 22. - P. 275-279.

125. Bergland, G.D. A Guided Tour of the Fast Fourier Transform / G.D. Bergland. // IEEE Spectrum. 1969. - Vol. 6. - P. 41-52.

126. Сергиенко, А.Б. Цифровая обработка сигналов / А.Б. Сергиенко. -СПб: Питер, 2002. 608 с.

127. Айфичер, Э.С. Цифровая обработка сигналов: практический подход / Э.С. Айфичер, Джервис, У. Барри; пер. с англ. М.: Изд. дом «Вильяме», 2004. - 992 с.

128. Hartley, R.V.L. / R.V.L. Hartley. // Proceedings of the IRE. 1942. -Vol. 30.-P. 75-79.

129. Брейсуэлл, P. Преобразование Хартли / P. Брейсуэлл. M.: Мир, 1990.- 176 с.

130. Bracewell, R.N. / R.N. Bracewell. // J. Opt. Soc. Amer. 1983. -Vol.73.-P. 44-47.

131. Брейсуэлл, P.H. / P.H. Брейсуэлл. // ТИИЭР. 1984. - Т. 72. - №8. -С. 97-101.

132. Per, S.C. / S.C. Per, Wul. // Electron. Lett. 1986. - Vol. 22. - №1. -P. 188-190.

133. Злобин, С. JI., Стальной А. Я. Матричный рекуррентный алгоритм быстрого преобразования Хартли с естественным порядком адресации входной и выходной информации / С. Л. Злобин, А. Я. Стальной. // Радиотехника. -2000,-№4.- С. 12-18.

134. Ahmed, N. Discrete Cosine Transform / N. Ahmed, Т. Natarajan, K.R. Rao. // IEEE Trans. Computers. 1974. - Vol. C-23. - P. 90-93.

135. Fike, C.T. Computer Evaluation of Mathematical Functions / C.T. Fike. Englewood Cliffs, N.J.: Prentice Hall, 1968. - 205 s.

136. Кей, C.M. Современные методы спектрального анализа / С.М. Кей.

137. ТИИЭР. 1981. — №11. - С. 5-51.

138. Ахмед, Н. Ортогональные преобразования при обработке цифровых сигналов / Н. Ахмед, К.Р. Рао; пер. с англ. под ред. И.Б. Фоменко. М.: Связь, 1980.-248 с.

139. Bellman, R. Introduction to Matrix Analysis / R. Bellman. New York: McGraw-Hill, I960. - 157 p.

140. Grenander, V. Toeplitz Forms and Their Applications / V. Grenander, G. Szego. Berceley and Los Angeles: University of California Press, 1958. - 95 p.

141. Стефанов, M.A. Оценка допустимой степени округления фазы спектральных компонент звуковых сигналов / М.А. Стефанов. // VII Между-нар. науч.-техн. конф. «Проблемы техники и технологий телекоммуникаций»: материалы конференции. Самара, 2006. - С. 171-173.

142. Стефанов, М.А. Особенности округления спектральных компонент звуковых сигналов / М.А. Стефанов. // XV Российская науч. конф.: тез. докладов. Самара, 2008. - С. 185.

143. Richards, D.R. Statistical properties of speech signals / D.R. Richards. // Proc. IEE. 1964. - Vol. 111. - № 5. - P. 941-948.

144. Римский-Корсаков, A.B. Статистические свойства радиовещательного сигнала / A.B. Римский-Корсаков. // Акустический журнал. 1960. - т.6. -Вып. 3.-С. 360-369.

145. Ферсман, Б.А. Экспериментальное исследование статистических свойств музыкальных и речевых радиовещательных сигналов / Б.А. Ферсман. // Акустический журнал. 1957. - №3. - С. 274-281.

146. Горон, И.Е. Радиовещание /И.Е. Горон. М.: Связь, 1979. - 368 с.

147. Стефанов, М.А. Оценка ширины полосы концентрации энергии коэффициентами ДОП / М.А. Стефанов. // IX Междунар. науч.-техн. конф.

148. Проблемы техники и технологий телекоммуникаций»: материалы конференции. Казань, 2008. - С. 140-141.

149. Дрейпер, Н. Прикладной регрессионный анализ / Н. Дрейпер, Г. Смит. М.: Финансы и статистика, 1996. - 336 с.

150. Ферстер, Э. Методы корреляционного и регрессионного анализа / Э. Ферстер, Б. Ренц. — М.: Финансы и статистика, 1983. — 302 с.

151. Акчурин, Э. А. Энергетический параметр высококачественной эффективной компрессии цифровых аудиоданных / Э.А. Акчурин, A.M. Стефанов, М. А. Стефанов. // ИКТ. 2009. - т. 7. - № 2. - С. 82-87.

152. Стефанов, М.А. Реализация округления коэффициентов дискретных ортогональных преобразований / М.А. Стефанов, A.M. Стефанов, И.А. Стефанова. // XV Российская науч. конф.: тез. докладов. Самара, 2008. - С. 188.

153. Финк, JT.M. Теория передачи дискретных сообщений / JI.M. Финк. -М.: Сов. радио, 1970. 727 с.154. 101. Гольденберг, JI.M. Цифровая обработка сигналов: справочник / Л.М. Гольденберг, Б.Д. Матюшкин, М.Н. Поляк. М.: Радио и связь, 1985. -457 с.

154. Вентцель, Е.С. Теория вероятностей и ее инженерные приложения / Е.С. Вентцель, Л.А. Овчаров. М.: Наука, 1988. - 480 с.

155. Стефанов, A.M. Эффективное использование интегрирующей способности слуха при цифровой обработки сигналов / A.M. Стефанов, И.А. Стефанова. // 3 Междунар. науч.-техн. конф. «Цифровая обработка сигналов»: сб. докладов. М., 2000. - т. З.-С. 137-141.

156. Стефанова, И.А. Аппроксимация основных характеристик слухового анализатора / И.А. Стефанова. // Акустический журнал. 2003. - т.49. -№ 2. - с. 245-249.

157. Стефанова, И.А. К оценке вероятности маскировки спектральных компонент звуковых сигналов / И.А. Стефанова, A.M. Стефанов. // XVI Российская науч. конф.: материалы конференции. — Самара, 2009. Ч. 2. — С. 8.

158. Музыкальная энциклопедия: в 6 т. / гл. ред. Ю.В. Келдыш. М.: Советская энциклопедия, 1978 - 6 т.

159. Глухов, А.А. Статистические исследования скважности сигналов программ центрального вещания / А.А. Глухов. // Электросвязь. 1972. - № 6.-С. 4-11.

160. Дьяконов, В.П. MATLAB 6.5 SPI/7 + Simulink 5/6. Обработка сигналов и проектирование фильтров. / В.П. Дьяконов. — М.: СОЛОН-Пресс, 2005.-576 с.

161. Черных, И.В. SIMULINK: среда создания инженерных приложений / И.В. Черных; под ред. В.Г. Потемкина. М.: ДИАЛОГ-МИФИ, 2003. -496 с.

162. Стефанов, М.А. К выбору способа нормировки коэффициентов ДОП при цифровой обработке звукового сигнала / М.А. Стефанов. // XVI Российская науч. конф.: тез. докладов. Самара, 2009. - ч.2 - С. 12.

163. Стефанов, М.А. Особенности цифровой обработки звуковых сигналов в системе MATLAB / М.А. Стефанов. // XVI Российская науч. конф.: тез. докладов. Самара, 2009. - ч.2 - С. 13.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.