Адаптивное скалярное квантование спектральных коэффициентов для систем сжатия аудио сигналов тема диссертации и автореферата по ВАК РФ 05.13.01, кандидат технических наук Поров, Антон Викторович

  • Поров, Антон Викторович
  • кандидат технических науккандидат технических наук
  • 2009, Санкт-Петербург
  • Специальность ВАК РФ05.13.01
  • Количество страниц 136
Поров, Антон Викторович. Адаптивное скалярное квантование спектральных коэффициентов для систем сжатия аудио сигналов: дис. кандидат технических наук: 05.13.01 - Системный анализ, управление и обработка информации (по отраслям). Санкт-Петербург. 2009. 136 с.

Оглавление диссертации кандидат технических наук Поров, Антон Викторович

ВВЕДЕНИЕ.

1. ОБЗОР МЕТОДОВ КОДИРОВАНИЯ СПЕКТРАЛЬНЫХ КОЭФФИЦИЕНТОВ ДЛЯ СИСТЕМ СЖАТИЯ АУДИО СИГНАЛОВ.

1.1. Кодирование аудио сигнала.

1.1.1. Блок фильтров.

1.1.2. Модель субъективного восприятия.

1.1.3. Распределение бит.

1.1.4. Сжатие информации без потерь.

1.1.5. Формирование битового потока.

1.2. Сжатие информации с потерями.

1.2.1. Теоретико-информационные пределы эффективности кодирования при сжатии с потерями.

1.2.2. Классификация методов квантования.

1.2.3. Ограничения на выбор метода квантования.

1.2.4. Оптимальные методы скалярного квантования.

1.2.5. Избыточность скалярного квантования.

1.2.6. Сравнение методов скалярного квантования.

1.3. Постановка задачи построения адаптивного скалярного квантования для системы кодирования аудио сигналов.

1.4. Результаты и выводы.

2. ИНФОРМАЦИОННЫЕ ХАРАКТЕРИСТИКИ ПОТОКА АУДИО ДАННЫХ.

2.1. Методы вычисления функции скорость-искажение источника данных.

2.2. Предварительная обработка спектральных коэффициентов для вычисления информационных характеристик.

2.3. Построение модели одномерного распределения.

2.4. Вычисление информационных характеристик реального сигнала.

2.5. Результаты и выводы.

3. СКАЛЯРНОЕ КВАНТОВАНИЕ.

3.1. Характеристики скалярного квантования.

3.2. Границы эффективности скалярного квантования.

3.3. Оптимальное скалярное квантование.

3.4. Скалярное квантование с расширенной нулевой зоной.

3.5. Адаптивное скалярное квантование с расширенной нулевой зоной.

3.6. Результаты и выводы.

4. ПЕРЦЕПТУАЛЬНАЯ ЭНТРОПИЯ И УПРАВЛЕНИЕ КВАНТОВАНИЕМ.

4.1. Вычисление допустимого уровня шума квантования.

4.2. Перцептуальная энтропия.

4.3. Управление квантованием.

4.4. Определение параметров скалярного квантования с расширенной нулевой зоной.

4.5. Вычисление перцептуальной энтропии для квантования с расширенной нулевой зоной.

4.6. Результаты и выводы.

5. ЭФФЕКТИВНОСТЬ ПРИМЕНЕНИЯ КВАНТОВАНИЯ С РАСШИРЕННОЙ НУЛЕВОЙ ЗОНОЙ В АУДИО КОДЕКЕ.

5.1. Передача аудио данных.

5.2. Спектральная обработка аудио данных и сжатие информации без потерь.

5.3. Результаты применения квантования с расширенной нулевой зоной в аудио кодеке.

5.4. Результаты и выводы.

Рекомендованный список диссертаций по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Введение диссертации (часть автореферата) на тему «Адаптивное скалярное квантование спектральных коэффициентов для систем сжатия аудио сигналов»

Актуальность. Алгоритмы сжатия аудио информации используются для получения компактного представления аудио сигналов. Эффективность сжатия важна с точки зрения уменьшения затрат на передачу информации по каналам связи или хранения информации на цифровом носителе. Целью кодирования аудио сигнала является представление сигнала наименьшим числом бит при условии, что последующее его воспроизведение удовлетворительно с точки зрения субъективного восприятия. Разработка устройства кодирования опирается на особенности восприятия аудио сигналов человеком. Эти особенности в большей степени зависят от спектрального состава сигнала, совместного влияния спектральных коэффициентов друг на друга и частотного диапазона. Квантование является одной из основных составляющих алгоритмов кодирования аудио информации.

Так как в реальных системах сжатия аудио информации качество передачи зависит от выбранного способа квантования, то актуальной является задача разработки алгоритмов квантования спектральных коэффициентов, обеспечивающих необходимое качество передачи сигнала и большую эффективность сжатия. Актуальным является также определение характеристик способов квантования, позволяющих предварительно оценить эффективность сжатия и выбрать наилучшие параметры передачи аудио информации.

Цели и задачи исследования. Целью диссертационной работы является разработка способов квантования спектральных коэффициентов аудио сигнала.

Для достижения цели исследования необходимо решить следующие задачи:

• Построение математической модели квантуемых данных.

• Идентификация модели по выборке данных малого объема.

• Адаптивный выбор параметров квантователя в зависимости от кодируемого сигнала и параметров распределения.

• Адаптивное квантование спектральных коэффициентов в зависимости от требуемой ошибки квантования.

Предметом исследования является разработка и анализ алгоритмов квантования, учитывающих особенности субъективного восприятия аудио сигналов. Взаимосвязь квантования и субъективного восприятия в области аудио кодирования на сегодняшний день настолько тесная, что рассматривать их в отдельности практически невозможно.

Научная новизна. На основе анализа информационных характеристик модели и источника показано, что в качестве модели источника аудио данных может быть использовано одномерное обобщенное гауссово распределение. В работе показано, что анализ оценки параметров распределения данных позволяет более эффективно выбирать параметры скалярного квантователя. Характеристики предложенного метода квантования значительно превосходят характеристики наиболее часто применяемых алгоритмов скалярного квантования (Макса-Ллойда, равномерного) и близки к оптимальному скалярному квантованию в области низких скоростей кодирования.

Положения, выносимые на защиту:

• Алгоритм квантования с расширенной нулевой зоной, оптимизированный по скорости и ошибке кодирования.

• Алгоритм субоптимального квантования с расширенной нулевой зоной, позволяющий получить характеристики, близкие к предельно достижимым при всех распределениях вероятностей рассматриваемого класса.

• Алгоритм адаптивного скалярного квантования с расширенной нулевой зоной на основе модели распределения спектральных коэффициентов.

• Метод вычисления перцептуальной энтропии для квантования с расширенной нулевой зоной при заданных параметрах модели распределения спектральных коэффициентов.

Теоретическая значимость полученных результатов в ходе диссертационной работы заключается в следующем:

• Построена вероятностная модель для коэффициентов преобразования аудио сигналов ортогональными фильтрами.

• Исследована зависимость потенциальных характеристик эффективности квантования от параметров модели.

• Предложен алгоритм адаптации квантования к изменениям модели входных данных.

• Дан вывод новой формулы перцептуальной энтропии на основе аппроксимации функции скорость-искажение.

Практическая значимость полученных результатов в ходе диссертационной работы:

• Разработан алгоритм субоптимального квантования с расширенной нулевой зоной, обеспечивающий выигрыш порядка 0.5 дБ по сравнению с обычным равномерным квантованием при скорости порядка 1 бит на отсчет. Потери энергетической эффективности лежат в пределах 0.05 дБ от теоретически достижимого предела для скалярного квантования.

• Разработан метод вычисления оценки перцептуальной энтропии, позволяющий эффективно реализовать на практике адаптацию параметров квантования к изменению параметров сигнала.

• Применение на практике нового метода вычисления перцептуальной энтропии позволяет более эффективно осуществлять распределение бит между полосами спектра сигнала. Как следствие этого, уменьшается число итераций при управлении ошибкой квантования или скоростью кодирования.

• На основе проведенных экспериментов по интеграции квантования с расширенной нулевой зоной в аудио кодек показано, что достигается значительный выигрыш по скорости и увеличение качества (в среднем на 8.71 кбит/с и 0.44 дБ, что соответствует 14.44% и 2.25%, измеренной в дБ).

• Экспертные оценки слепого тестирования при фиксированной целевой скорости показали: при внедрении квантования с расширенной нулевой зоной в кодек субъективное качество существенно возросло (в среднем на 15.03 балла).

Апробация результатов. Основные положения и результаты диссертации докладывались на 8, 9 конференции аспирантов ГУАП, на 8 международной конференции «Цифровая обработка сигналов», публиковались в журнале «Цифровая обработка сигналов», оформлено 7 заявок на патенты США и докладывались на научных семинарах института прогрессивных технологий Самсунг и кафедре информационных систем ИТМО.

Структура диссертации. Диссертационная работа состоит из введения, пяти глав, списка использованных источников (59 наименований). Основная часть работы изложена на 136 страницах машинописного текста, содержит 54 рисунка и 6 таблиц. В первой главе диссертационной работы приведен обзор методов обработки и кодирования аудио сигналов. Особое внимание уделено методам квантования и сформулирована постановка задачи построения адаптивного скалярного квантователя в системе кодирования аудио сигналов. Вторая глава посвящена информационным характеристикам квантования и построению модели спектральных коэффициентов аудио данных. Третья глава посвящена анализу предлагаемого метода квантования и сравнению его информационных характеристик с другими известными методами квантования. В четвертой главе рассматриваются вопросы управления квантованием, построения оценки перцептуальной энтропии и приведены алгоритмы для нахождения необходимых параметров. Пятая глава демонстрирует результаты применения предлагаемого метода квантования в аудио кодеке.

Похожие диссертационные работы по специальности «Системный анализ, управление и обработка информации (по отраслям)», 05.13.01 шифр ВАК

Заключение диссертации по теме «Системный анализ, управление и обработка информации (по отраслям)», Поров, Антон Викторович

Заключение

В разделе 1.3 были сформулированы требования к разрабатываемому методу квантования на основе ограничений накладываемых областью применения и желаемых характеристик квантования. Рассмотрим, насколько эти требования выполнены для квантования с расширенной нулевой зоной.

Вычислительная сложность. Выражение (3.24) однозначно определяет процесс квантования данных методом КРНЗ. Нетрудно заметить, что вычислительная сложность предлагаемого метода и равномерного скалярного квантования практически идентичны.

Адаптивный выбор параметров квантования. Перед квантованием осуществляется анализ распределения данных в предположении, что оно относится к классу обобщенного гауссова распределения с некоторым параметром а. Согласно найденному параметру а (2.34) выбираются параметры квантования (4.25), учитывая тем самым свойства квантуемого сигнала.

Поведение R(D) в сравнении с другими методами квантования. Цепочка неравенств (3.17) демонстрирует, что кривая R{D) в случае ОКРНЗ лежит между функцией скорость-искажение источника и скорость-искажение оптимального равномерного скалярного квантования. Согласно рис. 3.6, функция скорость-искажение для случая КРНЗ лежит между кривыми R(D) для равномерного скалярного квантования и функцией скорость-искажение источника.

Управление ошибкой квантования. Возможность управления ошибкой квантования реализована с помощью аппроксимации параметров КРНЗ (шкала, масштабирующий коэффициент и скорость кодирования) таким образом, чтобы среднеквадратичная ошибка кодирования была ближе заданной, согласно (4.36).

Аппроксимация перг{ептуальной энтропии. В результате исследований в области аппроксимации функции скорость-искажение КРНЗ была найдена простая зависимость перцептуальной энтропии от параметров обобщенного гауссова распределения и требуемой ошибки квантования (4.42).

Отсюда следует, что КРНЗ удовлетворяет сформулированным требованиям. Результаты применения КРНЗ на практике (см. рис. 5.7, 5.8 и 5.9) показывают, что эффективность работы аудио кодека значительно выше, чем при совместном использовании процедуры оптимизации Макса-Ллойда. Основные результаты диссертации в области квантования подытожим в виде следующих выводов:

Результаты моделирования показывают, что в качестве модели распределения спектральных коэффициентов можно использовать обобщенное гауссово распределение с параметрами а и а, поскольку информационные характеристики R(D) модели и реальной последовательности практически совпадают. Типичное значение параметра а = 0.4.

Из-за наличия ограничений на вычислительную сложность предпочтительнее использовать скалярное квантование спектральных коэффициентов. Скалярное квантование с фиксированным числом квантов и оптимизацией только по ошибке кодирования дает значительно худший результат, чем равномерный скалярный квантователь (РСК) для ярко выраженных экспоненциальных распределений в диапазоне низких скоростей. В данном случае предпочтительнее оптимизация по скорости кодирования.

За счет некоторого увеличения ошибки с уменьшением скорости кодирования можно получить существенно лучшие результаты, чем возможны при использовании процедуры Макса-Ллойда или РСК. Этот эффект достигается с помощью квантования с расширенной нулевой зоны (КРНЗ).

Квантование ОКРНЗ и ОРСК весьма близко по своим характеристикам к оптимальному скалярному квантованию. Их недостаток - большое количество параметров, требуемых для описания.

Полученные результаты убеждают в том, что при всех распределениях вероятностей рассматриваемого класса, характеристики близкие к предельно достижимым, могут быть получены с помощью СОКРНЗ, т.е. квантователя, описываемого относительно небольшим числом параметров (шаг квантования Я, номер шкалы j, аппроксимирующее значение для младшего ненулевого кванта). Выигрыш СОКРНЗ по сравнению с обычным равномерным квантованием при скорости порядка 1 бит на отсчет может превышать 0.5 дБ, а проигрыш по сравнению с оптимальным скалярным квантованием находится в пределах 0.0.05 дБ.

Расчеты и моделирование для модели обобщенного гауссова распределения и для реальных потоков данных показывают, что методы квантования этого типа весьма перспективны для использования в системах сжатия мультимедиа информации. Использование предварительной спектральной обработки и модели субъективного восприятия позволяет уменьшить битовые затраты. Вычисление оценки необходимого количества бит для передачи сигнала требует знания достаточно точной аппроксимации функции скорость-искажение используемого квантователя (перцептуальная энтропия).

Вычисление перцептуальной энтропии может быть сведено к аппроксимации функции скорость-искажение R(D) для заданного параметра а. Эффективность предлагаемой оценки значительно выше, чем дана в стандарте MPEG1 за счет исключения предположения о неизменности функции плотности вероятности внутри кванта.

Простота вычисления оценки перцептуальной энтропии, как функции PE(D) = f(D,a), дает возможность эффективно реализовать на практике зависимость (4.42). Вычислительные затраты на оценку перцептуальной энтропии чрезвычайно малы - несколько операций умножения, вычитания и двоичный логарифм.

Применение на практике оценки (4.42) позволяет более эффективно задать первоначальное распределение бит между передаваемыми участками сигнала. Как следствие этого уменьшается число итераций при управлении ошибкой квантования или скоростью кодирования.

На основе проведенных экспериментов с интеграцией КРНЗ в аудио кодек видно, что при передаче полного спектра средний выигрыш на 8.71 кбит/с (14.44%) и увеличение качества на 0.44 дБ (2.25%) достигается исключительно за счет использования КРНЗ.

Эксперименты слепого тестирования при фиксированной целевой скорости 18 кбит/с показали: с внедрением КРНЗ в кодек субъективное качество возросло в среднем на 15.03 балла, что является существенным улучшением.

Список литературы диссертационного исследования кандидат технических наук Поров, Антон Викторович, 2009 год

1. Арбузов С. М., Соловьева Е. Б., Солонина А. И., Улахович Д. А. Основы цифровой обработки сигналов. СПб: БХВ-Петербург, 2005, С. 768.

2. Ватолин Д., РатушнякА., Смирнов М., Юкин В. Методы сжатия данных. Устройство архиваторов, сжатие изображений и видео. М.: ДИАЛОГ-МИФИ, 2002, С. 384

3. Володин Э. К, Ковалгин Ю. А. Цифровое кодирование звуковых сигналов. СПб.: Корона-Принт, 2004, С. 240.

4. Гадзиковский В. И. Теоретические основы цифровой обработки сигналов. М.: Радио и связь, 2004, С. 344.

5. Галлагер Р. Теория информации и надежная связь: Пер. с англ. М.: Советское радио, 1974.

6. Ганеев P.M. Математические модели в задачах обработки сигналов: Справочное пособие. М.: Горячая линия Телеком, 2002, С. 84.

7. Гольденберг JI.M. и др. Цифровая обработка сигналов М.: Радио и связь, 1990, С. 256.

8. Павловец А.Н, Петровский А.А. Квантование огибающей спектра в вокодере, основанном на декомпозиции речевого сигнала на периодическую и апериодическую составляющие// Цифровая обработка сигналов. 2005. №3.

9. Колесник В. Д., Полтырев Г. Ш. Курс теории информации. М.: Наука, 1982.

10. Кошелев В.Н. Квантование с минимальной энтропией// Проблемы передачи информации, 1963. Т.14. С.151-156

11. Кудряшов БД., Поров А.В. Скалярные квантователи для случайных величин, имеющих обобщенное гауссовское распределение// Цифровая обработка сигналов. 2005. №4.

12. Куприянов М.С., Матюшкин БД. Цифровая обработка сигналов: процессоры, алгоритмы, средства проектирования. СПб.: Политехника, 1999, С. 592.

13. Поров А.В. Анализ эффективности квантования спектральных коэффициентов аудио сигналаУ/ Восьмая научная сессия аспирантов ГУАП, часть первая, технические науки: Сб. докл./ СПбГУАП. СПб., 2005. С. 327.

14. Поров А.В. Аппроксимация функции скорость-искажение при оценке битовых затрат в системах сжатия аналоговой информации// Цифровая обработка сигналов. 2009. №1.

15. Осипов КС., Поров А.В. Сравнительный анализ эффективности банков фильтров// Девятая научная сессия аспирантов ГУАП, часть первая, технические науки: Сб. докл./ СПбГУАП. СПб., 2006. С. 298.

16. Сборник задач по теории вероятностей, математической статистике и теории случайных функций/ Под ред. Свешникова А. А. М.: Наука, 1970.

17. Сергиепко А. Б. Цифровая обработка сигналов: Учебник для вузов. СПб: Питер, 2006, С. 752.

18. Солонина А. И. и др. Алгоритмы и процессоры цифровой обработки сигналов: Учебное пособие. СПб: БХВ-Петербург, 2001, С. 464.

19. ШелухигI О.И. и др. Цифровое сжатие видеоинформации и звука. М.: Дашков и Ко, 2003, С. 426.

20. Berger Т. Optimum quantizers and permutation codes// IEEE Trans. Inform. Theory, 18, No 6, pp. 759-765, Nov., 1972.

21. Berger Т., Gibson J. Lossy source coding// IEEE Trans. Inform. Theory, v. 44, No 6, pp. 2702-2703, Oct, 1998.

22. Blahut R. E. Computation of Channel Capacity and Rate-Distortion Functions// IEEE Trans. Inform. Theory, 18, No 4, pp. 460-473, Jul., 1972.

23. Chu P. L. Quadrature Mirror Filter Design for an Arbitrary Number of Equal Bandwidth Channels// IEEE Trans.Acous., Speech, and Sig. Process., v. ASSP-33, n. 1, pp. 203-218, Feb.1985.

24. Cover Т., Thomas J. Elements of Information Theory. John Wiley and Sons, Inc.: New York, 1991.

25. Cox R. The Design of Uniformly and Nonuniformly Spaced Pseudo QMF// IEEE Trans. Acous., Speech, and Sig Process., v. ASSP-34, pp. 1090-1096, Oct. 1986.

26. Farvardin N., Modestino J. W. Optimum quantizer performance for a class of non-Gaussian memoryless Sources// IEEE Trans. Inform. Theory, v. ГГ-30, No 3, pp. 485-497, May, 1984.

27. Fisher Т., Marcellin M., Wang M. Trellis-Coded Vector Quantization// ШЕЕ Trans. Inform. Theory, 37, No 6, pp. 1551-1566, Nov., 1991.

28. Fletcher H. Auditory Patterns// Rev. Mod. Phys., pp. 47-65, Jan. 1940.

29. Gish H., Pierce J.N. Asymptotically efficient quantizing// IEEE Trans. Inform. Theory, v.14, no 5, pp. 676-683, Sept., 1968.

30. Gray R. M., NeuhoffD.L. Quantization// IEEE Trans. Inform. Theory, vol. IT-44, pp. 2325 -2383, Oct. 1998.

31. Greenwood D.D. Critical Bandwidth and the Frequency Coordinates of the Basilar Membrane//J. Acous. Soc. Am., pp. 1344-1356, Oct. 1961.

32. Стандарт IS 11172-3 ISO/IEC JTC1/SC29/WG11 MPEG. Information Technology -Coding of Moving Pictures and Associated Audio for Digital Storage Media at up to About 1.5 Mbit/s, Part 3: Audio 1992. (MPEG-1)

33. Стандарт IS13818-3 ISO/IEC JTC1/SC29/WG11 MPEG. Information Technology -Generic Coding of Moving Pictures and Associated Audio, Part 3: Audio 1994. (MPEG-2)

34. Johnston J. Estimation of Perceptual Entropy Using Noise Masking Criteria// in Proc. ICASSP-88, pp. 2524-2527, May 1988.

35. Johnston J. Transform Coding of Audio Signals Using Perceptual Noise Criteria// IEEE J. Sel. Areas in Comm., pp. 314-323, Feb. 1988.

36. Johnston J., et al. AT&T Perceptual Audio Coding (РАС)// in Collected Papers on Digital Audio Bit-Rate Reduction, N. Gilchrist and C. Grewin, Eds., Aud. Eng. Soc., pp. 73-81, 1996.

37. Koilpillai R., Vaidyanathan P. P. New Results on Cosine-Modulated FIR Filter Banks Satisfying Perfect Reconstruction// in Proc. Int. Conf. Acous., Speech, and Sig. Process. (ICASSP-91), pp. 1793-1796, May 1991.

38. Koilpillai R., Vaidyanathan P. P. Cosine-Modulated FIR Filter Banks Satisfying Perfect Reconstruction// IEEE Trans. Sig. Proc., v. SP-40, pp. 770-783, Apr. 1992.

39. Lloyd S. P. Least squares quantization in PCM// IEEE Trans. Inform. Theory, vol. IT-28, pp. 129-137, Mar. 1982.

40. Malvar H. Lapped Transforms for Efficient Transform/Subband Coding// IEEE Trans. Acous., Speech, and Sig. Process.,v. 38, n. 6, pp. 969-978, Jun. 1990.

41. Malvar H. Modulated QMF Filter Banks with Perfect Reconstruction// Electronics Letters, v. 26, pp. 906-907, Jun. 1990.

42. Masson J., Picel Z. Flexible Design of Computationally Efficient Nearly Perfect QMF Filter Banks// in Proc. Int Conf. Acous., Speech, and Sig. Process. (ICASSP-85), pp. 14.7.1-14.7.4, Mar. 1985.

43. Max J. Quantizing for minimum distortion// IRE Trans. Inform. Theory, vol. ГГ-6, pp. 712, Mar. 1960.

44. Noll P., Zelinski R. Bounds on quantizer performance in the low bit-rate region// IEEE Trans. Commun., vol. COM-26, pp.300-304, Feb. 1978.

45. Nussbaumer H. J. Pseudo QMF Filter Bank// IBM Tech. Disclosure Bulletin, v. 24, pp. 3081-3087, Nov. 1981.

46. Пат. 20060004566 США, МКИ G10L 21/00. Low-bitrate encoding/decoding method and system. Oh Eunmi, Kim Junghoe, Kim Sangwook, Egorov Andrew, Porov Anton, Osipov Konstantin, Kudryashov Boris.

47. Пат. 20070229345 США, МКИ H03M 3/00. Method and apparatus to quantize and dequantize input signal, and method and apparatus to encode and decode input signal. Oh Eunmi, Kim Junghoe, Porov Anton.

48. Пат. 20080219455 США, МКИ H03M 7/30. Method and apparatus for encoding and decoding noise signal. Oh Eunmi, Porov Anton, Kim Jung-hoe.

49. Пат. 20080218390 США, МКИ H04N 7/24. Entropy encoding and decoding apparatus and method based on tree structure. Oh Eunmi, Porov Anton, Kim Jung-hoe.

50. Пат. 20080270125 США, МКИ G10L 19/00. Method and apparatus for encoding and decoding high frequency band. Oh Eunmi, Choo Ki Hyun, Porov Anton, Kim Jung-hoe

51. Пат. 20080281604 США, МКИ G10L 19/00. Method and apparatus for encoding and decoding audio signal. Oh Eunmi, Choo Ki Hyun, Porov Anton, Kim Jung-hoe.

52. Пат. 20080101600 Юж. Корея, МКИ G10L 19/00. Method and apparatus for adaptive quantization and inverse-quantization. Oh Eunmi, Kim Jung-Hoe, Sung Ho Sang, Kudryashov Boris, Porov Anton

53. Painter Т., SpaniasA. Perceptual Coding of Digital Audio// Proceedings of the IEEE, vol. 88, No. 4, pp. 451-513, April, 2000.

54. Ramstad T. Cosine Modulated Analysis-Synthesis Filter Bank With Critical Sampling and Perfect Reconstruction// in Proc. Int. Conf. Acous., Speech, and Sig. Process. (ICASSP-91), pp. 1789-1792, May 1991.

55. Rothweiler J. H. Polyphase Quadrature Filters A New Subband Coding Technique// in Proc. Int. Conf. Acous., Speech, and Sig. Process. (ICASSP-83), pp. 1280-1283, May 1983.

56. ScharfB. Critical Bands// in Foundations of Modern Auditory Theory, New York: Academic Press, 1970.

57. Schroeder M., et al. Optimizing Digital Speech Coders by Exploiting Masking Properties of the Human Ear// J. Acoust. Soc. Am., pp. 1647-1652, Dec. 1979.

58. Sharifi K., Leon-Garcia A. Estimation of Shape Parameter for Generalized Gaussian Distributions in Sub band Decompositions of Video// in ШЕЕ Trans. On Circuits and Systems for Video Technology, 5(1), pp. 52-56, Feb. 1995.

59. Terhardt E. Calculating Virtual Pitch// Hearing Research, pp. 155-182, 1, 1979.

60. Welch T. A Technique for High Performance Data Compression// ШЕЕ Сотр., v. 17, n. 6, pp. 8-19, Jun. 1992.

61. Witten I. Arithmetic Coding for Data Compression// Comm. ACM, v. 30, n. 6, pp. 520540, Jun. 1987.

62. Zador P. Topics in the asymptotic quantization of continuous random variables// ШЕЕ Trans. Inform. Theory, vol. ГГ-28, pp. 139 -149, March, 1982.

63. Ziv J., Lempel A. A Universal Algorithm for Sequential Data Compression// ШЕЕ Trans. On Information Th„ v. IT-23, n. 3, pp. 337-343, May 1977.

64. Zwicker E., Fasti H. Psychoacoustics Facts and Models// Springer-Verlag,1990.

65. Zwislocki J. Analysis of Some Auditory Characteristics// in Handbook of Mathematical Psychology, R. Luce, et al., Eds., New York: John Wiley and Sons, Inc., 1965.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.