Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении тема диссертации и автореферата по ВАК РФ 05.12.04, кандидат наук Таранов, Дмитрий Дмитриевич

  • Таранов, Дмитрий Дмитриевич
  • кандидат науккандидат наук
  • 2013, Таганрог
  • Специальность ВАК РФ05.12.04
  • Количество страниц 141
Таранов, Дмитрий Дмитриевич. Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении: дис. кандидат наук: 05.12.04 - Радиотехника, в том числе системы и устройства телевидения. Таганрог. 2013. 141 с.

Оглавление диссертации кандидат наук Таранов, Дмитрий Дмитриевич

Содержание

Введение

Глава 1. Музыкальные сигналы в помещении и их восприятие человеком

1.1 Задачи, возникающие при записи музыкальных сигналов

1.2 Особенности слухового восприятия

1.3 Статистические свойства музыкальных сигналов

1.4 Понятие аурализации и особенности слухового восприятия

1.5 Постановка задачи исследования

Глава 2. Анализ двумерных акустических музыкальных сигналов с использованием искусственной головы и моделей слуха

2.1 Модели слухового восприятия пространственных характеристик сигналов

2.2 Реверберационные алгоритмы

2.3 Модели восприятия искажений музыкальных сигналов

2.4 Влияние нелинейных искажений на спектр музыкального сигнала

2.5 Особенности обработки музыкальных сигналов и существующие модели

их представления

Глава 3. Моделирование пространственных характеристик слуха на основе

модели искусственной головы

3.1. Моделирование трехмерного пространства с использованием массива функций Head-Related Transfer Function (HRTF)

3.2 Экспериментальная запись массива функций HRTF во временной области

3.3 Формирование импульсных характеристик функции HRTF

3.4 Моделирование бинауральных свойств головы, упрощение алгоритма моделирования, уменьшение вычислительных затрат

3.5 Моделирование реверберационных свойств помещения

Глава 4. Экспериментальное исследование разработанных алгоритмов

с использованием экспертных оценок

4.1 Задачи и исходные данные эксперимента

4.2 Методика проведения эксперимента

4.3 Возможности повышения достоверности результатов эксперимента

4.4 Проведение эксперимента

4.5 Интерпретация экспериментальных данных

4.6 Выводы по результатам эксперимента

Заключение

Список литературы

Рекомендованный список диссертаций по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК

Введение диссертации (часть автореферата) на тему «Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении»

Введение

Актуальность работы

Обработка акустических музыкальных сигналов в настоящее время представляет собой обширную область, научных исследований, инженерных разработок, программного обеспечения и алгоритмов на стыке таких направлений как акустика, радиотехника, звукорежиссура, прикладная статистика, психология.

Традиционно, задачи звукозаписывающей и техники сводились к наиболее точному воссозданию акустических условий, в которых производилась звукозапись. Однако, на сегодняшний день обработка акустических музыкальных сигналов, включая монтаж, сведение, мастеринг и др. имеет, прежде всего, художественный характер. Как правило, звукозапись, в том числе и многоканальная, производится последовательно, т.е. источники звукового сигнала - музыкальные инструменты, голоса исполнителей и художественные звуковые эффекты - записываются по очереди, а не одновременно. Обычно эта запись проходит в заглушённом помещении (имитация условий свободного поля) с целью дальнейшей динамической, спектральной и пространственной обработки. Среди приложений пространственной обработки музыкальных акустических сигналов стоит отметить такие как:

- моделирование свойств реальных помещений; при создании фонограмм методом наложения;

- повышение естественности звучания фонограмм;

- улучшение локализации источников звуковых сигналов при создании фонограмм;

- оперативность позиционирования источника звукового сигнала в реальном времени при одновременном снижении вычислительных затрат;

- создание дополнительных художественных музыкальных эффектов.

В нашей стране проблемой исследования и обработки музыкальных акустических сигналов занимались такие ученые как Алдошина И.А., Меер-зон Б.Я., Ковалгин Ю.А., Вологдин Э.И. Среди зарубежных исследователей следует отметить такие имена как Д. Уиллиамс, Б. Вебстер,У. Зольцер, В. Гарднер, Дж. Блауэрт и др.

Решение задачи пространственного позиционирования музыкальных акустических сигналов сопряжено с существенными сложностями, многие из которых в полной мере не разрешены на сегодняшний день. Первой из таких сложностей является субъективность восприятия музыкальных сигналов слушателем. Под субъективностью подразумевается как вариативность исполнения различного музыкального материала на одних и тех же музыкальных инструментах, так и трудности, связанные с формальным описанием параметров музыкального интонирования, звукоизвлечения и их объективным измерением.

Данные проблемы являются причиной того, что на данный момент ни в одном из направлений обработки музыкальных сигналов не существует общепринятых моделей динамической и спектральной обработок, а также пространственного позиционирования. Алгоритмы обработки музыкальных сигналов не стандартизованы. Несмотря на достигнутые в ряде приложений значительные успехи (бинауральная звукозапись, достоверно передающие характер реальных помещений реверберационные алгоритмы и т.д.), в большинстве своем они не имеют фундаментальной значимости. Как следствие, исследователи и разработчики алгоритмов обработки музыкальных сигналов зачастую вынуждены исходить из эвристических соображений при подборе параметров алгоритмов в отсутствие накопленной информационной базы.

Также следует отметить такой недостаток многих существующих методов обработки музыкальных сигналов как чрезмерно формальный подход к задаче, т.е. недостаточный учет специфики музыкальных сигналов и

особенностей человеческого слуха и, в частности, особенностей восприятия конкретного музыкального материала.

В сложившейся ситуации возрастающего спроса на звукозаписывающие и звуковоспроизводящие системы в музыкальной сфере для использования в разнообразных приложениях существует необходимость поиска новых подходов к решению данной задачи, обладающих достаточной универсальностью и достоверностью звучания.

Объектом исследования являются музыкальные акустические сигналы, не содержащие информацию о конкретном помещении, в котором они были записаны.

Предметом исследования являются методы обработки музыкальных сигналов с целью их пространственного позиционирования и пространственной окраски в заданном помещении.

Целью диссертационной работы является повышение эффективности пространственного позиционирования и пространственной окраски музыкальных акустических сигналов в заданном акустическом пространстве.

Основными задачами, которые требуется решить для достижения поставленной цели, являются:

- моделирование свойств реальных помещений при создании фонограмм методом наложения;

- повышение естественности звучания фонограмм;

- задача локализации виртуальных источников звуковых сигналов при создании фонограмм;

- повышение оперативности позиционирования источника звукового сигнала в реальном времени при одновременном снижении вычислительных затрат;

Научная новизна

В диссертационной работе получены следующие новые научные результаты:

1. Предложен метод бинаурального позиционирования источника звукового сигнала на основе междуушных временных задержек и модели ушных раковин.

2. Разработан метод бинаурального позиционирования источника звукового сигнала с использованием передаточной характеристики «искусственной головы», применимый в реальном времени.

3. Предложен алгоритм снижения вычислительных затрат бинаурального позиционирования с возможностью использования в реальном времени.

4. Разработан гибридный реверберационный алгоритм, основанный на использовании импульсных характеристик реальных или математически моделируемых помещений и модели поздних отражений.

5. Предложена методика оценки качества бинаурального пространственного позиционирования с использованием экспертных групп.

Практическая ценность работы

1. Разработан алгоритм, в котором реализовано бинауральное позиционирование источника музыкального акустического сигнала относительно слушателя. Показано, что применение данного метода имеет достаточно высокие локационные характеристики. В среднем, погрешность локации во фронтальной полуплоскости составляет 7°, в тыловой полуплоскости - 15°, что более, чем на 20% превышает результаты распространенных коммерческих алгоритмов.

2. Разработан реверберационный алгоритм, позволяющий повысить естественность звучания музыкального материала, посредством помещения источника звука в акустическую среду, свойства которой максимально приближены к свойствам данного реального помещения.

3. Предложен метод снижения вычислительных затрат, требуемых для бинаурального пространственного позиционирования сигнала, понижающий ресурсозатратность более, чем на два порядка по сравнению с коммерческими сверточными алгоритмами. Алгоритм также позволяет реализовать динамическое пространственное позиционирование источника звукового сигнала в заданном акустическом пространстве.

Методы исследования основаны на использовании аппарата математической статистики, теории сигналов. Использовались методы, компьютерного моделирования, акустики, статистической радиотехники, цифровой обработки сигналов, прикладной статистики, а также некоторые положения психоакустики. Проверка теоретических выводов производилась путем проведения эксперимента с использованием экспертных оценок.

Реализация результатов работы.

Результаты исследований и разработанные программные продукты используются на студии звукозаписи медиагруппы «Звукодел» (г. Батайск) для улучшения параметров художественной обработки музыкальных сигналов, а также в учебном процессе кафедры ТОР в курсах «Акустика» и «Компьютерный синтез сигналов и электромузыкальные инструменты» (специальность «Аудиовизуальная техника»).

Публикации.

По результатам выполненных исследований опубликовано 7 работ, в том числе 2 статьи в рецензируемых журналах из списка ВАК РФ и 5 статей и тезисов в материалах Всероссийских научных конференций.

Основные положения, выносимые на защиту:

1. Повышение естественности звучания фонограмм с учетом специфики музыкальных сигналов возможно на основе одновременного учета как реверберационных свойств помещения, так и позиционирования источников звуковых сигналов.

2. Метод бинаурального позиционирования источника звукового сигнала может быть основан на использовании междуушных временных задержек и модели ушных раковин, а также с использованием передаточной характеристики «искусственной головы».

3. Наибольшая естественность звучания музыкальных сигналов при минимальной затрате вычислительных ресурсов достигается при использовании гибридного реверберационного алгоритма, основанного на использовании импульсных характеристик реальных или математически моделируемых помещений и модели поздних отражений.

Структура и объем работы

Диссертационная работа состоит из введения, четырех глав, заключения и списка использованных литературных источников, содержащего 88 наименований. Общий объем работы составляет 141 страниц машинописного текста, включая 56 рисунков и 38 таблиц.

Во введении обоснована актуальность темы, обозначено современное состояние исследований в области пространственной обработки музыкальных акустических сигналов, сформулированы цели исследования, отражены научная новизна и практическая значимость полученных результатов. Также сформулированы основные положения, выносимые на защиту.

В первой главе произведена формальная постановка задачи пространственной обработки музыкальных акустических сигналов. Описаны задачи, возникающие при записи музыкального материала, описаны некоторые особенности слухового восприятия человеческого слуха, а также общие сведения о слуховом аппарате человека. Рассмотрены статистические свойства музыкальных сигналов, приведен анализ спектрограмм различных музыкальных инструментов. Рассмотрены характеристики направленности музыкальных сигналов. Используется) понятие аурализации, на основе которого рассмотрены известные модели локационных алгоритмов человеческого слуха.

Во второй главе производится анализ акустических полей и двумерных акустических сигналов с использованием искусственной головы и моделей слуха. Приводятся известные аурализационные модели: метод лучевой трассировки, метод энергетического перехода и метод виртуального источника. Предлагается аурализационный алгоритм на основе междуушной временной задержки и модели ушных раковин слушателя. Вводится понятие гамматонового фильтра, используемого при моделировании процессов фильтрации слуховой системой алгоритма. В качестве тестовых сигналов в эксперименте используется полосовой третьоктавный шум с центральной частотой 250 Гц. Результаты эксперимента представлены в виде изображений взаим-

ных корреляционных функций (трехмерные и усредненные по частоте ко-реллограммы). Приводятся существующие модели реверберационных алгоритмов. Рассматриваются модели восприятия искажений музыкальных сигналов. Приводятся графические результаты эксперимента по расчету корреляционной функции клиппированного и неклипированного сигнала в частотной области. Рассматриваются особенности обработки музыкальных сигналов и существующие модели их представления.

В третьей главе рассматривается моделирование пространственных характеристик слуха на основе модели искусственной головы. Рассматривается система моделирования трехмерного акустического пространства с использованием функции HRTF (Head-Related Transfer Function). Предлагается алгоритм повышения эффективности аурализаци. Описывается эксперимент по записи массива функций HRTF во временной области, приводится последовательность, в которой производился эксперимент, описываются использованные программные и аппаратные средства. Приводятся подходы к формированию импульсных характеристик функции HRTF, описывается эксперимент по моделированию функций HRTF. Приводится алгоритм моделирования бинауральных свойств головы слушателя на основе массива HRTF В. Гарднера и К. Мартина, рассматривается упрощение данного алгоритма, уменьшение его вычислительных затрат. Приводятся графики HRTF использованного массива во временной и частотной областях. Представлены графики корреляционных функций в частотной области для каждой пары импульсных характеристик. Соответствующих левой и правой ушной раковине слушателя. Приводится алгоритм снижения вычислительных затрат алгоритма с использованием ФНЧ Чебышева 5-го порядка. Описывается моделирование реверберационных свойств заданного помещения. Приводятся модели ревербераторов М. Шредера и Р. Мурера. Предлагается структурная схема разработанного гибридного алгоритма. Рассматриваются различные техники выполнения операции свертки с приведением вычислительных затрат. Приводятся импульсные характеристики трех реальных помещений, использован-

11

ные в гибридном реверберационном алгоритме. Рассчитываются вычислительные затраты алгоритма. Предлагается алгоритм моделирования импульсных характеристик помещения на основе геометрических соотношений и коэффициента поглощения отражающих поверхностей. Приводятся параметры, использованные для имитации импульсных характеристик трех реальных помещений. Описывается выбор длительности импульсной характеристики и фильтрация входного сигнала. Описываются блоки, использованные во второй части гибридного реверберационного алгоритма, приводятся графики их импульсных характеристик и АЧХ.

В четвертой главе представлены результаты экспериментов с участием экспертных групп. Была проведена серия из 5 экспериментов по прослушиванию аурализованных сигналов (музыкальных фраз, исполненных на шести различных музыкальных инструментах, помещенных в три различных акустических среды и прослушиваемых с двух виртуальных расстояний по 12 азимутальным направлениям). Приведены результаты эксперимента по каждому из испытуемых. Результаты представлены в графическом виде и в виде таблиц.

В заключении сформулированы основные выводы по диссертационной работе.

Глава 1. Музыкальные сигналы в помещении и их восприятие

человеком

1.1 Задачи, возникающие при записи музыкальных сигналов

В настоящее время в связи с широким развитием звукозаписи, усложнением задач, связанных со звукозаписью и появлением новых методов звукозаписи особую важность приобретает техническое качество выполняемых записей и достижение максимальной реалистичности формируемого музыкального материала. Так, широкое распространение получил способ создания фонограмм, при котором партии музыкальных инструментов записываются отдельно с последующим сведением в единый аудиофайл [1]. Зачастую при этом возникает задача имитации записи данного материала в некотором помещении. Дополнительную естественность такому материалу может придать учет локализационных и пространственных характеристик источников звукового сигнала, использованных в процессе звукозаписи и сведения музыкального материала. Определенное значение имеет при этом и имитация дифракции на голове, ушных раковинах и торсе слушателя. Все это повышает естественность звуковоспроизведения, создает эффект присутствия и, как следствие, повышает «вовлеченность» слушателя.

1.2 Особенности слухового восприятия

Восприятие звука человеком, сформировавшееся в ходе эволюции, имеет определенные особенности, изучаемые психоакустикой. Исследования, производимые в течение ряда лет в рамках данной дисциплины позволили получить важные результаты, учет которых позволяет создавать как максимально естественно фонограммы, так и различно рода художественные эффекты, что нашло масштабное применение в современной эстрадной музыке. Особенности восприятия звука человеком определяются как строением слухового аппарата, так и характером музыкального материала, предъявляемого для прослушивания. Также значительную роль в восприятии музыкального материала играет культурный багаж слушателя, слуховой опыт и музыкальная эрудиция, музыкальные способ-

ности и особенности его психики. Однако, данные факторы являются сугубо индивидуальными, имеют большой разброс в обществе и не входят в число вопросов, рассматриваемых в данной работе.

1.2.1 Общие сведения о слуховом аппарате человека

Слуховая система является своеобразным приемником информации и состоит из периферической части и высших отделов слуховой системы. Наиболее изучены процессы преобразования звуковых сигналов в периферической части слухового анализатора.

К механическим и гидроакустическим структурам уха относят наружное ухо (ушная раковина, слуховой проход, барабанная перепонка) и среднее ухо (барабанная полость, слуховые косточки и удерживающие их мышцы) [1]. На рисунке 1.1 показано строение уха человека.

молоточек овальное окно

х стремечко

полукружные каналы

слуховой нерв

■ улитка круглое окно

ушная V Я \ / ^Ч^Г евстахиева

раковина /\ Д^ ) ^Х труба

, / /-'-'-

внешнее среднее внутреннее

■V У I ' ухо

слуховой барабанная

проход ' перепонка

ушной канал

Рис. 1.1 - Строение человеческого уха 1.2.2 Строение наружного уха

Внешнее ухо состоит из ушной раковины и слухового канала, заканчивающегося тонкой мембраной, называемой барабанной перепонкой. Внешние уши и голова - это компоненты внешней акустической антенны, которая соединяет (согласовывает) барабанную перепонку с внешним звуковым полем. Основные функции внешних ушей - бинауральное (пространственное)

восприятие, локализация звукового источника и усиление звуковой энергии, особенно в области средних и высоких частот.

Неравномерность характеристики наружного уха может быть приблизительно описана следующей передаточной функцией:

1 + рТ, + р2т;~

к*Лр)-1

(1.1)

+ рТ2 + рХ где р - комплексная частота; Г0 = 40 мкс, Тх = 60 мкс, Т2 = 15 мкс.

Графики соответствующих данной модели частотных характеристик показаны на рисунке 1.2 [2].

АЧХ

1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Частота, Гц ФЧХ

1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

Частота, Гц

Рис. 1.2- Частотные характеристики модели наружного уха

1.2.3 Строение среднего уха Среднее ухо выполняет функции согласования сопротивлений воздушной среды и перилимфы, заполняющей улитку внутреннего уха. Это согласование достигается при помощи системы подвижных косточек: молоточка, стремечка и наковальни. Данная механическая система имеет коэффициент

передачи приблизительно равный 10. В диапазоне частот от 20 Гц до 1 кГц система косточек может рассматриваться как безынерционная, а в боле высоком частотном диапазоне коэффициент передачи снижается в виду инерционности механических элементов системы [2].

Д. Фланаганом была предложена следующая аппроксимация передаточной функции среднего уха:

КсЛр) =

сп

(р + а) (р-а) +Ь2

где С0 = const', b = 2а = 2jv • 1500 рад/с.

(1.2)

Графики частотных характеристик модели Фланагана приведены на рисунке 1.3.

На графике АЧХ виден спад характеристики в области частот выше 1 кГц. При этом частотный диапазон слухового восприятия человека ограничен частотой 20 кГц. Верхняя граничная частота человеческого слуха снижается до 10-15 кГц с возрастом.

АЧХ

Частота, Гц ФЧХ

200,-■-■-■——г-т-^-т-

-200 -1-1-■—|—I I I I I-1-1->—|—''''I

7 1 4

10 10 10

Частота, Гц

Рис. 1.3 - Частотные характеристики модели среднего уха

1.2.4 Строение внутреннего уха

Внутреннее ухо можно условно разделить на две рецепторный секции: слуховую (улитка) и вестибулярную (полукружные каналы).

Улитка представляет собой свернутую в два с половиной витка спирали костяную трубку, срез которой показан на рис. 1.4.

Рис. 1.4. - Срез улитки внутреннего уха: 1 - промежуточный канал с органом Кор-ти и покровной мембраной, 2 - прямой канал, 3 - обратный канал. Стрелками показаны

прямой и обратный путь звуковой волны Звуковой сигнал через систему косточек среднего уха поступает на гибкую мембрану овального окна прямого канала, изображенного на развертке улитки рис. 1.5

Рис. 1.5 - Развертка улитки (без органа Корти и покровной мембраны): 1 - звуковой сигнал, 2 - овальное окно, 3 - прямой канал, 4 - рейснерова мембрана, 5 - промежуточный канал, 6 - основная мембрана, 7 - одна из струн, 8 - костная оправа, 9 обратный

канал, 10 - круглое окно, 11 - геликотрема.

Прямой канал заканчивается в вершине улитки отверстием (геликотре-мой) соединенным с началом обратного канала, ведущего к мембране круглого окна, выходящего в среднее ухо. Оба канала заполнены жидкостью -перилимфой, а находящийся между ними изолированный промежуточный канал заполнен жидкостью другого состава - эндолимфой. Основная мембрана армирована множеством жестких поперечных коллагеновых волокон -струн, натянутых на костную оправу поперек направления каналов. Число струн достигает 24000. Они настроены на различные звуковые частоты, высокие до 20 кГц у входа (выхода) прямого (обратного) канала и низкие до 20 Гц у геликотремы.

Звуковая волна определенной частоты, поступившая в прямой канал, доходит до зоны основной мембраны резонирующей на эту частоту и поглощается здесь органом Корти. Волны частот меньше 20 герц проходят через геликотрему в обратный канал, заставляя колебаться мембрану круглого окна. Волны, не до конца поглощенные органом Корти, также доходят до круглого окна обратного канала через основную мембрану или геликотрему.

Мембрана Рейснера передает звук любой частоты из основного канала в промежуточный. Ширина основной мембраны изменяется, увеличиваясь по направлению к геликотреме. На рис. 1.6 изображен небольшой по длине участок мембраны (условной струны), величиной с1х.

1 2 1

■■ / ШГ лъ

•• "таг ,

I- ¿у

Рис. 1.6. - Элемент основной мембраны - условная струна.

Толщина и длина участка являются функциями его удаленности от начала узкого конца мембраны. Упругая часть участка основной мембраны толщиной, состоящая из коллагеновых волокон и соединительной ткани на

рисунке изображена нижним слоем, а верхний слой соответствует нагрузке, которую создает прикрепленный к мембране орган Корти. Под воздействием переменного давления основная мембрана и ее участок изгибаются, как показано на рисунке дугообразной пунктирной линией в одну, а затем в другую сторону.

Существуют различные модели внутреннего уха. Это связано с малой изученностью этого органа. Каждая модель соотвествует определенной гипотезе, объясняющей то или иное свойство слуха [3], однако, универсальной модели до сих пор не создано.

1.3 Статистические свойства музыкальных сигналов

На сегодняшний день изучение звуковых, и в частности музыкальных сигналов, приобретает все большее значение в связи с развитием разнообразных музыкальных течений и жанров, в которых применяются все более разнообразные музыкальные инструменты - как акустические, так и электронные. Современные исследования касаются определения четких различий между тембрами музыкальных инструментов с точки зрения восприятия человеческого уха [4,5]. Существуют различные способы оценки ранее записанных звуковых музыкальных сигналов с целью дальнейшего исследования тембров музыкальных инструментов. Однако наиболее существенных результатов можно добиться при помощи математического анализа звуковых сигналов.

Как правило, музыкальные сигналы можно рассматривать как случайные. Следовательно, для анализа их акустических характеристик необходимо использование методов, принятых в статистическом, спектральном и корреляционном анализе.

Обладание информацией о статистических свойствах музыкальных сигналов является важным в процессе монтажа, сведения и редактирования аудиоматериала, его согласования с определенными параметрами (например, по среднему звуковому давлению, частотному диапазону и др.), при выборе

различных способов обработки сигналов и т.д.

19

Как любой случайный процесс, музыкальные сигналы с точки зрения статистики могут характеризоваться плотностью распределения вероятностей. Имеется множество исследований по исследованию одномерной плотности распределения вероятности аудиосигналов.

Одномерные плотности распределения вероятностей аудиосигналов достаточно хорошо изучены. Существует ряд аналитических выражений для их аппроксимации.

Так, например, для мужского вокала получено следующее выражение для плотности вероятности \¥(х)[6]:

ж 1^ = Ж, ехр + ехр I-—) (1 -3)

О] = 1,44, <72 = 0,24 - среднеквадратические отклонения; Для хора с оркестром:

= (1.4)

где а= 1.

Для симфонической музыки:

= (1.5)

где сг= 1,15.

Из соотношений (1.3 - 1.5) очевидно, что распределения плотностей вероятностей музыкальных сигналов распространенных типов можно аппроксимировать как экспоненциальным законом, так и гауссовым.

В случае когда распределение плотности вероятностей не является гауссовым, большую информацию о звуковом сигнале несет двумерное распределение. При этом, может быть использована модель следующего вида: и - XV, в которой случайный стационарный сигнал с гауссовой плотностью распределения вероятностей Ж2(х) модулируется по амплитуде другим случайным сигналом, имеющим плотность распределения вероятностей Рэлея 1¥у(х). Изменяя параметры обоих распределений можно получать выражения для аппроксимации самых разнообразных музыкальных звуковых сигналов,

относящихся к различным жанрам. Недостатком данного метода является сложность конечного выражения 1¥и(х).

Похожие диссертационные работы по специальности «Радиотехника, в том числе системы и устройства телевидения», 05.12.04 шифр ВАК

Список литературы диссертационного исследования кандидат наук Таранов, Дмитрий Дмитриевич, 2013 год

Список литературы

1. Алдошина И. Основы психоакустики. Оборонгиз., Москва, 2000.

2. James W. Beauchamp. The sound of music: analysis, synthesis, and perception of musical sounds, chapter Analysis and Synthesis of Musical Instrument Sounds, pages 1-89. Springer, New York, 2007.

3. Kenneth W. Berger. Some factors in the recognition of timbre. The Journal of the Acoustical Society of America, 36(10):1888-1891, 1964.

4. Кузнецов JI. А. Акустика музыкальных инструментов. M., 1989.

5. Caclin A., McAdams S., Smith В., Winsberg S. Acoustic correlates of timbre space dimensions:a confirmatory study using synthetic tones. Journal of the Acoustical Society of America, 118(1):471-482, 2005.

6. John M. Hajda. The sound of music : analysis, synthesis, and perception of musical sounds, chapter The Effect of Dynamic Acoustical Features on Musical Timbre, pages 250-271. Springer, New York, 2007.

7. Hajda J., Kendall R., Carterette E., Harshberger M. Perception and cognition of music, chapter Methodological issues in timbre research, pp. 253-306. Psychology Press, Hove, East Sussex, 1997. Интернет-ресурс. Режим доступа: http://www.loc.gov/catdir/enhancements/fy0652/ 97202027-d.html

8. Haken L., Fitz K., Christensen P. The sound of music: analysis, synthesis, and perception of musical sounds, chapter Beyond Traditional Sampling Synthesis: Real-Time Timbre Morphing, pages 122-144. Springer, New York, 2007.

9. Литюк В.И., Литюк Л.В. Введение в основы цифрового формирования и записи/воспроизведения звуковых сигналов: Учеб. Пособие. - Таганрог: Изд-во Технологического института ЮФУ, 2007. - 53 с.

10. Krumhansl С. Why is musical timbre so hard to understand? Structure and Perception of Electroacoustic Sound and Music, number 60, pages 43-54. Royal Swedish Academy of Music, ExcerptaMedica, 1989.

11. Lakatos S. A common perceptual space for harmonic and percussive timbres. Perception & Psychophysics, 62(7): 1426-1439, 2000.

12. Гарбузов H.A. Музыкальная акустика. M., 1954.

13. MosekApS. MosekApS optimization software, 2007. Интеренет-ресурс. Режим доступа: http://www.mosek.com/.

14. Усиков А.Я., Лаптий В.К., Радиофизическое исследование феномена тембра звучания старинных итальянских смычковых музыкальных инструментов. Институт радиофизики и электроники им. А. Я. Усикова НАН Украины, 12, ул. Ак. Проскуры, Харьков, 61085, Украина

15. Pachet F., Delerue О., and Hanappe P. Musicspace goes audio. Curtis Roads, editor, Sound in Space, Santa Barbara, CA, 2000.

16. Peeters G., Herrera P., Amatriain X. Audio CE for instrument description (timbre similarity). Proposal ISO/IEC JTC1/SC29/WG11, International Organisation for Standardisation: Coding of Moving Pictures and Audio, 1999.

17. Wessel D. Timbre space as a musical control structure. Computer Music Journal, 3(2):45-52, 1979.

18. Kleiner M., Auralization - an overview. J.Audio Eng. Soc. 41,861, 1993

19. Petri-Larmi M., Otala M., Lammasmiemi J. Psychoacoustic Delection Threshold of Transient Intermodulation Dibtoition. Journal of the Audio Engineering Society 1980, N 28, N 3, pp. 98-104

20. Bonham B.H., Lewis E.R., Localization by interaural time difference (ITD): effects of interaural frequency mismatch. J. Acoust. Soc. Am. 106, 1999, pp. 281-290.

21. Colburn H.S., Durlach N.I. Models of binaural interaction. In: Handbook of Perception, Vol. IV, Hearing, edited by E.C. Carterette and M.P. Friedman. Academic Press, New York, 1978.

22. Brand A., Behrend O., Marquardt Т., McAlpine D., Grothe B. Precise inhibition is essential for microsecond interaural time difference coding. Nature 417, 2002, pp. 543-547.

23. Stern R.M. An overview of models of binaural perception. National Research Council CHABA Symposium, Washington, D.C., USA, 1988.

24. Kozlov V. Study: Online Music Sales in Russia.. The Hollywood reporter, 2012.

25. Цвикер Э., Фельдкеллер P. Ухо как приемник информации. М. Связь, 1971

26. Stern, R.M. (1988). An overview of models of binaural perception. National Research Council CHABA Symposium, Washington, D.C., USA, 1988

27. Володин A.A. Роль гармонического спектра в восприятии высоты и тембра звука. Музыкальное искусство и наука. М., 1970.

28. Hebrank J., Wright, D. Spectral cues used in the localization of sound sources in the horizontal plane", Journal of the Acoustical Society of America 56, pp. 129-134, 1974

29. Jeffress L.A. A place theory of sound localization. J. Сотр. Physiol. Psych. 61, pp. 468-486, 1978

30. Bodden M. Binaural Modeling and Auditory Scene Analysis. IEEE Signal Processing Society, 1995 Workshop on Appl. of Signal Processing to Au- dio and Acoustics, Mohonk Mountain House, New Paltz, NY, 1995.

31. Raatgever J., Bilsen, F.A. A central spectrum theory of binaural processing. Evidence from di- chotic pitch. J. Acoust. Soc. Am. 80, 428-441, 1986

32. Kulowski A. Algorithmic representation of the ray tracing technique. Applied Acoustics, vol.18, pp. 449-469, 1984.

33. Lewers T. A combined beam tracing and radiant exchange computer model of room acoustics", Applied Acoustics, vol.38, pp. 161-178, 1993.

34. Duda R.O. Estimating azimuth and elevation from the interaural head related transfer function. In: Binaural and spatial hearing, R.HGilkey and T. Anderson (eds.), Erlbaum, N.J. 1997.

35. Lindemann W. Extension of a binaural cross-correlation model by contralateral inhibition. I. Simulation of lateralization of stationary signals. Journal of the Acoustical Society of America 80, pp. 108- 122, 1986

36. Gaik W. (1993). Combined Evaluation of Interaural Time and Intensity Differences: Psychoacoustical Results and Computer Modeling. Journal of the Acoustical Society of America 94, 98-110.

37. Blauert J.; Bodden, M.; Lehnert, H. (1992): Binaural Signal Processing & Room Acoustics Planning. IEICE Trans. Fundamentals. Vol. E75-A, No. 11, Nov. 1992, 1454-1459.

38. Wenzel E. M. Localization in virtual acoustic displays. Presence, vol. 1, pp. 80-107, 1992.

39. Применение акустических методов исследования в музыкознании. Сб. статей. М., 1964.

40. Kistler D. J. and Wightman F. L. A model of head-related transfer functions based on principal components analysis and minimum-phase reconstruction. J. Acoust. Soc. Amer., vol. 91, pp. 1637-1647, 1992.

41. The AUDIS catalogue of human HRTFs. CD-Rom, Documenta Acustica (09/DE2), D-Herzogenrath, 1998. Интернет-ресурс. Режим доступа: http://eaa.essex.ac.uk/eaa

42. Begault D.R. 3-D Sound for Virtual Reality and Multimedia. York: Academic, 1994.

43. Moller H., Hammershoi D., Jensen С. В., Sorensen M. F. Transfer characteristics of headphones measured on human ears. J. Audio Eng. Soc., vol. 43, pp. 203-217, 1995.

44. Gardner, W.G.. Chapter 3. Reverberation Algorithms. Kahrs, M. and Brandenburg, K. Editors. Applications of Digital Signal Processing to Audio and Acoustics. Kluwer Academic Publishers, 1998.

45. Dattorro, J.. Effect Design. Part 1: Reverberator and Other Filters. Journal of Audio Engineering Society. Vol. 45, No. 9, pp. 660-684, 1997.

46. Schroeder. M. R., Logan, B. F. Colorless Artificial Reverberation. J. Audio Engineering Society. Vol. 9, No. 3. 1961.

47. Udo Zolzer, DAFX. John Wiley & Sons, 2002.

48. Torna, N., Тора, M.D., Popescu, V., Szopos, E. Comparative Performance Analysis of Artificial Reverberation Algorithms. Automation, Quality and Testing, Robotics, IEEE International Conference on , vol.1, no., pp. 138-142, 2006.

49. И. Алдотиина, P. Приттс. Музыкальная акустика. Композитор, Санкт-Петербург 2009. 720 с.

50. Назайкинский Е.В. Музыка и информатика. М., 1999.

51. Старчеус М. С. Слух музыканта. М.: Моск. гос. консерватория им. П.И. Чайковского, 2003.

52. СНиП 2.08.02-89. Проектирование предприятий бытового обслуживания населения. М., Стройиздат, 1992.

53. Hall D. Musical Acoustics. An introduction. N.Y.: Wadsworth Publ., 1980.

54. Williams D. В., Webster P. R., Experiencing Music Technology. N. Y.: Schirmer Books, 1996.

55. R. O. Duda, "Modeling head related transfer functions," in Proc. 27 th Ann. Asilomar Conf. Signals, Systems and Computers, Asilomar, CA, Nov. 1993.

56. J. W. Strutt (Lord Rayleigh), "On the acoustic shadow of a sphere,"P/z//. Trans. R. Soc. London, vol. 203A, pp. 87-97, 1904; The Theory ofSound, 2nd ed. New York: Dover, 1945.

57. G. F. Kuhn, "Acoustics and measurements pertaining to directional hearing," in Directional Hearing, W. A. Yost and G. Gourevitch, Eds.Berlin, Germany: Springer-Verlag, 1987, pp. 3-25.

58. B. Gardner, K.Martin. HRTF Measurements of a KEMAR Dummy-Head Microphone. MIT Media Lab Perceptual Computing - Techonical report #280. 1994

59. G. F. Kuhn, "Acoustics and measurements pertaining to directional hearing," in Directional Hearing, W. A. Yost and G. Gourevitch, Eds.Berlin, Germany: Springer-Verlag, 1987, pp. 3-25.

60. В. Zhou, D. M. Green, and J. C. Middlebrooks, "Characterization of external ear impulse responses using Golay codes," J. Acoust. Soc.Amer., vol. 92, pp. 1169-1171, 1992.

61. M.D.Burkhardand, R.M.Sachs,"Anthropometricmanikin foracousticresearch," J. Acoust. Soc. Amer., vol. 58, pp. 214-222, 1975.

62. E. A. G. Shaw, "Acoustical features of the human external ear," in Binaural and Spatial Hearing in Real and Virtual Environments, R. H. Gilkey and T. R. Anderson, Eds. Mahwah, NJ: Lawrence Erlbaum, 1997, pp. 25-47.

63. D. W. Genuite, "The role of the pinna in human localization," Proc. R. Soc. Lond. B, vol. 168, pp. 158-180, 2001.

64. Иванов A.B. Теория вероятностей и математическая статистика. Ми.М. 2009. 109 с.

65. Y. Hiranaka and Н. Yamasaki, "Envelope representation of pinna impulse responses relating to three-dimensional localization of sound sources," J. Acoust. Soc. Amer., vol. 73, pp. 291-296, 1983.

66. F. L. Wightman and D. J. Kistler, "Headphone simulation of free-fieldlistening. II: Psychophysical validation," J. Acoust. Soc. Amer., vol. 85,pp. 868-878, Feb. 1989.

67. J. C. Middlebrooks and D. M. Green, "Sound localization by human listeners," Ann. Rev. Psych., vol. 42, pp. 135-159, 1991.

68. G. S. Kendall and C. A. P. Rodgers, "The simulation of three-dimensional localization cues for headphone listening," in Proc. 1982Int. Comput. Music Conf., 1982.

69. Gardner, W.G. 1998. Chapter 3. Reverberation Algorithms, in Kahrs, M. and Brandenburg, K. Editors. Applications of Digital Signal Processing to Audio and Acoustics. Kluwer Academic Publishers.

70. Schroeder. M. R., Logan, B. F. 1960. Artificial Reverberation. J. Audio Engineering Society. Vol. 9, No. 3.

71. Schroeder. M. R. 1962. Natural Sounding Artificial Reverberation. J. Audio Engineering Society. Vol. 10, No. 3.

72. Dattorro, J. 1997. Effect Design. Part 1: Reverberator and Other Filters. Journal of Audio Engineering Society. Vol. 45, No. 9. Pp. 660-684.

73. Gardner, W.G. 1992. The virtual Acoustic Room. Master Science Thesis at the MIT.

1A W7 ^iiir/lti af "'J "Fl A Iislin on/^ A /-* r\i irli r> f rs t Ti ovi-f A /irt^alivi rr " W 7 r/-»

/H-. W. vJ. vJaiuRCi, nuCiiu anu n^uuouv^ joijivliuuiii^iii ivj.uu.Cm.ig, wave

Arts, Inc., 1999.

75. W. G. Gardner, "Efficient Convolution without Input-Output Delay," J. Audio Eng. Soc., vol. 43, pp. 127 - 136, March 1995.

76. D. Griesinger. Practical Processors and Programs for Digital Reverberation. Proc. Audio Eng. Soc. 7th Int. Conf., pp. 187-195, 1999

77. J.-M. Jot. Efficient Models for Reverberation and Distance Rendering in Computer Music and Virtual Reality. Int. Computer Music Conf. (Thessaloniki, Greece), Sept. 1997.

78. S. W. Smith, The Scientist's and Engineer's Guide to Digital Signal Processing, California Technical Publishing, 1997.

79. P. Fausti, A. Farina, "Acoustic Measurements in Opera Houses: Comparison Between Different Techniques and Equipment", J. Sound and Vibration, v. 232, pp. 213-229, 2000

80. J. A. Moorer, "About This Reverberation Business", Computer Music Journal, vol. 3, no. 2, pp. 13 - 28, June 1979.

81. J.-M. Jot and A. Chaigne, iDigital Delay Networks for Designing Artificial Reverberators,! in Proc. 90th Conv. Audio Eng. Soc., Feb. 1991, preprint 3030.

82. U. Zolzer, Digital Audio Processing, JW & S, N.Y., 1998

83. J. VandeKieft, "Computational Improvements to Linear Convolution With Multi-rate Filtering Methods," Master's Thesis, University of Miami, 1998.

84. M. Barron, "The subjective effects of first reflections in concert halls - the need for lateral reflections," J. of Sound and Vibration, vol. 15 pp.475-94, 1971.

85. M. Barron, Auditorium acoustics and architectural design. London: E &FNSpon, 1993.

86. J. R. Beltran and F. A. Beltran, "Matlab implementation of reverberation algorithms," Proc. DAFX '99, Trondheim (Noruega), pp. 91-96. 99.

87. F. A. Beltran, "Matlab implementation of some reverberation algorithms," http://www.cps.unizar.es/~fbeltran/frame_inv.html, University of Zaragoza, Spain, accessed Aug. 2006.

88. R. Ben-Hador and I. Neoran. "Capturing manipulation and reproduction of sampled acoustic impulse responses," Audio Eng. Soc. 117th Conv. Paper, October 2004.

РЖДАЮ» ному образованию

В.В. Петров 2013 г.

АКТ

Л. Л. Л- ж* ж.

об использовании результатов, полученных в диссертационной работе, в учебный процесс Технологического института Южного федерального

университета в г. Таганроге

Комиссия в составе профессора Федосова В.П. (председатель), доцентов Цветкова Ф.А. и Терешкова В.В. рассмотрела диссертационную работу Таранова Дмитрия Дмитриевича «Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении» и составила настоящий акт о том, что результаты, полученные в представленной диссертации используются в учебном процессе кафедры теоретических основ радиотехники ТТИ ЮФУ в курсах «Акустика», «Зрительно-слуховое восприятие аудио-визуальных программ» и «Звукорежиссура массовых мероприятий и сцены».

Предметом внедрения являются:

- метод трехмерного пространственного позиционирования звуковых сигналов посредством использования массива функций HRTF (Head-Related Transfer Function)

- метод моделирования пространственных характеристик реальных помещений на основе гибридного реверберационного алгоритма.

Результаты, полученные Д.Д. Тарановым, позволяют улучшить восприятие музыкальных программ, повысить естественность звучания в части пространственных характеристик аудиозаписей.

Председатель комиссии

д.т.н., профессор

Члены комиссии

к.т.н., доцент

к.т.н., доцент

В.П. Федосов

Ф.А. Цветков В.В. Терешков

Медиагруппа ЗВУКОДЕЛ ИПГаличенко Евгений Сергеевич

_ИНН 616610913358 ОГРН 310618102500063

346680, Ростовская область, г.Батайск, мкрн. Авиагородок, д. 17 к.50, тел. +7-903-403-4404

АКТ ВНЕДРЕНИЯ

результатов диссертационной работы на соискание ученой степени кандидата технических наук Таранова Дмитрия Дмитриевича «Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении»

Настоящим подтверждаю, что результаты диссертационной работы Таранова Дмитрия Дмитриевича «Алгоритмы обработки и моделирования пространственно-временных музыкальных акустических сигналов в помещении» используются в выполняемой в настоящее время медиагруппой «Звукодел» обработке музыкальных акустических сигналов с целью их трехмерного пространственного позиционирования, а также для достижения художественных целей. Обработка звуковых сигналов, производимая при помощи алгоритмов Д.Д. Таранова позволяет с высокой степенью точности помещать музыкальный сигнал в требуемое акустическое пространство. Применение этих алгоритмов позволит расширить набор звуковых эффектов, применяемых при обработке аудиосигналов, что повысит естественность звучания фонограмм.

ИП Галиченко Е.С.

2013г.

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.