Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов тема диссертации и автореферата по ВАК РФ 05.11.06, кандидат наук Повинский, Юрий Владимирович

  • Повинский, Юрий Владимирович
  • кандидат науккандидат наук
  • 2013, Санкт-Петербург
  • Специальность ВАК РФ05.11.06
  • Количество страниц 111
Повинский, Юрий Владимирович. Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов: дис. кандидат наук: 05.11.06 - Акустические приборы и системы. Санкт-Петербург. 2013. 111 с.

Оглавление диссертации кандидат наук Повинский, Юрий Владимирович

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

1 ОБЗОР СУЩЕСТВУЮЩИХ СПОСОБОВ ПОВЫШЕНИЯ КАЧЕСТВА РЕЧИ НА ФОНЕ ПОМЕХ

1.1 Акустические способы повышения разборчивости речи

1.2 Амплитудное ограничение

1.3 Цифровая обработка сигналов

1.3.1 Винеровская фильтрация

1.3.2 Адаптивная фильтрация

1.3.3 Программно-аппаратные средства повышения разборчивости речи, основанные на цифровой обработке сигнала

1.4 Выводы по главе

1.5 Постановка задачи

2 РАЗРАБОТКА МЕТОДИКИ ПРОГНОЗНОЙ ОЦЕНКИ РАЗБОРЧИВОСТИ РЕЧИ НА ВЫХОДЕ ШУМОЗАЩШЦЕННОГО МИКРОФОНА

2.1 Анализ существующих методик оценки разборчивости речи

2.1.1 Метод артикуляционных испытаний

2.1.2 Формантные методы

2.2 Доработка методик Н.Б. Покровского и М.А. Сапожкова

2.3 Экспериментальная проверка доработанных методик Н.Б. Покровского и М.А. Сапожкова

2.4 Выводы по главе

3 ОПРЕДЕЛЕНИЕ ТЕХНИЧЕСКИХ ТРЕБОВАНИЙ К ШУМОЗАЩИЩЕННОМУ МИКРОФОНУ

3.1 Расчет разборчивости речи в условиях шума с теоретическим распределением спектральной плотности

3.2 Выбор оптимальной характеристики направленности микрофона, исходя из шумозащищеннности и разборчивости речи

3.3 Выбор оптимальной формы частотной характеристики чувствительности микрофона

3.4 Выводы по главе

4 ПРИМЕР РЕАЛИЗАЦИИ ШУМОЗАЩИЩЕННОГО МИКРОФОНА

4.1 Техническое задание

4.2 Расчет основных параметров капсюля

4.2.1 Предварительный расчет параметров преобразователя и размеров капсюля

4.2.2 Предварительный расчет акустико-механических параметров

4.2.3 Расчет внутренней конструкции капсюля

4.2.4 Расчет основных электроакустических параметров микрофона

ЗАКЛЮЧЕНИЕ

Список литературы

ПРИЛОЖЕНИЕ 1. Акт о реализации результатов диссертационной

работы Повинского Юрия Владимировича

Рекомендованный список диссертаций по специальности «Акустические приборы и системы», 05.11.06 шифр ВАК

Введение диссертации (часть автореферата) на тему «Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов»

ВВЕДЕНИЕ

На микрофон, используемый для звукопередачи, действует звуковое давление не только от основного источника, но и от большого числа источников акустического шума, присутствие которых по той или иной причине является при звукопередаче неизбежным. Под акустическими шумами могут пониматься шумы любой природы, источники которых находятся на некотором расстоянии от микрофона. Например: посторонние голоса, находящихся рядом людей, шум от приборов и механизмов, машин и т.д. При этом, источники акустических шумов могут иметь заранее известное статичное местоположение, либо появляться случайным образом, например, при нахождении микрофона на улице, в местах большого скопления людей, при выполнении бойцом спецназа боевого задания, в том числе находясь в перестрелке. Особенно актуальной задача получения разборчивого речевого сигнала становится в условиях сильных акустических шумов (соизмеримых или даже превышающих по величине полезный звуковой сигнал) в аппаратуре связи и оповещения. Например: кабина пилота самолёта, в гусеничном транспорте, устройствах связи в условиях интенсивного городского шума, диспетчерская связь в условиях промышленного шума и т.д. Неправильно понятая или не расслышанная речь в определенных ситуациях может стоить жизни людей (в военной технике, авиации), либо привести к материальному ущербу (на производстве, строительстве).

На данный момент создано множество устройств, позволяющих повысить разборчивость речи в электрической части звукового тракта путем различных методов обработки сигнала. Например, наиболее распространенный метод повышения разборчивости речи заключается в применении различных электронных (как аналоговых, так и цифровых) шумоподавителей. Если такие устройства и позволяют отчасти решить проблему, то они имеют очень высокую стоимость, которая неприемлема для массового использования.

Микрофоны, используемые в современных противошумных гарнитурах, имеют самые разнообразные характеристики направленности и частотный диапазон. Универсальных высококачественных противошумных микрофонов с

оптимальными характеристиками под всевозможные условия эксплуатации на данный момент практически не существует, во многом потому, что не выработано оптимальных критериев проектирования шумозащищенных микрофонов.

Целью работы является повышение эффективности выделения полезного речевого сигнала на фоне акустического шума высокого уровня путем оптимизации электроакустических характеристик речевых микрофонов.

Научная новизна диссертационной работы состоит в следующем:

1) формантные методики по оценке разборчивости речи М.А. Сапожкова и Н.Б. Покровского адаптированы для расчета разборчивости по известным спектральным распределениям шума и речи в стандартных октавных и третьоктавных полосах;

2) показано, что розовый шум, наряду с равномерно маскирующим шумом, имеет наиболее сильный маскирующий эффект для речевого сигнала;

3) введено и обосновано новое понятие: «коэффициент повышения разборчивости» шумозащищенного микрофона, пропорциональный повышению слоговой разборчивости речи при использовании микрофона с любой частотно-пространственной характеристикой;

4) обоснована целесообразность применения микрофонов ближнего действия с «суперкардиоидной» характеристикой направленности, в качестве универсальной и оптимальной по шумозащищенности и величине повышения разборчивости речи в условиях повышенного акустического шума практически любого спектра.

Практическая значимость работы заключается в следующем:

1) показано, что для предварительной оценки шумозащищенности микрофонов и звукового тракта в целом наиболее сильным маскирующим сигналом является равномерно маскирующий шум, а также «розовый» шум.

2) адаптирована формантная методика оценки разборчивости речи для стандартных октавных и третьоктавных полос, что дает возможность использования стандартизованной аппаратуры (шумомеров, спектро-

анализаторов) в условиях измерений разборчивости речи на фоне реальных шумов, что ранее не было возможно.

3) коррекция известной ранее методики проектирования микрофонов, основанная на разработанных в диссертации критериях, позволяет применять её при разработке шумозащищенных микрофонов ближнего действия.

Методологические и теоретические основы исследования составили научные труды отечественных и зарубежных ученых в области прикладной акустики -Иофе В.К., Сапожков М.А., Вахитов Я.Ш., Вахитов Ш.Я., а также в области речеобразования и теории разборчивости речи: Коллард Д., Покровский Н.Б.

Научные положения, выносимые на защиту:

1) доработанные в диссертации методики расчета разборчивости речи М.А. Сапожкова и Н.Б. Покровского справедливы для расчета и измерений в стандартных октавных и третьоктавных полосах с помощью аттестованной аппаратуры;

2) обоснован новый критерий оценки качества шумозащищенного микрофона - «коэффициент повышения разборчивости», величина которого пропорциональна повышению слоговой разборчивости речи при использовании микрофона с любой частотно-пространственной характеристикой;

3) тип характеристики направленности «суперкардиоида» является оптимальной по критериям шумозащищенности и разборчивости речи для микрофонов ближнего действия;

4) показано, что наиболее сильным маскирующим эффектом для речевого сигнала обладает, наряду с равномерно маскирующим, «розовый» шум.

Материалы диссертационной работы использовались в Федеральном государственном казенном учреждении «Войсковая часть 45187» при выполнении трех научно-исследовательских работ по гособоронзаказу. Имеется соответствующий акт внедрения.

1 ОБЗОР СУЩЕСТВУЮЩИХ СПОСОБОВ ПОВЫШЕНИЯ КАЧЕСТВА РЕЧИ НА ФОНЕ ПОМЕХ

Одним из методов повышения разборчивости речи является снижение уровней шумов. Но в большинстве случаев они бывают заданными и не зависят от нас, хотя иногда можно снизить помехи от диффузного звука (путем уменьшения акустического отношения), от шумов, проникающих под заглушки, и т. п. Остается возможность манипулирования уровнями речи у слушателя по прямому звуку. Это возможно реализовать следующим образом: повышением уровня речи говорящего, приближением микрофона ко рту и уменьшением динамического диапазона (путем приближения минимального уровня прямого звука к максимальному), увеличением индекса тракта.

1.1 Акустические способы повышения разборчивости речи

На микрофон, используемый для звукопередачи, действует звуковое давление не только от основного источника, но и от большого числа источников акустического шума, присутствие которых по той или иной причине является при звукопередаче неизбежным. Увеличения соотношения «полезный сигнал-шум» теоретически можно добиваться с помощью спектральной и пространственной селекции полезного сигнала, а также используя определенные свойства направленных микрофонов в поле сферической волны ближнего источника [1, с. 89-95]. На практике спектральная селекция полезного сигнала в воздушной акустике встречается крайне редко, так как спектры большинства реальных шумов близки или совпадают со спектром полезного сигнала. Исключение пожалуй составляет только интенсивные низкочастотные составляющие транспортных и некоторых промышленных шумов, которые в случае необходимости обрезают фильтром с частотой среза 200-300, а в ряде случаев и с 500 Гц, естественно, с частью спектра полезного сигнала.

Наиболее эффективным способом увеличения дальности приема является повышение коэффициента направленности микрофона или микрофонного устройства. Если под полезным сигналом понимается речь, то весьма желательно, чтобы острая характеристика направленности сохранялась в речевом диапазоне

частот (100-10000 Гц), или хотя бы в диапазоне 200-7000 Гц, особенно если важна не только разборчивость, но и надежная идентификация голоса. Направляя акустическую ось направленного микрофона на источник полезного акустического сигнала, удается повысить соотношение сигнал/шум. Такой метод довольно высоко эффективен, если местоположение помехи статично и заранее известно.

Повышение разборчивости речи на фоне шумов за счет оптимизации параметров первого элемента звукового тракта - микрофона - является наиболее экономически выгодным с точки зрения построения шумозащищенных систем, а также довольно простым в реализации, т.к. не требует дополнительных обрабатывающих сигнал устройств. Поэтому данный способ повышения разборчивости является наиболее востребованным на сегодняшний день.

В настоящее время для повышения разборчивости речи в шумной обстановке используют различные системы гарнитурного типа. Гарнитуры, как правило, представляют собой головные телефоны или наушники с прикрепленным к ним микрофоном, выведенным на гибком или жестком креплении ко рту оператора. Повышение отношения сигнал/шум на выходе микрофона достигается за счет малого удаления микрофона от рта оператора в совокупности с применением направленного микрофона и ветрозащиты.

Рассмотрим типовые гарнитурные системы, предлагаемые на рынке для различных сфер деятельности.

В сферах военной и гражданской авиации, армии и флота (в том числе в войсках стран НАТО) общемировую известность получили гарнитуры фирмы David Clark (США) [2]. Фирма выпускает широчайший ассортимент гарнитур различного назначения. Для примера на рисунке 1.1 показан внешний вид авиационной гарнитуры типа Н3335, предназначенной для пилотов самолетов.

Рисунок 1.1 - Авиационная гарнитура David Clark Н3335

Практически во всех гарнитурах David Clark используются два типа микрофонов, произведенные фирмой Acousticom (США): электретные типа 5720-СА и динамические типа M-87/AIC [3].

По данным производителя электретный микрофон Acousticom 5720-СА (рисунок 1.2) имеет следующие технические характеристики:

-частотный диапазон: 100-10000 Гц;

-индекс шумозащищенности: 15 дБ;

- коэффициент нелинейных искажений: 6 % при уровне звукового давления 114 дБ;

-сопротивление: 150±20 Ом;

- напряжение питания: 9-28 В;

- диапазон рабочих температур: от минус 55°С до +85 °С;

- габаритные размеры: 44,5 х 12,7 х 19,1 мм.

Рисунок 1.2 - Электретный микрофон фирмы Acousticom 5720-СА

Динамический микрофон АсоиБЙсот М-87/А1С (рисунок 1.3) применяется преимущественно в военных целях и обладает следующими техническими характеристиками [4]:

- частотный диапазон: 200-6000 Гц;

- индекс шумозащищенности: 15 дБ;

- диапазон рабочих температур: от минус 55°С до +85 °С.

Данные о характеристиках направленности микрофонов Acousticom 5720-СА и M-87/AIC производитель умалчивает.

Стоит также отметить, что микрофоны Acousticom 5720-СА и M-87/AIC используются в некоторых моделях гарнитур фирм Sennheiser (Германия), Flightcom (США), ЗМ Peltor (Швеция).

Фирма David Clark также выпускает гарнитуры нагубного ношения, например, авиационные гарнитуры типа Н3310 (рисунок 1.4).

Рисунок 1.3 - Динамический микрофон фирмы Acousticom M-87/AIC

f

Рисунок 1.4 - Авиационная гарнитура David Clark Н3310 с нагубным креплением

микрофона

Внутрь шумозащитного экрана встроен микрофон Асоизйсот 5720-СА. По данным производителя применение шумозащитного экрана с амбушюром позволяет увеличить шумоподавление до 25 дБ. В тоже время, помимо доставления определенного дискомфорта для пилота при ношении данной гарнитуры, не исключено проникновение шума через щели в заглушке, а также возникновение побочного шума, обусловленного сокращением мышц лица.

Не менее крупным производителем широкого спектра гарнитур различного назначения является немецкая фирма ЗеплЬ^Бег. Фирма выпускает противошумные гарнитуры для гражданской авиации, авиадиспетчерской связи, телекоммуникаций, теле- и радиостудий, бытового назначения. К примеру, на рисунке 1.5 показан внешний вид гарнитуры, предназначенной для пилотов пропеллерной авиации.

Рисунок 1.5 - Гарнитура фирмы 8еппЬе1зег НМЕС 461 Наибольший интерес представляют технические характеристики микрофонов, используемых в гарнитурах Бепп^^зег. В таблице 1.1 приведены технические характеристики микрофонов от гарнитур, предназначенных для эксплуатации в повышенной шумовой обстановке, на основе данных производителя [5; 6; 7; 8].

Таблица 1.1 - Основные характеристики микрофонов, используемых в гарнитурах фирмы 8еппЬе1зег

Модель Назначение Микрофон (тип электроакустич. преобразователя) Характеристика направленности Частотный диапазон, Гц

НМБ 280 РгоГГеззюпа1 телекоммуникации динамический «суперкардиоида» 50-13500

НМБ 26 теле- радиостудии ВМО 424 динамический «гиперкардиоида» 40-16000

НМЕ 26-4 теле-радиостудии ВМЕ 4-2 электретный «кардиоида» 40-20000

НМБ 46-3-6 авиадиспетчерская связь ВМБ 46-413 динамический «суперкардиоида» 100-12000

НМЕ 43-3 авиадиспетчерская связь электретный - 400-4500

НМЕС 26 кабина пилота самолета МКЕ46 электретный - 100-6000

НМЕС 46 кабина пилота самолета ВКЕ 46 электретный - 350-6000

НМЕ 100 кабина пилота самолета МКЕ 45-2 электретный - 500-5000

НМЕС 461 кабина вертолета МКЕ 45-1 электретный «восьмерка» 300-5000

НМБС 372 кабина вертолета М-87/А1С динамический - 500-4000

Также существуют варианты противошумных гарнитур с применением

ларингофонов. Помимо традиционного применения ларингофонов в военной сфере (пилотами самолетов, танковыми подразделениями, войсками спецназначения) в последнее время ларингофоны получили широкое распространение в гражданской сфере за счет возросшей популярности подвижных командных игр, таких как, пейнтбол, страйкбол и др., где игроками используются специальные защитные маски. Поэтому на сегодняшний день на рынке множеством производителей предлагается масса всевозможных гарнитур на основе ларингофонов.

В качестве ларингофонов большинства выпускаемых на сегодняшний день гарнитур чаще всего используются один или два электретных микрофона, прикрепляемых к шее на липучках (рисунок 1.6) или привязываемых к шее (рисунок 1.7).

Рисунок 1.6 - Ларингофон фирмы Motorola

f

Рисунок 1.7 - Авиационная гарнитура David Clark Н7130 с ларингофоном

Рабочий диапазон частот большинства предлагаемых на рынке ларингофонов 300-3000 Гц, что подразумевает собой низкую разборчивость речи. Основным недостатком ларингофонов является возникновение побочных шумов, вызываемых поворотами головы и посторонними звуками внутри гортани (глотание, хрипота и др.).

Один из самых старых способов повышения разборчивости речи — способ такой компрессии динамического диапазона речевого сигнала, при которой происходит повышение уровней слабых звуков речи при сохранении уровней громких звуков речи [9, с. 242]. Для систем с обратной акустической связью этот метод непригоден, так как возникает самовозбуждение системы. А в остальных системах слабые уровни речи повышаются на величину компрессии динамического диапазона.

Из компрессоров наиболее применимы ограничители уровня, действие которых сводится к выравниванию пиковых уровней громких звуков, при этом не изменяются соотношения между уровнями слабых звуков.

Рассмотрим предельный случай компрессии речи — предельное

1.2 Амплитудное ограничение

амплитудное ограничение, при котором речевой сигнал превращается в последовательность прямоугольных импульсов постоянной амплитуды, но с меняющимися интервалами между нулевыми переходами. А это означает, что все звуки речи будут иметь одинаковый и притом максимальный уровень на приеме. Если при передаче неограниченной речи слабые звуки маскировались помехами, то при таком способе передачи они окажутся выше уровней помех и разборчивость будет выше, чем при приеме неограниченной речи. Правда, качество звучания и разборчивость речи в отсутствие помех будут ниже, чем для неограниченной речи. Также сильно искажается тембр голоса, что порой трудно идентифицировать диктора. Современные условия эксплуатации звукопередающей аппаратуры предъявляют повышенные требования не только к разборчивости речи, но и узнаваемости голоса диктора, что весьма ограничивает применение рассмотренного метода.

1.3 Цифровая обработка сигналов Принцип коррекции речевых сигналов, маскируемых шумовой и реверберационной помехами, схематически представлен на рисунке 1.8 [10, с.47].

Математическая модель сигнала z(t), маскируемого помехой в виде аддитивного шума, имеет вид суммы:

z(t)=s(t)+v(t), (1.1)

где s(t) - полезный речевой сигнал; v(t) - аддитивный шум.

„9(0 s(t)®h(t) z(0 S(t)

Рисунок 1.8 - Принцип коррекции зашумленных речевых сигналов Математическая модель сигнала, маскируемого реверберационной помехой, имеет вид свертки (конволюции) речевого сигнала с импульсной

характеристикой помещения

15

z(t) = s(t) <8> h{t).

В общем случае, когда наблюдаются помехи обоих типов:

z{t) = s(t) ® h{t) + vit)

Задачу восстановления сигнала s(t) из смеси z(t) обычно решают путем фильтрации смеси z(t), в результате которой получают восстановленный сигнал sit). Черта над символом означает, что сигнал удается восстановить не полностью, т. е. между сигналом s(t) и результатом восстановления sit) остается различие.

Существует большое количество подходов к восстановлению речевых сигналов, которые можно условно разделить на две основные группы:

- методы непараметрической фильтрации;

- методы, основанные на оценивании параметров модели сигнала.

К первой группе методов относятся:

- винеровская фильтрация;

- адаптивная фильтрация.

Вторая группа методов интенсивно исследуется и развивается в настоящее время. Параметризация речевых сигналов позволяет существенно сжать объем описания передаваемой информации. Это весьма удобно как при фильтрации сигналов, так и при передаче их по линиям связи (ввиду возможности повышения объема пропускаемой информации).

1.3.1 Винеровская фильтрация

При винеровской фильтрации синтезируют оптимальный, в смысле минимума среднего квадрата ошибки sit)- sit) - sit), фильтр. Частотная характеристика такого фильтра содержит информацию о спектральных свойствах сигнала и шума [10, с. 48]:

#(/) =-^-= 1-^, (12)

Gs{f) + Gnif) Gz if) V-V

где Gsif) и Gnif) - спектры мощности сигнала s(t) и шума n(t), соответственно;

Gz if) = Gs if) + Gn if)- спектр смеси сигнала с шумом.

На практике спектр помехи можно оценить в паузах между передачей сигнала. Шум можно считать стационарным случайным процессом, поэтому за счет усреднения по множеству таких пауз возможно получение достаточно точной оценки спектра шума Опф. Что касается речевого сигнала, очевидно, что трактовка его как стационарного случайного процесса со спектром мощности С3ф весьма плохо соответствует действительности - во времени изменяется не только мощность речевого сигнала, но и его спектральный состав.

Между тем, оценка спектра Свф, формируемая путем усреднения на протяженном интервале времени (примерно 1 мин), именуемая долговременным спектром речи, содержит весьма приблизительную информацию о свойствах речевого сигнала. Как следствие, при таком подходе вряд ли следует ожидать хороших результатов восстановления речевого сигнала, что и подтверждают экспериментальные исследования [10, с. 49]. Например, синтезированный с использованием оценки долговременного спектра нерекурсивный винеровский фильтр порядка 250 оказывается низкочастотным, с частотой среза 650 Гц на уровне минус 3 дБ. Такой фильтр подавляет не только шум, но и высокочастотные компоненты речевого сигнала. В результате, хотя отношение сигнал-шум в целом повышается, разборчивость речи возрастает едва заметно. Данный феномен поясняется тем, что разборчивость речи в значительной степени определяется качеством передачи информации о согласных звуках, спектр которых простирается до 10 кГц.

В этой связи естественной выглядит попытка использования кратковременного спектра вместо долговременного. При этом помеха по-прежнему рассматривается как стационарный случайный процесс, тогда как речевой сигнал считается стационарным лишь на интервале времени Г=20-30 мс. Восстанавливающий винеровский фильтр при таком подходе является фильтром с переменными параметрами:

Я(/) = 1- .

е.СЛО

Результаты экспериментальных исследований свидетельствуют о более высоком качестве восстановленного с помощью такого фильтра речевого сигнала. Впрочем, положительное впечатление от вполне ощутимого прироста разборчивости омрачается появлением нового звукового эффекта, напоминающего плеск воды (по западной терминологии - музыкальный шум). Причина его кроется в нестационарном характере остаточной шумовой помехи, вызванном изменением во времени параметров фильтра.

Характеризуя винеровскую фильтрацию в целом, можно констатировать ее эффективность лишь в условиях достаточно высоких отношений сигнал-шум. Подобную ситуацию можно наблюдать в современных телевизионных приемниках, имеющих встроенную систему шумоподавления (предназначенную для работы с аналоговыми сигналами). Эффективность такой системы ощутима лишь при относительно малом уровне шумов.

1.3.2 Адаптивная фильтрация

Идея адаптивной фильтрации, в принципе, достаточно проста [10, с. 50]: если есть возможность получить информацию только о шумовом процессе (например, с помощью дополнительного микрофона или иного датчика, размещаемого как можно ближе к источнику шума - работающему двигателю, вибрирующей поверхности и т. п.), тогда можно так отрегулировать амплитуду и фазу этого шума, чтобы они максимально совпадали с таковыми для шумового процесса, находящегося «внутри» смеси полезного сигнала с шумом. Далее, чтобы получить речевой сигнал, достаточно вычесть отрегулированный (адаптированный) шум из смеси. Очевидно, это вычитание можно трактовать как «сложение шумов в противофазе».

В настоящее время построено много устройств очистки речевого сигнала от шумов на основе адаптивной фильтрации сигнала. Принцип работы любого из этих устройств можно пояснить с помощью схемы, представленной на рисунке 1.9. Отличия устройств друг от друга обусловлены лишь схемотехническими решениями, применяемыми для реализации алгоритма

адаптивной фильтрации в конкретном изделии и объемом сервисных функций, заложенных в нем.

Выход Фильтра

Рисунок 1.9 - Алгоритм работы адаптивного фильтра

Адаптивный фильтр действует по принципу оценивания статистических параметров поступающего сигнала и подстройки собственной переходной характеристики таким образом, чтобы минимизировать ошибку е(п).

Если предположить, что на вход Y(n) поступает смесь речевого сигнала и помехи, а на вход S(n) - сигнал помехи, то параметры программируемого фильтра будут изменяться в соответствии с алгоритмом адаптации таким образом, что на выходе Yf(n) будет присутствовать сигнал, приблизительно равный сигналу помехи, а на выходе е(п) - очищенный речевой сигнал.

Устройства, реализующие блок схему (см. рисунок 1.9) называются двухканальными адаптивными фильтрами или адаптивными компенсаторами помех. Если на вход программируемого фильтра подавать сигнал с задающего входа, т.е. выполнить условие S(n)=Y(n), то данная реализация блок-схемы называется одноканальным адаптивным фильтром, или просто адаптивным фильтром.

Алгоритм адаптации определяет закон, в соответствии с которым происходит настройка программируемого фильтра, где в качестве параметра используется величина, определяющая скорость изменения параметров программируемого фильтра.

Обычно используется два закона настройки:

- минимум среднего квадрата ошибки (МСКО);

- минимум модуля ошибки (ММО).

Параметр, определяющий скорость настройки, обеспечивает точную подстройку адаптивного фильтра под ту или иную помеху, поэтому для эффективной борьбы с помехами желательно, чтобы в устройствах была заложена возможность изменения этого параметра в достаточно широких пределах. В качестве программируемого фильтра часто используются фильтры с конечной импульсной характеристикой (FIR-фильтры). Порядок такого фильтра определяет количество коэффициентов адаптации.

Так как в основе всех без исключения аппаратных реализаций адаптивного фильтра лежат цифровые методы обработки сигналов, то большое влияния на качество обработки оказывают характеристики тракта АЦП-ЦАП (разрядность, нелинейные искажения, динамический диапазон, полоса рабочих частот).

Адаптивная фильтрация значительно эффективнее винеровской - качество восстановленного речевого сигнала оказывается весьма высоким даже в условиях малых отношений сигнал-шум. Расплатой за столь высокую эффективность является необходимость в дополнительном (опорном) источнике информации о шуме.

1.3.3 Программно-аппаратные средства повышения разборчивости речи, основанные на цифровой обработке сигнала

Комплекс шумоочистки на базе ПК Sound Cleaner (рисунок 1.10), разработанный «Центром Речевых Технологий» («ЦРТ», Россия), предназначен для решения следующих задач [11]:

- ввод звуковых сигналов в память ПК и их сохранение на жестком диске;

- шумоочистка и повышение качества звуковых сигналов в режиме реального времени;

- установление дословного содержания низкокачественных фонограмм

речи.

t ~r: ЕЗ • • ■ * ---HMBMH - j j ь — — ' í А »1 ^^^ ¥ "Ид е - 1- >

-

- - ----

Рисунок 1.10 - Комплекс шумоочистки Sound Cleaner

Основные функции, обеспечиваемые Sound Cleaner:

1) ввод и сохранение в памяти ПК звуковых сигналов с микрофонов или линейных выходов аудиоаппаратуры;

2) подавление шумов и компенсация искажений различных типов, в том числе:

- стационарных и медленно меняющихся аддитивных многокомпонентных узкополосных (полигармонических) и широкополосных шумов;

- медленно меняющихся амплитудно-частотных искажений (неравномерностей АЧХ канала звукозаписи/звукопередачи);

Похожие диссертационные работы по специальности «Акустические приборы и системы», 05.11.06 шифр ВАК

Список литературы диссертационного исследования кандидат наук Повинский, Юрий Владимирович, 2013 год

Список литературы

1. Вахитов Ш.Я. Современные микрофоны. Теория, проектирование. -СПб.: изд. СПбГУКиТ, 2003.

2. http://www.davidclark.com

3. http://www.acousticom.com

4. http://store.acousticom.com/microphones/dynamic-microphones/m-87/m-

87aic

5. http://www.sennheiser.com

6. http://www.sennheiser-aviation.com/general-aviation_active-noise-reduction_502399

7. http://www.sennheiser.ca/live/senn/type/en/3

8. http://www.scribd.eom/doc/57141972/l 1/Aviation-Aviation-Boomsets

9. Сапожков М.А. Электроакустика. Учебник для вузов. М., «Связь»,

1978.

10. Акустическая экспертиза каналов речевой коммуникации. Монография / Дидковский B.C., Дидковская М.В., Продеус А.Н. - Киев, 2008.

11. http://www.speechpro.rU/product/obrabotka/noise/sound-cleaner#tab2

12. http://www.speechpro.ru/product/obrabotka/noise/zolushka_micro3

13. Вахитов Я.Ш. Теоретические основы акустики и электроакустическая аппаратура. -М.: Искусство, 1982.

14. ГОСТ Р 50840-95. Государственный стандарт Российской Федерации. Передача речи по трактам связи. Методы оценки качества разборчивости и узнаваемости. Издание официальное. - М.: Госстандарт России, 1997.

15. ГОСТ 16600-72. Государственный стандарт СССР. Передача речи по трактам радиотелефонной связи. Требования к разборчивости речи и методы артикуляционных измерений. Издание официальное. - М.: ИПК издательство стандартов, 1980.

16. ГОСТ 51061-97. Государственный стандарт Российской Федерации. Системы низкоскоростной передачи речи по цифровым каналам. Параметры

качества речи и методы её измерения. Издание официальное. - М.: Госстандарт России, 1998.

17. Сапожков М.А. Речевой сигнал в кибернетике и связи. - М.: Связьиздат, 1963.

18. Покровский Н.Б. Расчет и измерение разборчивости речи. - М.: Связьиздат, 1962.

19. Быков Ю.С. теория разборчивости речи и повышение эффективности радиотелефонной связи. - M.-JL: Госэнергоиздат, 1959.

20. Акустика: Учебник для вузов / Ш.Я. Вахитов, Ю.А. Ковалгин, A.A. Фадеев, Ю.П. Щевьев; Под ред. Профессора Ю.А. Ковалгина. - М.: Горячая линия - Телеком, 2009.

21. Репина И.О. Громкоговорящая телефонная связь. М., «Связь», 1969.

22. Акустика: Справочник / А.П. Ефимов, A.B. Никонов, М.А. Сапожков, В.И. Шоров; Под ред. М.А. Сапожкова. - 2-е изд., перераб. и доп. - М.: Радио и связь, 1989.

23. Методические указания МУК 4.3.2231-07 «Оценка акустической нагрузки в кабинах экипажей воздушных судов при составлении санитарно-гигиенической характеристики условий труда летного состава гражданской авиации»/Роспотребнадзор. М., 2009.

24. Иванов Н.И. Инженерная акустика. Теория и практика борьбы с шумом: учебник. — М.: Университетская книга, Логос, 2008. - 424 с.

25. Акустические шумы в различных помещениях: Информационная справка № 1-96 / Р.Т. Калустьян. - СПб.: БНТИ, 1996.

26. Вахитов Ш.Я. Теория и методы проектирования современных направленных и комбинированных микрофонов - СПб., 2003.

27. Куликов Е.И. Прикладной статистический анализ. Учебное пособие для вузов. - 2-е изд., перераб. и доп. - М.: Горячая линия-Телеком, 2008.

АВТОРСКИЕ ПУБЛИКАЦИИ ПО ТЕМЕ РАБОТЫ:

28. Выбор оптимальной характеристики направленности микрофонов, исходя из шумозащищенности и разборчивости речи (сов. с Ш.Я. Вахитовым) // Мир техники кино. 2012. № 23.

29. Оценка влияния места установки акустических систем в помещении на искажения речевого сигнала // Специальная техника, Москва, 2012. С.1ЬО,

30. Расчет разборчивости речи в условиях шума с теоретическим распределением спектральной плотности. // Материалы научных и творческих конференций институтов и факультетов СПбГУКиТ «Неделя науки и творчества -2009», СПб, 2009, С. 73.

31. Выбор оптимальных характеристик микрофона для условий сильных акустических шумов исходя из шумозащищенности и разборчивости речи. // Материалы научных и творческих конференций институтов и факультетов СПбГУКиТ «Неделя науки и творчества - 2011», СПб, 2011.

32. Оптимизация амплитудно-частотной характеристики речевого тракта по критерию разборчивости речи (сов. с Ш.Я. Вахитовым) // Сборник статей Международной научно-практической конференции «Наука и образование XXI века»: в 5 ч. Ч.З - Уфа: РИЦ БашГУ, 2013, С. 284-291.

УТВЕРЖДАЮ

АКТ

А.Г. Булыго

о реализации результатов диссертационной работы Повинского Юрия Владимировича на тему «Обоснование комплекса электроакустических характеристик речевых гарнитурных микрофонов для условий повышенных акустических шумов»

Научно-технический совет Федерального государственного казенного учреждения "Войсковая часть 45187" подготовил настоящий акт о том, что результаты диссертационной работы Повинского Юрия Владимировича:

— обоснование комплекса электроакустических характеристик микрофонов для работы в условиях повышенных фоновых шумов;

— анализ влияния частотной характеристики чувствительности и характеристики направленности микрофонов на разборчивость речи;

использовались при выполнении трех научно-исследовательских работ по гособоронзаказу.

Внедрение результатов позволило разработать методику оценки качества полезного сигнала на выходе микрофона в условиях повышенных фоновых шумов.

Результаты представлены на научно-технической конференции федерального государственного казенного учреждения "Войсковая часть 35533" в 2012 году и опубликованы в сборнике научных трудов "Специальная техника" (№ 1770 перечня ВАК) за 2012 год.

Подана заявка № 2013120376 на выдачу патента Российской Федерации на полезную модель акустического устройства.

Секретарь научно-технического совета

ФГКУ "в/ч 45187

кандидат технических наук

Н.В. Князева

Обратите внимание, представленные выше научные тексты размещены для ознакомления и получены посредством распознавания оригинальных текстов диссертаций (OCR). В связи с чем, в них могут содержаться ошибки, связанные с несовершенством алгоритмов распознавания. В PDF файлах диссертаций и авторефератов, которые мы доставляем, подобных ошибок нет.